崗位職責(zé):
1)主導(dǎo)并實(shí)施老系統(tǒng)的容器化與云原生改造
評(píng)估和分析傳統(tǒng)老舊應(yīng)用的系統(tǒng)架構(gòu)、依賴關(guān)系和運(yùn)行狀態(tài),制定可行的容器化遷移方案與實(shí)施路徑。主導(dǎo)完成應(yīng)用的Docker鏡像化改造、Helm Chart封裝,并解決在遷移過程中遇到的網(wǎng)絡(luò)、存儲(chǔ)、配置等差異化問題。設(shè)計(jì)并實(shí)現(xiàn)狀態(tài)應(yīng)用、中間件等復(fù)雜系統(tǒng)的容器化方案,確保其在高可用、性能和可維護(hù)性上達(dá)到預(yù)期目標(biāo)。
2)為業(yè)務(wù)應(yīng)用提供容器化與云原生解決方案
指導(dǎo)和協(xié)助開發(fā)團(tuán)隊(duì)完成新應(yīng)用的容器化部署,提供最佳實(shí)踐指導(dǎo)。
設(shè)計(jì)和實(shí)現(xiàn)服務(wù)發(fā)現(xiàn)、負(fù)載均衡、網(wǎng)絡(luò)策略、存儲(chǔ)方案等,保障應(yīng)用在容器平臺(tái)上的高效、穩(wěn)定運(yùn)行。
3)構(gòu)建并運(yùn)維平臺(tái)的監(jiān)控、日志與告警體系
構(gòu)建覆蓋混合云多集群的立體化監(jiān)控、日志與告警系統(tǒng),實(shí)現(xiàn)全局可觀測(cè)性。
建立統(tǒng)一的監(jiān)控大盤和告警鏈路,具備快速定位跨云、跨集群故障的能力。
4)保障整體系統(tǒng)的可靠性
設(shè)計(jì)高可用架構(gòu)、容量規(guī)劃、制定可觀測(cè)性標(biāo)準(zhǔn)(監(jiān)控/日志/鏈路追蹤)、編寫基礎(chǔ)設(shè)施即代碼、進(jìn)行混沌工程實(shí)驗(yàn)。高效處理告警和故障、執(zhí)行應(yīng)急預(yù)案。主導(dǎo)或參與故障復(fù)盤、根因分析、推動(dòng)修復(fù)措施落地、優(yōu)化自動(dòng)化工具和流程。
任職要求:
1.容器化與遷移能力:精通應(yīng)用容器化(Docker)與云原生部署(Helm),能夠主導(dǎo)完成傳統(tǒng)應(yīng)用向容器平臺(tái)的遷移與復(fù)雜有狀態(tài)服務(wù)的容器化改造。
2.云原生技術(shù)棧:掌握服務(wù)發(fā)現(xiàn)、負(fù)載均衡、網(wǎng)絡(luò)策略等云原生核心組件的設(shè)計(jì)與實(shí)現(xiàn),能為業(yè)務(wù)應(yīng)用提供穩(wěn)定可靠的運(yùn)行環(huán)境。
3.平臺(tái)可觀測(cè)性:具備構(gòu)建覆蓋多集群的監(jiān)控、日志與告警體系的能力,實(shí)現(xiàn)全局故障快速定位與診斷。
4.高可用與自動(dòng)化運(yùn)維:擅長設(shè)計(jì)高可用架構(gòu)與可觀測(cè)性標(biāo)準(zhǔn),能通過基礎(chǔ)設(shè)施即代碼、混沌工程和自動(dòng)化流程保障系統(tǒng)可靠性并高效處理故障。
5.計(jì)算機(jī)軟件相關(guān)專業(yè),本科及以上學(xué)歷,年齡在35周歲以下。
6.適應(yīng)長期出差、高壓力環(huán)境下工作,快速適應(yīng)企業(yè)文化。