工作職責(zé):
1.、搭建與優(yōu)化 CI/CD 流水線,實(shí)現(xiàn)前端與后端服務(wù)的持續(xù)集成與交付,加速研發(fā)迭代效率;
2、協(xié)助開發(fā)團(tuán)隊(duì)進(jìn)行環(huán)境搭建、問題排查與性能調(diào)優(yōu),形成跨部門閉環(huán)支持;
3、設(shè)計(jì)并維護(hù)系統(tǒng)監(jiān)控、日志采集與告警機(jī)制,確保服務(wù)性能、資源利用率與故障響應(yīng)的及時(shí)性;
4、參與平臺(tái)架構(gòu)優(yōu)化,提出運(yùn)維層面的改進(jìn)建議,提升系統(tǒng)可擴(kuò)展性與自動(dòng)化程度;
5、編寫并維護(hù)相關(guān)技術(shù)文檔,包括運(yùn)維手冊、部署指南、應(yīng)急預(yù)案等,推動(dòng)運(yùn)維體系標(biāo)準(zhǔn)化與自動(dòng)化;
6、參與監(jiān)控體系建設(shè)、信息安全體系建設(shè)和DevOps工具鏈開發(fā)。
任職要求:
1、本科及以上學(xué)歷,5年以上DevOps/SRE工作經(jīng)驗(yàn);
2、深入理解Docker及K8S,Kubernetes使用經(jīng)驗(yàn)超過3年,Jenkins+Pipeline ClCD運(yùn)維經(jīng)驗(yàn)超過3年;
3、熟練運(yùn)用Linux常用命令,2年以上Python開發(fā)經(jīng)驗(yàn),具備較為成熟的工程思想,掌握常用的設(shè)計(jì)模式,熟練運(yùn)用常用的正則表達(dá)式;
4、有阿里云使用經(jīng)驗(yàn)、熟悉Linux常見發(fā)行版(CentOS6/7、Ubuntu Server、Alpine),熟悉Prometheus/Grafana/APM等監(jiān)控工具,能夠進(jìn)行相關(guān)配置和數(shù)據(jù)分析;
5、能獨(dú)立排查文件系統(tǒng)、網(wǎng)絡(luò)、負(fù)載過高等故障,熟練使用strace、vmstat、top、iftop、iotop等工具;
6、有容災(zāi)備份工程和一定的攻防實(shí)戰(zhàn)經(jīng)驗(yàn),能夠獨(dú)立完成數(shù)據(jù)恢復(fù)工作,與團(tuán)隊(duì)共同完成信息安全體系建設(shè)工作;
7、有較強(qiáng)的自驅(qū)力,對技術(shù)有熱情,學(xué)習(xí)能力強(qiáng),適應(yīng)能力好,溝通能力強(qiáng),有一定的抗壓能力。