崗位職責(zé)
云資源運(yùn)維管理:負(fù)責(zé)阿里云、政務(wù)云等云平臺(tái)資源(ECS/安全組/VPC/負(fù)載均衡/云盤/對(duì)象存儲(chǔ)等)的日常運(yùn)維、配置與優(yōu)化。
系統(tǒng)部署與發(fā)布:負(fù)責(zé)業(yè)務(wù)系統(tǒng)的部署上線、版本發(fā)布、回滾、灰度發(fā)布與發(fā)布流程規(guī)范化,保障發(fā)布穩(wěn)定性。
監(jiān)控告警與故障處理:搭建并維護(hù)監(jiān)控告警體系(CPU/內(nèi)存/磁盤/網(wǎng)絡(luò)/服務(wù)可用性),對(duì)線上故障進(jìn)行快速定位、處理與復(fù)盤。
安全與合規(guī)支持:參與系統(tǒng)安全加固(權(quán)限/端口/訪問(wèn)控制)、漏洞修復(fù)、日志審計(jì),配合等保測(cè)評(píng)、安全檢查、攻防演練整改等工作。
備份與容災(zāi):制定并執(zhí)行數(shù)據(jù)庫(kù)/文件/服務(wù)器備份策略,定期演練恢復(fù)流程,保障數(shù)據(jù)可靠性與可用性。
中間件維護(hù):負(fù)責(zé)常見(jiàn)中間件的安裝部署與維護(hù),如 Nginx、MySQL、Redis、MQ 等,保障服務(wù)穩(wěn)定運(yùn)行。
自動(dòng)化與標(biāo)準(zhǔn)化:編寫(xiě)運(yùn)維腳本與工具(Shell/Python等),推動(dòng)運(yùn)維自動(dòng)化;輸出運(yùn)維文檔、SOP、應(yīng)急預(yù)案與交接資料。
資源與成本優(yōu)化:對(duì)云資源使用情況進(jìn)行梳理與優(yōu)化,控制成本,提升資源利用率與系統(tǒng)性能。
任職要求:
基礎(chǔ)能力:熟悉 Linux 常用命令、系統(tǒng)管理、進(jìn)程/網(wǎng)絡(luò)排查;能獨(dú)立定位常見(jiàn)線上問(wèn)題(CPU飆高、磁盤滿、服務(wù)異常等)。
網(wǎng)絡(luò)理解:理解 TCP/IP、DNS、HTTPS、反向代理、負(fù)載均衡等概念,能處理證書(shū)配置、域名解析、訪問(wèn)鏈路問(wèn)題。
部署經(jīng)驗(yàn):熟悉常見(jiàn)部署方式(源碼/包部署、Docker/Compose 等),了解服務(wù)啟動(dòng)、日志分析與穩(wěn)定性保障。
系統(tǒng)思維(認(rèn)知能力重點(diǎn)):
能把問(wèn)題從“現(xiàn)象 → 定位 → 解決 → 復(fù)盤 → 預(yù)防”跑完整閉環(huán)
具備風(fēng)險(xiǎn)意識(shí):發(fā)布前評(píng)估、故障后復(fù)盤、長(zhǎng)期可維護(hù)性
能把運(yùn)維工作沉淀為流程和標(biāo)準(zhǔn),而不是“救火式處理”
責(zé)任心與溝通協(xié)作:能與研發(fā)、測(cè)試、業(yè)務(wù)人員配合推進(jìn)問(wèn)題解決,具備較強(qiáng)執(zhí)行力與抗壓能力。
值班/應(yīng)急意識(shí):可接受必要的應(yīng)急響應(yīng),能快速恢復(fù)核心業(yè)務(wù)。
加分項(xiàng)(更優(yōu)先):
有政務(wù)云、等保、日志審計(jì)、堡壘機(jī) 等相關(guān)經(jīng)驗(yàn)
熟悉 CI/CD(Jenkins/GitLab CI/GitHub Actions) 與發(fā)布流水線
熟悉 K8s 或具備集群化運(yùn)維經(jīng)驗(yàn)
熟悉 Prometheus + Grafana / ELK 等監(jiān)控與日志體系
有大規(guī)模系統(tǒng)的穩(wěn)定性保障經(jīng)驗(yàn)(高并發(fā)、重點(diǎn)業(yè)務(wù)系統(tǒng))
職位福利:五險(xiǎn)一金、績(jī)效獎(jiǎng)金、通訊補(bǔ)助、帶薪年假、定期體檢