崗位職責(zé)
1. 參與容器云平臺開發(fā)與維護,參與可觀測性體系建設(shè),負責(zé)指標(biāo)、日志系統(tǒng)開發(fā)與維護,提升采集與查詢效率。
2. 保障Kubernetes集群的穩(wěn)定性,包括容量管理、巡檢、性能優(yōu)化和資源治理;參與容器云內(nèi)業(yè)務(wù)負載上線、故障定位與問題解決,推動自動化與可靠性改進。
3. 保障網(wǎng)關(guān)組件的穩(wěn)定性,優(yōu)化流量策略管理,推進全鏈路追蹤、灰度發(fā)布和流量觀測能力建設(shè)。
4. 參與7x24小時告警響應(yīng)體系,處理線上突發(fā)問題,推進問題復(fù)盤,推動根因修復(fù)和穩(wěn)定性提升。
崗位要求
1. 熟練掌握Golang,有容器云相關(guān)開發(fā)經(jīng)驗。
2. 掌握容器技術(shù)和Kubernetes,深入理解K8s核心原理及其生態(tài),有K8s集群運維管理經(jīng)驗。
3. 熟悉可觀測性技術(shù)棧,包括Prometheus、Alertmanager、Grafana、阿里云SLS、華為云LTS、ELK等;能基于此進行二次開發(fā)。
4. 理解服務(wù)網(wǎng)關(guān)和流量治理,熟悉 APISIX、Envoy 或 Nginx的路由、限流、熔斷、鑒權(quán)等能力;能基于此進行二次開發(fā)。
5. 具備線上問題定位與處理經(jīng)驗,能高效處理K8s與網(wǎng)關(guān)故障;能接受 On-call。