崗位職責:
負責SRE團隊技術方向制定和團隊管理,推動穩(wěn)定性工程最佳實踐落地
設計和優(yōu)化多云環(huán)境下的系統(tǒng)架構穩(wěn)定性,制定SLI/SLO體系和錯誤預算管理
主導重大故障應急響應,建立故障處理流程和應急預案
負責容災體系設計和災難恢復演練,確保業(yè)務連續(xù)性
推動跨團隊協(xié)作,建立SRE文化和穩(wěn)定性意識
任職要求:
本科及以上學歷,計算機相關專業(yè),5年以上大型互聯(lián)網(wǎng)公司SRE/DevOps經(jīng)驗
精通多云架構設計(AWS、阿里云、GCP、OCI),具備大規(guī)模分布式系統(tǒng)穩(wěn)定性治理經(jīng)驗
熟悉Kubernetes、Docker、服務網(wǎng)格等云原生技術棧
具備優(yōu)秀的架構設計能力和容災規(guī)劃經(jīng)驗
優(yōu)秀的團隊管理和跨部門協(xié)作能力
英語讀寫能力良好,能閱讀英文技術文檔
Onsite易點天下,外企七險一金,15天年假,試用期100%薪資