一、職位概述
我們正在尋找一位兼具開發(fā)能力與運維能力的 運維開發(fā)工程師(DevOps)。你將參與公司關(guān)鍵業(yè)務(wù)系統(tǒng)的建設(shè)、優(yōu)化與穩(wěn)定性保障,深入?yún)⑴c Kubernetes、Linux、Java 服務(wù)以及自動化運維工具鏈的整體生命周期。
崗位職責運維方向
- 負責本地自建 Kubernetes 集群運維與管理,包括應(yīng)用部署、升級、擴縮容及故障處理
- 負責本地和阿里云 Linux 服務(wù)器運維,執(zhí)行日常巡檢、性能優(yōu)化、安全加固等工作
- 搭建、維護并持續(xù)優(yōu)化 GitLab CICD 流水線
- 建設(shè)與維護企業(yè)級 全鏈路可觀測體系(監(jiān)控、日志、鏈路追蹤)
- 確保核心系統(tǒng)的可用性,執(zhí)行 備份恢復(fù)、災(zāi)備演練 等穩(wěn)定性保障工作
- 參與工廠應(yīng)用體系的建設(shè)、部署與維護
二、開發(fā)方向
- 使用 Python 編寫自動化腳本、運維工具,持續(xù)提升運維效率與標準化水平
- 使用 Java 參與公司 Java 項目研發(fā),參與服務(wù)功能實現(xiàn)與技術(shù)優(yōu)化
- 負責 Java 服務(wù)的故障排查與性能分析:日志分析、線程分析、GC 排查等
- 參與平臺類系統(tǒng)的開發(fā)、接口整合與數(shù)據(jù)處理
- 編寫技術(shù)文檔、運維規(guī)范、部署說明等技術(shù)資料
三、任職要求必備條件
- 熟練掌握 Python,能使用 Python 編寫運維工具或完成數(shù)據(jù)自動化處理任務(wù)
- 熟練掌握 Java, **熟悉 Java 開發(fā)生態(tài)與工具鏈
- 具備 Java 服務(wù)故障排查能力:能通過日志、JVM 指標、線程、GC 等定位問題
- 熟練使用 Linux,能獨立進行系統(tǒng)運維、資源分析與問題診斷
- 熟悉 Kubernetes,了解其架構(gòu)、常用資源對象、部署方式和故障排查處理方法
四、優(yōu)先條件(加分項)
- 有 CICD 實施經(jīng)驗(Jenkins / GitLab CI 等)
- 熟悉 Prometheus / Grafana / Loki / ELK / SkyWalking / Jaeger 等監(jiān)控告警或可觀測工具
- 了解 Harbor、Helm、ArgoCD、Flux 等云原生工具鏈
- 有數(shù)據(jù)庫、應(yīng)用或集群 備份恢復(fù) 實施經(jīng)驗
- 有工業(yè)工廠 MES/SCADA/IoT 系統(tǒng)運維經(jīng)驗
- 有時序數(shù)據(jù)庫如Influxdb部署和運維經(jīng)驗
- 有 SRE、DevOps、自動化運維體系建設(shè)相關(guān)經(jīng)驗
五、我們希望你是這樣的人
- 具備系統(tǒng)思維與扎實的技術(shù)基礎(chǔ),能獨立解決問題
- 重視協(xié)作溝通,能夠在跨團隊中推動問題閉環(huán)
- 對穩(wěn)定性、自動化、可觀測性有強烈追求
- 樂于學(xué)習(xí)新技術(shù),愿意在云原生和工業(yè)數(shù)字化場景中持續(xù)成長