崗位職責
1. 負責公司系統(tǒng)的日常運維工作并量化相關指標,及時響應、定位、處理各類生產(chǎn)問題,要求:具備“7×24小時故障響應意識”,能承受突發(fā)問題處理壓力。
2. 負責網(wǎng)絡、服務器、數(shù)據(jù)庫系統(tǒng)的建設、運維和監(jiān)控,規(guī)劃、設計、完善運維流程,推動自動化建設,提高運維效率,降低運維成本;
3. 主動發(fā)現(xiàn)業(yè)務系統(tǒng)的問題和隱患,及時對系統(tǒng)功能優(yōu)化提出合理化建議,提高系統(tǒng)的健壯性;
4. 完善監(jiān)控體系,通過各類監(jiān)控自動化手段,確保系統(tǒng)的穩(wěn)定運行;
5. 負責測試、灰度、生產(chǎn)多套環(huán)境的搭建、部署和維護,配合研發(fā)、測試團隊進行應用部署;
6. 負責參與及推動CI/CD平臺開發(fā),推動及開發(fā)高效的自動化運維、管理工具,提升運維工作效率,提高研發(fā)效能;
7. 負責數(shù)據(jù)庫系統(tǒng)設計、實施、備份、容災、監(jiān)控、優(yōu)化及故障處理,保障各數(shù)據(jù)系統(tǒng)安全和高可用;
8. 負責各類運維文檔及相關工作技術文檔的撰寫工作,編制相關系統(tǒng)技術資料,推進運維工作標準化、規(guī)范化。;
9. 完成上級領導安排的其他任務工作。
任職要求:
工作經(jīng)驗:具備互聯(lián)網(wǎng)項目運維經(jīng)驗,具備物流平臺高并發(fā)場景運維經(jīng)驗,或熟悉OMAP/DMR等物流產(chǎn)品版本管理流程者優(yōu)先
專業(yè)要求:計算機、信息技術等相關專業(yè),持有AWS Certified SysOps Administrator、RHCE(紅帽認證工程師)等證書者優(yōu)先。
1. 熟悉華為云、阿里云、騰訊云等云平臺常見產(chǎn)品,有云上大規(guī)模、高并發(fā)業(yè)務維護經(jīng)驗,必須掌握阿里云產(chǎn)品/服務的環(huán)境和管理,具體一定網(wǎng)絡安全知識和網(wǎng)絡安全配置能力;
2. 熟悉網(wǎng)絡原理和TCP/IP協(xié)議,精通HTTP(S)協(xié)議,能抓包分析并快速定位故障原因,熟悉交換機、路由器、防火墻、WAF等軟硬件產(chǎn)品的參數(shù)配置及優(yōu)化,能對網(wǎng)絡故障快速定位,能追蹤相關協(xié)議包深層次分析解決問題。
3. 熟練編寫shell運維腳本、熟悉Linux(CentOS)、能熟練編寫linux系統(tǒng)命令,熟悉防火墻配置和網(wǎng)絡安全加固。
4. 熟悉Zabbix、prometheus、CAT、skywalking等監(jiān)控工具,持續(xù)集成jenkins+saltstack自動化部署工具;
5. 熟悉Nginx、ELK、redis、RocketMQ等的高可用架構,熟悉其部署及配置調優(yōu)。有分布式、大規(guī)模數(shù)據(jù)處理維護經(jīng)驗的優(yōu)先;
6. 熟悉容器云技術,深入了解微服務架構,有豐富的docker和k8s管理經(jīng)驗,有大規(guī)模k8s集群運維經(jīng)驗,能夠熟練部署和運維Kubernetes環(huán)境,能夠編寫常見應用的編排文件。
7. 具備良好的溝通能力和問題解決能力,可以接受早晚班及特殊時間段運維工作安排能夠有效地與同事、管理層和其他部門進行溝通和協(xié)作。
8. 悉MySQL、Postgres數(shù)據(jù)庫結構與原理、數(shù)據(jù)結構設計、性能調優(yōu)和日常故障解決方法;
9. 熟悉MySQL主從復制,讀寫分離、分庫分表設計;熟悉主流數(shù)據(jù)庫細粒度資源管理策略優(yōu)化,掌握數(shù)據(jù)備份與恢復方案;
10. 熟練使用Tidb集群、Redis集群、Elasticsearch集群 ,了解Doris、ClickHouse等數(shù)據(jù)庫優(yōu)先。
11. 熟悉數(shù)據(jù)庫安全?管理,包括權限控制、審計日志、數(shù)據(jù)加密(TLS/SSL)。