崗位職責: l 負責云運維監(jiān)控、devops落地、云原生部署維護及運維平臺二次開發(fā); l 負責各公有云上應(yīng)用系統(tǒng)運行軟件的安裝、配置、優(yōu)化與維護、故障處理、數(shù)據(jù)備份、日志分析等; l 負責辦公桌面運維工作,負責日常window和macbook的配置,各分支機構(gòu)網(wǎng)關(guān)、防火墻、vpn設(shè)備的管理; l 各類故障及事務(wù)的應(yīng)急響應(yīng)、處理,協(xié)調(diào),保證平臺正常運行; 任職要求: l 精通阿里云云效(或者:騰訊TAPD、PingCode等)產(chǎn)品,熟悉研發(fā)全生命周期的項目管理、熟悉敏捷開發(fā)全流程配置管理、支持混合云環(huán)境的devops和多分支測試環(huán)境落地、以及其它諸如:工單、缺陷跟蹤、工時管理、項目管理、效能分析和報告等需求; l 能獨立搭建和維護監(jiān)控系統(tǒng)(Prometheus、cloudwatch、alertmanager、prometheusalert和watchalert等),結(jié)合可視化工具(Grafana)實時分析系統(tǒng)指標。熟悉prometheus的rules、grafana的rules、dashboard編輯,能根據(jù)應(yīng)用需要建立監(jiān)控、告警和可視化統(tǒng)一平臺 l 了解opentelmetry,metrics、log和trace,集成智能可觀測性平臺,實現(xiàn)多源數(shù)據(jù)關(guān)聯(lián)分析與自動化故障處理。 l 熟練掌握aws cloudwatch、阿里云云監(jiān)控的配置和管理,并能夠融合自建和云監(jiān)控混合管理。 l 熟悉linux,熟練配置Nginx、Redis、kafka、mongodb等應(yīng)用相關(guān)軟件的部署、配置與優(yōu)化維護; l 熟悉amazon和aliyun等公有云產(chǎn)品,包括不限于vpc\ec2\rds\eks\mfk\analyticdb\dataworks\maxcompute\glue等產(chǎn)品 l 熟悉網(wǎng)絡(luò)基礎(chǔ)知識、熟悉TCP/IP的工作原理,快速分析網(wǎng)絡(luò)信息,熟悉主流交換機和路由器的維護 l 熟悉shell/python/go中的一種,具備項目開發(fā)經(jīng)驗更優(yōu)