崗位職責(zé)?
1.負(fù)責(zé)監(jiān)控平臺的搭建、部署與迭代優(yōu)化,涵蓋監(jiān)控指標(biāo)設(shè)計(jì)、數(shù)據(jù)采集鏈路構(gòu)建及可視化看板開發(fā)。?
2.開發(fā)自動化腳本(Shell/Python 等),實(shí)現(xiàn)服務(wù)器、應(yīng)用、數(shù)據(jù)庫等核心資源的指標(biāo)采集、日志清洗與異常檢測。?
3.深度分析監(jiān)控?cái)?shù)據(jù),挖掘系統(tǒng)性能瓶頸與潛在風(fēng)險(xiǎn),輸出分析報(bào)告并推動優(yōu)化落地。?
4.設(shè)計(jì)優(yōu)化告警規(guī)則,提升告警準(zhǔn)確性與及時(shí)性,降低誤報(bào)率以保障系統(tǒng)穩(wěn)定。?
5.承擔(dān)監(jiān)控平臺日常維護(hù)、故障排查與性能調(diào)優(yōu),確保平臺高效穩(wěn)定運(yùn)行。?
6.協(xié)作業(yè)務(wù)團(tuán)隊(duì)梳理核心監(jiān)控指標(biāo),輸出貼合業(yè)務(wù)需求的監(jiān)控方案。
任職要求?
1. 計(jì)算機(jī)相關(guān)專業(yè),2 年以上后臺研發(fā)或監(jiān)控平臺搭建經(jīng)驗(yàn)。?
2. 熟練掌握 Python/Shell 腳本開發(fā),能獨(dú)立完成數(shù)據(jù)采集、清洗與分析類腳本開發(fā)。?
3. 了解時(shí)序數(shù)據(jù)庫(如 InfluxDB)原理與使用,能處理監(jiān)控?cái)?shù)據(jù)存儲及查詢問題。?
4. 扎實(shí)掌握 Linux 操作、TCP/IP 網(wǎng)絡(luò)及進(jìn)程管理,能獨(dú)立排查系統(tǒng) / 應(yīng)用故障。?
5. 具備數(shù)據(jù)分析思維,能從監(jiān)控?cái)?shù)據(jù)提煉問題并輸出可落地優(yōu)化建議。?
6. 良好溝通協(xié)作能力,能推動跨團(tuán)隊(duì)協(xié)作;強(qiáng)問題解決與學(xué)習(xí)能力,對技術(shù)有鉆研精神。