1. 負(fù)責(zé)Linux系列操作系統(tǒng)(含Ubuntu、CentOS、RedHat等)服務(wù)器的部署、安裝、配置、初始化及日常運(yùn)維管理,保障服務(wù)器集群穩(wěn)定、高效運(yùn)行。
2. 承擔(dān)Ubuntu等系統(tǒng)環(huán)境下的應(yīng)用服務(wù)(如Nginx、Apache、MySQL、Redis、Docker等)的部署、配置、優(yōu)化及故障排查,確保業(yè)務(wù)應(yīng)用正常上線與持續(xù)運(yùn)行。
3. 制定并執(zhí)行服務(wù)器及系統(tǒng)的監(jiān)控策略,利用Zabbix、Prometheus、Grafana等監(jiān)控工具,實(shí)時(shí)監(jiān)控系統(tǒng)資源(CPU、內(nèi)存、磁盤、網(wǎng)絡(luò))、服務(wù)狀態(tài)及業(yè)務(wù)指標(biāo),及時(shí)發(fā)現(xiàn)并預(yù)警異常問題。
4. 負(fù)責(zé)Linux/Ubuntu系統(tǒng)及業(yè)務(wù)的備份與恢復(fù)方案設(shè)計(jì)、實(shí)施,定期執(zhí)行數(shù)據(jù)備份操作,驗(yàn)證備份有效性,確保在突發(fā)故障時(shí)能快速恢復(fù)數(shù)據(jù)與服務(wù)。
5. 開展系統(tǒng)安全防護(hù)工作,包括但不限于Ubuntu/Linux系統(tǒng)漏洞掃描與修復(fù)、防火墻規(guī)則配置、SSH安全加固、權(quán)限管理、病毒防護(hù)、入侵檢測(cè)等,保障服務(wù)器集群與業(yè)務(wù)數(shù)據(jù)的安全性。
6. 優(yōu)化Linux/Ubuntu系統(tǒng)性能,針對(duì)系統(tǒng)資源占用、網(wǎng)絡(luò)延遲、應(yīng)用響應(yīng)速度等問題進(jìn)行分析與調(diào)優(yōu),提升服務(wù)器集群的整體運(yùn)行效率;參與服務(wù)器硬件選型、資源擴(kuò)容規(guī)劃與實(shí)施。
7. 負(fù)責(zé)運(yùn)維自動(dòng)化腳本(Shell、Python等)的編寫與優(yōu)化,實(shí)現(xiàn)服務(wù)器批量管理、配置自動(dòng)化、故障自動(dòng)告警與初步處理等,提升運(yùn)維工作效率。
8. 處理日常運(yùn)維故障,包括系統(tǒng)宕機(jī)、服務(wù)異常、網(wǎng)絡(luò)故障、數(shù)據(jù)異常等,快速定位問題根源并實(shí)施解決方案;記錄故障處理過程,形成運(yùn)維知識(shí)庫。
9. 配合開發(fā)團(tuán)隊(duì)完成應(yīng)用上線、版本迭代、測(cè)試環(huán)境搭建等工作,提供Linux/Ubuntu系統(tǒng)層面的技術(shù)支持,協(xié)助解決開發(fā)過程中遇到的運(yùn)維相關(guān)問題。
10. 關(guān)注Linux及Ubuntu系統(tǒng)相關(guān)技術(shù)動(dòng)態(tài),學(xué)習(xí)前沿運(yùn)維技術(shù)(如容器化、云原生、K8s等),并結(jié)合實(shí)際業(yè)務(wù)場景推動(dòng)運(yùn)維架構(gòu)優(yōu)化與技術(shù)升級(jí)。
11. 編寫并完善運(yùn)維文檔,包括系統(tǒng)配置手冊(cè)、運(yùn)維操作手冊(cè)、故障處理手冊(cè)、應(yīng)急預(yù)案等,規(guī)范運(yùn)維工作流程。