1.專業(yè)背景:計(jì)算機(jī)科學(xué)與技術(shù)、網(wǎng)絡(luò)工程、軟件工程、信息安全等相關(guān)專業(yè)。
2.學(xué)歷與工作年限:博士2年及以上相關(guān)工作經(jīng)驗(yàn);碩士:3年及以上相關(guān)工作經(jīng)驗(yàn);本科5年及以上相關(guān)工作經(jīng)驗(yàn)。
3.政治面貌:不限
4.(執(zhí))業(yè)資格/專業(yè)證書:具有VCAP認(rèn)證或云計(jì)算廠商云架構(gòu)工程師認(rèn)證證書、具備網(wǎng)絡(luò)工程師認(rèn)證證書、CISP或其它安全廠商工程師認(rèn)證證書。
5.工作經(jīng)歷:5年以上云運(yùn)維工作經(jīng)驗(yàn),具備獨(dú)立處理復(fù)雜云平臺(tái)故障的能力,有大型云項(xiàng)目運(yùn)維經(jīng)驗(yàn)者優(yōu)先。
6.專業(yè)知識(shí):熟悉主流云計(jì)算平臺(tái)(如阿里云、騰訊云、華為云等)的產(chǎn)品架構(gòu)、服務(wù)組件和使用方法,具備云資源配置和管理能力;掌握網(wǎng)絡(luò)原理、操作系統(tǒng)(Linux/Windows)、數(shù)據(jù)庫(kù)(MySQL、Oracle等)、中間件等相關(guān)知識(shí),具備系統(tǒng)部署、監(jiān)控和維護(hù)技能。?熟練使用常用的運(yùn)維工具(如 Prometheus、Grafana、Ansible等)和腳本語(yǔ)言(Python、Shell),能夠進(jìn)行自動(dòng)化運(yùn)維操作?;了解云安全相關(guān)技術(shù)和標(biāo)準(zhǔn),具備安全風(fēng)險(xiǎn)評(píng)估和防護(hù)能力。?
7.技能要求:掌握各類辦公軟件、分析模型或管理軟使用技巧;具備較好溝通能力,表述準(zhǔn)確,重點(diǎn)突出,注意傾聽(tīng);熟悉各類公文基礎(chǔ)寫作方法與要求,能夠在指導(dǎo)下完成公文撰寫工作。具備較強(qiáng)的英語(yǔ)讀寫能力,能夠閱讀英文技術(shù)文檔和資料。
8.能力素質(zhì):工作認(rèn)真負(fù)責(zé),具備較強(qiáng)的責(zé)任心和嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,能夠承受較大工作壓力,適應(yīng)7×24小時(shí)輪班或應(yīng)急響應(yīng)工作模式;良好的溝通能力和團(tuán)隊(duì)協(xié)作精神,能夠與開(kāi)發(fā)團(tuán)隊(duì)、業(yè)務(wù)部門及外部供應(yīng)商有效溝通,協(xié)同解決問(wèn)題;較強(qiáng)的學(xué)習(xí)能力和創(chuàng)新意識(shí),能夠快速掌握新的云計(jì)算技術(shù)和運(yùn)維工具,適應(yīng)技術(shù)發(fā)展變化;具有良好團(tuán)隊(duì)領(lǐng)導(dǎo)能力,帶領(lǐng)團(tuán)隊(duì)開(kāi)拓進(jìn)取。
崗位職責(zé):
1.云資源管理與配置:負(fù)責(zé)企業(yè)云資源(如計(jì)算資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源等)的規(guī)劃、分配與管理,根據(jù)業(yè)務(wù)需求合理調(diào)整資源配置,保障資源高效利用。?負(fù)責(zé)保管云平臺(tái)超級(jí)用戶管理員賬號(hào)及密碼。負(fù)責(zé)云平臺(tái)的軟件版本升級(jí)工作,負(fù)責(zé)云平臺(tái)集群的擴(kuò)容或縮減工作。負(fù)責(zé)與云安全平臺(tái)、等保、密評(píng)、商密技術(shù)工作的對(duì)接。負(fù)責(zé)判斷云用戶業(yè)務(wù)的增長(zhǎng)量,及時(shí)做好云平臺(tái)擴(kuò)容預(yù)案。負(fù)責(zé)執(zhí)行云資源的創(chuàng)建、變更和釋放操作,確保操作準(zhǔn)確無(wú)誤,維護(hù)云資源清單,實(shí)時(shí)更新資源使用狀態(tài)。?負(fù)責(zé)與云服務(wù)提供商(如阿里云、騰訊云、華為云等)保持溝通,及時(shí)了解云產(chǎn)品更新動(dòng)態(tài),評(píng)估新功能對(duì)企業(yè)業(yè)務(wù)的適用性,適時(shí)引入并配置新資源。
2.云平臺(tái)監(jiān)控與維護(hù):負(fù)責(zé)云平臺(tái)整體健康檢查,負(fù)責(zé)檢查云平臺(tái)因功能及性能或物理資源占有量問(wèn)題可能導(dǎo)致的云用戶使用出現(xiàn)的問(wèn)題,并及時(shí)向用戶運(yùn)維人員通知和向上級(jí)匯報(bào),并及時(shí)形成解決方案。負(fù)責(zé)云平臺(tái)的故障排除,負(fù)責(zé)因硬件故障導(dǎo)致云平臺(tái)故障或不穩(wěn)定情況,及時(shí)通知用戶運(yùn)維人員,并向數(shù)據(jù)中心運(yùn)維人員及時(shí)通知,協(xié)助數(shù)據(jù)中心運(yùn)維人員判斷硬件故障。負(fù)責(zé)每日云平臺(tái)的健康巡檢工作,每周、月出具巡檢報(bào)告。負(fù)責(zé)執(zhí)行云平臺(tái)的日常維護(hù)任務(wù),包括系統(tǒng)升級(jí)、軟件安裝與配置、數(shù)據(jù)備份等,保障系統(tǒng)穩(wěn)定運(yùn)行。
3.故障診斷與處理:接到云平臺(tái)故障告警或用戶反饋后,迅速響應(yīng),運(yùn)用專業(yè)工具和技術(shù)手段進(jìn)行故障定位與分析,制定解決方案,確保故障及時(shí)修復(fù)。?對(duì)于重大故障,及時(shí)向上級(jí)匯報(bào),協(xié)調(diào)相關(guān)資源(如開(kāi)發(fā)團(tuán)隊(duì)、云服務(wù)提供商技術(shù)支持)共同解決問(wèn)題,記錄故障處理過(guò)程和結(jié)果,形成故障案例文檔,每月至少提交1份故障分析報(bào)告。?總結(jié)故障發(fā)生原因和處理經(jīng)驗(yàn),提出預(yù)防措施和改進(jìn)建議,避免同類故障再次發(fā)生,推動(dòng)云平臺(tái)穩(wěn)定性提升。
4.性能優(yōu)化與成本控制:負(fù)責(zé)分析云平臺(tái)性能數(shù)據(jù),識(shí)別性能瓶頸,提出優(yōu)化方案(如調(diào)整資源配置、優(yōu)化網(wǎng)絡(luò)架構(gòu)、改進(jìn)應(yīng)用程序等),提升云平臺(tái)運(yùn)行效率。?負(fù)責(zé)監(jiān)控云資源使用成本,分析費(fèi)用構(gòu)成,制定成本優(yōu)化策略(如合理選擇云服務(wù)套餐、優(yōu)化資源使用時(shí)長(zhǎng)等),實(shí)現(xiàn)云服務(wù)成本可控。?定期向管理層匯報(bào)云平臺(tái)性能和成本情況,提供數(shù)據(jù)支持和決策建議。
5.文檔管理與知識(shí)沉淀:編寫和維護(hù)云運(yùn)維相關(guān)文檔,包括操作手冊(cè)、應(yīng)急預(yù)案、配置文檔等,確保文檔內(nèi)容準(zhǔn)確、完整、及時(shí)更新。?組織內(nèi)部技術(shù)分享和培訓(xùn)活動(dòng),將云運(yùn)維經(jīng)驗(yàn)和技術(shù)知識(shí)傳遞給團(tuán)隊(duì)成員,提升團(tuán)隊(duì)整體技術(shù)水平,每年至少組織4次技術(shù)分享活動(dòng)。
6.其他:做好與公司其他部門的溝通協(xié)調(diào)和業(yè)務(wù)銜接工作;完成公司和部門領(lǐng)導(dǎo)交辦的其他工作。
下屬人數(shù):?16人