崗位職責(zé):
1.設(shè)計、構(gòu)建與優(yōu)化符合公司策略的云平臺架構(gòu)與解決方案,確保應(yīng)用系統(tǒng)的高可用性、彈性伸縮能力、卓越性能、安全保障及成本效益;
2.負(fù)責(zé)公司私有云及外部主流公有云(如阿里云、Azure)平臺的管理、部署和日常運維;
3.負(fù)責(zé)基于Rancher的Kubernetes(K8S)平臺的核心技術(shù)管理,包括集群生命周期管理(部署、升級、擴縮容)、安全策略實施、監(jiān)控告警優(yōu)化、日常運維及故障排除;
4.負(fù)責(zé)制定并持續(xù)完善公司云平臺管理策略,推動其落地實施,并建立效果評估與反饋機制。
崗位任職要求:
1.本科及以上學(xué)歷,計算機科學(xué)與技術(shù)/軟件工程/信息與計算科學(xué)等相關(guān)專業(yè);
2.熟悉云原生應(yīng)用架構(gòu),精通容器編排技術(shù),熟練掌握Rancher等Kubernetes集群管理工具,熟悉服務(wù)網(wǎng)格(如Istio)。持有CKA認(rèn)證者優(yōu)先;
3.精通阿里云、Azure云等主流公有云平臺管理(IaaS/PaaS核心服務(wù))。持有阿里云ACP、微軟相關(guān)云認(rèn)證者優(yōu)先;
4.熟悉GPU資源的規(guī)劃、調(diào)度、監(jiān)控和優(yōu)化。具備大語言模型(LLM)等AI工作負(fù)載相關(guān)基礎(chǔ)設(shè)施的管理經(jīng)驗者優(yōu)先;
5.熟練掌握J(rèn)ava/Python/Go中至少一門主流編程語言,具備良好的自動化腳本編寫或平臺工具開發(fā)能力。具有開發(fā)Operator、CRD控制器或云原生相關(guān)工具,或具有Terraform等自動化開發(fā)經(jīng)驗者優(yōu)先;
6.熟悉Kafka、RabbitMQ等消息中間件的原理與應(yīng)用;
7.了解主流大數(shù)據(jù)處理與數(shù)據(jù)集成組件(如HDFS, Spark, Flink, FlinkCDC, Debezium等)的架構(gòu)與工作原理者優(yōu)先;
8.掌握操作系統(tǒng)(Linux為主)、計算機網(wǎng)絡(luò)(TCP/IP協(xié)議棧、路由交換基礎(chǔ)、防火墻)、分布式系統(tǒng)基礎(chǔ)及容器技術(shù)等核心計算機理論知識;
9.具備大學(xué)英語六級(CET-6)或以上水平,具備優(yōu)秀的英文技術(shù)文檔閱讀和編寫能力;
10.具備優(yōu)秀的溝通協(xié)調(diào)能力和團隊合作精神。