国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 12月3日

政企技術經理主辦

2.5-5萬·14薪
  • 杭州拱墅區(qū)
  • 5-10年
  • 碩士
  • 全職
  • 招1人

職位描述

云計算/大數據通信/網絡設備
(一)崗位職責
1、硬件部署與集成:基于售前頂層設計方案與項目合同,主導制定行業(yè)領先的交付實施計劃(含風險預判模型與資源最優(yōu)配置方案)。牽頭超大規(guī)模智算中心(萬卡級)基礎設施部署與集成,獨立統(tǒng)籌算力集群、高速 RDMA 網絡、全閃存存儲系統(tǒng)、高密度制冷與冗余供電等核心設施的現(xiàn)場實施,主導跨廠商硬件兼容性測試、系統(tǒng)聯(lián)調與集成驗證。
2、軟件配置與優(yōu)化:負責定制化智算平臺軟件與調度系統(tǒng)的架構搭建、部署配置,主導完成操作系統(tǒng)內核優(yōu)化、容器平臺(K8s)高可用集群搭建、高性能作業(yè)調度系統(tǒng)(如 Slurm/LSF)定制開發(fā)、分布式存儲(如 Ceph)性能調優(yōu)、AI 框架(TensorFlow/PyTorch)適配優(yōu)化。
3、性能調優(yōu)與穩(wěn)定性保障:構建智算系統(tǒng)全維度性能測試體系(含算力、網絡帶寬 / 延遲、存儲 IOPS / 吞吐量等核心指標),運用專業(yè)工具(如 Perf、NVIDIA DCGM)進行深度瓶頸分析,主導制定并落地針對性調優(yōu)方案(如 GPU 集群通信優(yōu)化、存儲分級緩存策略調整),確保系統(tǒng)性能超越設計指標 10%-15% ,且 7×24 小時穩(wěn)定運行率達 99.99%。
4、問題解決與協(xié)調:作為技術核心,快速響應并牽頭解決部署、聯(lián)調及試運行階段的重大技術難題(如跨架構硬件兼容性故障、大規(guī)模集群網絡擁塞、軟件棧深度適配問題),統(tǒng)籌協(xié)調內外部頂級技術資源(如廠商專家、高??蒲袌F隊)進行根因分析。
5、項目交付支撐:主導構建標準化交付文檔體系,輸出具備行業(yè)參考價值的實施計劃、部署圖紙、配置清單、測試報告(含性能對比分析)、運維手冊(含故障應急響應流程)及培訓資料,牽頭完成客戶運維團隊的體系化技術培訓。
(二)任職要求
1、教育背景:985碩士研究生及以上學歷優(yōu)先,通信工程、電子信息工程、計算機科學與技術、軟件工程等相關專業(yè)。
2、工作經驗:具備智算中心、超算中心或大型數據中心項目交付、系統(tǒng)集成實際操作經驗。主導過至少1 個從零到一建設的萬卡級及以上智算集群交付項目(需含 GPU/NPU 混合架構),具備萬卡級集群大模型訓練,微調,推理的參數面優(yōu)化經驗。有國家級 / 省級重點智算項目(如政務智算中心、AI 大模型訓練集群)核心交付經驗者優(yōu)先。具備互聯(lián)網大廠工作經驗優(yōu)先。
3、網絡技術:精通數通網絡理論與實踐,深入掌握 TCP/IP、HTTP、RoCEv2、IB 等協(xié)議原理及優(yōu)化方案,能獨立完成超大規(guī)模智算中心網絡架構(含 Spine-Leaf 拓撲、RDMA 網絡)的規(guī)劃與設計;熟練使用 Python/Ansible 編寫數據中心級交換機自動化部署腳本,具備萬兆 / 四十萬兆網絡獨立調試、全網聯(lián)合調試及故障定位能力,曾主導解決過大規(guī)模集群網絡擁塞、延遲超標等核心問題。
4、硬件知識:精通 X86/ARM 架構服務器(如華為 TaiShan、浪潮 NF 系列)、SAN 存儲(如 EMC VMAX)、分布式存儲(如 Ceph、GlusterFS)技術原理與部署優(yōu)化;深入掌握主流算力廠商(NVIDIA、華為昇騰、寒武紀)GPU/NPU 產品技術細節(jié)(如算力卡型號差異、集群互聯(lián)方案),能獨立評估并選型適配不同業(yè)務場景的硬件解決方案,曾主導過跨廠商硬件混合部署的技術攻堅。
5、軟件與平臺:精通 Windows Server、Linux Server(CentOS/Ubuntu/RedHat)系統(tǒng)運維與內核優(yōu)化;熟練使用 Shell/Python(需具備至少 1 個自主開發(fā)的運維工具或自動化腳本項目經驗)。精通 OpenStack 云平臺(含 Nova、Neutron、Cinder 模塊)、Docker/K8s 容器技術的部署、調優(yōu)與故障排查,熟悉大模型訓練推理的分布式計算框架,具備大規(guī)模容器集群(千節(jié)點級)運維經驗。熟悉 AI 框架(TensorFlow/PyTorch/MindSpore)部署與優(yōu)化,有 AI 訓練任務調度效率提升項目經驗者優(yōu)先。
6、認證證書:持有HCIE-Data Center/Cloud/Storage、CCIE Data Center 、RHCE/RHCA、NVIDIA DCAT 等專業(yè)認證優(yōu)先;有云計算、AI 算力相關專利或核心技術論文(第一作者)者優(yōu)先。

工作地點

杭州拱墅區(qū)浙江移動數智科技有限公司

職位發(fā)布者

馬先生/招聘管理

昨日活躍
立即溝通
公司Logo浙江移動數智科技有限公司
浙江移動DICT中心/浙江移動數智科技有限公司,采用一套人馬兩塊牌子(對內是DICT中心,對外是浙移數科),專注于行業(yè)研究和產業(yè)洞察、數智化端到端解決方案、行業(yè)項目全流程交付管理、自主核心能力建設等。浙移數科是浙江移動全資子公司,負責全省DICT市場服務能力整合、集成、運營,迄今累計承接項目超320億元,管理信息化項目20000余個。部門專注于AI+DICT一體化項目集成、產品研發(fā)、平臺運營、云網技術,主營業(yè)務遍及黨政、軍警司法、住建、農業(yè)文宣、連鎖商業(yè)、交通、制造、能源、銀行、證券保險、教育、醫(yī)衛(wèi)、互聯(lián)網等十五大行業(yè)領域。部門近年來緊跟產業(yè)發(fā)展持續(xù)深化能力建設,初步形成“6+N”自主能力矩陣,即6大通用能力:大專網、大數據、大算力、大智能、大安全、大視頻,N個專項能力:低空經濟、車路云、中小企業(yè)數字化、園區(qū)社區(qū)等。目前正加快發(fā)力低空經濟、車路云、數據要素市場化等新賽道,緊密跟蹤人形機器人、量子科技等前沿領域?,F(xiàn)有專家隊伍規(guī)模超1000人,擁有行業(yè)領先的專業(yè)資質認證87項,積累各類知識產權近200項。部門下設解決方案、交付管理、售后服務、智慧城市、數智工業(yè)、平臺運營、算力網絡、視頻安全、數據產品研發(fā)和運營等16個部室,先后與華為、阿里、??档阮^部企業(yè)及之江實驗室、北大信研院、清華長三角研究院等頂尖研究院所建立了深入的合作關系,對助力浙江建設兩個先行示范區(qū)、賦能區(qū)域經濟發(fā)展、服務社會民生發(fā)揮了重要作用,先后獲評浙江省服務業(yè)百強企業(yè)、十大領軍型浙江數商、省級數字化服務商、杭州市鯤鵬企業(yè)等榮譽。
公司主頁