【崗位職責】
1. 深度理解業(yè)務用戶算力使用場景,分析算力需求并設計可落地的技術方案,涵蓋硬件選型、資源分配策略,平衡性能、安全性與預算約束。
2. 提供人工智能基礎服務(含算力、人工智能平臺、模型等)技術咨詢與培訓,協(xié)助用戶優(yōu)化適配硬件架構。
3. 主導智算中心硬件基礎設施優(yōu)化及迭代升級,包括服務器集群、存儲系統(tǒng)、網(wǎng)絡架構及異構計算資源(GPU/FPGA等)的選型與調(diào)優(yōu)。制定硬件資源全生命周期管理策略,監(jiān)控算力負載、能耗效率及系統(tǒng)穩(wěn)定性,建立容災與高可用性方案。
【任職條件】
1.計算機科學、電子工程、高性能計算相關專業(yè)優(yōu)先。
2.5年以上智算、云計算或相關領域的工作經(jīng)驗,其中3年以上項目管理或解決方案設計經(jīng)驗,有大型智算中心設計及實施經(jīng)驗優(yōu)先。
3.精通異構計算架構(NVIDIA/AMD GPU、昇騰/寒武紀AI芯片等),具備智算中心或大型IDC建設案例。
4.熟悉InfiniBand/RoCE高速網(wǎng)絡拓撲設計,掌握分布式存儲性能調(diào)優(yōu)方法。
5.出色的跨部門協(xié)調(diào)能力,可以快速理解用戶需求,并具備出色的可落地算力方案設計能力。
6.曾參與過國產(chǎn)化硬件替代項目者優(yōu)先。
7.持有OCP/AWS/華為HCIE認證者優(yōu)先。