一、崗位職責(zé): 1.在公司AI系統(tǒng)解決方案制定、售前支持和項(xiàng)目落地中起到關(guān)鍵技術(shù)帶頭作用; 2.系統(tǒng)架構(gòu)設(shè)計(jì):主導(dǎo)智算集群(GPU/TPU/NPU異構(gòu)計(jì)算)的系統(tǒng)架構(gòu)規(guī)劃,設(shè)計(jì)高吞吐、低延遲的計(jì)算與存儲(chǔ)方案,支持大規(guī)模模型訓(xùn)練與推理場(chǎng)景。 3.性能深度優(yōu)化:從硬件(芯片互聯(lián)、內(nèi)存帶寬)、框架(PyTorch/TensorFlow)、算法(模型并行策略)全棧協(xié)同優(yōu)化,提升算力利用率(MFU)與能效比。 4.異構(gòu)計(jì)算生態(tài)整合:對(duì)接芯片廠商(如NVIDIA、華為昇騰等),完成驅(qū)動(dòng)、固件、計(jì)算庫(kù)(CUDA/MindSpore)的適配與調(diào)優(yōu),解決跨平臺(tái)兼容性問題。 5.技術(shù)前瞻與落地:跟蹤AI芯片(如存算一體、光計(jì)算)、液冷技術(shù)等前沿方向,推動(dòng)創(chuàng)新技術(shù)在智算中心的工程化落。 二、任職要求 1.學(xué)歷與專業(yè):計(jì)算機(jī)科學(xué)、電子工程、應(yīng)用數(shù)學(xué)等相關(guān)專業(yè)博士。 2.核心能力 l 精通異構(gòu)計(jì)算架構(gòu)(GPU/TPU/FPGA),熟悉NVLink、RoCE、InfiniBand等高速互聯(lián)技術(shù)。 l 深入理解深度學(xué)習(xí)訓(xùn)練/推理流程,具備PyTorch/TensorFlow框架底層優(yōu)化經(jīng)驗(yàn)(如算子融合、顯存優(yōu)化)。 l 掌握C++/Python,熟悉Linux內(nèi)核機(jī)制,能通過perf、Nsight等工具分析系統(tǒng)瓶頸。 l 了解分布式訓(xùn)練框架(DeepSpeed、Megatron-LM)。 3.軟技能: l 具備技術(shù)領(lǐng)導(dǎo)力,能統(tǒng)籌硬件、算法、運(yùn)維團(tuán)隊(duì)協(xié)同,輸出高質(zhì)量技術(shù)方案與專利。 三、加分項(xiàng) l 具備高性能計(jì)算(HPC)或AI系統(tǒng)研發(fā)經(jīng)驗(yàn),有智算中心、云廠商AI平臺(tái)建設(shè)經(jīng)驗(yàn)者優(yōu)先。 l 有AI芯片(如NVIDIA H100/H200、華為昇騰910B、沐曦、寒武紀(jì)、天數(shù)智芯、的適配與優(yōu)化能力)底層驅(qū)動(dòng)或固件開發(fā)經(jīng)驗(yàn)。 l 熟悉液冷系統(tǒng)設(shè)計(jì)、綠色數(shù)據(jù)中心能效優(yōu)化方案。 l 有千億參數(shù)模型訓(xùn)練優(yōu)化經(jīng)驗(yàn)者優(yōu)先。