(此崗位為外包崗位)
崗位職責:
1.熟悉業(yè)界主流框架的部署與集成,完成在自研異構(gòu)芯片上的接入調(diào)試;
2.負責自研AI框架(含訓練/推理引擎)的架構(gòu)設計、核心模塊開發(fā)及性能調(diào)優(yōu);
3.熟悉分布式并行基礎(chǔ)原理,配合軟硬件進行分布式訓練推理策略的制定;
4.主導AI框架與自研芯片(GPU/NPU等)的軟硬件協(xié)同設計,通過編譯器優(yōu)化(如圖優(yōu)化、算子融合、內(nèi)存調(diào)度)提升計算效率。
崗位要求:
1.具備框架開發(fā)相關(guān)工作經(jīng)驗,從事過AI框架研發(fā)項目者優(yōu)先;
2.深入了解主流大模型知識以及分布式訓推技術(shù)((Megatron-LM、DeepSpeed));
3.了解AI編譯器技術(shù)棧(MLIR/LLVM),掌握圖優(yōu)化、算子融合、多面體優(yōu)化等編譯加速方法優(yōu)先;
4.有異構(gòu)芯片(GPU/NPU)開發(fā)經(jīng)驗:熟悉CUDA/OpenCL編程優(yōu)先;
5.有良好的學習能力、溝通能力和團隊合作能力,工作態(tài)度端。