崗位職責(zé):
1、架構(gòu)設(shè)計(jì):負(fù)責(zé)智算測(cè)試與適配優(yōu)化平臺(tái)的整體技術(shù)架構(gòu)設(shè)計(jì),確保系統(tǒng)能夠兼容昇騰 (Ascend 910B) 、百度昆侖芯、阿里PPU等異構(gòu)芯片架構(gòu)。
任職要求:
1.主流GPU架構(gòu)精通:深入理解 GPU/NPU 硬件架構(gòu),熟悉通用芯片及國(guó)內(nèi)主流 AI 芯片架構(gòu)(如昇騰 (Ascend 910B) 、百度昆侖芯、阿里PPU等);
2.底層通信協(xié)議: 具備分布式訓(xùn)練或多卡推理場(chǎng)景下的集合通信優(yōu)化經(jīng)驗(yàn),能夠分析網(wǎng)絡(luò)帶寬與計(jì)算重疊導(dǎo)致的瓶頸;
3.算子管理: 能夠指導(dǎo)高性能算子的全生命周期管理,包括算子的版本控制、兼容性管理;
AI模型工程與性能分析
1.主流模型框架:熟練掌握 DeepSeek、Qwen、ChatGLM、Llama等大模型的部署與調(diào)試;
2.推理優(yōu)化工具:深入理解并能集成 vllm-benchmark、Alsbench等自動(dòng)化基準(zhǔn)測(cè)試工具;
3.精度與性能平衡:具備性能差距自動(dòng)化分析能力,能夠在保證模型精度的前提下,通過 Profiler 等工具進(jìn)行全棧性能數(shù)據(jù)采集與函數(shù)調(diào)用分析;
4.具備智算中心、AI 開發(fā)平臺(tái)(AIH)或高性能計(jì)算相關(guān)項(xiàng)目的架構(gòu)設(shè)計(jì)經(jīng)驗(yàn)優(yōu)先。