崗位職責(zé):
1.AI平臺(tái)架構(gòu)設(shè)計(jì)
a.主導(dǎo)企業(yè)級(jí)AI訓(xùn)練/推理軟件平臺(tái)的全棧架構(gòu)設(shè)計(jì),支持多模態(tài)大模型的云邊端高效部署
b.開(kāi)發(fā)分布式訓(xùn)練框架與推理服務(wù)中間件,實(shí)現(xiàn)計(jì)算資源動(dòng)態(tài)調(diào)度與性能瓶頸突破
c.構(gòu)建從數(shù)據(jù)預(yù)處理到模型服務(wù)的端到端自動(dòng)化流水線
2.加速器深度優(yōu)化
a.針對(duì)GPU/NPU/ASIC等異構(gòu)計(jì)算設(shè)備,設(shè)計(jì)算子級(jí)優(yōu)化方案(如Tensor Core適配、內(nèi)存訪問(wèn)優(yōu)化)
b.實(shí)現(xiàn)編譯時(shí)優(yōu)化與運(yùn)行時(shí)優(yōu)化的協(xié)同加速
c.開(kāi)發(fā)硬件感知的混合精度訓(xùn)練策略,平衡計(jì)算效率與模型精度
3.系統(tǒng)性能工程
a.建立多維度性能評(píng)估體系(吞吐量、延遲、能耗比),主導(dǎo)Profiling驅(qū)動(dòng)的持續(xù)優(yōu)化
b.解決跨節(jié)點(diǎn)通信瓶頸、內(nèi)存碎片化等分布式系統(tǒng)級(jí)挑戰(zhàn)
c.設(shè)計(jì)容錯(cuò)機(jī)制與彈性訓(xùn)練方案保障系統(tǒng)穩(wěn)定性
d.對(duì)模型量化過(guò)程中出現(xiàn)的量化損失掉點(diǎn)過(guò)大問(wèn)題,進(jìn)行問(wèn)題定位排查。
任職要求:
1. 5年以上AI系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn),主導(dǎo)過(guò)至少1個(gè)大規(guī)模AI平臺(tái)項(xiàng)目
2.熟悉ARM SVE,RVV,CUDA,ROCm,OpenCL等,有編譯器優(yōu)化或芯片級(jí)調(diào)優(yōu)經(jīng)驗(yàn)者優(yōu)先
3.發(fā)表過(guò)第一作者CCF-A類或中科院SCI 1區(qū)論文
4.具備技術(shù)路線規(guī)劃能力,能平衡短期落地與長(zhǎng)期技術(shù)演進(jìn)。
5.跨團(tuán)隊(duì)協(xié)作經(jīng)驗(yàn)(算法/嵌入式/運(yùn)維團(tuán)隊(duì))
6.熟悉常見(jiàn)模型量化方法,熟練使用模型量化工具。
7.對(duì)AI芯片架構(gòu)演進(jìn)有敏銳洞察力。
8.熟悉RISC-V等開(kāi)源指令集擴(kuò)展。
9.有AI編譯器(如XLA、TorchDynamo)開(kāi)發(fā)經(jīng)驗(yàn)