崗位職責(zé):
1、負(fù)責(zé)GPU產(chǎn)品的通信庫驅(qū)動和用戶態(tài)并行計算驅(qū)動庫開發(fā);
2、負(fù)責(zé)互聯(lián)拓?fù)浞桨傅目尚行苑治?,制定有競爭力的軟件方案?/div>
3、負(fù)責(zé)支撐集合通訊庫在多機、多卡環(huán)境下的并行推理業(yè)務(wù);
4、制定大模型場景中,大規(guī)模集群計算的集合通信方案;
5、同框架軟件團隊共同實現(xiàn)并行推理性能優(yōu)化。
任職要求:
1、熟悉計算機體系結(jié)構(gòu)及常見互聯(lián)協(xié)議;
2、扎實的C/C++編程與調(diào)試能力,掌握大型Linux操作系統(tǒng)基本原理和概念;
3、熟悉GPGPU庫相關(guān)功能,有在集群環(huán)境中的多卡多機通信經(jīng)驗者優(yōu)先;
4、具備芯片互聯(lián)和網(wǎng)絡(luò)傳輸編程相關(guān)知識,熟悉RDMA、PCIe、CXL等方案,至少在其中一項中有開發(fā)經(jīng)驗;
5、擁有量產(chǎn)芯片的系統(tǒng)交付記錄;
6、自我驅(qū)動,具備快速學(xué)習(xí)和較強的溝通能力。