公司福利:周末雙休、五險一金、帶薪年假、餐補、出差補貼、團建
崗位職責(zé):
1、負責(zé)億級參數(shù)規(guī)模大模型(LLM/CV 多模態(tài))的預(yù)訓(xùn)練、指令微調(diào)及 RLHF 全流程開發(fā)
2、設(shè)計高效的分布式訓(xùn)練方案(數(shù)據(jù)/模型/流水線并行),優(yōu)化 GPU 集群利用率
3、開發(fā)模型壓縮技術(shù)(量化/蒸餾/剪枝)實現(xiàn)大模型輕量化部署
4、跟蹤 Diffusion/Transformer 等前沿架構(gòu),推動業(yè)務(wù)場景創(chuàng)新應(yīng)用
崗位要求:
1、計算機/數(shù)學(xué)本科及以上學(xué)歷,2 年以上大模型研發(fā)經(jīng)驗
2、精通 PyTorch 框架及 DeepSpeed/ColossalAI 等分布式訓(xùn)練工具
3、掌握 Megatron-LM/LLaMA 等開源架構(gòu)的二次開發(fā)
4、熟悉 CUDA 優(yōu)化及 TRT/TensorRT-LLM 部署方案
5、參與過開源大模型項目(如 ChatGLM/Baichuan 開發(fā))優(yōu)先