崗位職責(zé):
1.負(fù)責(zé)大模型的研發(fā):數(shù)據(jù)構(gòu)建、SFT、RLHF/DPO 對齊、評估與持續(xù)迭代。
2.針對業(yè)務(wù)場景(推薦、客服、Agent、多模態(tài)等)進(jìn)行領(lǐng)域微調(diào)、提示工程、RAG 優(yōu)化,完成模型上線與 A/B 實驗。
3.設(shè)計并實施訓(xùn)練與推理加速方案:3D 并行、ZeRO、Megatron-LM、FlashAttention、KV-Cache 優(yōu)化、量化/剪枝、TensorRT-LLM/vLLM 等,確保成本與延遲達(dá)標(biāo)。
4.跟蹤前沿研究(Scaling Law、MoE、Long Context、Agent、多模態(tài)、混合專家、推理規(guī)劃),產(chǎn)出專利,并將成果快速落地到產(chǎn)品。
5.與產(chǎn)品、工程、運營團(tuán)隊協(xié)作,實施大模型能力的落地。
任職要求:
1.計算機(jī)、人工智能、數(shù)學(xué)、統(tǒng)計等相關(guān)專業(yè),本科及以上學(xué)歷;5 年以上 NLP/深度學(xué)習(xí)或大模型相關(guān)經(jīng)驗。
2.扎實的算法與編程功底:熟練掌握 Python/C++,熟悉 PyTorch/TensorFlow。
3.熟悉 Transformer 系列模型結(jié)構(gòu)與優(yōu)化,對 LLaMA、Qwen、GLM、Mistral、Deepseek 等開源底座有深度實踐。
4.具備大模型預(yù)訓(xùn)練/微調(diào)/對齊完整項目經(jīng)驗:熟練使用 DeepSpeed、Megatron-LM、Colossal-AI、FSDP 等分布式框架,掌握 LoRA/QLoRA/RLHF/DPO 技術(shù)棧。
5.熟悉推理加速與部署:TensorRT-LLM、vLLM、FastServe、PageAttention、量化、剪枝、云端/端側(cè)落地經(jīng)驗。