崗位職責(zé):
1. 負責(zé)大模型(如LLM、多模態(tài)模型)的算法研發(fā)、優(yōu)化及工程化落地,包括模型架構(gòu)設(shè)計、預(yù)訓(xùn)練、指令微調(diào)、對齊優(yōu)化等關(guān)鍵技術(shù)環(huán)節(jié)。
2. 針對業(yè)務(wù)場景(如NLP、搜索推薦、對話系統(tǒng)、AIGC等)設(shè)計大模型應(yīng)用方案,提升模型效果與性能。
3. 探索大模型的高效訓(xùn)練與推理技術(shù),包括分布式訓(xùn)練、模型壓縮、量化部署、低資源適配等方向。
4. 利用LLM前沿技術(shù)方向,負責(zé)AI內(nèi)容生成和編輯(prompt設(shè)計、大模型SFT和預(yù)訓(xùn)練,大模型強化學(xué)習(xí)等)、內(nèi)容理解和質(zhì)量識別(質(zhì)量分級、內(nèi)容結(jié)構(gòu)化、智能標簽/摘要等)、場景應(yīng)用(需求理解、用戶刻畫、個性化推薦)等
任職要求
1. 本科以上學(xué)歷,5年以上工作經(jīng)驗,2年以上機器學(xué)習(xí),深度學(xué)習(xí),NLP,圖像識別等相關(guān)開發(fā)經(jīng)驗,1年以上大模型(參數(shù)量≥10B)相關(guān)項目經(jīng)驗。。
2. 扎實的機器學(xué)習(xí)和深度學(xué)習(xí)基礎(chǔ),熟悉主流大模型架構(gòu)(如Transformer、BERT、GPT、LLaMA、DeepSeek、Diffusion等)。
3. 精通PyTorch/TensorFlow等框架,具備大模型訓(xùn)練調(diào)優(yōu)經(jīng)驗(數(shù)據(jù)清洗、Prompt工程、LoRA/QLoRA等微調(diào)技術(shù))。
4. 熟悉大模型相關(guān)技術(shù)鏈:分布式訓(xùn)練(DeepSpeed、Megatron)、推理加速(vLLM、TensorRT)、評估對齊(RLHF、DPO)等。
5. 具備優(yōu)秀編碼能力,熟練掌握Python/C++,熟悉Linux開發(fā)環(huán)境及高性能計算優(yōu)化。
6. 具備大模型應(yīng)用開發(fā)經(jīng)驗(Agent、RAG、知識庫增強等)。
加分技能:
1) 熟悉大模型生態(tài)工具鏈(LangChain、LangGraph、HuggingFace、LlamaIndex等),或有開源項目貢獻經(jīng)驗。
2) 掌握CUDA編程、模型量化(INT8/FP16)、服務(wù)化部署(Docker、Kubernetes)等技術(shù)
簡歷投遞郵箱:*****************
聯(lián)系人:張經(jīng)理