崗位職責:
1. 負責大模型(LLM)的研發(fā)與優(yōu)化,包括但不限于模型架構設計、訓練調(diào)優(yōu)(SFT、RLHF)、推理加速等,提升模型在搜索、問答等場景的性能。
2. 探索前沿技術方向,如RAG(檢索增強生成)、多模態(tài)融合、數(shù)據(jù)飛輪等,推動大模型在垂直領域的應用落地。
3. 參與海量數(shù)據(jù)清洗、標注及預處理,構建高質(zhì)量訓練數(shù)據(jù)集,優(yōu)化模型泛化能力。
4. 主導大模型(LLM)與智能體(AI Agent)系統(tǒng)的聯(lián)合研發(fā),包括智能體任務規(guī)劃、決策推理、記憶機制等核心模塊設計,提升復雜場景(如自動化辦公、多輪交互)的自主執(zhí)行能力。
5. 熟悉大模型驅(qū)動的智能體技術棧,如AutoGen、LangChain框架開發(fā),實現(xiàn)API調(diào)用、工具擴展、多智能體協(xié)作等高級功能。
6. 參與大模型訓練全流程(預訓練、SFT、RLHF),支撐智能體底層認知與推理能力。
-
崗位要求:
1. 計算機/AI相關專業(yè),熟悉機器學習、強化學習及NLP核心技術,掌握Transformer、BERT/GPT等模型架構。
2. 精通Python,具備PyTorch/TensorFlow實戰(zhàn)經(jīng)驗,熟悉智能體開發(fā)框架(如AutoGen、LangChain)及工具鏈集成。
3. 有大模型結合智能體落地項目經(jīng)驗,包括但不限于任務分解、記憶管理、API調(diào)用優(yōu)化等。
4. 熟悉智能體評估方法論,能獨立設計測試用例與性能指標。