工作職責
1. 負責制定大語言模型方向的技術戰(zhàn)略與演進路線,持續(xù)帶領團隊在算法創(chuàng)新、系統(tǒng)部署、智能體架構等關鍵方向取得突破;
2. 全面統(tǒng)籌垂域大語言模型的研發(fā)、評估與部署生命周期,推動算法與系統(tǒng)能力的標準化、模塊化和可復用建設;
3. 牽頭在研發(fā)、制造、品質、供應鏈、財經、人力及辦公智能等核心領域構建智能體系統(tǒng),重構關鍵業(yè)務流程,推動大語言模型的深度融合與落地應用;
4. 主導復雜業(yè)務問題的抽象建模,構建行業(yè)級、多任務、多場景的評估體系,覆蓋模型精度、穩(wěn)定性、安全合規(guī)等維度;
5. 制定并實施大語言模型系統(tǒng)性能優(yōu)化策略,構建資源利用率高、彈性強的推理服務架構,提升模型部署效率與穩(wěn)定性;
6. 引導團隊圍繞業(yè)務目標開展系統(tǒng)性大語言模型算法調研與分析,識別潛在問題與機會點,提出可落地的優(yōu)化方案;
7. 緊跟大語言模型領域技術發(fā)展,持續(xù)輸出行業(yè)趨勢洞察,制定面向未來的技術路線與實施規(guī)劃;
任職要求
1. 碩士及以上學歷,博士學歷優(yōu)先,計算機/人工智能/數學/統(tǒng)計學等相關專業(yè)優(yōu)先,具備 5 年以上團隊管理經驗(3 年+大語言模型方向工作經驗);
2. 深入掌握大語言模型架構(如Transformer、LLaMA、Qwen、DeepSeek、GPT等),具備百億參數規(guī)模以上的大語言模型Pre-train、Fine-tune、RLHF(GRPO, DAPO等)等完整研發(fā)及落地實戰(zhàn)經驗;
3. 精通Python,掌握至少一類深度學習框架(如PyTorch),熟悉多種分布式訓練/推理加速技術(如DeepSpeed、Megatron、vLLM、FlashAttention等);
4. 具備大語言模型應用、Agent產品化經驗,深刻理解自主決策的Agent建設方法論,曾主導或深度參與復雜業(yè)務場景的大語言模型部署與落地,有可量化的業(yè)務成果;
5. 熟悉大模型的部署、AI工程化,熟悉大模型的訓練加速、推理加速、并發(fā)提升、資源節(jié)降技術,具備良好的系統(tǒng)工程能力;
6. 具備跨領域算法設計能力,可針對物流、客服、辦公等復雜場景制定定制化AI方案,具備業(yè)務抽象與復合建模能力;
7. 有扎實的數據分析能力,熟悉指標設計、AB測試、Benchmark搭建等,能驅動大語言模型與業(yè)務的融合優(yōu)化;
8. 有良好的前瞻視野,關注AI Agent、多模態(tài)、搜索推薦等技術趨勢,及前沿方向探索與落地;