職位描述:
1. 戰(zhàn)略規(guī)劃與技術(shù)攻堅
- 負(fù)責(zé)垂類大模型技術(shù)戰(zhàn)略制定,包括模型訓(xùn)練調(diào)優(yōu)、平臺架構(gòu)設(shè)計、應(yīng)用場景創(chuàng)新(如AI Agent、智能外呼)。
- 主導(dǎo)核心技術(shù)突破,如異構(gòu)計算優(yōu)化、多模態(tài)模型融合、推理性能提升等。
2. 團(tuán)隊管理與項目落地
- 搭建并管理AI技術(shù)團(tuán)隊,統(tǒng)籌大模型訓(xùn)練、平臺開發(fā)、應(yīng)用落地的全流程項目交付。
- 深入業(yè)務(wù)場景(如云計算服務(wù)、數(shù)據(jù)分析工具),設(shè)計端到端解決方案并打造行業(yè)標(biāo)桿案例。
3. 工具鏈與生態(tài)建設(shè)
- 構(gòu)建企業(yè)級大模型工具鏈(如自動評估、AB實(shí)驗(yàn)體系),提升開發(fā)效率與模型效果。
- 推動開源技術(shù)與內(nèi)部平臺整合,優(yōu)化國產(chǎn)化GPU適配及推理加速框架。
4. 商業(yè)化與行業(yè)影響
- 探索大模型驅(qū)動的服務(wù)新形態(tài)(如ChatUI升級、智能文檔處理),實(shí)現(xiàn)技術(shù)變現(xiàn)。
- 代表團(tuán)隊參與行業(yè)技術(shù)交流,提升公司在AI領(lǐng)域的技術(shù)影響力。
職位要求:
技術(shù)能力
1. 大模型核心技術(shù)
- 精通大模型(LLM)訓(xùn)練、調(diào)優(yōu)、推理加速、評估等全流程技術(shù),熟悉Transformer架構(gòu)、多模態(tài)融合、搜索增強(qiáng)生成(RAG)、AI Agents等方向。
- 具備垂類大模型(如云計算、數(shù)據(jù)分析、文檔處理等)領(lǐng)域落地經(jīng)驗(yàn),熟悉Prompt工程、微調(diào)、模型對齊等關(guān)鍵技術(shù)。
- 掌握主流深度學(xué)習(xí)框架(如PyTorch、TensorFlow)和分布式訓(xùn)練技術(shù),了解國產(chǎn)GPU(如昇騰、海光)適配經(jīng)驗(yàn)優(yōu)先。
2. 工程與架構(gòu)能力
- 熟悉大模型平臺搭建,包括LLMOps/DataOps工具鏈設(shè)計、異構(gòu)GPU混合訓(xùn)練與推理加速、高性能服務(wù)部署等。
- 具備大型系統(tǒng)的算法模型開發(fā)和優(yōu)化經(jīng)驗(yàn),熟練掌握Python/Java/C++至少一門語言,熟悉LangChain、vLLM等應(yīng)用框架。
3. 行業(yè)經(jīng)驗(yàn)
- 在自然語言處理(NLU/NLG)、對話機(jī)器人、智能輔助(Copilot)、搜索推薦等領(lǐng)域有大規(guī)模場景落地經(jīng)驗(yàn)。
- 熟悉云計算、數(shù)據(jù)分析、企業(yè)服務(wù)等垂類業(yè)務(wù)場景,能結(jié)合大模型解決實(shí)際業(yè)務(wù)痛點(diǎn)。
---
綜合能力
1. 學(xué)術(shù)與創(chuàng)新能力
- 計算機(jī)科學(xué)、人工智能相關(guān)碩士及以上學(xué)歷,近3年有頂會論文(如NeurIPS、ICML)或開源社區(qū)核心貢獻(xiàn)者優(yōu)先。
- 持續(xù)跟蹤大模型前沿技術(shù)(如混合專家、多模態(tài)對齊),具備技術(shù)選型與商業(yè)化潛力研判能力。
2. 管理與協(xié)作能力
- 5年以上算法團(tuán)隊管理經(jīng)驗(yàn),能獨(dú)立承擔(dān)復(fù)雜項目規(guī)劃、分解業(yè)務(wù)需求并推動跨團(tuán)隊協(xié)作。
- 優(yōu)秀的溝通能力,能與產(chǎn)品、工程團(tuán)隊高效配合,制定技術(shù)演進(jìn)路線并推進(jìn)商業(yè)化落地。