崗位職責(zé)
1. 負(fù)責(zé)公司大模型應(yīng)用方向的技術(shù)路線與架構(gòu)設(shè)計(jì):模型選型、能力規(guī)劃、迭代節(jié)奏、成本與質(zhì)量目標(biāo)。
2. 搭建可復(fù)用的 LLM 應(yīng)用平臺能力:
- Agent/工作流編排、工具調(diào)用網(wǎng)關(guān)、權(quán)限與審計(jì)
- Prompt/模板與版本管理、配置化發(fā)布、灰度與回滾
- 統(tǒng)一會話/記憶管理、上下文壓縮、長期記憶策略
3. 負(fù)責(zé) RAG 全鏈路工程化與治理:數(shù)據(jù)接入標(biāo)準(zhǔn)、索引策略、召回/重排優(yōu)化、證據(jù)引用、知識版本與可追溯。
4. 建立端到端評測與質(zhì)量體系:離線 benchmark、線上 A/B、回歸集、紅隊(duì)體系;定義指標(biāo)(命中率/引用覆蓋率/拒答率/風(fēng)險(xiǎn)率/成本/延遲等)。
5. 推理服務(wù)與成本治理:GPU 資源規(guī)劃、容量與 SLO、緩存與路由、量化與加速方案落地。
6. 帶團(tuán)隊(duì)/協(xié)作落地:指導(dǎo)工程實(shí)踐、code review、關(guān)鍵難題攻堅(jiān),與產(chǎn)品/業(yè)務(wù)/安全/后端平臺緊密協(xié)作。
任職要求
1. 深度理解 LLM 應(yīng)用落地關(guān)鍵問題:幻覺與可控性、RAG 質(zhì)量、工具調(diào)用安全、長上下文與記憶、線上評測與回歸。
2. 有從 0 到 1 或從 1 到 N 的大模型應(yīng)用/平臺化經(jīng)驗(yàn)(生產(chǎn)環(huán)境落地),能把方案拆解為可交付里程碑。
3. 強(qiáng)工程背景:服務(wù)端架構(gòu)、可觀測性、發(fā)布體系、穩(wěn)定性治理、性能與成本優(yōu)化。
4. 具備團(tuán)隊(duì)協(xié)作與技術(shù)領(lǐng)導(dǎo)力:能推動跨團(tuán)隊(duì)共識與標(biāo)準(zhǔn)落地。
加分項(xiàng)
- 有大規(guī)模推理/多租戶平臺經(jīng)驗(yàn)(路由、隔離、配額、審計(jì))
- 有分布式訓(xùn)練/對齊經(jīng)驗(yàn)(DeepSpeed/FSDP、DPO/RLHF、數(shù)據(jù)治理體系)
- 有安全/風(fēng)控體系經(jīng)驗(yàn)(越權(quán)工具調(diào)用防護(hù)、數(shù)據(jù)泄露防護(hù))
- 有垂直行業(yè)高風(fēng)險(xiǎn)場景落地經(jīng)驗(yàn)(醫(yī)療等)