一、崗位職責(zé)(Responsibilities)
1)LLM 應(yīng)用鏈路工程化
- 使用 LangChain / LlamaIndex 等構(gòu)建模塊化應(yīng)用鏈,沉淀可復(fù)用的 Chain/Tool/Prompt 組件
- 集成與優(yōu)化 RAG(清洗、Chunk、索引、召回/重排、引用溯源)
- 建立離線評測集與在線 A/B,完善命中率/幻覺率/引用準確率等指標與看板
2)基于 MCP 的 Client-Server 與 Agent 協(xié)作
- 設(shè)計并實現(xiàn) MCP 協(xié)議下的 Client/Server 服務(wù)框架,支持多 Agent 工具調(diào)用、跨系統(tǒng)協(xié)作
- 完善會話管理、消息路由、工具編排、權(quán)限與沙箱、數(shù)據(jù)流整合
- 建設(shè)接口規(guī)范:版本管理、超時/重試、冪等、失敗降級、回放能力
3)性能、成本與可擴展性
- 降低端到端延遲與 Token 成本(緩存、批處理、并發(fā)與限流、隊列化執(zhí)行)
- 集成向量數(shù)據(jù)庫/搜索系統(tǒng)(Milvus/Weaviate/ES 等),做好 embedding 管理、冷熱分層、索引與容量規(guī)劃
- 支撐多租戶與可擴展部署(灰度、彈性擴縮、配置中心、服務(wù)治理)
4)Java 后端與現(xiàn)有系統(tǒng)集成
- 基于 Java(Spring 生態(tài))建設(shè)核心后端服務(wù)與網(wǎng)關(guān)能力,對外提供穩(wěn)定 LLM API 與業(yè)務(wù)接口
- 結(jié)合 Spring AI 實現(xiàn)模型調(diào)用/路由、提示詞模板化、函數(shù)/工具調(diào)用封裝
- 對接統(tǒng)一鑒權(quán)、日志審計、數(shù)據(jù)權(quán)限、工作流/任務(wù)系統(tǒng)等現(xiàn)有平臺能力
5)Python 能力補位與交付
- 熟悉 Python,能獨立完成腳本工具、數(shù)據(jù)處理、服務(wù)部署與線上問題排查
- 與 Java 服務(wù)協(xié)同(異步任務(wù)、RPC/消息隊列等)
二、任職要求(Requirements)
- 5年以上后端開發(fā)經(jīng)驗,具備復(fù)雜系統(tǒng)架構(gòu)設(shè)計與落地經(jīng)驗(微服務(wù)/網(wǎng)關(guān)/多租戶/高可用)
- 精通 Java(Spring Boot / Spring Cloud),具備良好的編碼規(guī)范、單元測試與工程化能力
- 熟悉 LLM 應(yīng)用開發(fā)范式:RAG、工具調(diào)用/Function Calling、Prompt 工程、評測與可觀測
- 熟悉向量數(shù)據(jù)庫或搜索系統(tǒng)之一(Milvus/Weaviate/ES等),理解召回、索引、容量與性能權(quán)衡
- 熟悉 Python,可完成部署、腳本/組件開發(fā)與 CI/CD 基礎(chǔ)工作;溝通協(xié)作與文檔能力良好
三、加分項(Strong Plus)
- 有 MCP / 多 Agent 框架經(jīng)驗(或類似協(xié)議/多智能體編排經(jīng)驗)
- 生產(chǎn)級 RAG 優(yōu)化經(jīng)驗:rerank、多路召回、Hybrid Search、引用校驗、反幻覺策略
- 模型成本治理經(jīng)驗:緩存、批處理、壓縮、路由、多模型策略(小模型優(yōu)先/回退)
- 安全與合規(guī)經(jīng)驗:數(shù)據(jù)脫敏、審計、權(quán)限隔離、Prompt Injection 防護
- 熟悉 K8s、Terraform、OpenTelemetry/Prometheus/Grafana/ELK 等可觀測體系