職責(zé)
·條款識(shí)別與要素抽取:把合同切段、定位條款邊界、抽取當(dāng)事方/金額/期限/責(zé)任限制等字段。
·把“模板、標(biāo)準(zhǔn)條款庫(kù)、Playbook、歷史審查意見(jiàn)”結(jié)構(gòu)化:元數(shù)據(jù)、版本、適用范圍、權(quán)重。
· 風(fēng)險(xiǎn)識(shí)別:基于 Playbook 規(guī)則 + 模型判斷,輸出“風(fēng)險(xiǎn)等級(jí) + 原因 + 引用依據(jù)(定位到原文片段)”。
· 建設(shè)檢索:分塊策略(chunking)、向量化、混合檢索(關(guān)鍵詞+向量)、過(guò)濾條件(合同類型/地區(qū)/主體/金額檔位等)。
· 智能問(wèn)答/摘要:用 RAG 把“公司模板條款庫(kù)、歷史談判案例、制度”喂給模型,減少幻覺(jué)并增強(qiáng)可解釋性。
·數(shù)據(jù)治理:脫敏、權(quán)限、數(shù)據(jù)生命周期(留存/刪除/審計(jì))。
必備技能
· 大模型應(yīng)用:精通 國(guó)內(nèi)大模型(deepseek)的接口調(diào)用。
·熟悉主流 LLM 應(yīng)用開(kāi)發(fā):提示詞工程、結(jié)構(gòu)化輸出(JSON Schema)、函數(shù)/工具調(diào)用思想。
· RAG 基本管線:embedding、向量庫(kù)檢索、必要時(shí) reranker、評(píng)測(cè)與回歸、熟悉 LangChain 或 LlamaIndex,能夠搭建“合同知識(shí)庫(kù)”,讓 AI 基于法律法規(guī)和歷史合同進(jìn)行回答。
· OCR 技術(shù):熟悉 MinerU,PaddleOCR 或商業(yè) OCR 接口,解決掃描件合同的識(shí)別問(wèn)題。
· 能把算法做成服務(wù)(FastAPI 等)并與 Java 系統(tǒng)集成。
· 能進(jìn)行 ETL/數(shù)據(jù)清洗、文本處理;了解向量庫(kù)/全文檢索的基本原理。
·能把“知識(shí)”做成可維護(hù)資產(chǎn)(版本、審核流程、發(fā)布流程)。