崗位職責(zé)1. 大語言模型本地化部署與優(yōu)化
- 負(fù)責(zé)DeepSeek-R等大模型的本地化部署,實(shí)現(xiàn)高效GPU資源分配及推理加速方案。
- 開發(fā)模型壓縮技術(shù)(量化、剪枝等)及顯存優(yōu)化方案,降低硬件資源消耗。
- 封裝模型服務(wù)API,支持高并發(fā)、低延遲的知識檢索與生成場景。
2. 知識庫數(shù)據(jù)建模與算法開發(fā)
- 構(gòu)建知識抽取算法:基于NLP技術(shù)實(shí)現(xiàn)非結(jié)構(gòu)化文本的實(shí)體關(guān)系抽取、知識三元組生成及知識圖譜構(gòu)建。
- 設(shè)計知識表示與存儲方案:結(jié)合圖數(shù)據(jù)庫(Neo4j)與向量數(shù)據(jù)庫(Milvus)優(yōu)化多模態(tài)知識存儲結(jié)構(gòu)。
- 開發(fā)知識增強(qiáng)算法:利用RAG(檢索增強(qiáng)生成)技術(shù)提升大模型在垂直領(lǐng)域的準(zhǔn)確性和可解釋性。
3. 數(shù)據(jù)工程與模型訓(xùn)練
- 主導(dǎo)自有數(shù)據(jù)清洗與增強(qiáng):設(shè)計數(shù)據(jù)標(biāo)注規(guī)則、異常檢測算法及數(shù)據(jù)增強(qiáng)策略(如對抗訓(xùn)練)。
- 開發(fā)持續(xù)學(xué)習(xí)機(jī)制:結(jié)合主動學(xué)習(xí)(Active Learning)優(yōu)化模型迭代效率,降低人工標(biāo)注成本。
- 構(gòu)建自動化訓(xùn)練流水線:集成PyTorch/TensorFlow框架,實(shí)現(xiàn)分布式訓(xùn)練與超參數(shù)調(diào)優(yōu)。
4. 系統(tǒng)性能調(diào)優(yōu)與監(jiān)控
- 設(shè)計模型性能評估指標(biāo):包括響應(yīng)延遲、知識召回率、生成內(nèi)容合規(guī)性等。
- 進(jìn)行算法模塊的代碼級優(yōu)化:通過CUDA加速、多線程編程提升計算效率。
- 開發(fā)監(jiān)控告警系統(tǒng):實(shí)時跟蹤模型推理異常(如幻覺生成、知識沖突),并實(shí)現(xiàn)自修復(fù)機(jī)制。
任職資格技術(shù)能力
- 學(xué)歷與專業(yè):計算機(jī)科學(xué)、人工智能、數(shù)學(xué)相關(guān)專業(yè)碩士及以上學(xué)歷,博士優(yōu)先。
- 編程能力:精通Python/C++,熟悉PyTorch/TensorFlow框架,具備CUDA開發(fā)經(jīng)驗。
- 算法經(jīng)驗:
- 熟悉大模型微調(diào)技術(shù)(LoRA、P-Tuning)及本地化部署方案。
- 掌握NLP核心技術(shù)(BERT預(yù)訓(xùn)練、文本摘要、實(shí)體鏈接等)。
- 具備知識圖譜構(gòu)建經(jīng)驗(Neo4j、DGL等)。
項目經(jīng)驗
- 主導(dǎo)過知識庫系統(tǒng)、問答系統(tǒng)或企業(yè)級搜索項目開發(fā)。
- 有處理TB級結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù)的實(shí)戰(zhàn)經(jīng)驗。
- 熟悉RAG、向量檢索等增強(qiáng)生成技術(shù)者優(yōu)先。
軟性素質(zhì)
- 具備跨團(tuán)隊協(xié)作能力,能與產(chǎn)品經(jīng)理、數(shù)據(jù)工程師協(xié)同定義技術(shù)方案。
- 對AI技術(shù)趨勢敏感,持續(xù)跟蹤LangChain、LlamaIndex等開源工具生態(tài)。
加分項
- 有大型AI產(chǎn)品或項目落地經(jīng)驗。
- 熟悉云計算平臺(AWS/GCP/Azure)和模型部署(Docker/Kubernetes)。
- 了解生成式AI(如ChatGPT、Diffusion)、大語言模型(LLM)應(yīng)用開發(fā)。
- 具有開源項目貢獻(xiàn)經(jīng)驗或技術(shù)博客。