崗位職責
1)使用Doccano平臺進行文本標注(意圖識別、實體標注、問答對匹配等),構建高質量訓練數(shù)據(jù)集
2)基于BERT等嵌入模型將客服問答文本轉化為向量,優(yōu)化向量化流程,維護向量數(shù)據(jù)庫(如Milvus/FAISS/Pinecone),實現(xiàn)語義檢索與相似度計算功能
3)開發(fā)Python自動化腳本,完成數(shù)據(jù)預處理、模型評估及標注結果分析,與算法團隊協(xié)作,持續(xù)改進標注規(guī)范與模型效果
任職要求
技術能力:
1)熟練掌握Python及NLP相關庫(spaCy、HuggingFace Transformers等)
2)有Doccano標注經驗,能設計標注方案并管理標注團隊
3)理解嵌入模型原理,能獨立實現(xiàn)文本向量化與存儲
4)熟悉向量數(shù)據(jù)庫操作(Milvus/Weaviate等)及檢索優(yōu)化技巧
加分項
有客服對話系統(tǒng)開發(fā)經驗
熟悉RAG(檢索增強生成)技術棧
掌握Docker/Kubernetes部署流程
工作亮點
參與從數(shù)據(jù)標注到模型落地的全流程
接觸前沿的向量化與語義檢索技術
提供技術成長與跨團隊協(xié)作機會