**不要大數(shù)據(jù)平臺開發(fā)或者數(shù)倉開發(fā)的,主要是做數(shù)據(jù)處理以及知識庫建構(gòu)**
崗位職責:
1、負責文書知識庫的構(gòu)建,包括word/pdf等格式文稿數(shù)據(jù)的抽取、清洗、處理、向量化與入庫等;
2、基于自動或半自動方法進行數(shù)據(jù)標注,為LLM訓練調(diào)優(yōu)提供高質(zhì)量數(shù)據(jù)支持。
及知識庫構(gòu)建
任職要求:
1、熟悉Python及常用的數(shù)據(jù)處理相關(guān)工具庫(如Pandas, NumPy, datasets),了解doc/docx/pdf格式解析。
2、具備數(shù)據(jù)處理、ETL流程開發(fā)與管理經(jīng)驗。
3、了解Milvus/Pinecone等向量數(shù)據(jù)庫及相關(guān)技術(shù)者優(yōu)先。
期望到崗日期:一周之內(nèi)
工作時間:工作日9:30-18:30,可彈性,六日雙休,需現(xiàn)場坐班;