崗位描述:
SFT 和RL 數(shù)據(jù)質(zhì)檢與驗收:對大模型監(jiān)督微調(diào)(SFT)、強化學(xué)習(xí)(RL)任務(wù)的數(shù)據(jù)進行全流程質(zhì)檢,包括數(shù)據(jù)標注的準確性、一致性、合規(guī)性核查,依據(jù)標注規(guī)范和業(yè)務(wù)需求,嚴格驗收數(shù)據(jù)質(zhì)量,保障數(shù)據(jù)符合算法訓(xùn)練要求。
問題分析與優(yōu)化:深度分析質(zhì)檢過程中發(fā)現(xiàn)的數(shù)據(jù)問題,如標注錯誤、邏輯矛盾、格式不統(tǒng)一等,提出優(yōu)化建議并推動標注團隊改進;定期總結(jié)數(shù)據(jù)質(zhì)量問題,協(xié)助完善標注規(guī)則和驗收標準。
跨部門協(xié)作:與數(shù)據(jù)標注團隊、算法研發(fā)團隊、產(chǎn)品團隊緊密溝通,及時反饋數(shù)據(jù)質(zhì)量情況,根據(jù)業(yè)務(wù)需求調(diào)整質(zhì)檢策略;參與數(shù)據(jù)標注流程優(yōu)化,為大模型訓(xùn)練提供高質(zhì)量數(shù)據(jù)支持。
崗位要求:
專業(yè)知識:熟悉大模型數(shù)據(jù)標注流程,深入了解 SFT、RL 等技術(shù)原理及在數(shù)據(jù)標注中的應(yīng)用,具備扎實的機器學(xué)習(xí)或自然語言處理理論基礎(chǔ)。
實踐經(jīng)驗:1 年以上大模型數(shù)據(jù)標注質(zhì)檢或相關(guān)工作經(jīng)驗,有 SFT、RL 任務(wù)數(shù)據(jù)質(zhì)檢經(jīng)驗者優(yōu)先;熟練使用常見數(shù)據(jù)質(zhì)檢工具,能夠高效處理大規(guī)模數(shù)據(jù)。
其他要求:邏輯思維嚴謹,具備較強的問題排查和解決能力;擁有出色的溝通協(xié)調(diào)能力,能夠在跨部門協(xié)作中高效推進工作;對人工智能行業(yè)充滿熱情,具備持續(xù)學(xué)習(xí)新技術(shù)的能力。