RLHF數(shù)據(jù)訓(xùn)練師

7000-9000元

杭州余杭區(qū)
1-3年
本科
全職
招5人

職位描述

文本標注視頻標注音頻標注語音標注圖像標注人工智能云計算/大數(shù)據(jù)

崗位要求：
● 本科及以上學(xué)歷，語言學(xué)、心理學(xué)、計算機、認知科學(xué)、哲學(xué)、新聞傳播、教育學(xué)等相關(guān)專業(yè)優(yōu)先；
● 有1年以上內(nèi)容審核、編輯校對、用戶研究、UX評估、測試用例設(shè)計或AI數(shù)據(jù)獎勵建模標注經(jīng)驗；
● 熟悉大語言模型基本概念（如token、prompt、temperature、RLHF流程等）；
● 使用過主流大模型（如GPT、Claude、通義千問、文心一言等）并對其優(yōu)缺點有觀察。
● 出色的中文閱讀理解能力，對語言細微差異敏感，具備較強的邏輯分析與批判性思維；
● 對模型輸出的文本回答，有優(yōu)秀的范式理解；
● 對AI倫理、模型安全、內(nèi)容合規(guī)等議題有一定認知，能夠在指導(dǎo)下理解并嚴格執(zhí)行標注規(guī)范，注重細節(jié)，責任心強；
● 能熟練使用辦公軟件（如Excel、Google Sheets）及內(nèi)部標注平臺；
● 熟悉大語言模型評測，對大語言模型機理敏感；
● 良好的溝通能力與團隊協(xié)作意識。

工作內(nèi)容：
1. 高質(zhì)量偏好數(shù)據(jù)標注
○ 對同一提示（prompt）下由大語言模型生成的2–4個回復(fù)進行成對或全局排序（ranking），依據(jù)標準判斷哪個回復(fù)更符合人類偏好；
○ 在多維評估維度（如：事實準確性、安全性、指令遵循度等）下進行細粒度打分或分類；
○ 識別并標記模型輸出中的潛在風(fēng)險內(nèi)容，包括但不限于：事實錯誤、偏見歧視、誘導(dǎo)性語言、安全風(fēng)險內(nèi)容等。
2. 標注質(zhì)量保障與反饋閉環(huán)
○ 定期參與標注一致性校準會議，與團隊對齊判斷標準；
○ 主動記錄模糊案例、邊界情況或指南沖突點，提出改進建議；
○ 配合質(zhì)檢流程，接受隨機抽查與回溯評估，確保個人標注準確率 ≥95%（以內(nèi)部標準為準）。
3. 協(xié)作與知識沉淀
○ 與Prompt工程師協(xié)作，理解任務(wù)背景與模型能力邊界，提升標注上下文感知能力；
○ 參與標注文檔（SOP）的撰寫、更新與本地化（中英雙語場景）；
○ 必要時撰寫簡要標注理由（justification），用于模型可解釋性分析或人工審核復(fù)盤。
上班時間：早九晚六、周末雙休
薪資：
6800/8200面試定級定薪

工作地點

杭州余杭區(qū)阿里巴巴西溪C區(qū)(C1樓)西溪C區(qū)(C1樓)

完善一份簡歷
1736萬+企業(yè)在線搜索，780萬+海量職位精準推薦

相似職位

ai數(shù)據(jù)標注項目經(jīng)理-朝九晚六/周末雙休1.3-2萬
杭州 - 余杭
深圳市法本信息技術(shù)股份有限公司
審核標注4000-6000元
杭州 - 余杭
軟通動力信息技術(shù)(集團)股份有限公司
阿拉伯語ai標注/早九晚六/周末雙休/大廠7000-8000元
杭州 - 濱江
深圳市法本信息技術(shù)股份有限公司
多模態(tài)意圖Agent數(shù)據(jù)工程師7000-10000元
杭州 - 余杭
深圳市法本信息技術(shù)股份有限公司
RLHF數(shù)據(jù)訓(xùn)練師7000-9000元
杭州 - 余杭
深圳市法本信息技術(shù)股份有限公司
語言數(shù)據(jù)處理專員（英語）7000-10000元
杭州 - 濱江
新宇智慧

查看更多相似職位

職位發(fā)布者

火蓉/人事經(jīng)理

昨日活躍

立即溝通

深圳市法本信息技術(shù)股份有限公司

深圳市法本信息技術(shù)股份有限公司——高速成長的軟件科技企業(yè)公司簡介法本公司成立于2006年，總部位于深圳市南山區(qū)高新產(chǎn)業(yè)園區(qū)，已在北京、上海、廣州和香港設(shè)立分公司；現(xiàn)有員工約10,000人以上。目前已獲得國家高新技術(shù)企業(yè)認證、深圳市高新技術(shù)企業(yè)認證、雙軟認證和CMMI Level3認證等。公司立足于深圳，是一家面向中國大陸、香港及海外市場的電子元器件通路、專業(yè)IT服務(wù)和咨詢的多元化集團企業(yè)：上海法本電子科技有限公司，深圳市法本信息技術(shù)有限公司和深圳法本科技有限公司。深圳市法本信息技術(shù)有限公司成立于2006年，致力于成為全球領(lǐng)先的專業(yè)IT產(chǎn)品、服務(wù)及解決方案供應(yīng)商；為國內(nèi)外互聯(lián)網(wǎng)企業(yè)、金融系統(tǒng)、通信企業(yè)、高科技領(lǐng)域、教育事業(yè)及能源領(lǐng)域提供資源外包和解決方案服務(wù)。人才理念以人為本，尊重員工的個性與發(fā)展，使員工在平等、競爭、和諧的環(huán)境下充分發(fā)揮自身的創(chuàng)新能力和潛能，在達成公司發(fā)展目標的同時實現(xiàn)個人的理想和奮斗目標。核心價值觀真誠、用心、創(chuàng)造、分享、開放。合作伙伴自2006年以來，法本信息一直致力于為客戶提供優(yōu)質(zhì)的IT咨詢、解決方案以及外包服務(wù)，在互聯(lián)網(wǎng)、金融、通信、高科技、教育、能源等領(lǐng)域積累了豐富的行業(yè)經(jīng)驗，目前已與騰訊、百度、工商銀行、招商銀行、平安、中國移動、華為、中興通訊等大型企業(yè)和機構(gòu)建立了合作關(guān)系。隨著公司的高速發(fā)展，我們期盼著更多優(yōu)秀的人才加盟。公司已建立科學(xué)的培訓(xùn)、激勵和晉升機制，保障專業(yè)人才個人與公司共同健康發(fā)展。我們將凝聚優(yōu)秀的人才，共同鑄就事業(yè)的輝煌！公司相關(guān)福利： 1)5天8小時工作制； 2)入職即購買養(yǎng)老保險、醫(yī)療保險、工傷保險、失業(yè)險、生育險和住房公積金； 3)有市場競爭力的薪酬水平，公司還設(shè)立了公司發(fā)展獎、項目獎、合理化建議獎、長期服務(wù)獎等； 4)帶薪年假：試用期屆滿，即可享受年假； 5)根據(jù)公司當年經(jīng)營情況提供長于國家規(guī)定的春節(jié)假期； 6)結(jié)婚、生育正常假期，公司饋贈禮金； 7)定期組織年度體檢； 8)每月舉行生日Party、員工座談會，季度民主生活會等； 9)定期組織羽毛球、籃球和旅游等文娛活動。

公司主頁

關(guān)于我們: 公司介紹; 聯(lián)系我們; 誠聘英才

產(chǎn)品與服務(wù): 人才招聘; 企業(yè)招聘

使用與幫助: 賬號注銷; 意見反饋; 發(fā)票制度; 防騙指南; 法律協(xié)議; 資質(zhì)公示

智聯(lián)招聘更懂你的價值

智聯(lián)app小程序官方微信企業(yè)版APP

未經(jīng) Zhaopin.com 同意，不得轉(zhuǎn)載本網(wǎng)站之所有招聘信息及作品智聯(lián)招聘網(wǎng)版權(quán)所有

京ICP備17067871號?合字B2-20210134

京公網(wǎng)安備 11010502030147號?人力資源許可證:1101052003273號

網(wǎng)上有害信息舉報專區(qū)?違法不良信息舉報電話:400-885-9898 關(guān)愛未成年舉報熱線:400-885-9898-7

朝陽區(qū)人力資源與社會保障局監(jiān)督電話?

網(wǎng)絡(luò)110報警服務(wù)電子營業(yè)執(zhí)照