国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 2月2日

搜索問答大模型評測(外派騰訊)

6000-11000元
  • 成都武侯區(qū)
  • 1年以下
  • 本科
  • 全職
  • 招1人

雇員點評標(biāo)簽

  • 工作環(huán)境好
  • 同事很nice
  • 氛圍活躍
  • 人際關(guān)系好
  • 免費班車
  • 管理人性化
  • 團隊執(zhí)行強
  • 交通便利

職位描述

大模型標(biāo)注評測搜索問答人工智能
崗位職責(zé):
●負責(zé)各類大語言模型(LLM)通用能力的一線評測工作,包括但不限于文本生成、邏輯推理、知識問答、多輪對話、代碼生成等核心場景的效果驗證。
●按照評測標(biāo)準(zhǔn)和流程,對模型輸出結(jié)果進行客觀、準(zhǔn)確的打分與標(biāo)注,記錄評測過程中的異常情況和模型不足,形成詳細的評測日志。
●參與構(gòu)建自動評估集,完成題目構(gòu)建、考點撰寫、打分邏輯等任務(wù)。
●參與評測數(shù)據(jù)集的整理、清洗與標(biāo)注工作,協(xié)助優(yōu)化評測樣本的覆蓋度和代表性,提升評測數(shù)據(jù)的質(zhì)量。
●配合團隊完成評測任務(wù)的推進,及時反饋評測過程中遇到的問題(如評測標(biāo)準(zhǔn)模糊、樣本異常等),協(xié)助優(yōu)化評測方案和流程。
崗位要求:
●本科及以上學(xué)歷,專業(yè)不限。
●具備良好的文字理解與表達能力,邏輯思維清晰,具備較好的同理心和用戶視角。
●工作認真細致、責(zé)任心強,具備較強的執(zhí)行力和團隊協(xié)作精神,能嚴(yán)格遵守評測標(biāo)準(zhǔn)和流程。
●具備基本的計算機操作能力,能熟練使用辦公軟件(如Excel、Word),有數(shù)據(jù)標(biāo)注、模型評測相關(guān)經(jīng)驗者優(yōu)先。
●對人工智能、大語言模型領(lǐng)域有一定興趣,深度使用主流AI產(chǎn)品,并有自己的認知和見解;了解大模型的基本原理和技術(shù)框架。

工作地點

成都武侯區(qū)騰訊大廈

職位發(fā)布者

朱女士/招聘總監(jiān)

今日活躍
立即溝通
公司Logo上海微創(chuàng)軟件股份有限公司
上海微創(chuàng)軟件股份有限公司2002年由微軟與上海市政府共同創(chuàng)辦,是微軟在華投資的第一家合資公司。微創(chuàng)始終秉承高標(biāo)準(zhǔn)的服務(wù)品質(zhì)與“成就客戶”的服務(wù)理念,在全球設(shè)有20余處交付中心,分布在中國、美國、日本、澳大利亞,憑借在汽車、保險、高科技、金融、互聯(lián)網(wǎng)等行業(yè)的深厚積累和豐富經(jīng)驗,與2500余家企業(yè)與政府客戶達成了長期、穩(wěn)定、友好的合作。
公司主頁