国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 今天

大模型測試工程師

3-4萬·15薪
  • 北京海淀區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招2人

職位描述

人工智能
、測試工程師:2人 2輪技術面+AI負責人

崗位職責:

1.把大模型當“產品”測:從問答到Agent,設計case、跑評測、追指標,給結論,出報告。

2.搭評測體系:建數(shù)據集、定指標、寫工具,讓評測一鍵跑、結果一眼懂?!局攸c】

3.用代碼提效:Python寫腳本/平臺,讓重復評測高效完成,釋放團隊人力。

4.站在用戶角度“挑刺”:體驗流、 Bad Case 復盤,推動算法、產品一起閉環(huán)。

5.跟蹤最新評測方法:LLM-as-a-Judge、多模態(tài)Bench、Auto-Eval,能落地的第一時間引入。

6.把AI用在測試:探索“用AI測AI”,打造智能測試助手,讓測試也更AI。

崗位要求:

1.學歷&年限:計算機/AI/數(shù)學等本科及以上;5年+測試開發(fā),含2年+ AI/大模型評測經驗。

2.專業(yè)深度:

(1)具備大模型(LLM)、NLP、圖像識別/CV、多模態(tài)或強化學習等至少一類算法的評測實戰(zhàn)經驗;

(2)熟練掌握標注質量指標(準確率、召回率、F1、置信度校準)的計算與分析方法;

(3)熟悉 NLP/CV/多模態(tài)常用效果指標(Accuracy、Recall、F1、CIDEr、CLIP-Score 等)。

3.工程落地能力:精通Python,可獨立開發(fā)測試工具與自動化框(Pytest/Unittest/Playwright加分)。

4.素養(yǎng)&熱情

(1)學習鉆研強、溝通協(xié)同好;對質量與用戶體驗敏感,能發(fā)現(xiàn)問題并推動閉環(huán)解決

(2)有較強的自驅力和進取心,主動熱情,善于獨立思考、復盤總結;

(3)熱衷追蹤AI大模型前沿動態(tài),有主動學習創(chuàng)新探索能力。

學歷本科以上,專升本可以試試,必須5年以上經驗,1年以上AI經驗,年齡38以內,不用卡薪資,但是30-40k比較理想

(要ai大模型測試的人員,不是軟件測試。)

福利待遇:五險全額繳納,一金全額的8%

辦公時間:早10晚8,中午午休一個半小時,晚飯半個小時。工作日加班超過10點打車報銷,周六日加班一比一調休,法定節(jié)假日3倍。

工作地點:北京海淀區(qū)群英科技園(上地板塊)

工作地點

北京海淀區(qū)群英科技園1號樓

職位發(fā)布者

李彬/項目經理

昨日活躍
立即溝通
公司Logo北京一隆科創(chuàng)科技有限公司
北京一隆科創(chuàng)科技有限公司成立于2020年9月4日,注冊資本100萬元,是經過國家工商部門核準注冊公司。是一家技術咨詢,代理,企業(yè)咨詢,法律咨詢等業(yè)務的專業(yè)咨詢公司。公司實力強大,有專業(yè)的咨詢團隊和銷售團隊做支撐,且公司本著“誠信、務實、進取、創(chuàng)新”的企業(yè)精神和“講誠信,鑄品牌,謀共贏,求發(fā)展”的經營理念。秉承客戶滿意,服務周到的工作態(tài)度,為新老客戶提供安全,優(yōu)質、高效的服務。在行業(yè)競爭中憑著良好的服務質量及完善的跟蹤服務體系,以合理的價格贏得廣大客戶的信賴。
公司主頁