、測試工程師:2人 2輪技術面+AI負責人
崗位職責:
1.把大模型當“產品”測:從問答到Agent,設計case、跑評測、追指標,給結論,出報告。
2.搭評測體系:建數(shù)據集、定指標、寫工具,讓評測一鍵跑、結果一眼懂?!局攸c】
3.用代碼提效:Python寫腳本/平臺,讓重復評測高效完成,釋放團隊人力。
4.站在用戶角度“挑刺”:體驗流、 Bad Case 復盤,推動算法、產品一起閉環(huán)。
5.跟蹤最新評測方法:LLM-as-a-Judge、多模態(tài)Bench、Auto-Eval,能落地的第一時間引入。
6.把AI用在測試:探索“用AI測AI”,打造智能測試助手,讓測試也更AI。
崗位要求:
1.學歷&年限:計算機/AI/數(shù)學等本科及以上;5年+測試開發(fā),含2年+ AI/大模型評測經驗。
2.專業(yè)深度:
(1)具備大模型(LLM)、NLP、圖像識別/CV、多模態(tài)或強化學習等至少一類算法的評測實戰(zhàn)經驗;
(2)熟練掌握標注質量指標(準確率、召回率、F1、置信度校準)的計算與分析方法;
(3)熟悉 NLP/CV/多模態(tài)常用效果指標(Accuracy、Recall、F1、CIDEr、CLIP-Score 等)。
3.工程落地能力:精通Python,可獨立開發(fā)測試工具與自動化框(Pytest/Unittest/Playwright加分)。
4.素養(yǎng)&熱情
(1)學習鉆研強、溝通協(xié)同好;對質量與用戶體驗敏感,能發(fā)現(xiàn)問題并推動閉環(huán)解決
(2)有較強的自驅力和進取心,主動熱情,善于獨立思考、復盤總結;
(3)熱衷追蹤AI大模型前沿動態(tài),有主動學習創(chuàng)新探索能力。
學歷本科以上,專升本可以試試,必須5年以上經驗,1年以上AI經驗,年齡38以內,不用卡薪資,但是30-40k比較理想
(要ai大模型測試的人員,不是軟件測試。)
福利待遇:五險全額繳納,一金全額的8%
辦公時間:早10晚8,中午午休一個半小時,晚飯半個小時。工作日加班超過10點打車報銷,周六日加班一比一調休,法定節(jié)假日3倍。
工作地點:北京海淀區(qū)群英科技園(上地板塊)