工作職責??:
1.負責大模型測評數(shù)據(jù)的整理、分類、結構化標注。
2.根據(jù)測評和測試方案,執(zhí)行模型效果測評和系統(tǒng)端對端測試。
3.記錄測試異常并復現(xiàn)用戶問題場景,分析定位問題。
4.統(tǒng)計分析用戶真實數(shù)據(jù),不斷完善用例庫。
5.??測評系統(tǒng)建設支持??。
任職要求:
1.計算機相關專業(yè)本科及以上學歷,經驗年限不限。
2.能快速理解NLP任務需求,有AI輔助編程工具或類似產品的使用或測試經驗。
3.務必熟練使用Excel/Python進行基礎數(shù)據(jù)處理,具備一定的編寫測試腳本能力。
4.熟悉常用的測試開發(fā)工具,如Git、Postman、Jmeter等。
5.具備良好的溝通能力、執(zhí)行力強、具備跨團隊協(xié)作意識和問題解決能力。
6.加分項:NLP基本知識和原理,模型測評經驗,prompt工程能力。