崗位職責(zé):
1. 基礎(chǔ)數(shù)據(jù)與測試集構(gòu)建
數(shù)據(jù)采集與標(biāo)注:負(fù)責(zé)測試集數(shù)據(jù)的采集、清洗、校對和分類整理,為AI模型(如OCR、NLP模型)優(yōu)化提供數(shù)據(jù)支持。
2. 測試執(zhí)行與問題記錄
功能與性能測試:依據(jù)測試計(jì)劃,對搭建的智能體、AI應(yīng)用、機(jī)器人執(zhí)行功能測試(交互響應(yīng)、任務(wù)準(zhǔn)確性)、性能測試(響應(yīng)時(shí)間、吞吐量)及穩(wěn)定性測試。
3. 效果評價(jià):評測AI產(chǎn)品的質(zhì)量(如機(jī)器人穩(wěn)定性、任務(wù)成功率、識別準(zhǔn)確率等任務(wù)),做好質(zhì)量評測。
任職要求:
1.教育背景:本科或碩士在讀,計(jì)算機(jī)科學(xué)、人工智能、軟件工程、數(shù)學(xué)、電子信息等相關(guān)專業(yè)優(yōu)先。
2.編程能力:
熟悉至少一種編程語言(Python為主,或Java/JavaScript),能夠閱讀和理解代碼邏輯。
3.有基礎(chǔ)的腳本編寫能力,能夠處理數(shù)據(jù)或搭建簡單測試腳本。
4.AI基礎(chǔ)知識:
對機(jī)器人、人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)有濃厚興趣,了解大模型、NLP/CV等基本概念。
5.了解主流大模型評測基準(zhǔn)(如MMLU、MT-Bench、TruthfulQA等)者優(yōu)先。
6.工具使用:了解Postman/JMeter等接口測試工具,或Selenium/Pytest等自動化測試框架者優(yōu)先。