崗位職責:
1、負責公司智算平臺的功能、性能、安全性測試,確保平臺的穩(wěn)定性和高效性;
2、設計、編寫和執(zhí)行測試用例,搭建自動化測試框架,提升測試效率;
3、進行系統(tǒng)和接口測試,分析測試結果,編寫測試報告,并推動問題修復;
4、參與需求評審,提供測試策略和優(yōu)化建議,提升產(chǎn)品質(zhì)量;
5、研究并引入先進的測試技術和工具,提高測試覆蓋率和自動化程度;
6、監(jiān)控和優(yōu)化智算平臺的資源使用情況,保障大規(guī)模計算任務的穩(wěn)定運行。
崗位要求:
1、計算機、軟件工程、人工智能或相關專業(yè)本科及以上學歷;
2、有AI計算平臺、分布式計算或云計算測試經(jīng)驗者優(yōu)先;
3、熟悉常見的軟件測試方法和流程,掌握自動化測試框架(如Selenium、pytest、Cypress, Playwrite等);
4、具備較強的Linux系統(tǒng)操作能力,熟悉Shell、Python或其他腳本語言,能編寫自動化測試腳本;
5、了解Docker、Kubernetes等云原生技術,有相關測試經(jīng)驗者優(yōu)先;
6、熟悉常見的性能測試工具(如JMeter)及監(jiān)控工具(如Prometheus、Grafana);
7、具備較強的分析和問題定位能力,良好的溝通和團隊協(xié)作精神。
加分項:
有LLM(大語言模型)推理框架或分布式訓練相關測試經(jīng)驗;
了解K8S或其他容器編排系統(tǒng)的測試方法;
熟悉GPU計算框架(如CUDA、TensorRT、TPU等)。