【本科以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè)優(yōu)先,學(xué)信網(wǎng)可查,能接受長(zhǎng)期穩(wěn)定駐場(chǎng)辦公】
崗位職責(zé):
1.協(xié)助完成AI管理平臺(tái)功能測(cè)試、產(chǎn)品選型及平臺(tái)實(shí)施。
2.協(xié)助完成AI服務(wù)器選型和測(cè)試,包括GPU服務(wù)器基準(zhǔn)性能和精度測(cè)試,為采購(gòu)提供選型依據(jù);
3.協(xié)助管理GPU資源和有效分配,優(yōu)化集群資源利用率,提升AI訓(xùn)推效率和吞吐量。
4.協(xié)助GPU集群的日常運(yùn)維,包括但不限于系統(tǒng)部署、配置管理、監(jiān)控告警、故障排查與解決,確保集群的高效穩(wěn)定運(yùn)行。
任職要求:
1.了解Linux系統(tǒng)操作及Shell/Python腳本編寫,能完成自動(dòng)化腳本的簡(jiǎn)單調(diào)整;
2.熟悉GPU、NPU芯片架構(gòu),及主流AI服務(wù)器性能特性;
3. 了解虛擬化、容器化技術(shù)(如Docker/Kubernetes),具備云計(jì)算平臺(tái)(如阿里云/華為云)基礎(chǔ)操作經(jīng)驗(yàn)優(yōu)先;
4.掌握服務(wù)器硬件基礎(chǔ)維護(hù)知識(shí),了解GPU/NPU等異構(gòu)算力資源管理邏輯;
5.對(duì)AI技術(shù)有熱情,具備強(qiáng)烈的探索精神、優(yōu)秀的動(dòng)手能力、較強(qiáng)的問題分析解決能力,具備良好的問題解決能力和團(tuán)隊(duì)合作精神,及良好的文檔編寫和知識(shí)沉淀能力。