崗位職責:
1、AI模型開發(fā)與調優(yōu)支持
數據預處理:協(xié)助清洗、標注、增強訓練數據(如圖像去噪、文本分詞、缺失值填充),確保數據質量符合模型輸入要求;使用工具(如Pandas、OpenCV、LabelMe)完成數據格式轉換與特征工程。
模型訓練輔助:根據算法工程師的方案,配置訓練環(huán)境(如安裝PyTorch/TensorFlow/MindSpore、配置GPU/昇騰算力),執(zhí)行訓練腳本并監(jiān)控過程(如損失值、準確率、顯存占用);記錄實驗日志,協(xié)助排查訓練中斷、過擬合等問題。
模型調優(yōu)協(xié)助:參與超參數調試(如學習率、 batch size)、模型壓縮(剪枝、量化)或輕量化(如轉為ONNX/TFLite格式),提升模型推理速度或降低部署成本;配合測試不同模型結構(如ResNet vs. ViT)的效果差異
2、AI模型部署與運維
部署環(huán)境搭建:根據業(yè)務需求(如云端、邊緣端、移動端),將訓練好的模型部署至目標平臺(如使用TensorFlow Serving、TorchServe、MindSpore Lite或Docker容器化);配置推理服務接口(REST/gRPC),確保低延遲響應。
性能監(jiān)控與優(yōu)化:監(jiān)控模型線上表現(xiàn)(如QPS、延遲、錯誤率),定位推理瓶頸(如算子效率低、內存泄漏);聯(lián)合算法團隊優(yōu)化模型(如替換低效算子、啟用FP16混合精度),或與運維團隊協(xié)作擴容算力資源。
故障排查與修復:處理線上模型異常(如輸出錯誤、崩潰),通過日志分析(如推理請求參數、模型中間結果)定位根因(如數據分布偏移、依賴庫版本沖突),并推動修復(如重新校準模型、回滾版本)。
3、AI工具鏈與平臺維護
工具鏈支持:維護團隊使用的AI開發(fā)工具(如Jupyter Notebook、MLflow實驗管理、Weights & Biases可視化)、算力平臺(如Kubernetes集群、昇騰Atlas服務器)及協(xié)作流程(如Git代碼管理、CI/CD流水線),確保工具穩(wěn)定運行。
自動化腳本開發(fā):編寫輔助腳本(如數據批量處理腳本、模型自動測試腳本、部署流水線腳本),提升團隊效率;例如,開發(fā)一個定時任務腳本,自動檢測新數據并觸發(fā)模型重訓練
4、完成領導安排的其它事務
任職要求:
1、大專及以上學歷,計算機科學、人工智能、數學等相關專業(yè),熱愛人工智能行業(yè)并有所了解。
2、AI推理框架:熟悉vLLM / TGI / ONNX Runtime、了解 TensorRT、MindSpore Lite。
3、部署和容器化:Docker(鏡像構建、多階段構建)Kubernetes 基礎(Pod、Service、Ingress)或 華為云 CCE 實操經驗
/4、云平臺:熟練掌握各云平臺 ModelArts(模型部署、OBS(數據存儲、IAM(權限管理、AOM(應用監(jiān)控、OpenSearch(向量檢索)等工具
5、能編寫自動化 ETL 腳本、熟悉 Kafka / DMS 消息隊列、掌握基本數據脫敏方法(哈希、掩碼、泛化);
6、有一定的溝通協(xié)調能力,較強的邏輯性
7、公司單休,介意者慎投?。。?/div>