1. 基于Go語(yǔ)言構(gòu)建高可用、高性能的AI建模支撐系統(tǒng),包括模型訓(xùn)練任務(wù)調(diào)度平臺(tái)、數(shù)據(jù)流轉(zhuǎn)管道、模型版本管理系統(tǒng)等核心模塊開發(fā)與迭代。
2. 負(fù)責(zé)AI模型工程化落地的系統(tǒng)層實(shí)現(xiàn),設(shè)計(jì)并開發(fā)模型訓(xùn)練、推理部署的自動(dòng)化流程,對(duì)接TensorFlow/PyTorch等框架的底層接口,解決分布式訓(xùn)練的資源調(diào)度、任務(wù)監(jiān)控問題。
3. 參與AI建模相關(guān)工具鏈的開發(fā),如數(shù)據(jù)預(yù)處理工具、特征存儲(chǔ)服務(wù)、模型評(píng)估接口等,通過系統(tǒng)能力降低算法工程師的建模門檻,提升建模效率。
4. 負(fù)責(zé)系統(tǒng)性能優(yōu)化與問題排查,針對(duì)高并發(fā)場(chǎng)景(如大規(guī)模數(shù)據(jù)讀寫、多模型并行推理)進(jìn)行代碼調(diào)優(yōu)、數(shù)據(jù)庫(kù)索引優(yōu)化及服務(wù)架構(gòu)升級(jí),保障系統(tǒng)穩(wěn)定性。
5. 與業(yè)務(wù)團(tuán)隊(duì)協(xié)作,理解AI建模需求與業(yè)務(wù)目標(biāo),將技術(shù)方案轉(zhuǎn)化為系統(tǒng)功能,輸出清晰的技術(shù)文檔,推動(dòng)跨團(tuán)隊(duì)項(xiàng)目高效落地。