崗位職責(zé):
1.負(fù)責(zé)一站式機(jī)器學(xué)習(xí)平臺(tái)的研發(fā)與迭代,包括前端、后臺(tái)、平臺(tái)任務(wù)流設(shè)計(jì)與研發(fā),開發(fā)高并發(fā)高可用的機(jī)器學(xué)習(xí)MLOps平臺(tái),實(shí)現(xiàn)常規(guī)AutoML集成學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、多模態(tài)等算法,配合研究員開拓AI在高端復(fù)雜工業(yè)領(lǐng)域的應(yīng)用
2.搭建高并發(fā)分布式的推理平臺(tái),搭建穩(wěn)定高可用計(jì)算集群(GPU&CPU基礎(chǔ)設(shè)施),持續(xù)跟進(jìn)業(yè)界先進(jìn)開源組件、方案并落地到項(xiàng)目中,實(shí)現(xiàn)自動(dòng)化、健康檢查、實(shí)時(shí)性能監(jiān)控等
3.維護(hù)機(jī)器學(xué)習(xí)模型數(shù)據(jù)、訓(xùn)練和部署,負(fù)責(zé)線上算法的日常運(yùn)營(yíng),能夠及時(shí)響應(yīng)故障報(bào)警、快速解決問題恢復(fù)業(yè)務(wù)
4.推動(dòng)工業(yè)大模型的開發(fā)落地,持續(xù)推進(jìn)優(yōu)化模型效果
任職要求:
1.計(jì)算機(jī)相關(guān)專業(yè),碩士及以上3年或211本科5年以上開發(fā)經(jīng)驗(yàn),有扎實(shí)的編程基礎(chǔ),具有DevOps\MLOps相關(guān)背景優(yōu)先
2.熟練掌握python(pandas),熟悉C++或go,熟悉數(shù)據(jù)庫操作
3.熟悉kubernetes架構(gòu)及基本使用,具有kubernetes開發(fā)能力者優(yōu)先。熟悉多項(xiàng)大數(shù)據(jù)處理工具/分析工具如spark\hdfs等
4.熟悉圖像、推薦、NLP算法一類或幾類(大語言模型、SAM\ViT、widedeep\DCN、AutoGluon等),了解深度學(xué)習(xí)框架,了解數(shù)據(jù)并行、模型并行
5.有前沿模型研發(fā)經(jīng)驗(yàn),涉及數(shù)據(jù)、評(píng)估、平臺(tái)相關(guān)工作
6.有大規(guī)模分布式架構(gòu)設(shè)計(jì)或使用經(jīng)驗(yàn)
7.熟悉Linux基礎(chǔ)操作、配置、日志排查等
8.能較好閱讀英文論文、跟進(jìn)前沿技術(shù)并落地相關(guān)算法
9.要求候選人性格穩(wěn)重、主動(dòng)思考、抗壓、學(xué)習(xí)能力強(qiáng)、有較好的合作意識(shí)、較好的團(tuán)隊(duì)合作能力、有志在芯片及半導(dǎo)體行業(yè)發(fā)展