崗位職責:
1.大模型性能優(yōu)化:負責大型深度學習模型(如Transformer、BERT、GPT等)的性能調(diào)優(yōu)工作,包括但不限于模型收斂速度、準確率、泛化能力等關鍵指標的優(yōu)化。
2.算法研究與實現(xiàn):跟蹤并研究最新的深度學習算法、優(yōu)化技巧及前沿技術(shù),將研究成果轉(zhuǎn)化為實際應用,提升模型效果。
3.數(shù)據(jù)預處理與分析:參與數(shù)據(jù)集的預處理與分析工作,設計并實施數(shù)據(jù)清洗、特征工程等策略,確保數(shù)據(jù)質(zhì)量滿足模型訓練需求。
4.模型訓練與評估:利用TensorFlow、PyTorch等深度學習框架進行模型訓練,設計合理的評估指標體系,對模型效果進行全面評估。
5.團隊協(xié)作與溝通:與產(chǎn)品經(jīng)理、數(shù)據(jù)工程師、其他算法工程師緊密合作,共同推動項目進展,確保項目按時按質(zhì)完成。
6.文檔撰寫與分享:撰寫技術(shù)文檔,分享研究成果與經(jīng)驗,提升團隊整體技術(shù)水平。
任職要求:
1.教育背景:計算機科學、數(shù)學、統(tǒng)計學、物理等相關專業(yè)本科及以上學歷,碩士及以上學歷優(yōu)先。
2.工作經(jīng)驗:
o5年或以上算法工程師相關工作經(jīng)驗,有大模型調(diào)優(yōu)項目經(jīng)驗者優(yōu)先。
o具備良好的問題解決能力和創(chuàng)新能力,能夠獨立承擔項目任務。
3.專業(yè)技能:
o精通Python編程語言,熟悉TensorFlow、PyTorch等深度學習框架。
o對機器學習、深度學習算法有深入理解,具備扎實的數(shù)學基礎(線性代數(shù)、概率統(tǒng)計、微積分等)。
o熟悉常見的模型優(yōu)化算法(如梯度下降、Adam等),了解模型并行計算、分布式訓練等技術(shù)。
o有NLP、CV等大模型調(diào)優(yōu)經(jīng)驗者優(yōu)先。