【任職要求】
1. 教育背景:
- 計算機科學、人工智能相關領域的本科及以上學歷,985、211、雙一流優(yōu)先。
2. 技術能力:
- 熟悉深度學習、自然語言處理、計算機視覺等領域的基本理論和算法。
- 具備大規(guī)模預訓練模型(如GPT、BERT、Transformer等)的研發(fā)經(jīng)驗。
- 熟悉分布式訓練框架(如PyTorch、TensorFlow、Horovod等),并具備性能優(yōu)化經(jīng)驗。
- 熟悉模型壓縮技術(如剪枝、量化、蒸餾等)者優(yōu)先。
- 具備多模態(tài)大模型研發(fā)經(jīng)驗者優(yōu)先。
3. 編程能力:
- 熟練掌握Python、C++、C等任意一種編程語言,具備良好的代碼風格和工程能力。
- 熟悉Linux開發(fā)環(huán)境,具備大規(guī)模數(shù)據(jù)處理和分布式系統(tǒng)開發(fā)經(jīng)驗。
4.成功案例:
-有提供解決方案能力。
-有工程方向AI研究案例。
【工作職責】
1. 大模型研發(fā)與優(yōu)化:
- 負責大規(guī)模預訓練模型(如NLP、CV、多模態(tài)等)的算法設計與研發(fā),包括模型架構創(chuàng)新、訓練策略優(yōu)化等。
- 探索大模型的高效訓練方法,解決數(shù)據(jù)并行、模型并行、流水線并行等技術難題。
- 針對特定業(yè)務場景,進行模型剪枝、量化、蒸餾等優(yōu)化,提升模型推理效率。
2. 分布式訓練與性能優(yōu)化:
- 設計和優(yōu)化大規(guī)模分布式訓練框架,提升訓練效率與資源利用率。
- 解決大規(guī)模訓練中的性能瓶頸問題,包括通信優(yōu)化、內(nèi)存優(yōu)化等。
3. AI技術落地與應用:
- 將大模型技術與云計算業(yè)務場景結合,推動AI技術在智能客服、智能體、知識庫、內(nèi)容生成、數(shù)據(jù)分析等領域的應用落地。
- 與產(chǎn)品團隊緊密合作,提供技術支持和解決方案,確保技術成果的快速轉化。
4. 前沿技術研究:
- 跟蹤AI領域的最新研究成果,探索大模型技術的前沿方向,如自監(jiān)督學習、強化學習、多模態(tài)融合等。
- 參與學術交流與技術分享,提升團隊的技術影響力。