一、崗位職責(zé):
? 1、負(fù)責(zé)大語言模型、多模態(tài)大模型等算法,具體工作包括設(shè)計(jì)并訓(xùn)練大模型,確保高效收斂與穩(wěn)定性能;優(yōu)化模型壓縮與加速,提升推理效率;微調(diào)與對(duì)齊模型,增強(qiáng)場景適配性與安全性;跟蹤前沿技術(shù),推動(dòng)算法創(chuàng)新與應(yīng)用落地。
? 2、核心算法開發(fā)、核心算法在國產(chǎn)化平臺(tái)的適配、系統(tǒng)測(cè)試與部署等。
? 3、軟件產(chǎn)品的技術(shù)需求分析,撰寫需求分析、設(shè)計(jì)規(guī)格、技術(shù)總結(jié)報(bào)告等相關(guān)報(bào)告。
二、任職要求:
? 1、碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、物理等相關(guān)專業(yè)。
? 2、熟練掌握線性代數(shù)、概率論、隨機(jī)過程、優(yōu)化理論、信息論等基礎(chǔ)數(shù)學(xué)知識(shí),能夠運(yùn)用數(shù)學(xué)知識(shí)獨(dú)立推導(dǎo)大模型訓(xùn)練過程中的復(fù)雜公式。
? 3、深入理解深度學(xué)習(xí)基本原理,包括神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、反向傳播算法、梯度下降優(yōu)化方法等,熟悉大模型預(yù)訓(xùn)練、微調(diào)、對(duì)齊等階段的理論依據(jù)和關(guān)鍵技術(shù)。
? 4、精通Python,能夠高效編寫復(fù)雜的數(shù)據(jù)處理和模型訓(xùn)練代碼,熟悉常用的Python庫。
? 5、熟練使用至少一種深度學(xué)習(xí)框架(PyTorch、MindSpore、PaddlePaddle),能夠基于框架進(jìn)行大模型的搭建、訓(xùn)練和調(diào)試。
? 6、熟悉分布式訓(xùn)練框架(如DeepSpeed、Megatron-LM、Horovod等),能夠進(jìn)行大規(guī)模模型的分布式訓(xùn)練優(yōu)化。
? 7、具備從0到1訓(xùn)練和微調(diào)大模型的經(jīng)驗(yàn),熟悉大模型訓(xùn)練的全流程,包括數(shù)據(jù)準(zhǔn)備、模型設(shè)計(jì)、訓(xùn)練策略制定、超參數(shù)調(diào)優(yōu)等。
? 8、掌握大模型優(yōu)化技術(shù),包括模型壓縮(量化、剪枝、蒸餾)、高性能推理(如使用TensorRT、ONNX Runtime等)、模型并行和數(shù)據(jù)并行策略等。