崗位職責(zé):
1、研發(fā)與優(yōu)化大模型算法?:設(shè)計(jì)并實(shí)施大模型算法,提升訓(xùn)練效率和模型性能,包括預(yù)訓(xùn)練(Pretrain)、指令微調(diào)(SFT)、強(qiáng)化學(xué)習(xí)(RLHF)等子任務(wù)的全流程構(gòu)建。
?2、模型訓(xùn)練與調(diào)優(yōu)?:負(fù)責(zé)行業(yè)垂類大模型的訓(xùn)練、對(duì)齊、任務(wù)調(diào)優(yōu),優(yōu)化模型在準(zhǔn)確性、穩(wěn)定性和推理速度方面的表現(xiàn),解決梯度消失、過擬合等問題?。
?3、業(yè)務(wù)應(yīng)用與場景落地?:設(shè)計(jì)基于大模型的智能體架構(gòu),通過prompt工程、RAG技術(shù)或智能agent開發(fā)將AI agent應(yīng)用于具體業(yè)務(wù)。
?4、前沿技術(shù)探索與創(chuàng)新?:研究多模態(tài)融合、分布式訓(xùn)練、模型壓縮(如量化、剪枝)等前沿技術(shù),推動(dòng)算法在工業(yè)優(yōu)化或跨學(xué)科領(lǐng)域的應(yīng)用。
?5、數(shù)據(jù)處理與部署支持?:負(fù)責(zé)大規(guī)模數(shù)據(jù)清洗、分析和建模,搭建訓(xùn)練框架,并參與模型在云端或邊緣設(shè)備的部署與維護(hù)。
任職要求:
1、學(xué)歷與專業(yè)背景?:計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、電子工程或相關(guān)專業(yè)碩士及以上學(xué)歷優(yōu)先?。
?2、技術(shù)經(jīng)驗(yàn)?:具備深度學(xué)習(xí)領(lǐng)域(如NLP、計(jì)算機(jī)視覺)的實(shí)戰(zhàn)經(jīng)驗(yàn),熟悉預(yù)訓(xùn)練模型(如LLaMA、GPT、千問等)的訓(xùn)練、微調(diào)和優(yōu)化;有千億級(jí)大模型項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
3、?核心技能?:精通Python編程,熟練掌握PyTorch、TensorFlow、Hugging Face等深度學(xué)習(xí)框架和工具鏈。掌握prompt工程、模型蒸餾、推理加速等技術(shù),具備數(shù)據(jù)分析和建模能力。
4、熟悉Linux環(huán)境、分布式訓(xùn)練(如DeepSpeed)和CUDA/AMDRocom編程。
?能力與素質(zhì)?:優(yōu)秀的問題解決能力、文字表達(dá)和溝通技巧;良好的團(tuán)隊(duì)協(xié)作精神,能夠帶領(lǐng)團(tuán)隊(duì)高效推進(jìn)項(xiàng)目;持續(xù)學(xué)習(xí)前沿技術(shù)(如AI Agent、多模態(tài)應(yīng)用)。