1.人工智能、計(jì)算機(jī)、通信、網(wǎng)絡(luò)等專(zhuān)業(yè)領(lǐng)域。
2.對(duì)Transformer、MOE、多模態(tài)、擴(kuò)散模型等大模型架構(gòu)有深入理解,熟悉LLM、AIGC、多模態(tài)等相關(guān)算法的研究與算法優(yōu)化;
3.精通大模型預(yù)訓(xùn)練與微調(diào)策略,包括多模態(tài)無(wú)監(jiān)督預(yù)訓(xùn)練、有監(jiān)督微調(diào)與提示學(xué)習(xí);
4.精通信號(hào)(語(yǔ)音)處理方法,深入研究自動(dòng)語(yǔ)音識(shí)別、語(yǔ)音合成和語(yǔ)音多模態(tài)大模型等前沿技術(shù),部分與電磁信號(hào)共性技術(shù)可直接遷移至電磁大模型上;
5.精通多模態(tài)對(duì)齊和知識(shí)蒸餾技術(shù),熟練使用DeepSpeed、Megatron等多種分布式訓(xùn)練框架;
6.熟練掌握大模型微調(diào)技術(shù),包括LoRA、DPO策略優(yōu)化,熟悉MoE、AI Agent和RAG技術(shù)。
1、根據(jù)業(yè)務(wù)需求,負(fù)責(zé)領(lǐng)域/場(chǎng)景大模型技術(shù)路線論證工作,提供技術(shù)解決方案,包括但不限于多模態(tài)數(shù)據(jù)理解、RAG、AI Agent等;
2、與平臺(tái)工程師、數(shù)據(jù)科學(xué)家、評(píng)測(cè)工程師等團(tuán)隊(duì)合作,開(kāi)展大模型數(shù)據(jù)工程、訓(xùn)練與微調(diào)、對(duì)齊、評(píng)估、云邊端部署等工作與工具鏈建設(shè);
3、大模型迭代、訓(xùn)練與優(yōu)化工作,持續(xù)提高大模型在業(yè)務(wù)場(chǎng)景中的性能水平;
4、負(fù)責(zé)優(yōu)化電磁大模型架構(gòu),推進(jìn)多任務(wù)應(yīng)用落地
5、構(gòu)建電磁大模型的測(cè)評(píng)基準(zhǔn),測(cè)評(píng)在電磁多任務(wù)效果,推動(dòng)大模型性能提升
6、負(fù)責(zé)電磁大模型內(nèi)存和推理速度優(yōu)化,降低訓(xùn)練部署成本和推理延時(shí)
7、編寫(xiě)項(xiàng)目論證方案、實(shí)施方案與項(xiàng)目總結(jié)報(bào)告等相關(guān)技術(shù)報(bào)告、研發(fā)文檔、匯報(bào)PPT等文檔撰寫(xiě);
8、關(guān)注大模型相關(guān)技術(shù)發(fā)展趨勢(shì),參與集團(tuán)公司大模型相關(guān)論證工作。