崗位職責(zé):
1.參與大模型的全生命周期開發(fā):包括數(shù)據(jù)構(gòu)建、預(yù)訓(xùn)練、指令微調(diào)(SFT)、人類反饋強化學(xué)習(xí)(RLHF)、模型評估與部署等環(huán)節(jié)。
2.探索大模型在垂直行業(yè)(如金融、醫(yī)療、教育等)的應(yīng)用場景,設(shè)計領(lǐng)域適配方案,提升模型的專業(yè)性與實用性。
3.優(yōu)化模型推理效率與部署成本,包括模型壓縮、量化、蒸餾、推理加速等工程化技術(shù)。
4.跟蹤前沿大模型技術(shù)進展(如MoE架構(gòu)、多模態(tài)融合、Agent框架等),推動技術(shù)創(chuàng)新與業(yè)務(wù)結(jié)合。
任職要求:
1.碩士研究生及以上學(xué)歷,計算機、人工智能、數(shù)學(xué)等相關(guān)專業(yè),3年以上相關(guān)經(jīng)驗;
2.熟悉深度學(xué)習(xí)框架,如TensorFlow或Pytorch;
3.熟悉LLM原理,有l(wèi)lama13B、bloom7B同等及以上規(guī)模LLM的實戰(zhàn)經(jīng)驗優(yōu)先;
4.有自然語言處理、人機交互、AIGC方向落地經(jīng)驗者優(yōu)先;
5.有強烈好奇心和知識探求精神,有通過技術(shù)改變世界的使命感;
6.有較強的溝通和邏輯表達能力,具備良好的團隊合作精神和主動意識,較高的自我驅(qū)動和學(xué)習(xí)能力。