工作內(nèi)容:
1.協(xié)助開展大模型的訓(xùn)練與微調(diào)實(shí)驗(yàn),包括實(shí)驗(yàn)環(huán)境搭建與結(jié)果復(fù)現(xiàn)。
2.參與數(shù)據(jù)收集、清洗、標(biāo)注和預(yù)處理,保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性與完整性。
3.協(xié)助構(gòu)建和維護(hù)訓(xùn)練集、驗(yàn)證集與評估集,為模型迭代提供支持。
4.編寫實(shí)驗(yàn)?zāi)_本與工具代碼,提升研發(fā)與測試的自動化程度;撰寫實(shí)驗(yàn)日志與結(jié)果報告,定期總結(jié)實(shí)驗(yàn)經(jīng)驗(yàn)。
5.協(xié)助開展檢索增強(qiáng)生成(RAG)系統(tǒng)的實(shí)驗(yàn),測試embedding、檢索等模塊效果
崗位要求:
1.本科或碩士在讀,計算機(jī)科學(xué)、人工智能、數(shù)學(xué)、統(tǒng)計等相關(guān)專業(yè)。
2.熟悉Python 編程,掌握NumPy、Pandas等數(shù)據(jù)處理工具。
3.了解PyTorch 或TensorFlow 框架,能夠運(yùn)行基礎(chǔ)實(shí)驗(yàn)。
4.學(xué)習(xí)能力強(qiáng),能夠快速掌握新技術(shù)。
5.具備團(tuán)隊(duì)合作精神與良好的溝通能力。
6.每周實(shí)習(xí)不少于4天,持續(xù)3個月以上