崗位職責(zé)
1. 負(fù)責(zé)將大模型技術(shù)應(yīng)用于垂直行業(yè),推動(dòng)大模型技術(shù)發(fā)揮業(yè)務(wù)價(jià)值,并提供可規(guī)模復(fù)制的產(chǎn)品解決方案。
2. 負(fù)責(zé)對(duì)特定場景下大模型訓(xùn)練和推理優(yōu)化,負(fù)責(zé)RAG、AI Agent等相關(guān)算法的應(yīng)用落地。
3. 追蹤學(xué)術(shù)界和工業(yè)界在大模型預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)、知識(shí)蒸餾等方向的前沿進(jìn)展,并進(jìn)行持續(xù)創(chuàng)新和優(yōu)化。
4. 與團(tuán)隊(duì)成員緊密合作,共同解決大模型產(chǎn)業(yè)落地過程中的算法和技術(shù)難題,提高團(tuán)隊(duì)整體技術(shù)水平。
5. 跟蹤行業(yè)動(dòng)態(tài),了解競爭對(duì)手的技術(shù)發(fā)展,為公司的發(fā)展提供戰(zhàn)略建議。
6. 撰寫技術(shù)文檔,分享研究成果和經(jīng)驗(yàn),幫助團(tuán)隊(duì)共同成長。
任職要求
1. 計(jì)算機(jī)科學(xué)、人工智能或相關(guān)領(lǐng)域統(tǒng)招碩士及以上學(xué)歷,5年以上算法工作經(jīng)驗(yàn);
2. 熟悉DeepSeek、Qwen、Llama等主流大模型原理,熟悉大模型增強(qiáng)預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)、數(shù)據(jù)清洗、Prompt、RAG、Agent等相關(guān)技術(shù);
3. 具備扎實(shí)的數(shù)學(xué)和編程基礎(chǔ),熟練掌握Python/Java/C++等至少一種編程語言,TensorFlow/PyTorch等至少一種深度學(xué)習(xí)框架;
4. 具備良好的團(tuán)隊(duì)協(xié)作能力、項(xiàng)目管理能力、統(tǒng)籌協(xié)調(diào)能力;
5. 對(duì)新技術(shù)保持敏感度,具備較強(qiáng)的學(xué)習(xí)能力和創(chuàng)新能力;
6. 有大型互聯(lián)網(wǎng)公司工作經(jīng)驗(yàn)者優(yōu)先,有大模型實(shí)際落地經(jīng)驗(yàn)優(yōu)先,有基于國產(chǎn)芯片的經(jīng)驗(yàn)優(yōu)先。