崗位職責(zé)
1.多模態(tài)大模型研發(fā)與優(yōu)化
1)設(shè)計(jì)并實(shí)現(xiàn)多模態(tài)大模型(圖文音聯(lián)合建模),解決跨模態(tài)語(yǔ)義對(duì)齊、動(dòng)態(tài)數(shù)據(jù)處理等核心問(wèn)題。
2)優(yōu)化模型生成能力,支持復(fù)雜多模態(tài)交互,實(shí)現(xiàn)秒級(jí)響應(yīng)。
2.多 Agent 系統(tǒng)算法設(shè)計(jì)
1)構(gòu)建多 Agent 協(xié)作框架,設(shè)計(jì)動(dòng)態(tài)任務(wù)分配與博弈策略,解決資源爭(zhēng)奪、動(dòng)態(tài)聯(lián)盟等復(fù)雜場(chǎng)景下的決策問(wèn)題
2)結(jié)合博弈論與強(qiáng)化學(xué)習(xí),開(kāi)發(fā)對(duì)手建模模塊,預(yù)測(cè)其他 Agent 的策略分布,優(yōu)化協(xié)作效率
3)參與工業(yè)級(jí) Agent 系統(tǒng)落地。
3.行業(yè)場(chǎng)景落地與創(chuàng)新
1)探索生成式 AI與 RAG的結(jié)合,提升垂直領(lǐng)域的知識(shí)推理能力。
2)跟蹤前沿技術(shù),推動(dòng)技術(shù)方案的創(chuàng)新與落地。
任職要求
1.技術(shù)技能
1)模型開(kāi)發(fā):精通 Transformer 架構(gòu),熟悉多模態(tài)模型、大語(yǔ)言模型,
2)工具鏈:熟練使用 PyTorch、TensorFlow、Transformers,掌握 Deepspeed、Magtran 等分布式訓(xùn)練工具。
3)算法優(yōu)化:熟悉 SFT、RLHF、LORA 等微調(diào)技術(shù),具備模型壓縮等輕量化經(jīng)驗(yàn)。
4)分布式訓(xùn)練:了解 NCCL、Megatron-LM,有跨節(jié)點(diǎn)通信優(yōu)化經(jīng)驗(yàn)者優(yōu)先。
2.項(xiàng)目經(jīng)驗(yàn)
1)至少參與過(guò) 1 個(gè)完整的大模型項(xiàng)目(如預(yù)訓(xùn)練、微調(diào)、部署)
2)熟悉多模態(tài)數(shù)據(jù)處理流程,包括跨模態(tài)對(duì)齊、領(lǐng)域適配與模型壓縮全鏈路優(yōu)化
3) 有工業(yè)級(jí) Agent 系統(tǒng)落地經(jīng)驗(yàn)者加分。