工作職責(zé)
1. 負(fù)責(zé)無(wú)人機(jī) VLA(Vision-Language-Action)與基座大模型(Foundation Model)的技術(shù)探索與研發(fā),推動(dòng)多模態(tài)感知、語(yǔ)言理解與動(dòng)作決策的深度融合;
2. 基于大規(guī)模云端計(jì)算資源,對(duì)無(wú)人機(jī) VLA 大模型進(jìn)行訓(xùn)練、優(yōu)化與推理部署,實(shí)現(xiàn)復(fù)雜任務(wù)的自動(dòng)化與智能化;
3. 持續(xù)提升模型在多場(chǎng)景、多任務(wù)、多傳感器融合條件下的泛化能力與魯棒性;
4. 跟蹤并引入前沿 AI 技術(shù)(如自監(jiān)督、多模態(tài)對(duì)齊、強(qiáng)化學(xué)習(xí)、人類反饋訓(xùn)練等)到無(wú)人機(jī)任務(wù)中;
5. 與產(chǎn)品、硬件、數(shù)據(jù)平臺(tái)團(tuán)隊(duì)協(xié)作,將算法快速落地到實(shí)際業(yè)務(wù)場(chǎng)景中,包括巡檢、測(cè)繪、安防、農(nóng)業(yè)等領(lǐng)域。
任職要求
1. 計(jì)算機(jī)科學(xué)、人工智能、自動(dòng)化、電子工程等相關(guān)專業(yè)碩士及以上學(xué)歷;
2. 精通多模態(tài)人工智能(視覺(jué)、語(yǔ)言、動(dòng)作決策等)原理與算法,具備 VLM/VLA 相關(guān)研究或落地經(jīng)驗(yàn);
3. 熟練掌握并能靈活使用主流開(kāi)源 VLM 基座模型(優(yōu)先 Qwen2.5-VL),熟悉其架構(gòu)、訓(xùn)練流程與微調(diào)方法(如 LoRA、SFT、RLHF/DPO 等);
4. 有大語(yǔ)言模型(LLM)、視覺(jué)-語(yǔ)言模型(VLM)、Agent 系統(tǒng)或強(qiáng)化學(xué)習(xí)(RL)技術(shù)的實(shí)戰(zhàn)經(jīng)驗(yàn);
5. 具備大規(guī)模云端訓(xùn)練、分布式推理和模型優(yōu)化經(jīng)驗(yàn),熟悉 Kubernetes、Ray、DeepSpeed 等工具;
6. 編程能力強(qiáng)(Python/C++),能夠獨(dú)立完成從算法設(shè)計(jì)到工程實(shí)現(xiàn)的全流程;
7. 具備前瞻性技術(shù)視野、良好的溝通與跨團(tuán)隊(duì)協(xié)作能力,有推動(dòng)技術(shù)創(chuàng)新落地的經(jīng)驗(yàn)。