1.模型研發(fā):研究、設(shè)計(jì)并實(shí)現(xiàn)前沿的VLM/VLA模型架構(gòu),使其適用于自動駕駛的感知、預(yù)測、規(guī)劃等任務(wù)(如場景描述、危險(xiǎn)識別、因果推理、行為解釋、端到端規(guī)劃等);
2.數(shù)據(jù)處理及挖掘:構(gòu)建和管理大規(guī)模、高質(zhì)量的多模態(tài)(視覺、文本、駕駛動作)數(shù)據(jù)集,設(shè)計(jì)高效的數(shù)據(jù)標(biāo)注、清洗和增強(qiáng) pipeline;
3.算法訓(xùn)練與優(yōu)化:利用提示工程、模型微調(diào)、多模態(tài)對齊、強(qiáng)化學(xué)習(xí)等技術(shù)進(jìn)行模型訓(xùn)練,優(yōu)化訓(xùn)練效率與穩(wěn)定性;
4.評估與測試:構(gòu)建測試評估數(shù)據(jù)集,測評模型在安全、合規(guī)、舒適等多維度下的性能,持續(xù)迭代優(yōu)化模型。
任職要求:
1.計(jì)算機(jī)科學(xué)、人工智能、機(jī)器人或相關(guān)領(lǐng)域的碩士/博士學(xué)歷;
2.對機(jī)器學(xué)習(xí)、深度學(xué)習(xí)有深入的理解,熟悉大模型常用模型設(shè)計(jì)及訓(xùn)練方法,在以下一個或多個領(lǐng)域有扎實(shí)的理論基礎(chǔ)和實(shí)踐經(jīng)驗(yàn):
視覺-語言模型(VLM):如圖文理解,圖文檢索,圖文生成等
視覺-語言-行動模型(VLA):如端到端駕駛、機(jī)器人操控、具身智能等
自動駕駛AI算法:如感知、行為預(yù)測、運(yùn)動規(guī)劃等
在國際頂級機(jī)器學(xué)習(xí)、機(jī)器人相關(guān)會議、期刊發(fā)表過論文者優(yōu)先,在機(jī)器學(xué)習(xí)相關(guān)競賽中取得優(yōu)異成績者優(yōu)先。
3.具備出色的分析問題和解決問題的能力,良好的溝