崗位職責(zé)
1. 機(jī)器人視覺算法研發(fā)
? 設(shè)計(jì)并實(shí)現(xiàn)機(jī)器人視覺感知模塊,包括目標(biāo)檢測、姿態(tài)估計(jì)、場景分割、物體跟蹤等;
? 針對動態(tài)環(huán)境優(yōu)化感知算法的魯棒性和實(shí)時性;
? 支持多傳感器數(shù)據(jù)融合(RGB-D、激光雷達(dá)、慣性傳感器)。
2. 大模型能力融合
? 將視覺-語言模型(VLM)引入機(jī)器人感知與任務(wù)規(guī)劃環(huán)節(jié);
? 基于大模型能力實(shí)現(xiàn)場景語義理解、自然語言指令解析與任務(wù)生成;
? 探索多模態(tài)Transformer在機(jī)器人交互中的應(yīng)用(視覺+語言+控制信號)。
3. 算法優(yōu)化與部署
? 在嵌入式平臺(NVIDIA Jetson、Edge TPU等)上優(yōu)化推理性能;
? 使用模型壓縮、量化、蒸餾等技術(shù)提升部署效率;
? 與平臺團(tuán)隊(duì)協(xié)作,集成算法到機(jī)器人操作系統(tǒng)(ROS2)。
4. 跨團(tuán)隊(duì)協(xié)作
? 與機(jī)器人系統(tǒng)架構(gòu)師協(xié)作完成感知-決策-執(zhí)行閉環(huán);
? 與強(qiáng)化學(xué)習(xí)團(tuán)隊(duì)合作,提供視覺輸入和環(huán)境理解能力。
任職要求
? 碩士及以上學(xué)歷,5 年以上計(jì)算機(jī)視覺/機(jī)器人感知研發(fā)經(jīng)驗(yàn);
? 精通深度學(xué)習(xí)視覺算法(YOLO、Mask R-CNN、DETR、SAM 等);
? 有大模型(CLIP、BLIP、ImageBind、Kosmos-2 等)微調(diào)與應(yīng)用經(jīng)驗(yàn);
? 熟悉 ROS2、SLAM、多傳感器融合技術(shù);
? 有機(jī)器人實(shí)際項(xiàng)目落地經(jīng)驗(yàn)者優(yōu)先。