崗位職責:
1.負責具身大模型SFT、RL等后訓練算法設計、調優(yōu),提升VLA預訓練模型在特定場景成功率與樣本效率;
2.跟蹤和評估pi 0.5等最新具身大模型以及最新后訓練算法,維護和優(yōu)化相關算法框架;
3.根據(jù)實際場景需求,負責具身后訓練多模態(tài)數(shù)據(jù)集的構建、清洗等工作。
任職要求:
1.計算機、自動化、機器人、人工智能等相關專業(yè)碩士及以上學歷;
2.熟練掌握Python、C++等編程語言,熟悉機器人操作系統(tǒng)(如ROS)和常用深度學習框架(如PyTorch、TensorFlow);
3.熟悉Dif fusion Policy、ACT、PiO、RDT、OpenVLA等機器人模仿學習算法;
4.熟悉SFT、RL等VLA后訓練算法;
5.具備發(fā)表算法相關優(yōu)秀論文和參加算法相關競賽/獲獎的經(jīng)驗者優(yōu)先;
6.具備良好的團隊合作精神和溝通能力。