国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 2月3日

強化學習算法工程師

1.5-3萬·15薪
  • 深圳光明區(qū)
  • 經驗不限
  • 碩士
  • 全職
  • 招2人

職位描述

強化學習?人工智能
【工作職責】
1.負責規(guī)控與控制策略的強化學習建模,設計獎勵函數(shù)、搭建策略網絡。
2.基于 PPO、AMP 等算法,在 Isaac Gym、Isaac Lab、MuJoCo、Gazebo 等仿真環(huán)境開展大規(guī)模并行訓練。
3.研發(fā)領域自適應與域隨機化方法,緩解策略在真實具身智能設備(無人機、無人車、機器狗、機器人等)上的震蕩、失穩(wěn)與性能退化問題,提升 sim2real 成功率。
4.建立標準化仿真回歸測試流程,完成萬次級策略驗證與規(guī)劃邏輯回歸測試,評估策略穩(wěn)定性與失效邊界。
【任職要求】
1.控制理論、計算機科學相關專業(yè)碩士/博士學歷,系統(tǒng)修讀過《深度強化學習》《非線性動力學》,理論基礎扎實。
2.精通 Isaac Gym、Isaac Lab、MuJoCo 大規(guī)模仿真流程,具備千量級以上 Agent 并發(fā)訓練的算力調度經驗。
3.擅長獎勵函數(shù)設計,有通過域隨機化解決硬件失準與震蕩的實操經驗,具備 sim2real 相關理解與落地能力。
4.能設計自動化回歸測試邏輯,量化評估 RL 策略魯棒性上限,有標準化代碼與流程記錄習慣。
5.具備優(yōu)秀科研與實驗習慣,可系統(tǒng)性分析模型不收斂原因,而非盲目調參。
補充說明:優(yōu)秀且經驗豐富者,可適當放寬任職條件;本崗位可招聘應屆畢業(yè)生,同時開放實習生崗位,實習生薪資標準為300-380元/天

工作地點

廣東省深圳市光明區(qū)光明大道尚智科技園

認證資質

營業(yè)執(zhí)照信息

職位發(fā)布者

賈先生/技術總監(jiān)

三日內活躍
立即溝通
公司Logo中兵智能創(chuàng)新研究院(深圳)有限公司
中兵智能創(chuàng)新研究院(深圳)有限公司(以下簡稱“創(chuàng)新院深圳公司”)成立于2024年12月23日,是中國兵器工業(yè)集團有限公司所屬的中兵智能創(chuàng)新研究院有限公司全資子公司,著力打造的軍民融合深圳新標桿,建設粵港澳灣區(qū)智能化解決方案高地。公司面向新質新域,立足軍民融合應用場景落地,聚焦打造足式、輪式、履帶式等特種機器人及相關部組件研發(fā)和產業(yè)化推廣,圍繞平臺、智能感知與自主、通信、人機交互等方向,加大前沿技術應用并培育拓展自主產品產業(yè)化空間,構建從體系到平臺、關鍵部組件的系列化產品譜系,形成產業(yè)創(chuàng)新生態(tài)共建合力,加快產業(yè)聚集步伐,打造系統(tǒng)解決方案的高地。
公司主頁