強化學習算法工程師

1.5-3萬·15薪

深圳光明區(qū)
經驗不限
碩士
全職
招2人

職位描述

強化學習?人工智能

【工作職責】
1.負責規(guī)控與控制策略的強化學習建模，設計獎勵函數(shù)、搭建策略網絡。
2.基于 PPO、AMP 等算法，在 Isaac Gym、Isaac Lab、MuJoCo、Gazebo 等仿真環(huán)境開展大規(guī)模并行訓練。
3.研發(fā)領域自適應與域隨機化方法，緩解策略在真實具身智能設備（無人機、無人車、機器狗、機器人等）上的震蕩、失穩(wěn)與性能退化問題，提升 sim2real 成功率。
4.建立標準化仿真回歸測試流程，完成萬次級策略驗證與規(guī)劃邏輯回歸測試，評估策略穩(wěn)定性與失效邊界。
【任職要求】
1.控制理論、計算機科學相關專業(yè)碩士/博士學歷，系統(tǒng)修讀過《深度強化學習》《非線性動力學》，理論基礎扎實。
2.精通 Isaac Gym、Isaac Lab、MuJoCo 大規(guī)模仿真流程，具備千量級以上 Agent 并發(fā)訓練的算力調度經驗。
3.擅長獎勵函數(shù)設計，有通過域隨機化解決硬件失準與震蕩的實操經驗，具備 sim2real 相關理解與落地能力。
4.能設計自動化回歸測試邏輯，量化評估 RL 策略魯棒性上限，有標準化代碼與流程記錄習慣。
5.具備優(yōu)秀科研與實驗習慣，可系統(tǒng)性分析模型不收斂原因，而非盲目調參。

補充說明：優(yōu)秀且經驗豐富者，可適當放寬任職條件；本崗位可招聘應屆畢業(yè)生，同時開放實習生崗位，實習生薪資標準為300-380元/天

工作地點

廣東省深圳市光明區(qū)光明大道尚智科技園

認證資質

營業(yè)執(zhí)照信息

完善一份簡歷
1736萬+企業(yè)在線搜索，780萬+海量職位精準推薦

相似職位

AI算法工程師(012139)面議
深圳 - 福田
中信銀行信用卡中心
AI算法工程師((14薪,六險一金,接受考公考研失敗/25屆)1.5-3萬·14薪
深圳 - 龍崗
外企德科數(shù)字技術有限公司
后端開發(fā)工程師（ai方向）9000-18000元
深圳 - 福田
小雨傘保險經紀有限公司
AI工程師面議
深圳
CET中電技術
AI智能體開發(fā)工程師1-2萬
深圳 - 南山
綠鵬環(huán)境科技(深圳)有限公司
AI應用工程師2-3萬
深圳 - 南山
深圳市投控東海投資有限公司

查看更多相似職位

職位發(fā)布者

賈先生/技術總監(jiān)

三日內活躍

立即溝通

中兵智能創(chuàng)新研究院(深圳)有限公司

中兵智能創(chuàng)新研究院（深圳）有限公司（以下簡稱“創(chuàng)新院深圳公司”）成立于2024年12月23日，是中國兵器工業(yè)集團有限公司所屬的中兵智能創(chuàng)新研究院有限公司全資子公司，著力打造的軍民融合深圳新標桿，建設粵港澳灣區(qū)智能化解決方案高地。公司面向新質新域，立足軍民融合應用場景落地，聚焦打造足式、輪式、履帶式等特種機器人及相關部組件研發(fā)和產業(yè)化推廣，圍繞平臺、智能感知與自主、通信、人機交互等方向，加大前沿技術應用并培育拓展自主產品產業(yè)化空間，構建從體系到平臺、關鍵部組件的系列化產品譜系，形成產業(yè)創(chuàng)新生態(tài)共建合力，加快產業(yè)聚集步伐，打造系統(tǒng)解決方案的高地。

公司主頁

關于我們: 公司介紹; 聯(lián)系我們; 誠聘英才

產品與服務: 人才招聘; 企業(yè)招聘

使用與幫助: 賬號注銷; 意見反饋; 發(fā)票制度; 防騙指南; 法律協(xié)議; 資質公示

智聯(lián)招聘更懂你的價值

智聯(lián)app小程序官方微信企業(yè)版APP

京ICP備12025925號?京ICP證010207號

京公網安備 11010502059392號?人力資源許可證:1101051996081號

網上有害信息舉報專區(qū)?違法不良信息舉報電話:400-885-9898 關愛未成年舉報熱線:400-885-9898-3

朝陽區(qū)人力資源與社會保障局監(jiān)督電話?

網絡110報警服務電子營業(yè)執(zhí)照