崗位職責
1. 為行走和操作任務(wù)開發(fā)、訓練和部署強化學習算法。
2. 搭建大規(guī)模支持通用人形機器人訓練行走和操作策略的仿真基礎(chǔ)設(shè)施。
3. 與控制團隊合作,將訓練得到的策略集成到現(xiàn)有的控制系統(tǒng)中。
4. 定義、測試和評估學習策略的性能指標。
5. 訓練多任務(wù)深度神經(jīng)網(wǎng)絡(luò)。
6. 設(shè)計并交付高質(zhì)量、可靠的軟件,并部署到實際應(yīng)用中。
7. 與其他團隊成員合作,開發(fā)并持續(xù)改進完整的自主控制系統(tǒng)。
8. 實現(xiàn)機器人行為架構(gòu),提供各種行為編排工具,如狀態(tài)機和行為樹。評估潛在的行為協(xié)調(diào)解決方案,并根據(jù)機器人需求做出設(shè)計權(quán)衡和決策。
9. 基于該架構(gòu),為人形機器人設(shè)計、實現(xiàn)、測試和部署行為協(xié)調(diào)算法,適配多種任務(wù)場景,并不斷迭代提升算法的可靠性和魯棒性。
10. 采用現(xiàn)代軟件工程技術(shù),編寫高質(zhì)量、經(jīng)過充分測試的軟件。
任職要求
1. 碩士及以上學歷,計算機相關(guān)專業(yè)優(yōu)先。
2. 在生產(chǎn)級軟件和機器學習工程及最佳實踐方面擁有豐富經(jīng)驗。
3. 對深度學習有“白盒”理解:包括模型細節(jié)、損失函數(shù)設(shè)計和訓練算法。
4. 在概率論、優(yōu)化和線性代數(shù)方面具備扎實的數(shù)學基礎(chǔ)。
5. 具有以下領(lǐng)域?qū)I(yè)知識優(yōu)先:3D重建、深度估計、神經(jīng)渲染、目標檢測、跟蹤與狀態(tài)估計、實例分割與語義分割。
6. 擁有使用主流深度學習框架(如 PyTorch)的豐富經(jīng)驗。
7. 在節(jié)奏快、解決方案尚不清晰且需要探索的環(huán)境中表現(xiàn)出色。
8. 熟悉在線和離線強化學習算法,如 PPO、SAC 等,有調(diào)優(yōu)強化學習算法的超參數(shù)和代價函數(shù)的經(jīng)驗優(yōu)先。
9. 熟悉常見的強化學習技術(shù),如域隨機化、課程學習、獎勵設(shè)計等。
10. 熟悉常用的機器學習評估工具,如 TensorBoard、Weights & Biases 等。
11. 具備在真實機器人上使用 C++ 和/或 Python 實現(xiàn)、測試和部署行為協(xié)調(diào)解決方案的經(jīng)驗。
12. 在理論上對行為協(xié)調(diào)算法有深刻理解,同時擁有實際應(yīng)用經(jīng)驗者優(yōu)先。