崗位職責(zé)
1. 為行走和操作任務(wù)開發(fā)、訓(xùn)練和部署強(qiáng)化學(xué)習(xí)算法。
2. 搭建大規(guī)模支持通用人形機(jī)器人訓(xùn)練行走和操作策略的仿真基礎(chǔ)設(shè)施。
3. 與控制團(tuán)隊(duì)合作,將訓(xùn)練得到的策略集成到現(xiàn)有的控制系統(tǒng)中。
4. 定義、測(cè)試和評(píng)估學(xué)習(xí)策略的性能指標(biāo)。
5. 訓(xùn)練多任務(wù)深度神經(jīng)網(wǎng)絡(luò)。
6. 設(shè)計(jì)并交付高質(zhì)量、可靠的軟件,并部署到實(shí)際應(yīng)用中。
7. 與其他團(tuán)隊(duì)成員合作,開發(fā)并持續(xù)改進(jìn)完整的自主控制系統(tǒng)。
8. 實(shí)現(xiàn)機(jī)器人行為架構(gòu),提供各種行為編排工具,如狀態(tài)機(jī)和行為樹。評(píng)估潛在的行為協(xié)調(diào)解決方案,并根據(jù)機(jī)器人需求做出設(shè)計(jì)權(quán)衡和決策。
9. 基于該架構(gòu),為人形機(jī)器人設(shè)計(jì)、實(shí)現(xiàn)、測(cè)試和部署行為協(xié)調(diào)算法,適配多種任務(wù)場(chǎng)景,并不斷迭代提升算法的可靠性和魯棒性。
10. 采用現(xiàn)代軟件工程技術(shù),編寫高質(zhì)量、經(jīng)過(guò)充分測(cè)試的軟件。
任職要求
1. 碩士及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè)優(yōu)先。
2. 在生產(chǎn)級(jí)軟件和機(jī)器學(xué)習(xí)工程及最佳實(shí)踐方面擁有豐富經(jīng)驗(yàn)。
3. 對(duì)深度學(xué)習(xí)有“白盒”理解:包括模型細(xì)節(jié)、損失函數(shù)設(shè)計(jì)和訓(xùn)練算法。
4. 在概率論、優(yōu)化和線性代數(shù)方面具備扎實(shí)的數(shù)學(xué)基礎(chǔ)。
5. 具有以下領(lǐng)域?qū)I(yè)知識(shí)優(yōu)先:3D重建、深度估計(jì)、神經(jīng)渲染、目標(biāo)檢測(cè)、跟蹤與狀態(tài)估計(jì)、實(shí)例分割與語(yǔ)義分割。
6. 擁有使用主流深度學(xué)習(xí)框架(如 PyTorch)的豐富經(jīng)驗(yàn)。
7. 在節(jié)奏快、解決方案尚不清晰且需要探索的環(huán)境中表現(xiàn)出色。
8. 熟悉在線和離線強(qiáng)化學(xué)習(xí)算法,如 PPO、SAC 等,有調(diào)優(yōu)強(qiáng)化學(xué)習(xí)算法的超參數(shù)和代價(jià)函數(shù)的經(jīng)驗(yàn)優(yōu)先。
9. 熟悉常見(jiàn)的強(qiáng)化學(xué)習(xí)技術(shù),如域隨機(jī)化、課程學(xué)習(xí)、獎(jiǎng)勵(lì)設(shè)計(jì)等。
10. 熟悉常用的機(jī)器學(xué)習(xí)評(píng)估工具,如 TensorBoard、Weights & Biases 等。
11. 具備在真實(shí)機(jī)器人上使用 C++ 和/或 Python 實(shí)現(xiàn)、測(cè)試和部署行為協(xié)調(diào)解決方案的經(jīng)驗(yàn)。
12. 在理論上對(duì)行為協(xié)調(diào)算法有深刻理解,同時(shí)擁有實(shí)際應(yīng)用經(jīng)驗(yàn)者優(yōu)先。