技術要求: a. 熟悉基本算法與數(shù)據(jù)結構,具備python和c++的編程經(jīng)驗 b. 具備扎實的強化學習理論基礎 c. 熟悉并了解當前常用深度強化學習、多智能體強化學習方法 d. 熟練使用現(xiàn)有強化學習和深度學習開源框架(gym/baseline/TensorFlow或Pytorch),了解其底層實現(xiàn)細節(jié)、并且能夠根據(jù)實際需求進行改進 e. 有實際強化學習或多智能體系統(tǒng)開發(fā)經(jīng)驗者優(yōu)先 f. 做事認真負責,善于溝通 g. 有一定的創(chuàng)新能力,并且能夠獨立解決問題,有一定的抗壓能力 工作職責: a. 負責公司強化學習、多智能體系統(tǒng)的設計與開發(fā) b. 負責強化學習、多智能體系統(tǒng)算法的工程實現(xiàn) c. 負責算法的集成和應用,系統(tǒng)開發(fā)和性能優(yōu)化