崗位職責(zé):
1、負(fù)責(zé)業(yè)務(wù)系統(tǒng)強(qiáng)化學(xué)習(xí)相關(guān)部分技術(shù)設(shè)計(jì)落地和功能開(kāi)發(fā),對(duì)模型進(jìn)行訓(xùn)練、調(diào)優(yōu)和評(píng)估。
2、負(fù)責(zé)與后端接口制定及聯(lián)調(diào),與項(xiàng)目經(jīng)理和產(chǎn)品經(jīng)理確認(rèn)開(kāi)發(fā)需求及實(shí)現(xiàn)。
3、負(fù)責(zé)算法模型維護(hù)及版本迭代、發(fā)布。
4、負(fù)責(zé)相關(guān)技術(shù)文檔的編寫工作。
5、上級(jí)安排的其它工作事項(xiàng)。
任職要求:
1、統(tǒng)招碩士研究生及以上學(xué)歷,人工智能強(qiáng)化學(xué)習(xí)領(lǐng)域相關(guān)專業(yè)。
2、深入理解強(qiáng)化學(xué)習(xí)的基本概念,如策略、價(jià)值函數(shù)、獎(jiǎng)勵(lì)函數(shù)、馬爾可夫決策過(guò)程等。熟悉各種經(jīng)典和前沿的強(qiáng)化學(xué)習(xí)算法,掌握其原理、適用場(chǎng)景和優(yōu)缺點(diǎn).
3、熟悉常用的強(qiáng)化學(xué)習(xí)框架,如 Stable-Baselines3、 Ray RLlib、 Dopamine、Tianshou。能夠運(yùn)用框架完成智能體的搭建、訓(xùn)練和評(píng)估等工作。
4、具備一定的編程開(kāi)發(fā)能力和代碼調(diào)試能力,能夠獨(dú)立完成智能體的代碼編寫、測(cè)試和優(yōu)化工作。
5、工作認(rèn)真負(fù)責(zé)、積極主動(dòng)、團(tuán)隊(duì)協(xié)作意識(shí)強(qiáng)、抗壓能力強(qiáng),有良好的溝通能力。