l 智能體核心開(kāi)發(fā),有基于Dify框架設(shè)計(jì)決策智能體架構(gòu),實(shí)現(xiàn)狀態(tài)感知、策略推理、動(dòng)作執(zhí)行全流程開(kāi)發(fā)優(yōu)先前沿技術(shù)預(yù)研探索大語(yǔ)言模型(LLM)與強(qiáng)化學(xué)習(xí)融合方案(如LLM+RL決策層耦合),研究Dify與Ray/RLlib的協(xié)同訓(xùn)練框架,提升多智能體協(xié)作效率; l 學(xué)歷學(xué)信網(wǎng)可查,3年以上Python開(kāi)發(fā)經(jīng)驗(yàn),精通異步編程/多線程優(yōu)化; l 1年以上智能體開(kāi)發(fā)經(jīng)驗(yàn)(游戲AI/機(jī)器人控制/推薦系統(tǒng)等場(chǎng)景); l 深度使用Dify框架經(jīng)驗(yàn),了解mcp,agent 等經(jīng)驗(yàn)者優(yōu)先。