一. 崗位職責(zé)
1. 基于大模型,構(gòu)建智能體架構(gòu),實現(xiàn)復(fù)雜問題的 理解–規(guī)劃–工具調(diào)用–執(zhí)行–感知–反思(必要條件) 全流程能力;
2. 前沿技術(shù)探索,設(shè)計 算法迭代飛輪(必要條件),優(yōu)化基礎(chǔ)模型,有效提升模型性能指標與穩(wěn)定性;
3. 規(guī)劃與實施 多智能體系統(tǒng)(必要條件),并在實際場景中落地;
4. 負責(zé)大模型在具體產(chǎn)品中的預(yù)訓(xùn)練、微調(diào)、封裝與模型部署服務(wù)化全鏈路;
5. 與產(chǎn)品、工程團隊協(xié)作,針對業(yè)務(wù)進行模型適配、性能優(yōu)化與迭代升級。
二. 任職要求
● 碩士及以上學(xué)歷,人工智能、計算機科學(xué)、自動化、數(shù)學(xué)等相關(guān)專業(yè)優(yōu)先;
● 扎實的數(shù)據(jù)結(jié)構(gòu)和算法功底,精通 Python/C++ 中至少一種,有 PyTorch、
TensorFlow 等深度學(xué)習(xí)框架使用經(jīng)驗,并熟悉 分布式訓(xùn)練;
● 有大型預(yù)訓(xùn)練模型開發(fā)經(jīng)驗,包括高效訓(xùn)練、微調(diào)、模型壓縮、推理優(yōu)化/部署等;
● 在頂級學(xué)術(shù)會議(如 NeurIPS、ICLR、CVPR、ACL 等)發(fā)表一作論文,或在多模態(tài)、CV、NLP、強化學(xué)習(xí)等競賽中取得優(yōu)異成績者優(yōu)先;
● 責(zé)任心強、積極主動,良好的溝通與團隊協(xié)作能力,能夠快速推進項目進展
工作時間10點——21點