一、工作職責(zé)
1. 模型開發(fā)與優(yōu)化
(1)負(fù)責(zé)大模型全鏈路開發(fā),包括數(shù)據(jù)清洗、特征工程、偏好對(duì)齊(RLHF)及大小模型國(guó)產(chǎn)化加速卡部署。
(2)設(shè)計(jì)并實(shí)施多維度模型評(píng)估方案(如準(zhǔn)確性、推理速度、資源效率),定位并解決模型性能瓶頸。
(3)探索前沿技術(shù)(如長(zhǎng)上下文、MoE 架構(gòu)優(yōu)化、多智能體協(xié)作),推動(dòng)模型在推理速度及場(chǎng)景適配性上的突破。
2. 工程化部署與落地
(1)開發(fā)文件解析程序,支持多格式數(shù)據(jù)(如文本、圖像、表格)的標(biāo)準(zhǔn)化處理與適配,確保數(shù)據(jù)高效輸入模型。
(2)基于國(guó)產(chǎn)加速卡(如昇騰910B、寒武紀(jì)MLU等)部署大模型,優(yōu)化模型壓縮、量化及推理加速(如顯存動(dòng)態(tài)卸載、訓(xùn)推共卡協(xié)同技術(shù))。
(3)開發(fā)模型推理接口(如RESTful API、gRPC),并完成與前后端系統(tǒng)的聯(lián)調(diào),確保低延遲、高并發(fā)場(chǎng)景下的穩(wěn)定運(yùn)行。
3. 技術(shù)協(xié)作與產(chǎn)品落地
(1)與產(chǎn)品、工程團(tuán)隊(duì)協(xié)作,將大模型能力轉(zhuǎn)化為實(shí)際產(chǎn)品(如智能交互、數(shù)據(jù)分析工具),解決行業(yè)痛點(diǎn)并提升業(yè)務(wù)效率。
(2)參與工業(yè)級(jí)大模型平臺(tái)開發(fā),支持私有化部署及行業(yè)定制化需求(如SFT、強(qiáng)化學(xué)習(xí)優(yōu)化)。
(3)編寫技術(shù)文檔,推動(dòng)技術(shù)方案在團(tuán)隊(duì)內(nèi)的高效傳遞與落地。
二、任職要求
1. 技術(shù)能力要求
(1)深度學(xué)習(xí)框架與工具:
?精通PyTorch、TensorFlow等主流框架。熟悉Hugging Face、LangChain、ollama等工具。
(2)工程化能力:
? Python編程能力優(yōu)秀;熟練使用Docker、Kubernetes實(shí)現(xiàn)模型容器化部署。
?具備模型壓縮、量化及國(guó)產(chǎn)加速卡(如昇騰、寒武紀(jì))部署經(jīng)驗(yàn),顯存優(yōu)化技術(shù)者優(yōu)先。
?熟練開發(fā)RESTful API、gRPC等接口,具備前后端聯(lián)調(diào)經(jīng)驗(yàn)及微服務(wù)架構(gòu)設(shè)計(jì)能力。
?具備基于開源大模型問(wèn)答系統(tǒng)工程化開發(fā)經(jīng)驗(yàn)
(3)大模型核心技術(shù):
?具備大nlp模態(tài)模型、Agent智能體系統(tǒng)開發(fā)經(jīng)驗(yàn)者優(yōu)先。
2. 算法與理論基礎(chǔ)
(1)扎實(shí)的數(shù)學(xué)基礎(chǔ)(線性代數(shù)、概率統(tǒng)計(jì)、優(yōu)化理論),熟悉生成式模型(如GPT、BERT)原理及Scaling Law、Long Context等前沿方向。
(2)熟悉梯度消失、過(guò)擬合等問(wèn)題的解決方案,能快速將頂會(huì)論文轉(zhuǎn)化為工程實(shí)踐。
3. 項(xiàng)目與經(jīng)驗(yàn)要求
(1)參與過(guò)nlp大模型模態(tài)Agent系統(tǒng)開發(fā)或工業(yè)級(jí)大模型部署項(xiàng)目。
(2)具備文件解析程序開發(fā)、國(guó)產(chǎn)加速卡部署(如昇騰910B集群)及接口開發(fā)經(jīng)驗(yàn)者優(yōu)先。
4. 軟技能與素質(zhì)
(1)良好的跨團(tuán)隊(duì)協(xié)作能力,能高效溝通技術(shù)方案與業(yè)務(wù)需求,推動(dòng)項(xiàng)目進(jìn)展。
(2)具備技術(shù)文檔撰寫、代碼規(guī)范及開源社區(qū)貢獻(xiàn)經(jīng)驗(yàn)者優(yōu)先。