職位職責(zé);
構(gòu)建和完善 LLM 智能分析系統(tǒng),包括 Service API、任務(wù)流程管理、推理服務(wù)集成等;
主導(dǎo)模型訓(xùn)練與優(yōu)化:推理加速、微調(diào)訓(xùn)練、評(píng)估指標(biāo)提升;
負(fù)責(zé) LLM 模型部署版本發(fā)布、安全監(jiān)控與系統(tǒng)維護(hù);
推動(dòng)真實(shí)項(xiàng)目落地,參與 LLM 相關(guān)產(chǎn)品的技術(shù)迭代與迭代優(yōu)化。
任職要求:
碩士及以上學(xué)歷,計(jì)算機(jī)、AI、語(yǔ)言技術(shù)相關(guān)專業(yè)(優(yōu)秀本科亦可);
精通 Python、數(shù)據(jù)結(jié)構(gòu)與算法設(shè)計(jì);
熟練使用 PyTorch/TensorFlow 等主流深度學(xué)習(xí)框架;
熟悉 Transformer 架構(gòu),有 LLM 預(yù)訓(xùn)練、微調(diào)、RLHF、LoRA、推理部署等經(jīng)驗(yàn);
掌握 Linux 操作環(huán)境,了解 Docker 容器部署;
具備閱讀與復(fù)現(xiàn)前沿論文的能力,有相關(guān)落地實(shí)踐優(yōu)先;
責(zé)任心強(qiáng)、良好的執(zhí)行力、自我驅(qū)動(dòng)性突出;
加分項(xiàng):
有使用 vLLM、DeepSpeed、FlashAttention、LangChain、RAG 等經(jīng)驗(yàn);有開(kāi)源項(xiàng)目、科研論文發(fā)表者優(yōu)先。