(一)崗位職責
1、負責大語言模型(LLM)相關(guān)前沿技術(shù)的研發(fā)以及落地工作,包括模型部署、優(yōu)化和應用開發(fā);
2、負責制定企業(yè)級AI大模型應用解決方案,建立相應的模型管理和監(jiān)控機制,開展模型性能監(jiān)控及優(yōu)化,確保模型服務的穩(wěn)定性和高可用性;
3、負責大模型推理框架(vLLM、TGI、Triton等)的部署和優(yōu)化,負責AI應用架構(gòu)、API接口、模型調(diào)用方式的設計和實現(xiàn);
4、負責RAG(檢索增強生成)應用的自主研發(fā)和建設,包括向量數(shù)據(jù)庫選型、知識庫構(gòu)建、檢索策略優(yōu)化及prompt工程等;
5、負責識別和解決模型應用中的潛在問題,包括但不限于性能瓶頸、準確率優(yōu)化、成本控制等,并推動相關(guān)技術(shù)手段建設;
6、熟悉AI應用全生命周期管理相關(guān)要求,建設和優(yōu)化模型訓練、部署、監(jiān)控、迭代的能力體系。
(二)任職資格
1、本科及以上學歷,計算機、人工智能、機器學習、數(shù)據(jù)科學等相關(guān)專業(yè),3年以上工作經(jīng)驗;
2、熟悉vLLM、LangChain、LlamaIndex等大模型推理和應用開發(fā)框架,有大規(guī)模模型部署或應用開發(fā)經(jīng)驗;
3、熟悉RAG技術(shù)棧,包括向量數(shù)據(jù)庫(Milvus、Qdrant、Chroma等)、Embedding模型、文檔解析等;
4、掌握Python、Java等常見開發(fā)語言,熟練掌握PyTorch,熟悉FastAPI、Flask等Web框架;
5、熟悉主流大語言模型(ChatGPT、Claude、Deepseek、Qwen等),有AI Agent、prompt工程、模型微調(diào)、模型量化(GPTQ、AWQ)經(jīng)驗者優(yōu)先;
6、有GPU服務器管理、CUDA優(yōu)化、模型性能調(diào)優(yōu)、分布式推理等相關(guān)的實踐經(jīng)驗者優(yōu)先;
7、有責任心和職業(yè)道德,良好的邏輯思維能力和團隊合作精神。
職位福利
六險一金、員工食堂、帶薪年假、工會福利、定期體檢、周末雙休、年度獎金