崗位職責:
1.參與公司AI場景的規(guī)劃與建設,涵蓋但不限于智能對話機器人(Chatbot)、檢索增強生成(RAG)、本地部署等項目(llama.cpp,vLLM等),推動大模型技術在實際業(yè)務中的落地與應用。
2.深入參與大模型的關鍵技術建設,包括但不限于Prompt工程、監(jiān)督微調(SFT)、模型對齊以及基于人類反饋的強化學習(DPO)等細分方向,通過技術創(chuàng)新提升模型性能與效果。
3.持續(xù)跟蹤業(yè)界前沿的大模型技術動態(tài),及時引入先進理念與方法,促進團隊在大模型基礎能力建設方面的提升,助力團隊保持技術領先優(yōu)勢。
4.積極探索大模型在新興領域的應用潛力,包括但不限于視覺語言模型(VLM/VLA)、端側部署、模型優(yōu)化、推理加速等細分領域。
5.將AI模型部署到生產環(huán)境,優(yōu)化模型性能。
任職要求:
1.計算機相關專業(yè)研究生及以上學歷,發(fā)表過大模型相關研究AI頂會論文優(yōu)先。
2.熟悉NLP、CV相關的算法和技術,熟悉大模型訓練、RL算法者優(yōu)先。
3.熟悉常見的模型小型化技術,如量化/剪枝/蒸餾等,熟悉onnx/tensorRT
4.良好的代碼開發(fā)能力,有開源項目開發(fā)經驗優(yōu)先。
5.具備在不同算力服務器的模型部署經驗,如:英偉達、昇騰、海光、天數等。
6.良好的溝通協(xié)作能力,能和團隊一起探索新技術,推進技術進步。