【職位描述】
作為我們AI團隊的核心算法成員,您將專注于大型語言模型(LLM)的微調(diào)、優(yōu)化與應用落地,以及部分私有小模型的算法優(yōu)化,主要是在礦業(yè)地質(zhì)應用方面的私有模型。您的工作核心是提升模型在礦業(yè)、地質(zhì)領域和特定場景下的理解、生成和推理能力,并主導構(gòu)建新一代檢索增強生成(RAG)系統(tǒng)的算法策略。您將與一流的Java后端工程師并肩作戰(zhàn),將最前沿的算法研究成果轉(zhuǎn)化為穩(wěn)定、高效、可擴展的線上服務,為我們的產(chǎn)品提供強大的AI內(nèi)核。
【主要職責】
1. 大模型微調(diào)與優(yōu)化:負責領域大模型的微調(diào)(Fine-Tuning)工作,包括但不限于全參數(shù)微調(diào)、LoRA、QLoRA、P-Tuning等高效微調(diào)技術(shù),持續(xù)提升模型在特定任務上的表現(xiàn)。
2. 私有小模型的實現(xiàn)與優(yōu)化:負責私有小模型的算法實現(xiàn)和優(yōu)化工作,主要是礦業(yè)和地質(zhì)方向的小模型。
3. RAG算法研究與實現(xiàn):深入研究并構(gòu)建先進的RAG(檢索增強生成)系統(tǒng),優(yōu)化包括文本分割(Chunking)、向量化(Embedding)、檢索排序(Re-ranking)、提示工程(Prompt Engineering) 在內(nèi)的全鏈路算法效果。
4. 數(shù)據(jù)體系建設:構(gòu)建和管理高質(zhì)量的指令微調(diào)數(shù)據(jù)集、評估數(shù)據(jù)集和知識庫數(shù)據(jù),設計數(shù)據(jù)自動化處理與標注方案,持續(xù)通過數(shù)據(jù)驅(qū)動算法效果提升。
5. 模型評估與迭代:建立科學的模型評估體系,設計離線與在線評估方案,監(jiān)控模型線上表現(xiàn),基于用戶反饋和數(shù)據(jù)洞察持續(xù)迭代優(yōu)化模型和算法策略。
6. 技術(shù)探索與創(chuàng)新:跟蹤學術(shù)界與工業(yè)界最新進展(如Agent、多模態(tài)等),并將有潛力的技術(shù)應用于實際業(yè)務場景,進行概念驗證(POC)和落地實踐。
7. 緊密跨團隊協(xié)作:與后端開發(fā)團隊深度合作,確保算法模型的高效部署和線上服務;與產(chǎn)品經(jīng)理溝通,將業(yè)務需求轉(zhuǎn)化為技術(shù)方案。
【職位要求】
必備條件:
1. 教育背景:計算機科學、人工智能、數(shù)學、統(tǒng)計學等相關專業(yè),碩士及以上學歷(特別優(yōu)秀者可放寬至本科)。
2. 算法基礎:扎實的機器學習/深度學習基礎,熟悉常見的NLP模型(如Transformer, BERT, GPT系列等)和理論。
3. 大模型經(jīng)驗:對大型語言模型(如LLaMA, ChatGLM, GPT等)有深入理解,具備至少一種大模型的實際微調(diào)經(jīng)驗(項目或研究經(jīng)歷)。
4. 編程與工具:熟練掌握Python及主流的深度學習框架(如PyTorch, TensorFlow)。熟悉LangChain、LlamaIndex等應用框架者優(yōu)先。
5. 數(shù)據(jù)處理能力:具備優(yōu)秀的數(shù)據(jù)處理和分析能力,熟練使用Pandas, NumPy等工具,能夠從復雜數(shù)據(jù)中發(fā)現(xiàn)問題并得出結(jié)論。
6. 解決問題能力:具備強大的邏輯思維能力和創(chuàng)造性解決問題的能力,能夠獨立開展實驗,并對結(jié)果進行深入分析。
7. 團隊與溝通:良好的團隊合作精神和溝通能力,能夠清晰地向工程團隊解釋算法原理和需求。
優(yōu)先考慮:
1. RAG實戰(zhàn)經(jīng)驗:有完整的RAG項目經(jīng)驗,深入?yún)⑴c過檢索器、生成模塊的優(yōu)化,或?qū)ο嚓P組件(如向量數(shù)據(jù)庫)有調(diào)優(yōu)經(jīng)驗。
2. 高級技術(shù)經(jīng)驗:有模型量化(Quantization)、推理加速、Agent應用、多模態(tài)大模型等相關經(jīng)驗者優(yōu)先。
3. 開源貢獻或論文:在頂級會議(ACL, EMNLP, NeurIPS, ICML等)發(fā)表過相關論文,或有影響力的開源項目貢獻者優(yōu)先。
4. 工程落地能力:具備一定的工程思維,了解Web服務、API設計、Docker等基本概念,能與開發(fā)團隊順暢協(xié)作。
5. 領域知識:在礦業(yè)、地質(zhì)領域有相關經(jīng)驗。
【我們提供】
?世界級的挑戰(zhàn):直面全球最前沿的AIGC技術(shù)難題,您的算法工作將是產(chǎn)品的核心競爭力。
?頂尖的團隊:與領域內(nèi)的專家和充滿激情的伙伴共事,享受純粹的技術(shù)氛圍和高效的協(xié)作環(huán)境。
?成長與影響:提供廣闊的學術(shù)和技術(shù)成長空間,您的成果將直接影響和改變一個行業(yè)的運作模式。
?全面薪酬福利:具有競爭力的薪資方案、完善的福利保障體系及靈活的工作方式。