崗位職責:
1. 大模型全鏈路開發(fā)與優(yōu)化:主導企業(yè)級大模型的設計、訓練與迭代優(yōu)化,覆蓋文本生成、智能對話系統(tǒng)、代碼生成等核心應用場景,打造高性能、高可用性的底層模型底座。
2. 行業(yè)化應用落地構建:基于成熟大模型技術棧,針對特定業(yè)務場景進行應用程序開發(fā)與適配,確保模型性能與實際業(yè)務需求深度匹配,實現(xiàn)技術到業(yè)務價值的高效轉(zhuǎn)化。
3. 定制化模型微調(diào)實施:結合企業(yè)個性化需求,設計科學的預訓練模型微調(diào)方案,完成數(shù)據(jù)準備、訓練調(diào)參、效果驗證全流程,交付高度貼合業(yè)務場景的定制化解決方案。
4. 大規(guī)模數(shù)據(jù)體系搭建:設計并落地高效的大規(guī)模數(shù)據(jù)處理與清洗流程,構建支持模型訓練、評估與迭代的數(shù)據(jù)支撐體系,保障數(shù)據(jù)質(zhì)量與模型訓練效率。
5. 前沿技術創(chuàng)新探索:跟蹤自然語言處理、大模型領域前沿算法與技術動態(tài),開展技術預研與創(chuàng)新實踐,持續(xù)優(yōu)化現(xiàn)有系統(tǒng)性能與效果,主導或參與核心技術突破項目。
6. 跨團隊協(xié)同推進:與產(chǎn)品、工程、業(yè)務等多團隊緊密協(xié)作,明確技術需求、同步項目進度、解決跨領域問題,共同保障項目高效落地與業(yè)務目標達成。
7. 技術知識沉淀與傳遞:撰寫規(guī)范、詳實的實驗報告、技術方案文檔及操作手冊,梳理技術經(jīng)驗與方法論,實現(xiàn)團隊內(nèi)部知識的有效沉淀與傳遞。
任職資格:
1. 學歷背景:本科及以上學歷,具備扎實的學術基礎與學習能力。專業(yè)領域:計算機科學與技術、人工智能、應用數(shù)學、數(shù)據(jù)科學等相關專業(yè)優(yōu)先。
2. 經(jīng)驗要求:擁有1年及以上自然語言處理(NLP)、機器學習或大模型相關領域開發(fā)經(jīng)驗;有大模型訓練、微調(diào)或行業(yè)應用落地經(jīng)驗者優(yōu)先。
3. 技術能力:熟練掌握Python編程語言,深入理解深度學習原理,能熟練運用TensorFlow、PyTorch等主流深度學習框架開展模型開發(fā)工作。
4. 模型認知:對BERT、GPT、Qwen、LLaMA等主流大模型的架構原理、訓練邏輯與應用場景有深入理解,具備實際項目中的模型選型、調(diào)優(yōu)與部署經(jīng)驗。
5. NLP技術儲備:熟悉文本分類、命名實體識別、機器翻譯、文本摘要、對話生成等常見NLP任務的技術原理與實現(xiàn)方案,能獨立設計并落地相關任務解決方案。
6. 數(shù)據(jù)能力:具備良好的數(shù)據(jù)分析思維與統(tǒng)計學基礎,能熟練運用數(shù)據(jù)處理工具(如Pandas、Spark)處理、分析大規(guī)模數(shù)據(jù)集,具備數(shù)據(jù)驅(qū)動的問題解決能力。