国产中文无码av每日更新在线观看, 亚洲天堂中文字幕一区二区三区免费, 国产口爆吞精在线观视频-黄色国产, 92福利-国内精品久久久久久99,亚洲成AV人A片不卡无码,浪潮AV无码专区,老熟女败火白浆,中文字幕日产av,色情日本免费看大片

更新于 9月3日

LLM 數(shù)據(jù)工程與微調(diào)研發(fā)實(shí)習(xí)生

150-210元/天
  • 上海徐匯區(qū)
  • 本科
  • 實(shí)習(xí)
  • 招1人
  • 6個(gè)月
  • 5天/周

職位描述

可轉(zhuǎn)正實(shí)習(xí)證明PYTHON/PANDASHF TRANSFORMERS計(jì)算機(jī)LLM計(jì)算機(jī)軟件云計(jì)算/大數(shù)據(jù)人工智能
一、核心職責(zé)
1. 訓(xùn)練數(shù)據(jù)處理與生成:針對 LLM 訓(xùn)練需求,清洗并規(guī)范化多源數(shù)據(jù)(文本 / 表格 / 日志),完成數(shù)據(jù)脫敏、去重、去噪,輸出符合訓(xùn)練標(biāo)準(zhǔn)的語料;結(jié)合交通 / 政務(wù) / 停車等業(yè)務(wù)場景,設(shè)計(jì)提示詞模板與采樣策略(含 system prompt、shot 數(shù)量、temperature/top-p 參數(shù)),批量生成高質(zhì)量問答對與指令數(shù)據(jù),并搭建 “生成 - 過濾 - 審?!?閉環(huán)機(jī)制,保障數(shù)據(jù)質(zhì)量。
2. 微調(diào)數(shù)據(jù)流水線構(gòu)建:負(fù)責(zé) LLM 微調(diào)數(shù)據(jù)全流程搭建,涵蓋數(shù)據(jù)切分、格式適配(Alpaca/ShareGPT 規(guī)范)、多輪質(zhì)檢與版本化管理,確保數(shù)據(jù)鏈路可追溯。
3. LLM 微調(diào)執(zhí)行與協(xié)助:執(zhí)行并協(xié)助團(tuán)隊(duì)完成 LLM 參數(shù)高效微調(diào)任務(wù)(LoRA/QLoRA/PEFT),實(shí)時(shí)監(jiān)控訓(xùn)練關(guān)鍵指標(biāo)(loss、grad norm、VRAM 占用、TPS 等),輸出可復(fù)現(xiàn)的訓(xùn)練腳本,配合團(tuán)隊(duì)優(yōu)化微調(diào)效果。
4. 模型評測與驗(yàn)收:開展 LLM 離線基準(zhǔn)評測(Exact-Match、F1、ROUGE、BERTScore、長度懲罰等指標(biāo)),針對交通 / 政務(wù) / 停車等領(lǐng)域數(shù)據(jù)集進(jìn)行專項(xiàng)測試,對比基線模型與 A/B 測試結(jié)果,輸出評測報(bào)告。
5. 文檔與知識沉淀:梳理并沉淀崗位核心知識資產(chǎn),包括 LLM 訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn)、提示詞庫、模型評測報(bào)告、模型迭代變更記錄(changelog),支撐團(tuán)隊(duì)技術(shù)復(fù)用。
二、任職要求
1. 學(xué)歷與實(shí)習(xí)時(shí)長:計(jì)算機(jī)、數(shù)據(jù)科學(xué)、人工智能等相關(guān)專業(yè)在讀(本科及以上);每周可到崗≥3 天,連續(xù)實(shí)習(xí)≥3 個(gè)月,能穩(wěn)定參與項(xiàng)目迭代。
2. 基礎(chǔ)技術(shù)能力:熟練掌握 Python 編程(必備);具備正則表達(dá)式應(yīng)用、SQL 結(jié)構(gòu)化查詢能力;扎實(shí)掌握 Linux 操作系統(tǒng)基礎(chǔ)與 Git 版本控制(如分支管理、提交規(guī)范、沖突解決)。
3. 模型認(rèn)知基礎(chǔ):熟悉 Transformer 模型核心原理(如 Tokenization、上下文窗口機(jī)制),理解 SFT(監(jiān)督微調(diào))、指令微調(diào)及模型對齊的核心邏輯,能清晰區(qū)分不同微調(diào)方式的適用場景。
4. 工作能力要求:具備快速試錯(cuò)與迭代意識,能基于數(shù)據(jù)驗(yàn)證提示詞優(yōu)化效果,以 “產(chǎn)出高質(zhì)量結(jié)果” 為導(dǎo)向,主動推進(jìn)任務(wù)落地。
三、加分項(xiàng)
1. 微調(diào)與工具經(jīng)驗(yàn):了解 LoRA/QLoRA 等參數(shù)高效微調(diào)技術(shù),或使用過 DeepSpeed/Accelerate(訓(xùn)練加速)、vLLM/TGI(推理部署)工具;有 HuggingFace Transformers、LlamaFactory 實(shí)操經(jīng)驗(yàn)者優(yōu)先。
2. 評測能力儲備:使用過 lm-eval-harness、OpenAI Evals 等 LLM 專業(yè)評測框架,或有自建領(lǐng)域評測集(如交通 / 政務(wù)場景)、設(shè)計(jì)評測指標(biāo)的經(jīng)驗(yàn)。
3. 數(shù)據(jù)與開源經(jīng)驗(yàn):參與過數(shù)據(jù)標(biāo)注、眾包質(zhì)檢、合成數(shù)據(jù)治理項(xiàng)目;曾向開源社區(qū)(如 HuggingFace、LlamaFactory)提交過 PR 并被合并者優(yōu)先。
四、技術(shù)棧(含應(yīng)用場景)
類別 核心技術(shù)及應(yīng)用說明
數(shù)據(jù)處理 Python/Pandas(數(shù)據(jù)清洗、分析與格式轉(zhuǎn)換)、SQL(結(jié)構(gòu)化數(shù)據(jù)查詢與提取)
模型訓(xùn)練 HF Transformers/PEFT/TRL(LLM 基礎(chǔ)訓(xùn)練框架)、LoRA/QLoRA(參數(shù)高效微調(diào))、DeepSpeed/Accelerate(訓(xùn)練加速)、BitsAndBytes(低精度訓(xùn)練)
服務(wù)與評測 vLLM/TGI(LLM 推理部署)、FastAPI(簡單服務(wù)搭建)、lm-eval-harness(評測框架)、Weights & Biases/Grafana(指標(biāo)監(jiān)控與可視化)
協(xié)作與工具 Jupyter(數(shù)據(jù)探索與腳本調(diào)試)、VS Code(代碼開發(fā))、Git(版本控制與團(tuán)隊(duì)協(xié)作)

工作地點(diǎn)

上海市-徐匯區(qū)-云視路1號星云1號大廈2樓

職位發(fā)布者

章天一/HR

昨日活躍
立即溝通
公司Logo中城交(上海)科技有限公司
作為隧道股份孵化的上海首家國資背景垂類大模型企業(yè),中城交(上海)科技有限公司(簡稱“中城交”)聚焦交通與城市治理大模型領(lǐng)域,依托深厚的行業(yè)積淀、領(lǐng)先的技術(shù)優(yōu)勢與海量數(shù)據(jù)資產(chǎn),為城市智能化升級提供全鏈條解決方案。公司以“數(shù)據(jù)驅(qū)動決策,AI重塑城市”為使命,致力于成為全國領(lǐng)先的城市治理大模型構(gòu)建者。
公司主頁