【崗位要求】
1、本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè)或數(shù)學(xué)專業(yè),1年以上開發(fā)經(jīng)驗(yàn);
2、扎實(shí)的編程基礎(chǔ),精通PYTHON,熟悉一種或多種深度學(xué)習(xí)框架(Pytorch/TensorFlow)作為加分項(xiàng);
3、熟悉 Linux 常用命令,掌握在 Linux 下搭建環(huán)境及開發(fā)部署測(cè)試,熟悉docker鏡像操作和部署;
4、在大模型、算法、語(yǔ)音、圖像處理等一個(gè)或多個(gè)領(lǐng)域有扎實(shí)的理論基礎(chǔ)和豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)優(yōu)先;
5、具有音頻數(shù)據(jù)處理相關(guān)技能如ffmpeg,torchaudio,librosa,pydub,wave等優(yōu)先;
【工作職責(zé)】
1、負(fù)責(zé)多模態(tài)大模型數(shù)據(jù)語(yǔ)料(語(yǔ)音、視頻、圖像、文本等)生產(chǎn)和處理,包括但不限于數(shù)據(jù)生成增強(qiáng)、分布研究、數(shù)據(jù)獲取、數(shù)據(jù)規(guī)范化、數(shù)據(jù)質(zhì)量檢測(cè)、打標(biāo)等,確保訓(xùn)練數(shù)據(jù)的有效性,可用性;
2、負(fù)責(zé)優(yōu)化和改進(jìn)現(xiàn)有的數(shù)據(jù)清洗和質(zhì)檢打標(biāo)流程,提高效率和準(zhǔn)確性;
3、負(fù)責(zé)大模型相關(guān)數(shù)據(jù)工具鏈的開發(fā)實(shí)現(xiàn)及應(yīng)用維護(hù)等;
項(xiàng)目介紹:專注于AI數(shù)據(jù)處理,為大模型訓(xùn)練提供高質(zhì)量的多模態(tài)數(shù)據(jù)(文本/圖像/音視頻等)支持。核心業(yè)務(wù)包括數(shù)據(jù)預(yù)處理、生成增強(qiáng)、清洗過濾、異常檢測(cè)、特征提取和質(zhì)量校驗(yàn),確保數(shù)據(jù)精準(zhǔn)合規(guī)。同時(shí)參與訓(xùn)練與推理優(yōu)化,助力提升模型性能。
Python語(yǔ)言必須、音頻處理、視頻處理、Python后端、大模型、圖像處理
音頻相關(guān)技能關(guān)鍵詞:ffmpeg,torchaudio,librosa,pydub,wave