【崗位三 Python語音數(shù)據(jù)/流媒體開發(fā)】(招聘1人)
1、python技能必須熟練,接受手撕python代碼;
2、本科一年以上語音數(shù)據(jù)處理經(jīng)驗,音頻技能關(guān)鍵詞有ffmpeg,torchaudio,librosa,pydub;
3、院校好,相關(guān)專業(yè)優(yōu)先考慮,有NLP大模型相關(guān)經(jīng)驗的優(yōu)先考慮;
【工作職責(zé)】
1、負責(zé)多模態(tài)大模型數(shù)據(jù)語料生產(chǎn)和處理,包括但不限于數(shù)據(jù)生成增強、分布研究、數(shù)據(jù)獲取、數(shù)據(jù)規(guī)范化、數(shù)據(jù)質(zhì)量檢測、打標等,確保訓(xùn)練數(shù)據(jù)的有效性,可用性;
2、負責(zé)優(yōu)化和改進現(xiàn)有的數(shù)據(jù)清洗和質(zhì)檢打標流程,提高效率和準確性;
3、負責(zé)大模型相關(guān)數(shù)據(jù)工具鏈的開發(fā)實現(xiàn)及應(yīng)用維護等;