1. 崗位職責(zé) 核心算法研發(fā) o 深入研究深度學(xué)習(xí)及多模態(tài)融合學(xué)習(xí)理論(如Transformer、注意力機(jī)制、跨模態(tài)對(duì)齊等),掌握模型壓縮、量化及蒸餾技術(shù)。 o 設(shè)計(jì)高效的分布式訓(xùn)練方案,優(yōu)化海量音視頻數(shù)據(jù)(如圖像、視頻、音頻)的預(yù)處理、特征提取流程。 o 探索知識(shí)增強(qiáng)(RAG)策略及提示詞工程在提升模型對(duì)復(fù)雜、隱蔽違規(guī)內(nèi)容推理能力方面的應(yīng)用。 o 負(fù)責(zé)大模型(尤其是多模態(tài)大模型)的算法研究、訓(xùn)練、蒸餾、微調(diào)與優(yōu)化,重點(diǎn)提升模型在音視頻內(nèi)容安全場(chǎng)景(如暴恐、色情、敏感人物、違規(guī)廣告、不良場(chǎng)景等)下的識(shí)別準(zhǔn)確率與魯棒性。 系統(tǒng)研發(fā)與落地 o 設(shè)計(jì)并開發(fā)支持高并發(fā)、低延遲的大模型音視頻內(nèi)容安全實(shí)時(shí)檢測(cè)與離線審核系統(tǒng),實(shí)現(xiàn)自動(dòng)化訓(xùn)練、部署與監(jiān)控(MLOps)。 o 與業(yè)務(wù)團(tuán)隊(duì)協(xié)作,解決音視頻大規(guī)模數(shù)據(jù)處理(如視頻抽幀、音頻特征提?。?、特定風(fēng)控特征工程及模型在復(fù)雜線上環(huán)境部署的難題。 2. 任職要求 基礎(chǔ)要求 o 知名院校碩士及以上學(xué)歷,計(jì)算機(jī)、人工智能等相關(guān)專業(yè)。 o 吃苦耐勞,有自驅(qū)力,能夠適應(yīng)高強(qiáng)度工作。 技術(shù)能力 o 熟練使用TensorFlow、PyTorch等深度學(xué)習(xí)框架,具備分布式訓(xùn)練、并行計(jì)算以及模型壓縮、量化技術(shù)的實(shí)踐經(jīng)驗(yàn)。 o 熟練掌握音視頻處理相關(guān)技術(shù)庫(kù)(如OpenCV、FFmpeg、Librosa等),具備扎實(shí)的計(jì)算機(jī)視覺和/或音頻信號(hào)處理基礎(chǔ)。有圖像/視頻分類、檢測(cè)、分割或音頻事件檢測(cè)等項(xiàng)目經(jīng)驗(yàn)。 o 具備音視頻內(nèi)容安全算法研究經(jīng)驗(yàn),熟悉常見的審核算法和模型研發(fā)經(jīng)驗(yàn)。 o 了解音視頻內(nèi)容安全領(lǐng)域的常見風(fēng)險(xiǎn)類型、檢測(cè)難點(diǎn)及行業(yè)實(shí)踐,對(duì)對(duì)抗攻擊、模型魯棒性等問題有認(rèn)識(shí)者優(yōu)先。 o 熟悉大模型算法,具備豐富的模型訓(xùn)練、蒸餾及微調(diào)經(jīng)驗(yàn);有在內(nèi)容安全領(lǐng)域應(yīng)用多模態(tài)大模型(如LLaMA、GPT、CLIP、Qwen等)進(jìn)行微調(diào)(RFT)的經(jīng)驗(yàn)者優(yōu)先。 綜合素質(zhì) o 對(duì)利用技術(shù)解決音視頻內(nèi)容安全挑戰(zhàn)充滿熱情,具備較強(qiáng)的學(xué)習(xí)能力與創(chuàng)新精神,能跟蹤學(xué)術(shù)界與工業(yè)界最新進(jìn)展。 o 優(yōu)秀的溝通、團(tuán)隊(duì)協(xié)作和問題解決能力,能夠獨(dú)立承擔(dān)項(xiàng)目研發(fā)任務(wù)并推動(dòng)技術(shù)方案落地。