崗位職責(zé):
1. 負(fù)責(zé)文本分類、情感分析、關(guān)鍵信息抽取等算法模型的開發(fā)、維護和更新。
2.負(fù)責(zé)輿情分析系統(tǒng)中自然語言處理模塊的開發(fā)和優(yōu)化。
3. 構(gòu)建和維護文本數(shù)據(jù)處理pipeline,提升數(shù)據(jù)質(zhì)量。
4. 對部署環(huán)境進行監(jiān)控和優(yōu)化,確保模型的穩(wěn)定運行和高性能,編寫技術(shù)文檔,參與代碼審查,保證代碼質(zhì)量。
5.跟蹤NPL領(lǐng)域最新技術(shù)進展,并將適合的技術(shù)應(yīng)用于實際業(yè)務(wù)。
6.參與技術(shù)方案設(shè)計和評審,確保系統(tǒng)的可擴展性和穩(wěn)定性。
7.領(lǐng)導(dǎo)安排的相關(guān)開發(fā)或架構(gòu)任務(wù)。
8.辦公地點:廣州
崗位要求:
1. 計算機科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷。至少具有1-3年以上自然語言處理相關(guān)項目經(jīng)驗
2. 具有扎實的計算機科學(xué)基礎(chǔ)知識,包括數(shù)據(jù)結(jié)構(gòu)、算法和軟件工程。 對大規(guī)模語言模型的訓(xùn)練和部署有深入理解。
3.精通Python,熟悉Java/Scala中至少一種
,熟練使用TensorFlow、PyTorch等深度學(xué)習(xí)框架,熟悉Hadoop、Spark等大數(shù)據(jù)處理工具。
4.自然語言處理基礎(chǔ)能力,熟練掌握文本預(yù)處理、分詞、詞性標(biāo)注、命名實體識別等基礎(chǔ)技術(shù),深入理解詞向量、語言模型等基本概念和技術(shù)實現(xiàn)
5.深度學(xué)習(xí)技術(shù)能力,精通BERT、GPT等預(yù)訓(xùn)練模型原理,具有豐富的模型微調(diào)經(jīng)驗,熟悉注意力機制、Transformer架構(gòu)等現(xiàn)代NLP技術(shù)
6.專項技術(shù)能力,具備文本分類、情感分析、實體關(guān)系抽取等任務(wù)的實戰(zhàn)經(jīng)驗,熟悉文本生成、文本摘要、知識圖譜等技術(shù)者優(yōu)先
7.工程實現(xiàn)能力,具有模型部署和優(yōu)化經(jīng)驗,熟悉Docker等容器化技術(shù),了解高并發(fā)數(shù)據(jù)處理和模型服務(wù)化技術(shù)。
優(yōu)先考慮:
1.有大規(guī)模文本數(shù)據(jù)處理和分析經(jīng)驗者
2.具備輿情分析系統(tǒng)開發(fā)經(jīng)驗者
3.有多語言NLP項目經(jīng)驗者
4.在ACL、EMNLP等頂級會議發(fā)表論文者
5.參加過知名算法競賽并獲得優(yōu)秀名次者