崗位職責(zé):
- 負責(zé)檔案數(shù)字化項目中的數(shù)據(jù)治理體系搭建,制定數(shù)據(jù)清洗、標(biāo)準(zhǔn)化及質(zhì)量管控流程,保障檔案數(shù)據(jù)符合行業(yè)規(guī)范;
- 設(shè)計并優(yōu)化數(shù)據(jù)清洗策略,針對OCR識別后的文本數(shù)據(jù)、結(jié)構(gòu)化元數(shù)據(jù)等進行異常值處理、去重、格式統(tǒng)一及語義糾錯;
- 參與檔案數(shù)據(jù)資產(chǎn)管理,構(gòu)建元數(shù)據(jù)目錄、數(shù)據(jù)血緣追蹤及數(shù)據(jù)安全分類分級機制,提升數(shù)據(jù)可追溯性與合規(guī)性;
- 開發(fā)自動化數(shù)據(jù)質(zhì)檢工具,結(jié)合規(guī)則引擎與輕量級AI模型(如NLP文本分類),實現(xiàn)檔案數(shù)據(jù)質(zhì)量動態(tài)監(jiān)控與預(yù)警;
- 協(xié)同業(yè)務(wù)團隊完成檔案數(shù)據(jù)遷移、整合及歸檔,優(yōu)化數(shù)據(jù)存儲結(jié)構(gòu),提升檢索效率與長期保存可靠性;
- 研究檔案行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)(如《電子檔案管理規(guī)范》),推動數(shù)據(jù)治理方案在政府/國企項目中的落地應(yīng)用。
崗位要求:
1.本科及以上學(xué)歷,計算機、數(shù)學(xué)、人工智能等相關(guān)專業(yè),2-3年 數(shù)據(jù)治理經(jīng)驗或者AI 研發(fā)經(jīng)驗;
2.具備大規(guī)模數(shù)據(jù)處理能力,熟悉Spark、Hadoop、Flink 等大數(shù)據(jù)處理框架;
3具備計算機視覺(CV)、自然語言處理(NLP)、推薦系統(tǒng)等領(lǐng)域的工程實踐經(jīng)驗;
4.熟悉圖像處理、文字識別(OCR) 相關(guān)核心算法,如 CNN、Transformers、OCR 識別算法(如 CRNN、CTC、Attention-based OCR);
5.熟練掌握 Python、C++、Java 等編程語言,具備 AI 模型優(yōu)化及高效部署經(jīng)驗;
6.有國產(chǎn)化相關(guān)經(jīng)驗者優(yōu)先,熟悉國產(chǎn)數(shù)據(jù)庫、中間件、操作系統(tǒng)等生態(tài)環(huán)境;
7.具有大型 G 端項目經(jīng)驗者優(yōu)先,了解政府、國企等行業(yè)的大型項目需求和系統(tǒng)架構(gòu)特點;
8.具備良好的問題分析與解決能力,對 AI 技術(shù)落地有深入理解和實踐經(jīng)驗。