崗位職責(zé):
- 負(fù)責(zé)檔案數(shù)字化項(xiàng)目中的數(shù)據(jù)治理體系搭建,制定數(shù)據(jù)清洗、標(biāo)準(zhǔn)化及質(zhì)量管控流程,保障檔案數(shù)據(jù)符合行業(yè)規(guī)范;
- 設(shè)計(jì)并優(yōu)化數(shù)據(jù)清洗策略,針對(duì)OCR識(shí)別后的文本數(shù)據(jù)、結(jié)構(gòu)化元數(shù)據(jù)等進(jìn)行異常值處理、去重、格式統(tǒng)一及語(yǔ)義糾錯(cuò);
- 參與檔案數(shù)據(jù)資產(chǎn)管理,構(gòu)建元數(shù)據(jù)目錄、數(shù)據(jù)血緣追蹤及數(shù)據(jù)安全分類(lèi)分級(jí)機(jī)制,提升數(shù)據(jù)可追溯性與合規(guī)性;
- 開(kāi)發(fā)自動(dòng)化數(shù)據(jù)質(zhì)檢工具,結(jié)合規(guī)則引擎與輕量級(jí)AI模型(如NLP文本分類(lèi)),實(shí)現(xiàn)檔案數(shù)據(jù)質(zhì)量動(dòng)態(tài)監(jiān)控與預(yù)警;
- 協(xié)同業(yè)務(wù)團(tuán)隊(duì)完成檔案數(shù)據(jù)遷移、整合及歸檔,優(yōu)化數(shù)據(jù)存儲(chǔ)結(jié)構(gòu),提升檢索效率與長(zhǎng)期保存可靠性;
- 研究檔案行業(yè)數(shù)據(jù)標(biāo)準(zhǔn)(如《電子檔案管理規(guī)范》),推動(dòng)數(shù)據(jù)治理方案在政府/國(guó)企項(xiàng)目中的落地應(yīng)用。
崗位要求:
1.本科及以上學(xué)歷,計(jì)算機(jī)、數(shù)學(xué)、人工智能等相關(guān)專(zhuān)業(yè),2-3年 數(shù)據(jù)治理經(jīng)驗(yàn)或者AI 研發(fā)經(jīng)驗(yàn);
2.具備大規(guī)模數(shù)據(jù)處理能力,熟悉Spark、Hadoop、Flink 等大數(shù)據(jù)處理框架;
3具備計(jì)算機(jī)視覺(jué)(CV)、自然語(yǔ)言處理(NLP)、推薦系統(tǒng)等領(lǐng)域的工程實(shí)踐經(jīng)驗(yàn);
4.熟悉圖像處理、文字識(shí)別(OCR) 相關(guān)核心算法,如 CNN、Transformers、OCR 識(shí)別算法(如 CRNN、CTC、Attention-based OCR);
5.熟練掌握 Python、C++、Java 等編程語(yǔ)言,具備 AI 模型優(yōu)化及高效部署經(jīng)驗(yàn);
6.有國(guó)產(chǎn)化相關(guān)經(jīng)驗(yàn)者優(yōu)先,熟悉國(guó)產(chǎn)數(shù)據(jù)庫(kù)、中間件、操作系統(tǒng)等生態(tài)環(huán)境;
7.具有大型 G 端項(xiàng)目經(jīng)驗(yàn)者優(yōu)先,了解政府、國(guó)企等行業(yè)的大型項(xiàng)目需求和系統(tǒng)架構(gòu)特點(diǎn);
8.具備良好的問(wèn)題分析與解決能力,對(duì) AI 技術(shù)落地有深入理解和實(shí)踐經(jīng)驗(yàn)。