我們正在尋找一位在OCR領域有深厚技術積累的算法工程師,負責復雜場景下的文字檢測與識別核心算法研發(fā)。您將參與構建高精度、高性能的OCR系統(tǒng),解決多語言、多模態(tài)、低質量圖像等挑戰(zhàn)性問題,推動技術在實際業(yè)務場景中的落地應用。
核心職責:
研發(fā)前沿OCR算法,包括但不限于:
復雜場景文字檢測(彎曲文本、遮擋文本、極小文本等)
多語種文字識別(中文/英文/小語種/混合語種)
手寫體/印刷體/特殊字體識別
結構化信息提?。ū砀?票據(jù)/證件等)
優(yōu)化算法性能,解決實際業(yè)務中的難點問題(如低光照、模糊、扭曲圖像等)
跟蹤CV/NLP領域最新進展,將前沿技術應用于OCR系統(tǒng)
主導技術方案設計,推動算法在端側/云端的工程化落地
構建行業(yè)領先的OCR評測體系,持續(xù)提升模型效果
任職要求:
硬性條件:
碩士及以上學歷,計算機/數(shù)學/電子工程等相關專業(yè)
3年以上OCR算法研發(fā)經驗(博士可放寬)
精通深度學習框架(PyTorch/TensorFlow),有CV項目完整落地經驗
深入掌握CNN/Transformer等模型,熟悉DBNet/CRNN/ABINet等OCR算法
扎實的編程能力(Python/C++),熟悉OpenCV等圖像處理庫
在ICDAR/ReCTS等權威評測中取得優(yōu)異成績者優(yōu)先
加分項:
發(fā)表過CVPR/ICCV/ECCV等相關頂會論文
熟悉多模態(tài)(圖像+文本)聯(lián)合建模
有文檔結構化、信息抽取項目經驗
具備模型量化、剪枝等部署優(yōu)化經驗