跳轉到主要內容

為什麼要改善影像?

提升影像品質這項工作有兩個層面。 一方面,我們需要提升影像品質,使其更適合 OCR。 intro_KeyFeatures_ImageProcessing1 另一方面,我們也需要改善影像的外觀,例如在將文件影像存放於封存檔案時,這一點就很有必要。 intro_KeyFeatures_ImageProcessing2 由於 ABBYY 技術專注於文件分析與辨識,因此系統包含一套強大的影像預處理技術:自適應二值化、失真校正、文字行校直、對開頁面分割等。 無需任何第三方工具,即可獲得精確的 OCR 結果。ABBYY 提供完整的一套專為 OCR 打造的預處理技術。

影像前處理

ABBYY FineReader Engine 在接收影像後,會執行一系列影像前處理功能,以提升文件影像的品質,以便後續進行辨識或封存:

此文件影像功能在大量輸入影像時尤為重要,特別是當文件頁面的掃描方向未知且可能各不相同的情況下。系統會自動偵測每個頁面的方向,並在必要時加以校正。

此功能適用於以跨頁方式掃描書籍,同時涵蓋左右兩頁。將頁面分割為兩個獨立頁面,使每個頁面對應書籍的單一頁面後,識別品質將會更高。系統隨後會針對每個頁面分別執行識別與版面分析,並在需要時進行傾斜校正。

這是一項重要的文件影像功能,適用於需要修正影像傾斜的掃描文件,且無需前緣邊框或線條。全新的 ABBYY FineReader Engine 12 提供多種影像傾斜校正方法:成對黑色方塊、線條或文字行。

從掃描或拍攝的書籍中擷取文字時,文字行可能參差不齊,導致 OCR 識別困難。ABBYY 技術提供專用演算法,可校正傾斜並校直文字行,從而實現精確的文字識別。

掃描品質較差至中等的文件時,可能會產生含有大量斑點或雜點的高雜訊影像。這些斑點若出現在字母或數字附近,可能會影響 OCR 的識別品質。此功能可去除此類雜訊,使用者亦可自行指定要去除的斑點大小。此功能可套用於整張影像,也可套用於影像中的任何個別區塊 (或區域) 。

此技術可自動識別數位照片,並校正數位相機常見的影像失真。系統能辨識數位影像中的各種典型缺陷,例如文字行扭曲、梯形 3D 失真、對焦不良、模糊、厚書對頁的暗角、眩光、ISO 雜訊等。這些缺陷均由系統自動校正,使用者無需借助任何第三方應用程式來修正照片。

intro_KeyFeatures_ImageProcessing3

紋理濾波技術有助於濾除背景「雜訊」 (如色彩與紋理) ,從而提升難以辨讀的文件 (如新聞紙、彩色文件、傳真及複印件) 的識別準確率。

intro_KeyFeatures_ImageProcessing4

此程序將影像轉換為黑白格式,去除雜訊、移除背景、消除紋理,並獲取清晰的文字。此程序可確保最佳的 OCR 品質。每個片段所需的參數均單獨識別。對於薄型報紙,反面印刷的文字可能會在掃描件上顯現。自適應二值化可去除此類文字。

創新的自適應二值化技術在識別過程中,針對每個影像片段動態調整亮度閾值。透過套用個別識別參數,可對具有灰階或彩色可變對比背景及紋理的文件產生精確的識別結果。

此程序使用極小的點對灰階影像進行二值化處理,可改善文件的外觀,使文件呈現出更多層次的色調。

二值影像濾鏡

影像縮放

對於以較低解析度 (低於 120 dpi) 掃描的文件,以及字體較小 (小於 10 pt) 的文件,可透過數位放大影像來提升 OCR 品質。

另請參閱

主要特色