跳轉到主要內容

光學字元辨識 (OCR)

  • OCR 技術——印刷文字辨識支援 211 種語言,包括:
    • 歐洲語言 (拉丁、斯拉夫、亞美尼亞、希臘字母)
    • 中文 (簡體與繁體) 、日文和韓文 (CJK)
    • 阿拉伯文、泰文、越南文、希伯來文和波斯文
    • 緬甸文——技術預覽版
    • FineReader XIX——專為將 17 至 20 世紀出版的舊文件、書籍和報紙數位化及封存而設計的 OCR 模組,其中許多都十分珍貴且獨一無二。這些資料保存於圖書館和政府機構的歷史檔案中,屬於必須妥善保存的國家文化遺產。FineReader XIX 具備獨特的辨識能力,可辨識 1600 年至 1937 年間以英文、法文、德文、義大利文和西班牙文出版的文本。它支援辨識 Fraktur、Schwabacher 以及大多數 Gothic 字體等古老字型。
intro_KeyFeatures_OCRTechnologies
  • 56 種語言支援字典/形態學功能,可大幅提升 OCR 準確度。
  • 多語言文件辨識功能可在同一份文件中辨識多種語言,例如德文與中文,或英文、俄文與韓文。
  • 點陣列印文件辨識——ABBYY FineReader Engine 可辨識多種類型的點陣列印文字。它已使用數千個由各式印表機產生的樣本進行訓練,包括點陣、菊輪、鏈式和帶式印表機,以及草稿和 Near Letter Quality (NLQ) 列印模式。
  • 打字文件辨識。
  • 可辨識 OCR-A、OCR-B、MICR (E13B) 和 CMC7 字型。
請參閱完整支援語言清單文字類型

智慧字元辨識 (ICR)

  • ICR 技術——可辨識超過 126 種語言的手寫印刷體字元。
  • 39 種語言 (使用拉丁、希臘和西里爾字母) 支援詞形變化/字典。
  • 支援阿拉伯國家所使用印度數字的 ICR。
  • 支援全球不同國家和地區使用的 30 種區域性手寫印刷體樣式 (適用於支援的 ICR 語言) 。
  • 可辨識欄位和框格中的手寫印刷體字元——如帶底線的欄位、方框、梳狀欄位等。
  • 多語言 ICR。ABBYY ICR 技術的主要優勢之一是,即使欄位同時包含大小寫字母,對數字及數字與一種或多種語言字母的組合,仍能提供幾乎同樣高的辨識準確率。

光學標記辨識 (OMR)

ABBYY 的 OMR 技術可辨識各種形式的簡單勾選記號、成組勾選記號、範本勾選記號,以及經手寫「更正」的勾選記號:
  • 方框內的勾選記號
  • 空白背景上的勾選記號
  • 非標準類型的勾選記號 (特殊勾選記號必須先經過訓練才能辨識)
OMR 的準確率可達 99.995 %

Optical Barcode Recognition (OBR)

  • 一維與二維條碼。ABBYY OCR SDK 支援辨識常見的一維與二維條碼類型。請參閱支援的條碼類型清單
  • 快速條碼擷取。此功能可自動偵測並辨識文件中任意角度的條碼,適用於一維和二維條碼

辨識模式

透過 Engine 預先定義的處理模式,開發人員可以快速設定並調整處理速度與準確度,以最符合需求的方式進行處理。除了預設處理模式之外,OCR 與 ICR 辨識還可在一般、快速和精確辨識模式下執行:
  • 精確辨識模式
這是最精確的模式,可達到最高的辨識品質。如果您打算重複使用辨識出的內容,或用於其他將準確度視為關鍵因素的任務,強烈建議使用此模式。
  • 快速辨識模式
此模式專為大量文件處理,以及以速度為首要考量的情境所設計。此模式可將處理速度提升 200-250%,因此特別適合用於內容管理 (CMS)、文件管理 (DMS) 和歸檔系統。
  • 一般辨識模式
此模式在精確與快速模式之間提供折衷的辨識準確度與處理速度。一般而言,在準確度幾乎與精確模式相同的情況下,它能提供更高的處理速度。

全文辨識與欄位層級辨識

辨識可分為兩種類型:全文辨識和欄位層級辨識。兩者的主要差異在於,全文辨識通常包含 OCR 技術,主要用於文件轉換;欄位層級辨識則包含 OCR、ICR 及其他技術,用於局部區域中辨識並擷取特定資料。 下表顯示這些辨識類型的規格:
規格全文辨識欄位層級辨識
使用情境文件轉換、書籍歸檔資料擷取
---------
文件分析一般文件分析發票文件分析用於全文索引的文件分析欄位層級辨識的手動區塊設定
辨識OCR,整體準確率通常約為 96–99%OCR、ICR、OMR、條碼辨識,搭配預先定義的資料類型和值域。準確率約為 100%
驗證建議用於內容再利用多數情況下為必要
合成用於文件擷取不使用
匯出辨識結果文件檔案 (RTF、DOCX、PDF 等)匯出至 XML 檔案或資料庫
全文辨識 全文辨識是適用於各種任務的基本辨識類型,例如: 這些作業都需要對文件 (頁面) 上的完整文字進行辨識 (OCR) 。在辨識之前,文件分析通常會先處理頁面分割與方向校正,並偵測文字區塊、圖片及其他物件。 接著,在 OCR 完成後,文件合成會重建文件的結構與版面配置 (用於內容再利用任務) ,或僅針對含有多欄文字和圖片的複雜文件還原正確的文字順序 (用於歸檔情境) 。產生的文字會依任務需求匯出為純文字,或匯出為支援格式的文件。 也可以手動驗證文字,以提高其準確率,尤其是在後續需要重複使用時。 欄位層級辨識 ABBYY FineReader Engine 12 提供完整的欄位層級辨識功能,可支援表單處理、關鍵字分類和關鍵字索引等核心業務流程。強大的影像處理功能進一步提升其智慧偵測各種品質之小型區域的能力,即使存在可能影響辨識準確率的各類圖形特徵也不例外 (例如加底線文字、掃描後雜訊、文字中的空格等) 。 欄位層級或區域辨識的主要功能包括多語 OCR 與 ICR、OMR、條碼辨識,以及一系列特定功能,例如:
  • 從具有各種邊框與框線的欄位擷取資料,包括下拉式方塊、底線欄位、方框,甚至資料超出欄位邊界的欄位
  • 透過設定字母表、字典、正規表示式、分段類型、手寫樣式 (僅限 Windows) 等來定義欄位內容
  • 偵測欄位內空格,準確辨識允許空格的欄位。ABBYY FineReader Engine 12 也支援使用包含帶空格詞組的字典
  • 智慧處理具有相交部分與線條的區塊,可辨識完全位於區塊邊界內的文字 (單字和符號) ,節省辨識無關文字區塊所耗費的時間
  • 文字區塊去斑點,並可指定白色或黑色「雜訊」的大小
欄位層級辨識也可搭配 Engine 提供的開發人員專用工具,例如 Voting API“On-the-Fly” Recognition Tuning。如需詳細資訊,請參閱進階開發工具

使用者語言

ABBYY FineReader Engine 提供建立及編輯辨識語言的 API,可建立預先定義之辨識語言的副本並加以調整,也能將新字詞加入使用者語言。 例如,如果文件包含產品代碼、電話號碼、護照號碼等「結構」資料,就可能發生辨識錯誤。這是因為程式會逐字母讀取這類結構。為了改善產品代碼及類似內容的辨識效果,您可以建立新的辨識語言,協助程式正確讀取特定類型的資料。 以下兩個範例說明使用者語言如何協助您提升辨識品質:
  • 在手寫填寫的文件中,表單欄位中的值通常屬於特定集合,例如城市名稱、國家、郵遞區號、產品代碼、金額等。為了提升 ICR 辨識品質,您可以使用使用者語言來描述各欄位可能輸入的資訊。
  • 如果文件包含產品代碼、電話號碼、護照號碼等「結構」資料,就可能發生辨識錯誤。這是因為程式會逐字母讀取這類結構。為了改善產品代碼及類似內容的辨識效果,您可以建立新的辨識語言,協助程式正確讀取特定類型的資料。

字樣訓練

在絕大多數情況下,ABBYY FineReader Engine 無須事先訓練,也能成功辨識文字。不過,在辨識裝飾字型或空心字型,以及批次輸入印刷品質不佳的文件等情況下,預先進行字樣訓練會很有幫助。 OCR SDK 可讓您直接透過 API 建立及使用使用者字樣。您可以藉由載入圖片並配對對應字元來訓練字樣。

另請參閱

主要功能 使用者字樣訓練導覽 - 僅限 Windows 進階開發工具