跳轉到主要內容
本主題適用於 Windows 版 FRE,但不需要 Visual Components。
如果 IRecognizerParams::TrainUserPatterns 屬性設為 TRUE,則會在識別過程中使用 Train User Pattern 模式。每當遇到未知字元時,就會開啟 Pattern Training 對話方塊,並在其中顯示該字元的影像。 PatternTrainingDialog
您也可以使用 IEngine::TrainUserPattern 方法執行模式訓練,而不顯示對話方塊。此方法會將 TrainingImagesCollection 物件 (用於儲存字元影像的集合) 以及字元本身作為輸入參數。

訓練辨識字元

上方對話方塊視窗中的框線應只框住一個字元,且該字元必須完全位於框線內。如果框線只框住字元的一部分,或框住超過一個字元,請點選框線邊界並加以移動,直到符合上述要求。MoveBodyLeftMoveBodyRight 按鈕也可用來移動框線邊界 (對訓練斜體字元特別有用) 。將框線調整到正確位置後,輸入該字元並點選 Train 按鈕。
  • 您只能訓練系統讀取字母表中包含的字元。如果您想訓練 ABBYY FineReader Engine 讀取無法從鍵盤輸入的字元,請使用兩個字元的組合來表示這些字元,或從 Character Table 複製所需字元 (在 Pattern Training 對話方塊中點選 DotButton 按鈕即可開啟 Character Table) 。
  • 如果您希望訓練系統保留字元格式,請先在 Pattern Training 對話方塊中選取對應的 Italic 或 Bold 項目,再點選 Train 按鈕。
  • 訓練大寫/小寫字元影像時,請分別確認只輸入大寫/小寫字元。
如果您在訓練過程中出錯,請點選 Back 按鈕,將框線還原到先前的位置。最後輸入的「影像 — 字元」配對會自動從模式中移除。請注意,此「復原」功能僅適用於最後一個訓練的單字。

識別連字的訓練

連字是由兩個或三個字元「連」在一起形成的組合,例如 fi、fl、ffi。這些字元難以分開,因為它們在印刷過程中會連成一體。事實上,將它們視為「單一」的複合字元來處理,通常能獲得更好的結果。 連字的訓練方式與個別字元並無不同:
  1. 輸入所需的字元組合,然後按一下 Train 按鈕。
  2. 上方對話方塊中的框線應涵蓋整個連字。您可以使用滑鼠移動框線邊界,或按一下 MoveBodyLeftMoveBodyRight 按鈕。
每個模式最多可包含 1000 個新字元。不過,您不應建立過多的連字,因為這可能會對識別品質造成不良影響。

訓練限制

在訓練 ABBYY FineReader Engine 時,您還應注意下列限制:
  • ABBYY FineReader Engine 不會區分某些通常視為不同的字元。這類影像會被辨識為同一個字元。例如,直單引號 (’)、右單引號 (’) 和左單引號 (‘) 在模式中都會保留為同一個字元——直單引號。因此,即使您嘗試訓練右單引號和左單引號,也絕不會在辨識結果文字中看到它們。
  • 在某些情況下,特定影像會根據其前後文環境而被辨識為某個特定字元。
  • CJK 語言不支援模式訓練。

另請參閱

利用訓練進行識別 RecognizerParams