- 掃描影像的預處理
- 同時辨識大量文件
- 匯出為歸檔格式
情境實作
本主題提供的程式碼範例僅適用於 Windows。
步驟 1. 載入 ABBYY FineReader Engine
步驟 1. 載入 ABBYY FineReader Engine
若要開始使用 ABBYY FineReader Engine,您需要建立 Engine 物件。Engine 物件是 ABBYY FineReader Engine 物件階層中的頂層物件,提供各種全域設定、部分處理方法,以及用於建立其他物件的方法。若要建立 Engine 物件,您可以使用 InitializeEngine 函式。另請參閱載入 Engine 物件的其他方式 (Win) 。
C#
C++ (COM)
步驟 2. 載入此情境的設定
步驟 2. 載入此情境的設定
ABBYY FineReader Engine 可透過 Engine 物件的 LoadPredefinedProfile 方法,載入最適合此情境的各項處理設定。此方法會接收設定檔名稱作為輸入參數。如需更多資訊,請參閱 Working with Profiles。ABBYY FineReader Engine 針對此情境支援 2 種設定:
如果您想變更處理設定,請使用適當的參數物件。如需更多資訊,請參閱 特定任務的進一步最佳化。
設定檔名稱 | 說明 |
|---|---|
DocumentArchiving_Accuracy | 此設定已針對準確度最佳化:
|
DocumentArchiving_Speed | 此設定已針對處理速度最佳化:
|
C#
C++ (COM)
步驟 3. 載入並預處理影像
步驟 3. 載入並預處理影像
ABBYY FineReader Engine 提供 FRDocument 物件,可用於處理多頁文件。使用此物件可保留文件的邏輯組織結構。若要載入單一文件的影像並進行預處理,您應建立 FRDocument 物件並將影像加入其中。您可以採用下列任一方式:
- 使用 Engine 物件的 CreateFRDocumentFromImage 方法建立 FRDocument 物件。此方法會建立 FRDocument 物件,並從指定檔案載入影像。
- 使用 Engine 物件的 CreateFRDocument 方法建立 FRDocument 物件,然後從檔案將影像加入已建立的 FRDocument 物件 (使用 FRDocument 物件的 AddImageFile、AddImageFileWithPassword 或 AddImageFileWithPasswordCallback 方法) 。
C#
C++ (COM)
步驟 4. 文件辨識
步驟 4. 文件辨識
若要辨識文件,建議使用 FRDocument 物件的分析與辨識方法。此物件提供完整的方法集,可用於文件分析、辨識與合成。若要透過單一方法完成文件分析、辨識與合成,最方便的是使用 Process 方法。此方法也能以最高效率運用多處理器與多核心系統的平行處理功能。不過,您也可以使用 Preprocess、Analyze、Recognize 和 Synthesize 方法,依序執行預處理、分析、辨識與合成。
C#
C++ (COM)
步驟 5. 文件匯出
步驟 5. 文件匯出
若要儲存已辨識的文件,您可以使用 FRDocument 物件的 Export 方法,並將 FileExportFormatEnum 常數作為其中一個參數。在此情況下,例如,您可以使用 MRC,並將匯出模式設為 PEM_ImageOnText (PDFExportParams 物件的 TextExportMode 屬性) ,將文件儲存為 PDF 格式。您可以使用對應的匯出物件來變更預設的匯出參數。如需更多資訊,請參閱下方的 特定任務的進一步最佳化。完成 FRDocument 物件的使用後,請釋放此物件所使用的所有資源。請使用 IFRDocument::Close 方法。
C#
C++ (COM)
步驟 6. 卸載 ABBYY FineReader Engine
步驟 6. 卸載 ABBYY FineReader Engine
必要資源
特定任務的進一步最佳化
-
掃描 - 僅限 Windows
- 掃描
ABBYY FineReader Engine 文件掃描情境的說明。
- 掃描
-
識別
- 預處理、分析、辨識與合成的調整參數
使用分析、辨識與合成的參數物件,自訂文件處理流程。
- 預處理、分析、辨識與合成的調整參數
-
識別手寫文字
DocumentArchiving_*** 設定檔不包含手寫或工整手寫文字的識別功能。如果您需要識別手寫文字,請將 PageAnalysisParams 物件的 DetectHandwritten 屬性設為 TRUE。 -
PageProcessingParams 物件
此物件可讓您自訂分析與辨識參數。使用此物件,您可以指定必須偵測的影像與文字特性 (反相影像、影像方向、條碼、辨識語言、辨識誤差範圍) 。 -
SynthesisParamsForPage 物件
此物件包含負責在合成過程中還原頁面格式的參數。 -
SynthesisParamsForDocument 物件
此物件可自訂文件合成的方式,以還原其結構與格式。 -
MultiProcessingParams 物件 - 支援 Linux 和 Windows
處理大量影像時,同時處理會很有幫助。在這種情況下,處理負載會在影像開啟與預處理、版面分析、辨識及匯出期間分散到各個處理器核心,因此可加快處理速度。
讀取模式 (同時或循序) 可使用 MultiProcessingMode 屬性設定,而 RecognitionProcessesCount 屬性則用來控制可啟動的處理程序數量。 -
匯出
- 調整匯出參數
使用匯出參數物件自訂文件匯出。 - PDFExportParams 物件
此物件只需幾個參數即可讓您調整 PDF (PDF/A) 匯出設定。 - 若要自訂 PDF (PDF/A) 格式的匯出模式,請使用 PDFExportParams 物件的 TextExportMode 屬性;若要自訂 MRC 設定,請使用 MRCMode 屬性。
- 此外,您也可以自訂影像匯出設定,以加快處理速度、進一步縮小檔案大小等。例如,若符合您的使用情境,您可以將彩色影像儲存為灰階或黑白影像 (請使用 PDFExportParams 物件的 Colority 屬性) 。
- 您可以變更影像解析度,讓產生的電子副本之後可在印表機上列印或在電腦螢幕上檢視;或者,您也可以選擇僅適合閱讀文字、圖形品質較差的低解析度 (請使用 PDFExportParams 物件的 Resolution 和 ResolutionType 屬性) 。
- 調整匯出參數
-
分割為多個文件
- 在這種情況下,可能需要將一批影像分割成多個文件。ABBYY FineReader Engine 12 不支援自動文件分割。不過,您可以使用 ABBYY FlexiCapture Engine 來實作自動分割。例如,可根據文件的頁數,或根據帶有分隔條碼的頁面來分割文件。實作條碼分割時,您可以使用僅從文件擷取條碼值的情境。
