ABBYY FineReader Engine 支援許多參數,讓您能微調 Engine。在大多數情況下,您無需自行設定所有值:新物件的屬性在建立時會設為合理的預設值;而針對主要使用情境,我們也提供經過充分測試的預先定義設定檔。
如果您的使用情境較為特殊,且已找出兼顧最佳處理速度與品質的最佳設定,請建立自訂設定檔。影像預處理、分析、辨識、合成和匯出的所有參數,都可以透過設定檔變更。舉例來說,如果您的應用程式將辨識結果匯出為 TXT (不含格式的純文字) ,那麼許多與版面配置相關的屬性就不重要,可以關閉。
使用 Engine 物件的 LoadPredefinedProfile/LoadProfile 方法載入設定檔後,新建立物件的屬性將會設為該設定檔中指定的預設值。
ABBYY FineReader Engine 提供一組專為主要使用情境設計的預先定義設定檔。大多數設定檔都有兩種版本:一種針對最佳輸出文件品質進行最佳化,另一種則針對最高處理速度進行最佳化。如需所有預先定義設定檔的完整規格,請參閱預先定義設定檔規格。
| |
|---|
| 適用於從文件中擷取資料並以結構化格式呈現。所有物件 (包括表格、圖片、核取記號及手寫內容) 均會連同其位置和屬性一併儲存。此設定檔最適合用於進一步處理擷取的資料,或與其他應用程式整合。 |
| 適用於將文件轉換為可編輯格式 (例如 RTF、DOCX) 。相關設定已針對準確性進行最佳化: - 最佳品質。啟用字型樣式偵測,並完整合成文件的邏輯結構。
|
| 適用於將文件轉換為可編輯格式 (例如 RTF、DOCX) 。相關設定已針對處理速度進行最佳化: - 最佳品質。啟用字型樣式偵測,並完整合成文件的邏輯結構。
- 不校正影像方向。
- 文件分析程序已加速。
|
| 適用於建立電子封存檔(轉換為 PDF、PDF/A,以及使用 MRC 的 PDF 和 PDF/A) 。相關設定已針對準確性進行最佳化: - 啟用對影像中最大文字量的偵測,包括嵌入影像中的文字。
- 不執行文件邏輯結構的完整合成。
此設定檔不適用於將文件轉換為 RTF、DOCX 或純文字 PDF。如有此類需求,請使用文件轉換設定檔。 |
| 適用於建立電子封存檔(轉換為 PDF、PDF/A,以及使用 MRC 的 PDF 和 PDF/A) 。相關設定已針對處理速度進行最佳化: - 啟用對影像中最大文字量的偵測,包括嵌入影像中的文字。
- 不執行傾斜校正。
- 不執行文件邏輯結構的完整合成。
- 文件分析與辨識程序已加速。
此設定檔不適用於將文件轉換為 RTF、DOCX 或純文字 PDF。如有此類需求,請使用文件轉換設定檔。 |
| 適用於從文件中擷取文字。相關設定已針對準確性進行最佳化: - 啟用對影像中所有文字的偵測,包括低品質的小型文字區域 (不偵測圖片和表格) 。
- 不執行文件邏輯結構的完整合成。
文字的擷取順序與人類閱讀順序相同,可確保資料在用於自然語言處理 (NLP) 引擎的訓練和處理時保持一致性。 此設定檔不適用於將文件轉換為 RTF、DOCX 或純文字 PDF。如有此類需求,請使用文件轉換設定檔。 |
| 適用於從文件中擷取文字。相關設定已針對處理速度進行最佳化: - 啟用對影像中所有文字的偵測,包括低品質的小型文字區域 (不偵測圖片和表格) 。
- 不執行文件邏輯結構的完整合成。
- 文件分析與辨識程序已加速。
文字的擷取順序與人類閱讀順序相同,可確保資料在用於自然語言處理 (NLP) 引擎的訓練和處理時保持一致性。 此設定檔不適用於將文件轉換為 RTF、DOCX 或純文字 PDF。如需此類用途,請使用文件轉換設定檔。 |
| 適用於辨識短文字片段。目前此設定檔採用預設設定。 |
| 適用於條碼擷取。僅擷取條碼 (不偵測文字、圖片或表格) 。設定已針對準確性進行最佳化。 為確保相容性,您也可以透過
BarcodeRecognition 名稱存取此設定檔。 |
| 適用於條碼擷取。僅擷取條碼 (不偵測文字、圖片或表格) 。設定已針對處理速度進行最佳化。 |
| 適用於建立將整份文件儲存為圖片的高壓縮 PDF 檔案。使用以下設定: - 不執行文件辨識及文件邏輯結構合成。
- 不執行歪斜校正。
- PDF 匯出已針對最小化輸出檔案大小進行最佳化。
- 整份文件儲存為圖片 (PEM_ImageOnly模式) 。
|
| 適用於辨識名片。使用以下設定: - 僅偵測名片。
- 啟用偵測影像上的所有文字,包括低品質的小型文字區域 (不偵測圖片和表格) 。
- 執行解析度校正。
- 不執行文件邏輯結構的完整合成。
|
| 適用於從機器可讀區域擷取資料(MRZ)。使用以下設定: - 啟用偵測並擷取影像上的所有文字 (不偵測圖片、向量圖形和表格) 。
- 自動執行解析度和幾何校正。
|
| 適用於辨識技術圖紙。此設定檔考量了工程圖的大尺寸與複雜性,以及影像中可能存在不同文字方向的情況。此設定檔旨在將此類影像轉換為可搜尋的 PDF 格式。使用以下設定: - 啟用偵測影像上的所有文字,包括垂直方向的文字區塊。
- 不執行文件邏輯結構的完整合成。
此設定檔不適用於將文件轉換為 RTF、DOCX 或純文字 PDF。如需此類用途,請使用文件轉換設定檔。 |
| 將所有處理參數設定為預設值。 |
這些設定檔提供的設定可使用 Engine 物件的 LoadPredefinedProfile 方法載入。載入設定檔後,新建立的物件將會具有該設定檔中指定的新預設值。
- FRE for Linux 使用者可在發行套件的 Bin Libraries 資料夾中找到預先定義的設定檔案。
- FRE for macOS 使用者可在發行套件的 /PredefinedProfiles 資料夾中找到預先定義的設定檔案。
- 若要藉助 FREngineDistribution.csv 檔案判定應用程式正常運作所需的資源檔案集合,請參閱與您所選情境對應的頁面。
您也可以建立自訂的使用者設定檔。設定檔案的語法與 *.ini 檔案類似。若要加入註解,可在行首加上分號。
各區段會以方括號括住物件名稱,而各鍵則包含屬性及其新值。名為 UserData 的特殊區段可包含任何使用者自訂鍵。不同類型的屬性可使用下列格式撰寫:
- 布林屬性值以字串表示:true 或 false。
- 列舉屬性值以常數名稱表示。
- string 屬性值直接寫出,不加引號。
例如:
[PrepareImageMode]
RasterizeFreeText = false
[PDFExportParams]
TextExportMode = PEM_ImageOnText
; 這是一個注釋
[RecognizerParams]
TextLanguage = English,Russian
[TextExportParams]
TabSeparator = \t
Engine 物件的 LoadProfile 方法可讓您載入使用者設定檔。載入使用者設定檔後,新建立的物件其屬性將設為設定檔中指定的值。從設定檔載入參數,類似於在程式碼中設定對應的屬性,但能簡化應用程式邏輯。如果您呼叫 LoadProfile 時輸入空的 string,則會使用標準預設值。
建立對應物件時,系統會檢查屬性新值是否正確,以及是否符合授權。
設定檔可用來重新指定下列物件的所有屬性:
1 請注意,RecognizerParams 物件的 UserPatternsFile 屬性只接受模式檔案的完整路徑,並以適用的斜線符號作為分隔符號。路徑值不應加上引號。例如,在 Windows 中:
[RecognizerParams]
UserPatternsFile = C:\folder\file.ptn
在 Linux 上:/home/user/Documents/Patterns/,在 macOS 上:/Users/user/Documents/
2 若要設定 PictureExportParams 或 PaperSizeParams 物件的屬性,請直接在匯出參數物件的區段中指定參數 (而非在 PictureExportParams 或 PaperSizeParams 區段中指定) 。如此即可針對不同的匯出格式使用不同的設定。例如,若要為 RTF 檔案指定灰階圖片格式:
[RTFExportParams]
GrayPictureFormats = GPF_Png
3 若要設定 DocumentContentInfoWritingParams 物件的屬性,請直接在其父物件的區段中指定參數。若為 PDF 格式,父物件是 PDFExportFeatures 物件;若為其他格式,則是對應的匯出參數物件。因此,您可以針對不同的匯出格式指定不同的內容資訊設定。例如,如果您不想將文件作者資訊寫入輸出的 PDF 檔案,請在設定檔中插入下列幾行:
[PDFExportFeatures]
WriteAuthor = false
4 若要設定 PageMargins 物件的屬性,請直接在其父物件的區段中指定參數。請注意,必須先將 UseCustomPageMargins 屬性設為 TRUE,再指定頁邊距值:
[RTFExportParams]
UseCustomPageMargins = true
PageMargins.Left = 5000
PageMargins.Right = 5000
PageMargins.Top = 5000
PageMargins.Bottom = 5000
一個預先定義設定檔和一個使用者設定檔可以同時載入。使用者設定檔的優先順序高於預先定義設定檔;也就是說,如果使用者設定檔設定了與預先定義設定檔相同的參數,系統會使用使用者設定檔中的值。
如果您再載入另一個預先定義設定檔,新的設定檔會取代先前的預先定義設定檔。同樣地,新的使用者設定檔也會取代先前的使用者設定檔。請注意,載入設定檔會清除目前的辨識工作階段 (相當於呼叫 IEngine::CleanRecognizerSession method) 。
預處理、分析、辨識和合成的調整參數
調整匯出參數