macOS 不支援 Office 文件。
元素
| 名稱 | 說明 |
|---|---|
| CRM_Auto | ABBYY FineReader Engine 會自動選擇適合處理 PDF 檔案或 Office 文件的模式。如果此模式的處理結果未達預期,或已事先知道文件類型及對應的重用模式,則可手動選擇該模式。 |
| CRM_ContentAndPictures | ABBYY FineReader Engine 會自動為來源 PDF 檔案或 Office 文件中每一頁的各個部分,選擇文字與影像的使用模式。這表示處理時會同時使用來源檔案內容和點陣化影像。如果來源檔案中的文字品質良好,則會使用該文字;否則會使用此部分點陣圖中的文字。 |
| CRM_ContentOnly | ABBYY FineReader Engine 會使用來源 PDF 檔案或 Office 文件中的文字和影像。 <Warning> 使用來源檔案中的文字內容可加快處理速度,但如果您選擇此模式且檔案中沒有文字層,則會發生錯誤。 </Warning> 我們建議將此模式用於包含可見文字的來源檔案,且這些文字是以 Unicode、ASCII 或其他字元編碼標準編碼,並具有正確的字型與大小設定。如果您的來源檔案屬於其他類型,請使用 CRM_Auto、CRM_ContentAndPictures 或 CRM_DoNotReuse。 <Warning> 在記憶體中平行處理文件時 (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) ,此模式無法使用。 </Warning> |
| CRM_DoNotReuse | ABBYY FineReader Engine 會將來源 PDF 檔案或 Office 文件的頁面點陣化後再進行處理。來源檔案的內容會被忽略。 |
使用 IsPdfWithTextualContent 方法來確認檔案是否包含文字層。
備註
- CRM_DoNotReuse — 一律會判定文字模型的型別。
- CRM_Auto, CRM_ContentAndPictures — 是否判定文字模型的型別,取決於是否使用文件內容識別。
- CRM_ContentOnly — 永遠不會判定文字模型的型別。
