跳轉到主要內容
SourceContentReuseModeEnum 列舉常數說明了可用於重用來源 PDF 檔案與 Office 文件內容的模式。
macOS 不支援 Office 文件。
typedef enum {
 CRM_Auto,
 CRM_DoNotReuse,
 CRM_ContentOnly,
 CRM_ContentAndPictures
} SourceContentReuseModeEnum;

元素

名稱說明
CRM_AutoABBYY FineReader Engine 會自動選擇適合處理 PDF 檔案或 Office 文件的模式。如果此模式的處理結果未達預期,或已事先知道文件類型及對應的重用模式,則可手動選擇該模式。
CRM_ContentAndPicturesABBYY FineReader Engine 會自動為來源 PDF 檔案或 Office 文件中每一頁的各個部分,選擇文字與影像的使用模式。這表示處理時會同時使用來源檔案內容和點陣化影像。如果來源檔案中的文字品質良好,則會使用該文字;否則會使用此部分點陣圖中的文字。
CRM_ContentOnlyABBYY FineReader Engine 會使用來源 PDF 檔案或 Office 文件中的文字和影像。 <Warning> 使用來源檔案中的文字內容可加快處理速度,但如果您選擇此模式且檔案中沒有文字層,則會發生錯誤。 </Warning> 我們建議將此模式用於包含可見文字的來源檔案,且這些文字是以 Unicode、ASCII 或其他字元編碼標準編碼,並具有正確的字型與大小設定。如果您的來源檔案屬於其他類型,請使用 CRM_Auto、CRM_ContentAndPictures 或 CRM_DoNotReuse。 <Warning> 在記憶體中平行處理文件時 (MultiProcessingParams::MultiProcessingMode = MPM_Parallel) ,此模式無法使用。 </Warning>
CRM_DoNotReuseABBYY FineReader Engine 會將來源 PDF 檔案或 Office 文件的頁面點陣化後再進行處理。來源檔案的內容會被忽略。
使用 IsPdfWithTextualContent 方法來確認檔案是否包含文字層。

備註

在判定文字模型型別的過程中,會同時進行文件內容識別 (請參閱 IWord::ModelType) 。此程序取決於所選的內容重用模式:
  • CRM_DoNotReuse — 一律會判定文字模型的型別。
  • CRM_Auto, CRM_ContentAndPictures — 是否判定文字模型的型別,取決於是否使用文件內容識別。
  • CRM_ContentOnly — 永遠不會判定文字模型的型別。

用於

IObjectsExtractionParams::SourceContentReuseMode