PDF 處理模式

模式	說明	何時使用
預設 (建議)	可用時使用內嵌的 PDF 文字層，並在需要時輔以 OCR。這是 Vantage 的標準處理方式。	一般用途。建議用於大多數同時包含文字層 PDF 與純影像 PDF 的文件集。
僅使用文字層	僅從內嵌的 PDF 文字層擷取文字。若不存在文字層，Vantage 會自動改用 OCR。	當您擁有高品質且可信賴的文字層，並希望在不執行完整 OCR 的情況下加快擷取速度時使用。適用於受監管的環境，在這類環境中，現有文字層是正式依據。
僅使用 OCR	忽略任何內嵌的 PDF 文字層，並對文件的每一頁執行完整 OCR。	當已知 PDF 文字層不可靠或已損毀，或當您需要不受文件結構影響，對所有文件一致採用以 OCR 為基礎的擷取方式時使用。

模式

說明

何時使用

預設 (建議)

可用時使用內嵌的 PDF 文字層，並在需要時輔以 OCR。這是 Vantage 的標準處理方式。

一般用途。建議用於大多數同時包含文字層 PDF 與純影像 PDF 的文件集。

僅使用文字層

僅從內嵌的 PDF 文字層擷取文字。若不存在文字層，Vantage 會自動改用 OCR。

當您擁有高品質且可信賴的文字層，並希望在不執行完整 OCR 的情況下加快擷取速度時使用。適用於受監管的環境，在這類環境中，現有文字層是正式依據。

僅使用 OCR

忽略任何內嵌的 PDF 文字層，並對文件的每一頁執行完整 OCR。

當已知 PDF 文字層不可靠或已損毀，或當您需要不受文件結構影響，對所有文件一致採用以 OCR 為基礎的擷取方式時使用。

僅使用文字層

您的組織會處理由供應商 ERP 系統匯出的數位原生 PDF 發票。內嵌的文字層準確無誤，且為機器產生。使用 僅使用文字層 可在不執行不必要 OCR 的情況下，提供快速且可靠的擷取結果。

預設（建議）

您在同一工作流程中處理大量混合的掃描紙本文件與數位原生 PDF。有些檔案具有清晰的文字層，有些則沒有。預設 (建議) 會自動處理這兩種情況，無需逐份文件個別設定。

僅使用 OCR

您的文件集由舊式掃描系統產生的 PDF 組成，而該系統會在掃描時嵌入低品質的文字層。該內嵌層包含識別錯誤，進而影響欄位擷取品質。僅使用 OCR 會完全略過該層，直接從頁面影像擷取乾淨的文字。

受監管環境

您所處的產業受到嚴格監管 (例如金融服務或醫療保健) ，因此擷取結果必須完全可重現且可稽核。將模式鎖定為 僅使用文字層 或 僅使用 OCR，可確保無論文件如何進入系統，始終使用相同的處理路徑。

可用模式