跳轉到主要內容
在 ABBYY Vantage 中,處理與光學文字辨識 (OCR) 的結果可取得 JSON 和 XML 格式: Vantage 會為每個已處理的文件產生一個或一組獨立的 JSON 或 XML 檔案 — 具體取決於套用至文件的 skill,以及在使用流程技能時 Output 活動的設定。 下表說明 Vantage 中可用的輸出檔案類型。這些檔案類型皆屬於 Vantage API 中的 ResultFileType 列舉。
File typeDescription
Json已擷取的資料,例如欄位值、欄位結構與規則檢查錯誤。
Pdf具有或不具有文字層的 PDF 文件。
Text以 TXT 格式儲存的已擷取文字資料。
Docx以 DOCX 格式儲存的已擷取文字和影像資料。
Xlsx以 XLSX 格式儲存的已擷取文字和影像資料。
OcrJson以 JSON 格式儲存的全文辨識資料。
FieldsJson簡化的 JSON 檔案。僅包含欄位值與規則檢查錯誤。
FieldPicture以 JPG 格式儲存的已擷取影像欄位。
Xml已擷取的全文辨識資料。
Tiff以 TIFF 格式儲存的已擷取影像資料。
Jpeg以 JPG 格式儲存的已擷取影像資料。
Csv來自重複或非重複欄位的已擷取資料值。
Html以 HTML 格式儲存的已擷取全文辨識資料。
Pptx以 PPTX 格式儲存的已擷取文字和影像資料。
Alto以 XML 格式儲存的已擷取全文辨識資料,其結構符合 ALTO 標準,schema 版本為 4.2
在使用 Vantage API 時,您可以透過 GET https://vantage-[region].abbyy.com/api/publicapi/v1/transactions/transaction-id 要求,取得已處理之處理作業的輸出檔案資訊。檔案類型位於 resultFile 陣列中每個物件的 type 屬性。 如需關於檔案類型的詳細資訊,請參閱 Output 活動與 Image (FieldPicture)。