跳转到主要内容
在 ABBYY Vantage 中,处理结果和 OCR 结果以 JSON 和 XML 格式提供: Vantage 会为每个已处理文档生成一个单独的 JSON 或 XML 文件,或一组此类文件——具体取决于应用于文档的技能,以及在使用流程技能时 Output 活动的设置。 下表描述了 Vantage 中可用的输出文件类型。所有这些文件类型都是 Vantage API 中 ResultFileType 枚举的一部分。
File typeDescription
Json提取的数据,例如字段值、字段结构和规则检查错误。
Pdf带或不带文本层的 PDF 文档。
TextTXT 格式的提取文本数据。
DocxDOCX 格式的提取文本和图像数据。
XlsxXLSX 格式的提取文本和图像数据。
OcrJsonJSON 格式的全文识别数据。
FieldsJson简化的 JSON 文件,仅包含字段值和规则检查错误。
FieldPictureJPG 格式的提取图像字段。
Xml提取的全文识别数据。
TiffTIFF 格式的提取图像数据。
JpegJPG 格式的提取图像数据。
Csv提取的重复或非重复字段的数据值。
HtmlHTML 格式的全文识别数据。
PptxPPTX 格式的提取文本和图像数据。
Alto以 XML 格式提供的全文识别数据,对应 ALTO 标准,架构版本为 4.2
在使用 Vantage API 时,可以通过 GET https://vantage-[region].abbyy.com/api/publicapi/v1/transactions/transaction-id 请求获取有关已处理事务输出文件的信息。文件类型位于 resultFile 数组中每个对象的 type 属性中。 有关文件类型的更多信息,请参阅 Output 活动和 Image (FieldPicture) 。