跳转到主要内容
在 ABBYY Vantage 中,处理结果和 Optical Character Recognition (OCR) 结果以 JSON 和 XML 格式提供: Vantage 会为每个已处理的文档生成一个单独的 JSON 或 XML 文件,或一组此类文件——具体取决于对文档应用的 Skill,以及在使用 Process 技能时 Output 活动的设置。 下表描述了 Vantage 中可用的输出文件类型。所有这些文件类型都是 Vantage API 中 ResultFileType 枚举的一部分。
File typeDescription
Json提取的数据,例如 field 值、field 结构以及规则检查错误。
Pdf带或不带文本层的 PDF 文档。
Text以 TXT 格式导出的文本数据。
Docx以 DOCX 格式导出的文本和图像数据。
Xlsx以 XLSX 格式导出的文本和图像数据。
OcrJson以 JSON 格式导出的全文识别数据。
FieldsJson简化的 JSON 文件,仅包含 field 值和规则检查错误。
FieldPicture以 JPG 格式导出的图像 field。
Xml提取的全文识别数据。
Tiff以 TIFF 格式导出的图像数据。
Jpeg以 JPG 格式导出的图像数据。
Csv重复或非重复 field 的提取数据值。
Html以 HTML 格式导出的全文识别数据。
Pptx以 PPTX 格式导出的文本和图像数据。
Alto以 XML 格式导出的全文识别数据,对应于 ALTO 标准,架构版本为 4.2
在使用 Vantage API 时,可以通过 GET https://your-server/api/publicapi/v1/transactions/transaction-id 请求获取已处理处理事务的输出文件信息。文件类型位于 resultFile 数组中每个对象的 type 属性中。 有关文件类型的更多信息,请参阅 Output 活动以及 Image (FieldPicture)。