| File type | Export option | Description | Skill type | File name | JSON schema |
|---|---|---|---|---|---|
| Fields (JSON) | Values, metadata, and field structure for each document | 包含分类结果(如果应用了 Classification skill)、完整的数据提取结果(如果应用了 Document skill)、规则错误、文档和处理事务的注册参数(如果可用)以及其他元数据的文件。 | Document Classification Process | <Applied_skill_name>.json * | JSON schema |
| Fields (JSON) | Values only | 包含 field 值和规则错误的文件。 | Document Process | <Applied_skill_name>_fields.json * | 取决于所使用的 Document skill。目前不可下载。 |
| Text (JSON) | Text only | 该模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。会忽略文档外观和结构,且不会检测图片和表格。它适用于需要从图像中检索数据,以便您在后续流程中进行处理的情况,例如从账单、收据或发票中提取数据。选择此模式将无法导出为 DOCX 和 XLSX。 | OCR | <First_source_file_name>.json ** | OCR skill schema |
| Text (JSON) | Text only | 该模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。会忽略文档外观和结构,且不会检测图片和表格。它适用于需要从图像中检索数据,以便您在后续流程中进行处理的情况,例如从账单、收据或发票中提取数据。选择此模式将无法导出为 DOCX 和 XLSX。 | Process | <Applied_skill_name>_text.json * | OCR skill schema |
| Text (JSON) | Preserve document structure | 该模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。 | OCR | <First_source_file_name>.json ** | OCR skill schema |
| Text (JSON) | Preserve document structure | 该模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。 | Process | <Applied_skill_name>_text.json * | OCR skill schema |
* <Applied_skill_name> 将是下列之一:
- 如果为 Document 或 Classification skill 创建了处理事务,则为该 Skill 的名称。
- 如果为 Process skill 创建了处理事务:
- 应用于该文档的最后一个 Document skill 的名称
- 如果未应用任何 Document skill,则为应用于该文档的最后一个 Classification skill 的名称
- 如果未应用任何 Document 和 Classification skill,但在 Process skill 流程中至少存在其中一种,则为 “Unknown”。
** <First_source_file_name> 将是用于组装文档的第一个文件的名称,例如 “IMG_12234”。
Document skill 始终会生成这两种 Fields (JSON) 文件。Process skill 设置允许您选择一个 Fields (JSON) 文件和/或一个 Text (JSON) 文件。OCR skill 设置允许您选择一个 Text (JSON) 文件。
如果处理事务失败,您可以通过 Vantage API 以 JSON 格式获取有关错误的信息。该 JSON 字符串包含有关处理事务的信息、错误消息,以及处理事务中所有源文件的名称和标识符。如果您对 Process skill 的 Output 活动进行了相应配置,此字符串也会导出到输出共享文件夹中的 Error.json 文件中。