| File type | Export option | Description | Skill type | File name | JSON schema |
|---|---|---|---|---|---|
| Fields (JSON) | Values, metadata, and field structure for each document | 包含分类结果(如果应用了 Classification 技能)、完整数据提取结果(如果应用了 Document 技能)、规则错误、文档和事务注册参数(如果可用)以及其他元数据的文件。 | Document Classification Process | <Applied_skill_name>.json * | JSON schema |
| Fields (JSON) | Values only | 包含字段值和规则错误的文件。 | Document Process | <Applied_skill_name>_fields.json * | 取决于所使用的 Document 技能。目前尚不可下载。 |
| Text (JSON) | Text only | 此模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。文档外观和结构将被忽略,不会检测图片和表格。该模式适用于需要从图像中获取数据以便在您这边进行后续处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。 | OCR | <First_source_file_name>.json ** | OCR skill schema |
| Text (JSON) | Text only | 此模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。文档外观和结构将被忽略,不会检测图片和表格。该模式适用于需要从图像中获取数据以便在您这边进行后续处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。 | Process | <Applied_skill_name>_text.json * | OCR skill schema |
| Text (JSON) | Preserve document structure | 此模式侧重于保留文档的原始结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。 | OCR | <First_source_file_name>.json ** | OCR skill schema |
| Text (JSON) | Preserve document structure | 此模式侧重于保留文档的原始结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。 | Process | <Applied_skill_name>_text.json * | OCR skill schema |
* <Applied_skill_name> 将为以下之一:
- 如果为 Document 或 Classification 技能创建了事务,则为该技能的名称。
- 如果为 Process 技能创建了事务,则:
- 应用于该文档的最后一个 Document 技能的名称
- 如果未应用任何 Document 技能,则为应用于该文档的最后一个 Classification 技能的名称
- 如果未应用任何 Document 和 Classification 技能,但在 Process 技能流程中至少存在其中一种技能,则为 “Unknown”。
** <First_source_file_name> 将是用于组装该文档的第一个文件的名称,例如 “IMG_12234”。
Document 技能始终会生成两种 Fields (JSON) 文件。Process 技能设置允许您选择一个 Fields (JSON) 文件和/或一个 Text (JSON) 文件。OCR 技能设置允许您选择一个 Text (JSON) 文件。
如果事务失败,您可以通过 Vantage API 以 JSON 格式获取有关错误的信息。该 JSON 字符串包含有关事务的信息、错误消息,以及事务中所有源文件的名称和标识符。如果您对 Process 技能的 Output 活动进行了相应配置,该字符串还会导出到输出共享文件夹中的 Error.json 文件中。