| File type | Export option | Description | Skill type | File name | JSON schema |
|---|---|---|---|---|---|
| Fields (JSON) | 每个文档的值、元数据和 field 结构 | 包含分类结果(如果应用了 Classification skill)、完整的数据提取结果(如果应用了 Document skill)、规则错误、文档和事务(Transaction)注册参数(如有)以及其他元数据的文件。 | Document Classification Process | <Applied_skill_name>.json * | JSON schema |
| Fields (JSON) | 仅值 | 包含 field 值和规则错误的文件。 | Document Process | <Applied_skill_name>_fields.json * | 取决于所用的 Document skill。目前无法下载。 |
| Text (JSON) | 仅文本 | 适用于从输入图像中提取所有文本,包括质量较低的小文本区域。忽略文档外观和结构,不检测图片和表格。当您需要从图像中获取数据以便在您方进行后续处理(例如从账单、收据或发票中提取数据)时,可选择该模式。选择此模式将无法导出为 DOCX 和 XLSX。 | OCR | <First_source_file_name>.json ** | OCR skill schema |
| Text (JSON) | 仅文本 | 适用于从输入图像中提取所有文本,包括质量较低的小文本区域。忽略文档外观和结构,不检测图片和表格。当您需要从图像中获取数据以便在您方进行后续处理(例如从账单、收据或发票中提取数据)时,可选择该模式。选择此模式将无法导出为 DOCX 和 XLSX。 | Process | <Applied_skill_name>_text.json * | OCR skill schema |
| Text (JSON) | 保留文档结构 | 侧重保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等文档。 | OCR | <First_source_file_name>.json ** | OCR skill schema |
| Text (JSON) | 保留文档结构 | 侧重保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等文档。 | Process | <Applied_skill_name>_text.json * | OCR skill schema |
* <Applied_skill_name> 将会是以下之一:
- 如果为 Document 或 Classification skill 创建了处理事务,则为该 Skill 的名称。
- 如果为 Process Skill 创建了处理事务:
- 应用于该文档的最后一个 Document skill 的名称
- 如果未应用任何 Document skills,则为应用于该文档的最后一个 Classification skill 的名称
- “Unknown”,如果未应用任何 Document 和 Classification skills,但在 Process skill 流程中至少存在其中之一。
** <First_source_file_name> 将是用于组装文档的第一个文件的名称,例如 “IMG_12234”。
Document skill 始终会生成两个 Fields (JSON) 文件。Process skill 的设置允许您选择一个 Fields (JSON) 文件和/或一个 Text (JSON) 文件。OCR skill 的设置允许您选择一个 Text (JSON) 文件。
如果处理事务失败,您可以通过 Vantage API 以 JSON 格式获取错误信息。该 JSON 字符串包含有关该处理事务、错误消息的信息,以及处理事务中所有源文件的名称和标识符。如果您相应配置了 Process skill 的 Output 活动,该字符串也会导出到输出共享文件夹中的 Error.json 文件。