跳转到主要内容
下表描述了各种可用的输出 JSON 文件类型。Skill type 列列出了可以生成相应 JSON 文件类型的 Skill 类型。
File typeExport optionDescriptionSkill typeFile nameJSON schema
Fields (JSON)Values, metadata, and field structure for each document包含分类结果(如果应用了 Classification skill)、完整的数据提取结果(如果应用了 Document skill)、规则错误、文档和处理事务的注册参数(如果可用)以及其他元数据的文件。Document
Classification
Process
<Applied_skill_name>.json *JSON schema
Fields (JSON)Values only包含 field 值和规则错误的文件。Document
Process
<Applied_skill_name>_fields.json *取决于所使用的 Document skill。目前不可下载。
Text (JSON)Text only该模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。会忽略文档外观和结构,且不会检测图片和表格。它适用于需要从图像中检索数据,以便您在后续流程中进行处理的情况,例如从账单、收据或发票中提取数据。选择此模式将无法导出为 DOCX 和 XLSX。OCR<First_source_file_name>.json **OCR skill schema
Text (JSON)Text only该模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。会忽略文档外观和结构,且不会检测图片和表格。它适用于需要从图像中检索数据,以便您在后续流程中进行处理的情况,例如从账单、收据或发票中提取数据。选择此模式将无法导出为 DOCX 和 XLSX。Process<Applied_skill_name>_text.json *OCR skill schema
Text (JSON)Preserve document structure该模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。OCR<First_source_file_name>.json **OCR skill schema
Text (JSON)Preserve document structure该模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。Process<Applied_skill_name>_text.json *OCR skill schema
* <Applied_skill_name> 将是下列之一:
  • 如果为 Document 或 Classification skill 创建了处理事务,则为该 Skill 的名称。
  • 如果为 Process skill 创建了处理事务:
    • 应用于该文档的最后一个 Document skill 的名称
    • 如果未应用任何 Document skill,则为应用于该文档的最后一个 Classification skill 的名称
    • 如果未应用任何 Document 和 Classification skill,但在 Process skill 流程中至少存在其中一种,则为 “Unknown”。
** <First_source_file_name> 将是用于组装文档的第一个文件的名称,例如 “IMG_12234”。 Document skill 始终会生成这两种 Fields (JSON) 文件。Process skill 设置允许您选择一个 Fields (JSON) 文件和/或一个 Text (JSON) 文件。OCR skill 设置允许您选择一个 Text (JSON) 文件。 如果处理事务失败,您可以通过 Vantage API 以 JSON 格式获取有关错误的信息。该 JSON 字符串包含有关处理事务的信息、错误消息,以及处理事务中所有源文件的名称和标识符。如果您对 Process skill 的 Output 活动进行了相应配置,此字符串也会导出到输出共享文件夹中的 Error.json 文件中。