跳转到主要内容
下表介绍可用的输出 JSON 文件类型。Skill 类型列列出可生成相应 JSON 文件类型的 Skill 类型。
File typeExport optionDescriptionSkill typeFile nameJSON schema
Fields (JSON)每个文档的值、元数据和 field 结构包含分类结果(如果应用了 Classification skill)、完整的数据提取结果(如果应用了 Document skill)、规则错误、文档和事务(Transaction)注册参数(如有)以及其他元数据的文件。Document
Classification
Process
<Applied_skill_name>.json *JSON schema
Fields (JSON)仅值包含 field 值和规则错误的文件。Document
Process
<Applied_skill_name>_fields.json *取决于所用的 Document skill。目前无法下载。
Text (JSON)仅文本适用于从输入图像中提取所有文本,包括质量较低的小文本区域。忽略文档外观和结构,不检测图片和表格。当您需要从图像中获取数据以便在您方进行后续处理(例如从账单、收据或发票中提取数据)时,可选择该模式。选择此模式将无法导出为 DOCX 和 XLSX。OCR<First_source_file_name>.json **OCR skill schema
Text (JSON)仅文本适用于从输入图像中提取所有文本,包括质量较低的小文本区域。忽略文档外观和结构,不检测图片和表格。当您需要从图像中获取数据以便在您方进行后续处理(例如从账单、收据或发票中提取数据)时,可选择该模式。选择此模式将无法导出为 DOCX 和 XLSX。Process<Applied_skill_name>_text.json *OCR skill schema
Text (JSON)保留文档结构侧重保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等文档。OCR<First_source_file_name>.json **OCR skill schema
Text (JSON)保留文档结构侧重保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等文档。Process<Applied_skill_name>_text.json *OCR skill schema
* <Applied_skill_name> 将会是以下之一:
  • 如果为 Document 或 Classification skill 创建了处理事务,则为该 Skill 的名称。
  • 如果为 Process Skill 创建了处理事务:
    • 应用于该文档的最后一个 Document skill 的名称
    • 如果未应用任何 Document skills,则为应用于该文档的最后一个 Classification skill 的名称
    • “Unknown”,如果未应用任何 Document 和 Classification skills,但在 Process skill 流程中至少存在其中之一。
** <First_source_file_name> 将是用于组装文档的第一个文件的名称,例如 “IMG_12234”。 Document skill 始终会生成两个 Fields (JSON) 文件。Process skill 的设置允许您选择一个 Fields (JSON) 文件和/或一个 Text (JSON) 文件。OCR skill 的设置允许您选择一个 Text (JSON) 文件。 如果处理事务失败,您可以通过 Vantage API 以 JSON 格式获取错误信息。该 JSON 字符串包含有关该处理事务、错误消息的信息,以及处理事务中所有源文件的名称和标识符。如果您相应配置了 Process skill 的 Output 活动,该字符串也会导出到输出共享文件夹中的 Error.json 文件。