跳转到主要内容
下表描述了各种可用的输出 XML 文件类型。Skill type 列列出了可以生成相应类型 XML 文件的 Skill 类型。
File typeExport optionDescriptionSkill typeFile nameXML schema
XMLText only此模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。会忽略文档的外观和结构,不检测图片和表格。该模式适用于需要从图像中获取数据,以便在您侧进行进一步处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。OCR<Source_file_name>.xml **XML schema
XMLText only此模式适用于从输入图像中提取所有文本,包括质量较低的小文本区域。会忽略文档的外观和结构,不检测图片和表格。该模式适用于需要从图像中获取数据,以便在您侧进行进一步处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。Process<Applied_skill_name>.xml *XML schema
XMLPreserve document structure此模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范类文档。OCR<Source_file_name>.xml **XML schema
XMLPreserve document structure此模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范类文档。Process<Applied_skill_name>.xml *XML schema

文件命名约定

*<Applied_skill_name> 将是以下之一:
  • 如果为 Document skill 或 分类 Skill 创建了处理事务,则为该 Skill 的名称。
  • 如果为 Process 技能创建了处理事务:
    • 应用于文档的最后一个 Document skill 的名称
    • 如果未应用任何 Document skill,则为应用于文档的最后一个分类 Skill 的名称
    • 如果未应用任何 Document skill 和 分类 Skill,但在 Process 技能流程中至少存在其中之一,则为 “Unknown”。
** <Source_file_name> 将是用于组装该文档的第一个文件的名称,例如 “IMG_12234”。