跳转到主要内容
下表介绍了可用的输出 XML 文件类型。“Skill 类型”列列出了可生成特定 XML 文件类型的 Skill 类型。
File typeExport optionDescriptionSkill typeFile nameXML schema
XML仅文本此模式适用于从输入图像中提取全部文本,包括质量较低的小型文本区域。忽略文档外观和结构,不检测图片和表格。适用于需要从图像中获取数据以在您侧进行后续处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。OCR<Source_file_name>.xml **XML schema
XML仅文本此模式适用于从输入图像中提取全部文本,包括质量较低的小型文本区域。忽略文档外观和结构,不检测图片和表格。适用于需要从图像中获取数据以在您侧进行后续处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。Process<Applied_skill_name>.xml *XML schema
XML保留文档结构此模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、技术规范等文档。OCR<Source_file_name>.xml **XML schema
XML保留文档结构此模式侧重于保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、技术规范等文档。Process<Applied_skill_name>.xml *XML schema

文件命名约定

*<Applied_skill_name> 可能为以下之一:
  • 若为 Document 或 分类 Skill 创建了处理事务,则为该 Skill 的名称。
  • 若为 Process 技能创建了处理事务:
    • 应用于该文档的最后一个 Document skill 的名称
    • 若未应用任何 Document skills,则为应用于该文档的最后一个 分类 Skill 的名称
    • 若未应用任何 Document 和 分类 Skill,但在 Process 技能流程中至少存在其中之一,则为“Unknown”。
**<Source_file_name> 为用于组装该文档的第一个文件的名称,例如“IMG_12234”。