跳转到主要内容
下表介绍了各种可用的 XML 输出文件类型。Skill type 列列出了可以生成特定类型 XML 文件的技能类型。
File typeExport optionDescriptionSkill typeFile nameXML schema
XMLText only此模式适用于从输入图像中提取所有文本,包括低质量的小文本区域。会忽略文档的外观和结构,不检测图片和表格。该模式适用于需要从图像中检索数据并在您端进行后续处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。OCR<Source_file_name>.xml **XML schema
XMLText only此模式适用于从输入图像中提取所有文本,包括低质量的小文本区域。会忽略文档的外观和结构,不检测图片和表格。该模式适用于需要从图像中检索数据并在您端进行后续处理的场景,例如从账单、收据或发票中提取数据。选择此模式后,将无法导出为 DOCX 和 XLSX。Process<Applied_skill_name>.xml *XML schema
XMLPreserve document structure此模式侧重保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。OCR<Source_file_name>.xml **XML schema
XMLPreserve document structure此模式侧重保留原始文档的结构和外观,包括字体样式、图片、背景颜色等,更适用于协议、合同、规范等类型的文档。Process<Applied_skill_name>.xml *XML schema

文件命名约定

*<Applied_skill_name> 将会是以下之一:
  • 如果为文档技能或分类技能创建了事务,则为该技能的名称。
  • 如果为流程技能创建了事务:
    • 为最后一个应用到该文档的文档技能的名称
    • 如果没有应用任何文档技能,则为最后一个应用到该文档的分类技能的名称
    • 如果未对该文档应用任何文档技能和分类技能,但在流程技能流中至少存在其中之一,则为 “Unknown”。
** <Source_file_name> 将会是用于组装该文档的第一个文件的名称,例如 “IMG_12234”。