跳转到主要内容
本文中描述的架构决定了在 Output 活动中启用 XML 格式时,包含 OCR 技能和流程技能文档处理结果的 XML 文件的结构。 所有对象属性、其数据类型以及允许的取值都在 XML 架构中列出,因此建议先熟悉该架构,以便更轻松地配置用于分析 XML 文件的工具。您可以在此下载该 XML 架构。 根对象描述整个已识别的文档。关于文档的一般信息存储在 pagedocumentData 元素中。 下表列出了根 document 元素的所有属性:
PropertyData typeDescription
version *stringXML 架构文档的版本。默认设置为:Vantage OCR.Skill XML output v1.0
producer *stringXML 文件的来源。默认设置为:ABBYY Vantage OCR.Skill
languagesstring文档中检测到的所有语言列表。
星号表示必填属性。