跳转到主要内容
本文介绍的 schema 描述了包含文档处理结果的 JSON 文件结构。这些文件存储了图像中检测到的图形元素、文本元素、表格和列表的信息,以及推断出的文档结构信息:所有检测到的文本都会被划分为段落,并为每个段落指定特定功能。段落会进一步分组为逻辑章节。 您可以在 ABBYY_Scheme_JSON.json 文件中找到 JSON schema。对于 macOS,该文件位于 Headers 文件夹中;对于 LinuxWindows,该文件位于 Inc 文件夹中 (开始 > 程序 > ABBYY FineReader Engine 12 > 安装文件夹 > Include Files 文件夹) 。 根对象描述整个已识别的文档。文档的常规信息存储在 layoutcontent 对象中。layout 对象描述图像参数以及所有检测到的图形和文本元素,而 content 对象描述文档的数据组成部分及其在文档逻辑结构中的位置。 下表列出了根对象的所有属性:
属性数据类型说明
version*stringJSON schema 文档的版本。导出时设置为以下值:FineReader Engine 12
producer*stringJSON 文件的来源。导出时设置为以下值:FineReader Engine
languagesstring array文档中检测到的所有语言列表。
layoutobject文档的物理 (layout) 结构。
contentobject内容 (文档的逻辑结构) 。
  • 表示必需属性。