跳转到主要内容
数据目录(data catalog)包含有助于文档识别的信息。这些信息可以包括客户 ERP 系统中的数据(例如 Vendor 和 采购订单 数据),或其他相关数据,例如所用 币种 的信息、特定国家的机场清单,或某个组织的节假日清单。您可以在 Document skill 中使用数据目录以:
  • 提高数据提取的准确性。
  • 校验提取的数据。
  • 在人工校验期间允许用户从下拉列表中选择一条记录,并自动用所选记录中的数据填充其他 field。
数据目录本质上是数据表。数据目录在使用前必须先填充数据。为了让 Vantage 将提取的数据与数据目录中的记录进行比对,需要配置相应规则,这样在处理文档时,ABBYY Vantage 会在数据目录中查找与文档上找到的 field 值匹配项最多的记录。如果找到这样的记录,所有匹配的文档字段将使用该记录中的数据进行填充。如果在数据目录中未找到合适的记录,或找到多条此类记录,该规则将产生错误,操作员可以在人工校验期间从数据目录中手动选择适当的记录。
注意:目录记录的最大允许数量为 500,000。目录中的字段值长度最多为 256 个字符。
在 ABBYY Vantage 中,会为内置的 Document skill 创建数据目录,例如:
  • 对于 Invoice Skill,会创建名为 VendorsBusinessUnitsPurchaseOrdersPurchaseOrderItems 的数据目录。
  • 对于 采购订单 Skill,会创建名为 BuyersSuppliers 的数据目录。
每个预定义的数据目录都有预定义的结构和规范化类型,且不得修改。 要打开数据目录列表,请单击左侧菜单中的 Data Catalogs
注意:创建和更新数据目录的权限取决于用户角色。有关角色的更多信息,请参阅基于角色的访问控制

创建数据目录(data catalog)

在 ABBYY Vantage 中,在编辑或导入 Skill 时,可以为内置的 Document skill 创建数据目录。由于内置 Skill 无法直接编辑,你需要先对其进行复制,复制时会自动创建数据目录。 可以通过以下两种方式创建数据目录:
  • 使用 CSV 文件
  • 手动输入数据列
有关更多信息,请参见创建数据目录

更新数据目录(data catalogs)

您可以通过以下方式向数据目录(data catalog)添加数据:
  • 通过 UI 上传 CSV 文件。
  • 通过共享文件夹上传 CSV 文件。
  • 使用 Vantage API 以 JSON 格式提交数据。
提示: 更新后的数据目录(已添加和/或删除记录)对租户中的所有 Skill 可用。但它们仅适用于在数据目录更新之后上传的文档。对于较早上传的文档,将继续使用旧数据。

另请参阅