跳转到主要内容
为公司分类配置数据目录、正则表达式和字段映射。

步骤 1:添加 Activity

Activities 选项卡中,将 Classify By Company 活动添加到文档处理流程中。

步骤 2. 选择数据目录

转到 Activity Properties 窗格,并在 Issuer Company 下拉列表中选择一个可用的数据目录。如果要搜索一对关联公司,还需要在 Receiver Company (optional) 下拉列表中选择一个数据目录。 您可以执行以下操作之一:
  • 按名称选择数据目录。系统会自动创建一个以所选数据目录命名的数据目录 Parameter。之后可以在技能设置中的 Parameters 选项卡中查看这些 Parameter。
  • 选择技能中已存在的数据目录 Parameter。只有当该 Parameter 所引用的数据目录类型受 Classify By Company 活动支持时,该 Parameter 才会显示在列表中。该 Parameter 所引用的数据目录名称会在括号中注明。
  • 选择 Manage Skill Parameters… 打开技能设置并创建新的数据目录 Parameter。有关更多信息,请参阅使用参数
注意: 您可以在 ABBYY Vantage 中创建更多数据目录。有关详细信息,请参阅 Skill Designer 指南中的“创建数据目录”部分。

步骤 3. 更新数据目录(可选)

如有需要,可使用 CSV 文件更新所选数据目录:单击数据目录列表旁的“更多选项”按钮,然后单击 从 CSV 更新,在打开的对话框中选择一个 CSV 文件。您也可以使用 Vantage API 和共享文件夹来更新数据目录。有关更多信息,请参阅 Skill Designer 指南中“使用数据目录”一节。

步骤 4. 配置正则表达式和关键字

要更精确地搜索公司数据,您可以为文档中可能出现的公司标识符(例如税号、国家税号和 IBAN)指定正则表达式和关键字。正则表达式将定义特定的搜索算法,而关键字会缩小文档上的搜索区域。我们建议将正则表达式与关键字结合使用以加快文档处理速度,因为正则表达式只会应用于在找到关键字的搜索区域中的文本。 要指定正则表达式和关键字,请单击 Activity Settings。在打开的对话框中,对于所需列:
  1. 直接在字段中输入正则表达式,或单击编辑 icon 并在 Regular Expression Editor 中输入正则表达式。您还可以将正则表达式设置为技能的 Parameter 值,并从下拉列表中选择此 Parameter。
  2. 直接在字段中输入关键字。您还可以将关键字设置为技能的 Parameter 值,并从下拉列表中选择此 Parameter。
  3. 单击 Next

步骤 5:映射数据目录列

将数据目录中的列映射到技能中的相应字段。在执行数据提取时,唯一必填的字段是公司标识符字段,其他所有字段都是可选的。完成所有相应字段的映射后,单击 Save 一个 Classify By Company 活动每种类型只能连接到一个数据目录。如需在多个目录中查找数据,可以在文档处理流程中添加多个 Classify By Company 活动,并将它们连接到不同的数据目录。

使用分类结果

在设置好 Classify By Company 活动之后,使用文档中识别到的公司数据。您可以直接提取这些数据,然后进入下一个处理步骤。如果处理流程会根据发行公司有明显差异,您还可以使用公司数据,通过 Extraction Rules 活动或 IF 活动对流程进行分支处理。