跳转到主要内容 为公司分类配置数据目录、正则表达式和字段映射。
在 Activities 选项卡中,将 Classify By Company 活动添加到文档处理流程中。
转到 Activity Properties 窗格,并在 Issuer Company 下拉列表中选择一个可用的数据目录。如果要搜索一对关联公司,还需要在 Receiver Company (optional) 下拉列表中选择一个数据目录。
您可以执行以下操作之一:
按名称选择数据目录。系统会自动创建一个以所选数据目录命名的数据目录 Parameter。之后可以在技能设置中的 Parameters 选项卡中查看这些 Parameter。
选择技能中已存在的数据目录 Parameter。只有当该 Parameter 所引用的数据目录类型受 Classify By Company 活动支持时,该 Parameter 才会显示在列表中。该 Parameter 所引用的数据目录名称会在括号中注明。
选择 Manage Skill Parameters… 打开技能设置并创建新的数据目录 Parameter。有关更多信息,请参阅使用参数 。
您可以在 ABBYY Vantage 中创建更多数据目录。有关详细信息,请参阅创建数据目录 。
如有需要,可使用 CSV 文件更新所选数据目录:单击数据目录列表旁的“更多选项”按钮,然后单击 从 CSV 更新 ,在打开的对话框中选择一个 CSV 文件。您也可以使用 Vantage API 和共享文件夹来更新数据目录。有关更多信息,请参阅 Skill Designer 指南中“使用数据目录”一节。
要更精确地搜索公司数据,您可以为文档中可能出现的公司标识符 (例如税号、国家税号和 IBAN) 指定正则表达式和关键字。正则表达式将定义特定的搜索算法,而关键字会缩小文档上的搜索区域。我们建议将正则表达式与关键字结合使用以加快文档处理速度,因为正则表达式只会应用于在找到关键字的搜索区域中的文本。
要指定正则表达式和关键字,请单击 Activity Settings 。在打开的对话框中,对于所需列:
直接在字段中输入正则表达式,或单击编辑 icon 并在 Regular Expression Editor 中输入正则表达式。您还可以将正则表达式设置为技能的 Parameter 值,并从下拉列表中选择此 Parameter。
直接在字段中输入关键字。您还可以将关键字设置为技能的 Parameter 值,并从下拉列表中选择此 Parameter。
单击 Next 。
将数据目录中的列映射到技能中的相应字段。在执行数据提取时,唯一必填的字段是公司标识符字段,其他所有字段都是可选的。完成所有相应字段的映射后,单击 Save 。
一个 Classify By Company 活动每种类型只能连接到一个数据目录。如需在多个目录中查找数据,可以在文档处理流程中添加多个 Classify By Company 活动,并将它们连接到不同的数据目录。
在设置好 Classify By Company 活动之后,使用文档中识别到的公司数据。您可以直接提取这些数据,然后进入下一个处理步骤。如果处理流程会根据发行公司有明显差异,您还可以使用公司数据,通过 Extraction Rules 活动或 IF 活动对流程进行分支处理。