跳转到主要内容
要设置 Classify By Company 活动,请按以下步骤操作:

步骤 1:添加活动

Activities 选项卡中,将 Classify By Company 活动添加到文档处理流程。

步骤 2:选择数据目录(data catalog)

导航到 Activity Properties 面板,从 Issuer Company 下拉列表中选择一个可用的数据目录(data catalog)。如果要搜索相关的公司配对,还需从 Receiver Company (optional) 下拉列表中选择一个数据目录(data catalog)。 您可以执行以下任一操作:
  • 按名称选择数据目录(data catalog)。系统会自动创建一个以所选数据目录命名的数据目录参数。随后可在 Skill 设置的 Parameters 选项卡中查看这些参数。
  • 选择 Skill 中已存在的数据目录参数。仅当该参数所引用的数据目录类型受 Classify By Company 活动支持时,参数才会显示在列表中。参数所引用的数据目录名称会在括号中标注。
  • 选择 Manage Skill Parameters…,打开 Skill 设置并创建新的数据目录参数。更多信息,请参阅 Using parameters
注意: 您可以在 ABBYY Vantage 中创建其他数据目录。更多信息,请参阅 Skill Designer 指南的“创建数据目录”。

步骤 3:更新数据目录(可选)

如有需要,可使用 CSV 文件更新所选数据目录:单击数据目录列表旁的“更多选项”按钮,选择 Update from CSV,并在随即打开的对话框中选择一个 CSV 文件。你也可以通过 Vantage API 和共享文件夹来更新数据目录。更多信息,请参阅 Skill Designer 指南中的“使用数据目录”。

步骤 4:配置正则表达式和关键字

为更准确地检索公司数据,您可以为文档中可能出现的公司标识符(例如纳税人识别号、国家纳税人识别号以及 IBAN(国际银行账户号码))指定正则表达式和关键字。正则表达式用于设定具体的搜索算法,关键字则用于缩小文档中的搜索范围。建议将正则表达式与关键字结合使用以加快文档处理:只有在找到关键字的搜索区域内,才会应用正则表达式。 要指定正则表达式和关键字,单击 Activity Settings。在打开的对话框中,对于所需的列: a. 直接在字段中编写正则表达式,或单击编辑 icon 并在 Regular Expression Editor 中编写正则表达式。您也可以将正则表达式设置为 Skill 的 Parameter 值,并从下拉列表中选择该参数。 b. 直接在字段中输入关键字。您也可以将关键字设置为 Skill 的 Parameter 值,并从下拉列表中选择该参数。 c. 单击 Next

步骤 5:映射数据目录(data catalog)列

将数据目录(data catalog)中的列映射到该 Skill 中相应的字段。执行数据提取时,唯一必填的字段是公司标识符字段,其他字段均为可选。完成所有相应字段的映射后,单击 Save 一个 Classify By Company 活动在每种类型上只能连接到一个数据目录(data catalog)。如果需要在多个目录中查找数据,可以在文档处理流程中添加多个 Classify By Company 活动,并将它们分别连接到不同的数据目录(data catalog)。

使用分类结果

在设置好 Classify By Company 活动后,可利用文档中的公司数据。您可以直接提取这些数据并进入下一步处理。若处理流程会因开具/发行公司而显著不同,也可以基于公司数据,通过 Extraction Rules 活动或 IF 活动对流程进行分支。