跳转到主要内容
我们将要处理的文档可以根据版式分成两类。我们希望为每一类创建一套单独的提取规则。我们还希望我们的技能可以使用标准的 Vantage 技术进行训练。下面根据这些要求来配置此技能的文档处理流。
  1. 转到 Activities 选项卡。
  2. 首先,我们需要确定文档类别。为此,我们将使用分类活动。单击 Activities 面板中的 Classify By Text and Image 活动。它将被添加到工作流中。添加此活动后,会在技能结构中创建一个新的字段。该字段将用于记录分类结果,并显示在技能字段结构中,但会被标记为隐藏字段且不可编辑。您可以在 Activities 选项卡的 Activity Properties 面板中更改此字段名称。将该字段重命名为 “Layout”。
  3. 根据分类结果,文档应在处理流中被路由到不同的活动。要让工作流产生分支,请插入 IF 活动: a. 在工作流中单击 Classify By Text and Image 活动。 b. 在弹出窗口中选择 IF 项。它将作为 Classify By Text and Image 活动之后的步骤添加到工作流中。
注意: 除了使用 IF 活动之外,您还可以创建一个包含两个 Extraction Rules 活动的工作流项,并选择字段 “Layout” 作为源字段,使其值作为条件,用于选择将哪个活动应用于每个文档。有关此选项的详细信息,请参见在单个活动中使用多个 Extraction Rules 集
  1. 现在我们将添加用于从不同类别文档中提取数据的活动。 a. 选择 Extraction Rules 活动作为下一个项。将其重命名为 “Sick Note DE”。此活动将从德文文档中提取数据。 b. 现在我们需要一个活动,从比利时和荷兰文档中提取数据。在此类文档中存在一些变体,但可以通过单个 Extraction Rules 活动进行处理。单击 IF 活动,并向工作流中再添加一个 Extraction Rules 活动。将该活动重命名为 “Sick Note BE-NL”。现在 IF 活动应同时连接到这两个 Extraction Rules 活动以及 Finish
  2. 我们希望 Vantage 使用已处理的文档对技能进行进一步训练。为此,我们需要在工作流末尾添加 Fast Learning 活动。我们也会在配置技能时对该活动进行训练,但其主要目的,是在生产环境中为技能启用在线学习(Online Learning)。 a. 在处理流中单击 “Sick Note BE-NL”。 b. 在弹出窗口中选择 Fast Learning 活动。它将被添加到 “Sick Note BE-NL” 活动之后,但 “Sick Note DE” 活动仍然连接到 Finish c. 将鼠标悬停在连接 “Sick Note DE” 活动和 Finish 的箭头上。该箭头应变为橙色。 d. 将此箭头拖放到 Fast Learning 活动上。 e. 将鼠标悬停在连接 IF 活动和 Finish 的箭头上。也将该箭头拖放到 Fast Learning 活动上。现在所有文档都会被转发到 Fast Learning 活动。
最终设置应如下所示: Workflow diagram showing the processing pipeline 感叹号表示这些活动尚未配置。我们将在后续步骤中对其进行配置。