注意: 此技术当前以预览形式提供,未来版本将进一步改进。
设置“假设筛选”容器
- 点击包含 Deep Learning 活动的区块并选择筛选假设。这将创建一个新的“假设筛选”容器,并把所选的 Deep Learning 活动放入其中。
- (可选)将更多 Deep Learning 活动拖放到“假设筛选”容器上。这样可以组合并比较两个或多个 Deep Learning 活动的输出。例如,当同时处理文本 field 和表格时,可能需要两个活动。
- 向容器中添加一个 Extraction Rules 活动。您可以点击占位符创建新活动,或者将现有活动拖放到容器上。
- 配置 Extraction Rules 活动。针对由 Deep Learning 活动找到的每个值,添加一个 Deep Learning 搜索元素并设置其属性。您可以一次性添加某个 Deep Learning 活动的所有输出 fields。Deep Learning 搜索元素支持所有用于限制搜索区域及设定查找条件的属性。
- 将“假设筛选”容器的输入和输出连接到文档处理工作流中的其他区块。该容器的输出 fields 将与 Extraction Rules 活动的输出 fields 相同。
注意:如果您决定不再对 Deep Learning 活动的输出进行控制,请在容器内任意位置点击并选择不筛选假设。容器将被拆解,但活动本身不会被删除,您仍可在修改后的文档处理工作流中继续使用它们。
示例
Skill 工作流程

- Deep Learning 活动提取文本字段(Text fields)。
- Deep Learning 2 活动提取表格。
- Hypothesis Filtering 容器对结果进行筛选并合并。
提取规则活动中的搜索元素结构

示例 1:修正由 Deep Learning 活动找到的值

- 为了修正 Document_Number 的值,创建一个新的搜索元素。该搜索元素命名为 DocNumber_Corrected,应位于 Document_Number 搜索元素的区域内,并且字符数应受限。

- 通过在元素的代码中添加以下行,将新元素的搜索区域限定为匹配 Document_Number 区域:
- 已校正的搜索元素被映射到用于提取文档编号的字段:


示例 2:从多个重复值中选择一个
注意: 我们建议您先将已标注的文档集保存到文件夹中。当您为某个 field 禁用 Allow Multiple Items 设置时,该 field 的所有额外实例都会从标注中删除。在 Deep Learning 活动中训练的模型仍然可用,但如果您希望对其进行修改并重新训练,则需要加载原始文档集。
- 为 Document Number field 禁用 Allow Multiple Items 设置(可通过单击 Manage Fields 访问该设置)。

- 具有多个实例的 Document_Number 搜索元素无法映射到 Document Number field。因此,从 Deep Learning 活动的文档编号输出创建一个新的 Deep Learning 搜索元素,并将其映射到 Document Number field。

- 使用 Deep Learning 活动找到的多个文档编号实例来构建假设树,其中只有一个会被选为 Document_Number 搜索元素的值。

- 为找到特定实例,为 Document_Number 搜索元素添加相应条件(在此示例中,我们希望找到文档编号最靠上的实例)。

示例 3:合并两个 Deep Learning 活动的输出

