跳转到主要内容
通过在文档图像上指定程序应查找对象的区域,并使用绝对坐标或与锚定元素的相对关系,可以为元素定义搜索区域。 搜索区域 是图像上的一个区域,程序会在其中查找与特定元素对应的对象。该区域是根据 属性 面板中 搜索位置 部分指定的条件计算得出的。 在半结构化文档中,一些对象在不同文档中的位置可能各不相同,因此程序并不总能通过绝对搜索区域找到它们。在这种情况下,可以相对于位置固定的元素,或相对于已经找到的字段来定义搜索区域。也有一些情况,无需定义搜索区域即可检测元素(例如,总是包含某个在文档中唯一的单词的 Static Text 元素,可以仅基于该单词进行检测),或者只将搜索区域限制在文档的第一页或最后一页。

指定搜索区域

要为元素指定搜索区域:
  1. 创建并设置锚定元素。任何已被检测到的元素都可以用作锚定元素,只要您能够在这些元素与希望程序检测的目标元素之间定义某种关系。使用 Match 命令将这些元素与图像进行匹配,并确保它们被正确检测出来。
  2. 创建一个与要检测的图像对象相对应的元素,并在 What to search for 部分中指定其属性。
  3. Where to search 部分中指定搜索区域。a. 在 Search on 下拉列表中,如果需要搜索整个文档,请选择 Whole Document;如果需要将搜索限制在首页或末页,请选择 First PageLast Page。以这种方式指定搜索区域时,不需要锚定元素。b. 如有需要,指定待检测元素与其他元素之间的关系,或直接在图像上绘制搜索区域。您可以相对于其他元素来指定搜索区域的边界,从搜索区域中排除某些元素,或者指定哪个元素或页面边缘距离待检测元素最近。
  4. 单击 Match,确保您的元素可以在所有文档中被正确检测到。

在文档图像上指定搜索区域

在大多数情况下,您会根据用作锚点的其他搜索元素的位置来指定搜索区域。只有在元素已在图像上成功找到时,才能将其用作锚点,因此您应先设置并识别将用作锚点的元素。 单击 在图像上绘制 按钮,然后在图像上绘制搜索区域。搜索区域应靠近锚点元素的区域或与其相交。在 搜索位置 部分中,将为您绘制的搜索区域显示 右侧下方左侧上方 属性,以及用于指定这些属性相对于搜索区域和锚点元素的距离的坐标。这些属性与图像上的搜索区域是同步的。您可以随时通过编辑图像上的区域或在 属性 窗格中更改关系属性来修改搜索区域。当您在 属性 窗格中选择某个关系时,由该关系指定的半平面将在文档图像上高亮显示。 接下来,使用锚点元素工具栏调整锚点元素与搜索区域之间的关系。单击某个元素的区域即可打开该工具栏: AD_ExtractionRules_SearchArea_Tools
  • 可以使用方向箭头工具启用或禁用相对于该元素在相应方向上的对象搜索关系。
  • 删除关系工具会删除为所选元素设置的所有关系。
  • 最近工具指定:在所有元素假设中,在其他条件同等满足时,应优先考虑最接近所选元素的那个。当生成假设时,将选择最接近所选元素的对象。如果使用此工具,最近于 属性将显示在 属性 窗格中。此属性只能为一个锚点元素设置。
  • 排除工具会将所选元素从搜索区域中排除。当搜索区域内的某个元素可能被误认为正在搜索的对象时使用该工具。例如,如果您正在查找具有某个字符集的 Character String 元素,则可能会错误地选择另一个具有相同或类似字符集的 Character String 元素。为防止这种情况发生,请使用排除工具将第二个元素从搜索区域中排除。使用此工具时,排除 属性会显示在 属性 窗格中。
完成搜索区域的设置后,单击 在图像上绘制 按钮以退出绘制搜索区域模式。

在“属性”窗格中指定搜索区域

这些关系等同于上文所述通过锚元素工具栏配置的关系。您可以分别编辑每个关系。 如果开启“绘制搜索区域”模式,文档图像上将显示搜索区域以及由所选关系定义的半平面。搜索区域将与关系属性保持同步。

右侧、下方、左侧、上方、排除

Where to search 部分,单击 Add 并选择要配置的关系类型。在打开的对话框中,选择锚点元素。您可以选择当前元素上方的任意有效元素。 您可以为上述每种类型添加多个关系。 您可以通过更改 Right ofBelowLeft ofAbove 关系的偏移值来修改搜索区域。正偏移值表示边界将按照关系中指定的方向移动。负偏移值则会将边界移动到与关系中指定方向相反的方向。例如,针对 Right of 关系设置负偏移值,会将边界向左移动。 您还可以选择用于计算搜索区域的元素边界。默认情况下,边界会以一种方式进行选择,使搜索区域不包含锚点元素(高于上边界、低于下边界等)。您也可以从锚点元素的相反边界(高于下边界、低于上边界等)或从其中心计算搜索区域。要调整此设置,请单击相应关系所显示的边界图标。

示例

假设您需要查找一个特定的字符序列,在某些文档中它位于预定义静态文本的上方,而在其他文档中则与该静态文本处于同一水平。如果将 Above 的值设为 0,则搜索区域不会考虑与静态文本处于同一水平的元素,这意味着在某些图像中,您的元素不会位于搜索区域内: 示例 1 示例 1b 但是,如果将 Above 的值设置为 -50,或者单击边界图标并选择 区域的下边界,则搜索区域将同时包含与静态文本处于同一水平的区域及其上方的区域,从而确保在所有图像中,您的元素都位于搜索区域内: 示例 2 示例 2b

最近的

Properties 窗格中设置此关系时,您可以选择搜索元素或某个页面边缘作为锚点。这是唯一可以为树中第一个元素设置的关系类型。此类关系一次只能添加一个。您不能为 Group 和 Repeating Group(重复组)元素添加此关系,但可以为 Group 或 Repeating Group 的子元素添加此关系。

使用重复组元素作为锚点元素

当为关系选择锚点元素时,会看到重复组元素及其子元素始终呈灰色显示。不过,仍然可以将这些元素用作锚点元素。要使用重复组元素建立关系,单击元素名称右侧的“编辑”下拉 icon,然后选择将作为锚点元素的实例。可以指定最后找到的实例、所有已完成的实例,或具有特定编号的实例。

编辑和删除关系

您可以在 Properties 窗格中双击某个关系来更改其锚点元素。偏移量和边界设置将会保留。 您可以通过锚点元素窗格删除现有关系,也可以使用 Properties 窗格中相应属性旁边的删除按钮进行删除。 要删除搜索区域,请单击该搜索区域上的删除关系图标。或者,在 Search on 属性中选择 Whole DocumentFirst PageLast Page