跳转到主要内容通过在文档图像上指定区域,为元素定义搜索区域,指示程序应在何处查找对象;可使用绝对坐标,或基于锚定元素的相对关系进行定义。
搜索区域是图像上的一块区域,程序会在其中查找与特定元素对应的对象。该区域根据属性窗格中搜索位置部分指定的条件计算得出。
在半结构化文档中,某些对象可能在不同文档上出现于不同位置,因此程序并不总能通过绝对搜索区域找到它们。在这种情况下,可以相对于位置固定的元素,或相对于已找到的 field 来定义搜索区域。也有一些情况下,无需定义搜索区域也能检测到某个元素(例如,一个始终包含某个在文档中唯一的词语的 Static Text 元素,可以仅凭该词语进行检测),或者只将搜索范围限定在文档的第一页或最后一页。
要为元素指定搜索区域:
- 创建并设置所谓的锚点元素。任何已检测到的元素都可用作锚点元素,前提是你能在它们与希望程序检测的目标元素之间定义一定的关系。使用 Match 命令将这些元素与图像匹配,并确保它们被正确检测。
- 创建一个与要检测的图像对象相对应的元素,并在 What to search for 部分设置其属性。
- 在 Where to search 部分指定搜索区域。a. 在 Search on 下拉列表中,若需搜索整个文档,选择 Whole Document;若需将搜索范围限定为第一页或最后一页,选择 First Page 或 Last Page。以此方式指定搜索区域时,无需锚点元素。b. 如有需要,指定待检测元素与其他元素之间的关系,或直接在图像上绘制搜索区域。你可以相对于其他元素设定搜索区域的边界,从搜索区域中排除某些元素,或指定哪个元素或页边与待检测元素最近。
- 点击 Match,以确保该元素能在所有文档中被正确检测。
在大多数情况下,您会相对于用作锚点的其他搜索元素的位置来指定搜索区域。只有在元素已在图像上成功找到时,才能将其用作锚点,因此应先配置并匹配将作为锚点的元素。
单击 Draw on Image 按钮,在图像上绘制一个搜索区域。搜索区域应靠近锚点元素的区域或与之相交。在 Where to search 部分,针对您绘制的搜索区域将显示 Right of、Below、Left of 和 Above 属性,以及用于指定这些属性相对于搜索区域和锚点元素距离的坐标。这些属性与图像上的搜索区域保持同步。您可以随时通过在图像上编辑该区域,或在 Properties 窗格中更改关系属性来修改搜索区域。当您在 Properties 窗格中选择某个关系时,由该关系定义的半平面会在文档图像上高亮显示。
接下来,使用锚点元素工具栏调整锚点元素与搜索区域之间的关系,可通过单击元素的区域来打开该工具栏:
- 方向箭头工具用于启用或禁用相对于该元素在相应方向上的对象搜索关系。
- 删除关系工具会移除为所选元素设置的所有关系。
- 最近工具指定:在所有元素候选中,在其他条件相同的情况下,应选取距离所选元素最近的那个。在生成假设时,将选择最接近所选元素的对象。使用此工具后,Nearest to 属性会出现在 Properties 窗格中。该属性只能为一个锚点元素设置。
- 排除工具会将所选元素从搜索区域中排除。当搜索区域内的某个元素可能被误认为正在搜索的对象时使用该工具。例如,若您正在查找具有字符集的 Character String 元素,另一个具有相同或相似字符集的 Character String 元素可能会被误选。为防止这种情况,使用排除工具将第二个元素从搜索区域中排除。使用此工具时,Exclude 属性会出现在 Properties 窗格中。
完成搜索区域的设置后,再次单击 Draw on Image 按钮以退出“绘制搜索区域”模式。
这些关系与上文所述通过锚点元素工具栏配置的关系等效。您可以分别编辑每个关系。
开启“绘制搜索区域”模式后,所选关系定义的搜索区域与半平面将显示在文档图像上。搜索区域将与该关系的属性保持同步。
在搜索位置部分,单击添加并选择要配置的关系类型。在打开的对话框中,选择一个锚点元素。您可以选择位于当前元素之上的任何活动元素。
上述每种类型的关系都可以添加多个。
您可以通过更改右侧、下方、左侧和上方关系的偏移量来调整搜索区域。正偏移值表示边界将沿关系指定的方向移动;负偏移值表示边界将朝相反方向移动。例如,右侧关系的负偏移会将边界向左移动。
您还可以选择用于计算搜索区域的元素边界。默认情况下,边界的选择方式会使锚点元素不包含在搜索区域内(例如,高于上边界、低于下边界等)。您也可以从锚点元素的相对边界(例如,高于下边界、低于上边界等)或其中心来计算搜索区域。要调整此设置,请单击相应关系所显示的边界icon。
假设你需要在某些文档中查找位于一段预定义静态文本上方的特定字符序列,而在另一些文档中该序列与该静态文本处于同一水平。将 Above 值设置为 0 时,搜索区域不会包含与该静态文本处于同一水平的元素,这意味着在某些图像中你的元素将不在搜索区域内:
而将 Above 值设置为 -50,或单击边界 icon 并选择 Bottom Boundary of Region,则会同时包含与该静态文本同一水平的区域及其上方的区域,从而确保你的元素在所有图像中都位于搜索区域内:
在 Properties 窗格中设置此关系时,您可以选择搜索元素或页面边缘作为锚点。这是您可以为树中第一个元素设置的唯一关系。此类型的关系一次只能添加一个。无法为 Group 和 Repeating Group 元素添加此关系,但可以为组或可重复组的子元素添加。
当您为关系选择锚点元素时,您会发现可重复组元素及其子元素始终显示为灰色。不过,仍可将这些元素用作锚点元素。要使用可重复组元素设置关系,点击元素名称右侧的编辑下拉图标,并选择将作为锚点元素的实例。您可以指定最后找到的实例、所有已完成的实例,或具有特定编号的实例。
您可以在属性窗格中双击某个关系来更改其锚点元素。偏移量和边界设置将被保留。
可以通过锚点元素窗格,或在属性窗格中点击相应属性旁的删除按钮来删除现有关联关系。
要删除搜索区域,请在该搜索区域上单击“删除关系”图标。或者,在搜索范围属性中选择整个文档、第一页或最后一页。