跳转到主要内容搜索区域是图像上的一块区域,程序会在其中查找与特定元素对应的对象。它依据属性窗格中搜索位置部分指定的条件进行计算。
在半结构化文档中,一些对象在不同文档中的位置可能不同,因此程序并不总能通过绝对搜索区域找到它们。此时,可以将搜索区域相对于位置固定的元素,或相对于已找到的 field 来定义。也有无需预先定义搜索区域即可检测到元素的情况(例如,始终包含某个文档唯一词语的 Static Text 元素可以仅基于该词语被检测到),或者可以将搜索范围仅限制在文档的第一页或最后一页。
要为元素指定搜索区域:
-
创建并配置锚定元素。任何已被检测到的元素都可用作锚定元素,前提是您能够定义它们与程序需检测元素之间的关系。使用 Match 命令将这些元素与图像匹配,并确保它们被正确检测。
-
创建一个与要检测的图像对象对应的元素,并在 What to search for 部分设置其属性。
-
在 Where to search 部分指定搜索区域。
a. 在 Search on 下拉列表中,若需搜索整个文档,选择 Whole Document;若需将搜索限定为第一页或最后一页,选择 First Page 或 Last Page。以此方式指定搜索区域时,无需锚定元素。
b. 如有需要,指定待检测元素与其他元素之间的关系,或直接在图像上绘制搜索区域。您可以相对于其他元素来限定搜索区域边界,从搜索区域中排除特定元素,或指定与待检测元素最近的元素或页边。
-
单击 Match,确保在所有文档中都能正确检测到该元素。
在大多数情况下,您将相对于其他用作锚点的搜索元素的位置来指定搜索区域。只有当某个元素已在图像上成功找到时,才能将其用作锚点,因此应先设置并匹配将用作锚点的元素。
单击 Draw on Image 按钮,然后在图像上绘制搜索区域。搜索区域应靠近或与锚点元素的区域相交。在 Where to search 部分,您为刚绘制的搜索区域将看到 Right of、Below、Left of 和 Above 属性,以及用于指定这些属性相对于搜索区域与锚点元素之间距离的坐标。这些属性与图像上的搜索区域保持同步。您可以随时通过在图像上编辑该区域,或在 Properties 窗格中更改关系属性来修改搜索区域。当您在 Properties 窗格中选择某个关系时,文档图像上会高亮显示由该关系定义的半平面。
接下来,使用锚点元素工具栏为锚点元素与搜索区域调整关系。单击元素的区域即可打开该工具栏:
-
使用方向箭头工具可启用或禁用相对于该元素在相应方向上的对象搜索关系。
-
“删除关系”工具会移除为所选元素设置的所有关系。
-
“最近”工具指定:在所有元素假设中,若其他条件相同,则应选择距离所选元素最近的那个。在生成假设时,将选择最接近所选元素的对象。使用该工具时,Nearest to 属性会出现在 Properties 窗格中。该属性只能为一个锚点元素设置。
-
“排除”工具会将所选元素从搜索区域中排除。当搜索区域内的某个元素可能被误认为目标对象时使用。例如,如果您正在查找具有特定字符集的 Character String 元素,可能会错误选择另一具有相同或相似字符集的 Character String 元素。为防止这种情况,请使用“排除”工具将第二个元素从搜索区域中排除。使用该工具时,Exclude 属性会显示在 Properties 窗格中。
完成搜索区域设置后,单击 Draw on Image 按钮以退出绘制搜索区域模式。
这些关系与上文所述通过锚点元素工具栏配置的关系等效。您可以分别编辑每个关系。
开启“绘制搜索区域”模式后,所选关系定义的搜索区域与半平面将显示在文档图像上。搜索区域将与该关系的属性保持同步。
在搜索位置部分,单击添加并选择要配置的关系类型。在打开的对话框中,选择一个锚点元素。您可以选择位于当前元素之上的任何活动元素。
上述每种类型的关系都可以添加多个。
您可以通过更改右侧、下方、左侧和上方关系的偏移量来调整搜索区域。正偏移值表示边界将沿关系指定的方向移动;负偏移值表示边界将朝相反方向移动。例如,右侧关系的负偏移会将边界向左移动。
您还可以选择用于计算搜索区域的元素边界。默认情况下,边界的选择方式会使锚点元素不包含在搜索区域内(例如,高于上边界、低于下边界等)。您也可以从锚点元素的相对边界(例如,高于下边界、低于上边界等)或其中心来计算搜索区域。要调整此设置,请单击相应关系所显示的边界icon。
假设你需要查找一段特定的字符序列:在某些文档中,它位于预定义静态文本之上,而在另一些文档中与该静态文本处于同一水平。将 Above 值设为 0 时,搜索区域不会包含与该静态文本处于同一水平的元素,这意味着你的元素在某些图像上将不在搜索区域内:
而将 Above 值设为 -50,或单击边界 icon 并选择 Bottom Boundary of Region,则会同时包含与静态文本处于同一水平的区域以及其上方的区域,从而确保你的元素在所有图像上都位于搜索区域内:
在 Properties 窗格中设置此关系时,您可以选择搜索元素或页面边缘作为锚点。这是您可以为树中第一个元素设置的唯一关系。此类型的关系一次只能添加一个。无法为 Group 和 Repeating Group 元素添加此关系,但可以为组或可重复组的子元素添加。
当您为关系选择锚点元素时,您会发现可重复组元素及其子元素始终显示为灰色。不过,仍可将这些元素用作锚点元素。要使用可重复组元素设置关系,点击元素名称右侧的编辑下拉图标,并选择将作为锚点元素的实例。您可以指定最后找到的实例、所有已完成的实例,或具有特定编号的实例。
您可以在属性窗格中双击某个关系来更改其锚点元素。偏移量和边界设置将被保留。
可以通过锚点元素窗格,或在属性窗格中点击相应属性旁的删除按钮来删除现有关联关系。
要删除搜索区域,请在该搜索区域上单击“删除关系”图标。或者,在搜索范围属性中选择整个文档、第一页或最后一页。