要查找的文本
- 默认选择 手动输入,它允许您在下方的框中输入搜索文本。您可以直接键入搜索文本,或通过单击识别出的单词,或框选包含要查找文本的区域,从文档图像中粘贴文本。您可以指定多个单行或多行的文本变体。语法说明见下文。
- 来自用户字典 允许您使用一个 TXT 文件作为搜索文本变体的来源。您需要在 字典 下拉列表中选择所需的 TXT 文件。
其他属性
- 允许多行 启用/禁用对跨多行书写文本的检测。
- 允许错误数 指定与要查找文本不匹配的字符所占的最大百分比或字符数量。
- 搜索词的一部分 启用/禁用对包含所搜索单词的其他单词的检测。例如,如果在 要查找的文本 框中指定了“contract”,且文档中包含单词“contracts”,启用此选项将会检测到“contracts”中的“contract”。否则,仅在“contract”作为独立单词出现时才会被检测到。
高级属性
- 考虑空格 允许在搜索字符串中保留空格。如果未选中此选项,搜索字符串中的空格将被删除。忽略空格可以加快搜索速度。但是,如果您要搜索的短语可能被拆分成多行,或者短语中的某些单词可能缺失,则需要启用 考虑空格 选项,并在输入搜索短语时保留空格。
- 允许缺失单词 允许短语中缺少单词,并允许为缺失单词设置惩罚系数。惩罚系数是一个从 0 到 1 的数字。假设结果的质量将按短语中缺失单词的数量多次乘以该数字。如果短语中的某些单词可能缺失,请将此参数设置为 1(将假设质量乘以 1 不会降低其质量)。
- 最大空格长度 允许指定在检测到的对象内部空格的最大长度。
- 区分大小写 启用区分大小写搜索,使程序能够区分小写和大写字母。
- 文本方向 允许指定要查找的文本方向。默认情况下,该活动只查找水平排列的文本,并且不会对旋转文本提出假设。如果您需要查找以特定方式旋转的文本,并忽略以其他任何方向书写的文本,则应仅选择 顺时针 或 逆时针 选项。若要在不考虑文本方向的情况下查找文本,则应启用所有可用选项。
查找文本变体
单行变体
注意: 从文档图像中粘贴文本时,每个变体会自动放置在新的一行上。
多行变体
{ } 括起来。例如,如果同一类型的文档可以具有不同的标题,如 “Contract”、“Rental Agreement” 或 “Agreement”,并且标题 “Rental Agreement” 可能被拆分成两行,请在 Text to find 框中指定以下变体:
{Contract} {Rental Agreement} {Agreement}
你也可以绘制一个包含多行文本的区域。在这种情况下,系统会提示你启用 Allow multiple lines 选项。启用此选项后,Advanced Designer 会自动提示你在每个变体两侧添加花括号。花括号不会被视为搜索文本的一部分。Advanced Designer 还会为你从图像中粘贴的任何文本添加花括号。如果之后你选择关闭此选项,Advanced Designer 会提示你删除这些花括号。
由单词组合的短语变体
在此示例中,程序将查找以下短语:rental agreement、rental contract、lease agreement、lease contract、client statement 和 partner statement。请注意,每个短语变体都应放在花括号中,且所有打开的花括号都必须有对应的闭合花括号。{RENTAL|LEASE AGREEMENT|CONTRACT}{CLIENT|PARTNER STATEMENT}
