跳转到主要内容
要搜索的内容部分,静态文本元素具有以下属性:

要查找的文本

要查找的文本 决定用于指定搜索文本的方法。
  • 默认选择 手动输入,您可以在下方的框中输入搜索文本。您可以直接键入搜索文本,或通过单击识别出的词,或框选包含所需文本的区域,从文档图像中粘贴文本。您可以指定多个单行或多行的文本变体。语法说明见下文。
  • 来自用户词典 允许您使用 TXT 文件作为搜索文本变体的来源。您需要在 Dictionary 下拉列表中选择所需的 TXT 文件。

其他属性

  • “允许多行”用于启用/禁用对跨多行书写文本的检测。
  • “允许错误”用于指定与要查找文本不匹配的字符的最大百分比或数量。
  • “搜索词的部分”用于启用/禁用对包含所搜索词的其他单词的检测。例如,如果在“要查找的文本”框中指定了“contract”,且文档包含单词“contracts”,启用此选项将会检测到“contracts”中的“contract”。否则,仅当“contract”作为独立单词出现时才会被检测到。

高级属性

  • 考虑空格 允许在搜索字符串中包含空格。未选中该选项时,搜索字符串中的空格将被移除。忽略空格可提升搜索速度。但如果要查找的短语可能被拆分为多行,或短语中的某些词可能缺失,则需要启用“考虑空格”,并在输入搜索短语时保留空格。
  • 允许缺失词 允许短语中缺少词语,并可为缺失词设置惩罚系数。惩罚系数为 0 到 1 之间的数值。假设的质量将按短语中缺失词的数量,多次乘以该系数。如果短语中可能缺少某些词,将此参数设置为 1(用 1 相乘不会降低假设质量)。
  • 最大空白长度 用于指定在检测到的对象内部空白的最大长度。
  • 区分大小写 启用区分大小写搜索,使程序可区分小写与大写字母。
  • 文本方向 用于指定要查找文本的方向。默认情况下,该活动仅查找水平文本,且不会对旋转文本提出假设。如果需要仅查找以特定方式旋转的文本并忽略其他方向的文本,应只选择 顺时针逆时针 选项。若需不受文本方向影响进行查找,请启用所有可用选项。
要显示高级属性,请单击 Properties 窗格上的高级模式图标。

搜索文本版本

单行变体

如果要搜索的文本在不同文档之间有所差异,请在 Text to find 中添加多个可能的文本变体,并将每个变体单独放在一行。例如,如果同类型的表单可能包含不同的标题,如“Contract”“Rental Agreement”或“Agreement”,应在 Text to find 中指定如下内容: Contract Rental Agreement Agreement 注意: 从文档图像中粘贴文本时,每个变体会自动换行。

多行变体

如果搜索文本可能被拆分到多行,请启用允许多行选项。务必将每个变体用花括号 { } 括起来。例如,如果同一类型的文档可能有不同的标题,如 “Contract”、“Rental Agreement” 或 “Agreement”,且 “Rental Agreement” 这个标题可能会被分成两行,请在要查找的文本框中指定以下变体: {Contract} {Rental Agreement} {Agreement} 您也可以框选一个包含多行文本的区域。在这种情况下,系统会提示您启用允许多行选项。启用后,Advanced Designer 会自动提示您为每个变体添加花括号。花括号不会被视为搜索文本的一部分。Advanced Designer 还会为您从图像中粘贴的任何文本添加花括号。如果随后取消选中该选项,Advanced Designer 将提示您删除花括号。

由词组合的短语变体

你也可以在 Text to find 框中使用“|”(OR 运算符)来指定短语变体。例如:
{RENTAL|LEASE AGREEMENT|CONTRACT} {CLIENT|PARTNER STATEMENT}
在此示例中,程序将查找以下短语:rental agreement、rental contract、lease agreement、lease contract、client statement 和 partner statement。请注意,每个短语变体都应放在花括号中,且所有开启的括号都必须成对闭合。

使用文本文件

与其在 Text to find 框中添加搜索文本变体,不如将它们列在一个 TXT 文件中。每个搜索文本变体应单独占一行。您可以按上文所述使用 OR 运算符。如果词典中位于同一行的文本在文档中可能被拆分为多行,请启用 Allow multiple lines 选项。不要用花括号括起变体,否则它们会被视为搜索文本的一部分。 要上传已准备好的文件,点击工具栏上的更多图标并选择 User Dictionaries。在打开的对话框中,点击添加目录图标,将文件类型切换为 TXT,定位到要上传的文件,然后点击 Open。要查看和编辑用户词典,选中它并点击编辑目录图标。 要将已上传的 TXT 文件作为文本变体的来源,选择 From User Dictionary 选项,然后在 Dictionary 下拉列表中选择已上传的文件。