跳转到主要内容配置 Static Text 元素的属性,可通过手动输入或用户词典搜索预定义文本,并支持多个变体和多行文本。
在搜索内容部分,Static Text 元素具有以下属性:
要查找的文本 用于确定指定搜索文本的方法。
- 默认选择 手动输入,你可以在下方的框中输入搜索文本。你可以直接键入,或通过单击识别出的词,或框选包含目标文本的区域,从文档图像中粘贴文本。你可以指定多个单行或多行文本变体。语法见下文。
- 来自用户词典 允许你使用 TXT 文件作为搜索文本变体的来源。你需要在 Dictionary 下拉列表中选择所需的 TXT 文件。
- 允许多行 允许/禁止检测跨多行书写的文本。
- 允许错误 指定与待查文本不匹配的最大百分比或字符数。
- 搜索词的一部分 允许/禁止检测包含所搜索词的其他词语。例如,如果在 待查文本 框中指定了“contract”,且文档包含单词“contracts”,启用此选项将会在“contracts”中检测到“contract”。否则,只有当“contract”作为独立单词出现时才会被检测到。
- 考虑空格 允许搜索字符串中包含空格。未选中该选项时,搜索字符串中的空格将被移除。忽略空格可提升搜索速度。但如果待查找的短语可能被分成多行,或其中部分词语可能缺失,则需要启用“考虑空格”,并在输入搜索短语时保留空格。
- 允许缺失词 允许短语中出现缺失词,并可为缺失词设置惩罚值。惩罚值为 0 到 1 之间的数字。假设的质量会按短语中缺失词的数量,多次乘以该数值。如果短语中的某些词可能缺失,请将此参数设为 1(将假设质量乘以 1 不会降低其质量)。
- 最大空白长度 用于指定在检测到的对象内部空白的最大长度。
- 区分大小写 启用区分大小写的搜索,使程序能够区分小写和大写字母。
- 文本方向 用于指定要查找的文本方向。默认情况下,该活动仅查找水平排列的文本,不会针对旋转文本生成假设。如果需要查找以特定方式旋转的文本并忽略其他方向的文本,应仅选择 顺时针 或 逆时针。若要不受方向影响地查找文本,应启用所有可用选项。
要显示高级属性,请在 Properties 窗格中单击高级模式图标。
如果在不同文档中要搜索的文本不尽相同,请在 Text to find 中添加多个可能的文本变体,并将每个变体单独置于新的一行。例如,如果同类型的表单可能包含不同的标题,如“Contract”“Rental Agreement”或“Agreement”,则应在 Text to find 中指定如下内容:
Contract
Rental Agreement
Agreement
注意: 从文档图像粘贴文本时,每个变体会自动换行到新的一行。
如果搜索文本可能跨多行,请启用允许多行选项。请务必将每个变体用花括号 { } 括起来。例如,如果同一类型的文档可能有不同的标题,如“Contract”、“Rental Agreement”或“Agreement”,且“Rental Agreement”这一标题可能被分成两行,请在要查找的文本框中指定以下变体:
{Contract} {Rental Agreement} {Agreement}
您也可以圈选包含多行文本的区域。在这种情况下,系统会提示您启用允许多行选项。启用该选项后,Advanced Designer 会自动提示您为每个变体添加花括号。花括号不会被视为搜索文本的一部分。Advanced Designer 还会为您从图像中粘贴的任何文本自动添加花括号。如果您随后清除此选项,Advanced Designer 会提示您删除花括号。
您也可以在 Text to find 框中使用“|”(OR 运算符)来指定短语变体。例如:
{RENTAL|LEASE AGREEMENT|CONTRACT} {CLIENT|PARTNER STATEMENT}
在此示例中,程序将查找以下短语:rental agreement、rental contract、lease agreement、lease contract、client statement、partner statement。请注意,每个短语变体都应置于花括号中,且所有左括号都必须有对应的右括号。
与其在 Text to find 框中添加搜索文本变体,不如将它们列在一个 TXT 文件中。每个搜索文本变体应单独占一行。您可以按上文所述使用 OR 运算符。如果词典中位于同一行的文本在文档中可能被拆分为多行,请启用 Allow multiple lines 选项。不要用花括号括起变体,否则它们会被视为搜索文本的一部分。
要上传已准备好的文件,点击工具栏上的更多图标并选择 User Dictionaries。在打开的对话框中,点击添加目录图标,将文件类型切换为 TXT,定位到要上传的文件,然后点击 Open。要查看和编辑用户词典,选中它并点击编辑目录图标。
要将已上传的 TXT 文件作为文本变体的来源,选择 From User Dictionary 选项,然后在 Dictionary 下拉列表中选择已上传的文件。