- Group 和 Repeating Group(重复组) 元素,它们本身没有任何属性。
- 输入字段元素,这些元素来自 Extraction Rules 活动之前的其他活动,只提供 从中获取区域 选项,用于在不同输入字段之间切换。
搜索内容
人员、组织、地址、地点、日期、持续时间、金额
- Entities:实体类型。如果更改类型,搜索元素旁边的 icon 会自动更新。
- Instances:实例数量。可以提取找到的第一个实例或所有实例。
来自词典的值
- 文本来源:包含要查找的单词或短语列表的 TXT 文件,每行一个变体。
- 使用词形变化:启用此选项以查找该词的所有词形变化形式。
- 实例:实例数量。可以仅提取第一个实例,或提取所有检测到的实例。
正则表达式的值
- Regular expression:用于搜索的正则表达式。程序使用 PCRE2 正则表达式语法。
- Search for parts of words:启用此选项后,即使匹配内容未与其余文本以空格分隔,仍然可以找到匹配项。
- Instances:实例数量。可以提取第一个实例或提取所有检测到的实例。
文本
- Text source:要查找的单词或短语列表,每行一个变体。
- Use morphology:启用此选项以查找所有词形变化。
- Allowed errors:仍允许找到文本的字符差异百分比或数量。在存在识别错误时可能会有帮助。
Note: 如果启用 Use morphology 选项,则此选项不可用。
- Instances:实例数。可以提取第一个实例或所有检测到的实例。
搜索范围
- 搜索于:搜索元素位于整个文档中,或位于另一个搜索元素之内。
- 之后:搜索元素在识别文本中位于另一个搜索元素之后。
- 在同一句中搜索:启用此选项以在同一句中查找该元素。
- 之前:搜索元素在识别文本中位于另一个搜索元素之前。
- 在同一句中搜索:启用此选项以在同一句中查找该元素。
