跳转到主要内容
调试 Extraction Rules 活动包括以下步骤:
  1. 编译并运行匹配该活动。
  2. 查看错误并优化规则,以提升对象提取效果。
重复上述步骤,直至您对结果满意。

编译与匹配

当你退出活动编辑器或单击 MatchTest Activity 时,系统会自动编译 Extraction Rules 活动。若出现任何编译错误,将无法继续进行匹配。存在编译错误的搜索元素会被标记为错误图标。将鼠标悬停在该图标上即可查看错误的详细说明。以下情况可能会产生编译错误:
  • 元素依赖关系:元素按自上而下进行搜索。这意味着,若某元素在另一元素的搜索条件中被使用,则它必须在元素列表中位于该元素之前。例如,如果在元素 B 的搜索条件中引用了元素 A,则元素 A 必须位于元素 B 之前。若你禁用了元素 A,或将其在列表中移动到元素 B 之后,将产生编译错误,元素 B 会被标记为错误图标。
  • 正则表达式:如果 Value from Regular Expression 搜索元素中的正则表达式无效,该元素将报错。
  • 字典:如果程序无法连接到 Value from Dictionary 搜索元素所使用的字典,该元素将报错。
  • 代码(参见 Code syntax for Extraction Rules activity for NLP
“匹配”指根据搜索元素属性中指定的条件查找符合要求的对象。程序将按 Search Elements 列表自上而下,逐一尝试定位各元素所描述的对象。 仅对处于活动状态的元素和 field 执行匹配。为缩短调试时的匹配时间,你可以暂时禁用不影响当前调试目标结果的元素。要更改元素状态,请使用其快捷菜单。你也可以选择多个元素,一次性更改其状态。 Extraction Rules 活动的编译与匹配状态会显示在通知日志中(可通过单击右上角的铃铛图标打开)。你可以点击相应通知中的链接跳转到匹配结果。

审查与纠正错误

如果未找到搜索元素,请检查是否选择了正确的元素类型,并考虑细化条件以提高搜索的可靠性。例如,可以添加辅助搜索元素来帮助定位该元素。 纠正错误后,请再次执行匹配活动,确保在存在问题的页上能够找到所有对象,并且这些更正不会影响其他页上对象的匹配。