跳转到主要内容
调试 Extraction Rules 活动包括以下步骤:
  1. 编译并运行该活动以进行匹配。
  2. 查看错误并优化规则,以提升对象提取效果。
重复以上步骤,直至对结果满意。

第 1 步:编译与匹配

当你退出活动编辑器或点击 MatchTest Activity 时,Extraction Rules 活动会自动编译。若出现任何编译错误,将无法执行匹配。任何存在编译错误的搜索元素都会标记为错误图标。将鼠标悬停在该图标上可查看错误的详细说明。编译错误可能发生在以下情况:
  • 元素依赖关系:元素按自上而下的顺序进行搜索。这意味着在某个元素的搜索条件中被引用的元素,必须在元素列表中位于该元素之前。例如,如果在元素 B 的搜索条件中引用了元素 A,则元素 A 必须位于元素列表中元素 B 之前。如果你禁用了元素 A,或将其移动到元素列表中元素 B 的下方,将会发生编译错误,并且元素 B 会标记为错误图标。
  • 正则表达式:如果 Value from Regular Expression 搜索元素中的正则表达式无效,该元素将报错。
  • 词典:如果程序无法连接到 Value from Dictionary 搜索元素所使用的词典,该元素将报错。
  • 代码(参见 Code syntax for Extraction Rules activity for NLP
Matching 指根据搜索元素属性中指定的条件查找满足条件的对象。程序会按 Search Elements 列表逐一向下尝试定位由这些元素描述的所有对象。 仅对处于活动状态的元素和字段执行匹配。为在调试时缩短匹配时间,你可以临时禁用不影响当前调试元素结果的元素。要更改元素状态,请使用其快捷菜单。你也可以选择多个元素,一次点击即可更改它们的状态。 Extraction Rules 活动的编译与匹配状态会显示在通知日志中(可通过点击右上角的铃铛图标按钮查看)。你可以点击相应通知中的链接跳转到匹配结果。

步骤 2:审查与纠正错误

如果未找到搜索元素,请检查是否选择了正确的元素类型,并考虑细化条件以提高搜索的可靠性。例如,可以添加辅助搜索元素来帮助定位该元素。 纠正错误后,请再次执行匹配活动,确保在存在问题的页上能够找到所有对象,并且这些更正不会影响其他页上对象的匹配。