跳转到主要内容
调试 Extraction Rules 活动包括以下步骤:
  1. 编译并匹配该活动。
  2. 查看错误并优化规则,以改进对象提取。
重复执行这些步骤,直到对结果满意为止。

步骤 1. 编译和匹配

当退出 Extraction Rules 活动编辑器,或者单击 MatchTest Activity 时,Extraction Rules 活动会自动编译。如果出现任何编译错误,将无法继续进行匹配。所有存在编译错误的搜索元素都会以错误图标标记。将鼠标悬停在该图标上即可查看错误的详细说明。以下情况下可能会发生编译错误:
  • 元素依赖关系:元素按自上而下的顺序进行搜索。这意味着,在其他元素的搜索条件中被引用的元素,必须在元素列表中位于该元素之前。例如,如果在元素 B 的搜索条件中引用了元素 A,则元素 A 必须在元素列表中排在元素 B 前面。如果禁用了元素 A,或将其在元素列表中移动到元素 B 的下方,则会发生编译错误,并且元素 B 会以错误图标标记。
  • 正则表达式:如果 Value from Regular Expression 搜索元素中的正则表达式无效,将在此元素中发生错误。
  • 字典:如果程序无法连接到 Value from Dictionary 搜索元素所使用的字典,将在此元素中发生错误。
  • 代码(参见 Code syntax for Extraction Rules activity for NLP
Matching(匹配) 指的是查找符合搜索元素属性中指定条件的对象。程序会自上而下遍历 Search Elements 列表,尝试逐个定位由这些元素描述的所有对象。 匹配仅针对处于启用状态的元素和字段执行。为了在调试时缩短匹配时间,可以暂时禁用那些不会影响当前正在调试元素结果的元素。要更改元素的状态,请使用其快捷菜单。也可以选择多个元素,通过一次单击同时更改它们的状态。 Extraction Rules 活动的编译和匹配状态会显示在通知日志中(可通过单击右上角的铃铛图标按钮打开)。可以通过单击相应通知中的链接跳转到匹配结果。

步骤 2. 检查并更正错误

如果未找到搜索元素,请检查是否选择了正确的元素类型,并考虑调整搜索条件以获得更可靠的搜索结果。例如,可以添加辅助搜索元素来帮助定位该元素。 在更正错误后,请再次执行匹配活动,确保在存在问题的页面上可以找到所有对象,并且这些更正不会影响其他页面上对象的匹配。