跳转到主要内容调试 Extraction Rules 活动包括以下步骤:
- 编译并运行匹配该活动。
- 查看错误并优化规则,以提升对象提取效果。
重复上述步骤,直至您对结果满意。
当你退出活动编辑器或单击 Match 或 Test Activity 时,系统会自动编译 Extraction Rules 活动。若出现任何编译错误,将无法继续进行匹配。存在编译错误的搜索元素会被标记为错误图标。将鼠标悬停在该图标上即可查看错误的详细说明。以下情况可能会产生编译错误:
-
元素依赖关系:元素按自上而下进行搜索。这意味着,若某元素在另一元素的搜索条件中被使用,则它必须在元素列表中位于该元素之前。例如,如果在元素 B 的搜索条件中引用了元素 A,则元素 A 必须位于元素 B 之前。若你禁用了元素 A,或将其在列表中移动到元素 B 之后,将产生编译错误,元素 B 会被标记为错误图标。
-
正则表达式:如果 Value from Regular Expression 搜索元素中的正则表达式无效,该元素将报错。
-
字典:如果程序无法连接到 Value from Dictionary 搜索元素所使用的字典,该元素将报错。
-
代码(参见 Code syntax for Extraction Rules activity for NLP)
“匹配”指根据搜索元素属性中指定的条件查找符合要求的对象。程序将按 Search Elements 列表自上而下,逐一尝试定位各元素所描述的对象。
仅对处于活动状态的元素和 field 执行匹配。为缩短调试时的匹配时间,你可以暂时禁用不影响当前调试目标结果的元素。要更改元素状态,请使用其快捷菜单。你也可以选择多个元素,一次性更改其状态。
Extraction Rules 活动的编译与匹配状态会显示在通知日志中(可通过单击右上角的铃铛图标打开)。你可以点击相应通知中的链接跳转到匹配结果。
如果未找到搜索元素,请检查是否选择了正确的元素类型,并考虑细化条件以提高搜索的可靠性。例如,可以添加辅助搜索元素来帮助定位该元素。
纠正错误后,请再次执行匹配活动,确保在存在问题的页上能够找到所有对象,并且这些更正不会影响其他页上对象的匹配。