跳转到主要内容为半结构化文档处理配置搜索元素和提取规则。
在 Activities 选项卡上,将 Extraction Rules 活动添加到文档处理流程中。
在 Activity Properties 窗格中,选择应由该活动提取的字段。
注意: 对于新的 Extraction Rules 活动,默认会选中所有字段。
单击 Activity Editor 以打开 Activity Editor。
配置该 activity:
-
在文档图像上启用预识别对象的显示。
如有需要,您还可以为该 activity 创建单独的文档集,和/或上传其他文档。
-
创建并配置搜索元素,以定位辅助对象和字段值。
-
调试 Extraction Rules activity,直到成功提取所有所需数据。
这包括编译并匹配该 activity、审查该 activity 生成的假设,以及调整搜索元素的属性。
注意: 您也可以以 JSON 文件的形式导入 Extraction Rules activity。
完成配置后,单击 Test Activity。
测试完成后,分析此活动的 field 提取结果。必要时,调整活动并再次测试。