跳转到主要内容
通过将元素配置为必需、可选或禁止,可以在对象缺失或检测不正确时控制是否继续进行匹配。 半结构化文档不同于结构化文档,其字段集合会因图像而变化。创建元素时需要注意,对应的对象可能不会出现在某些图像中,因此无法在这些图像上检测到它。图像在扫描时也可能出现问题(例如某些区域过暗或过亮),从而导致数据丢失。在这种情况下,相应的对象同样无法被检测到。Extraction Rules Activity Editor 允许在某个特定元素在图像上缺失时,程序继续搜索其他元素。要在不包含某个特定对象的图像上继续进行匹配,需要将该对象设置为可选。

必需元素

使用 必需 元素描述的图像对象表示它们在图像中应始终存在,并且在匹配 Extraction Rules 活动时必须被检测到。然而,如果未检测到此类对象,匹配将被停止。

可选元素

使用可选元素描述的图像对象可能在图像中不存在,或者可能未被检测到。但与必需元素不同,这不会中断匹配,由其他元素描述的图像对象仍然可以被检测到。 默认情况下,所有简单元素都是可选的,这意味着它们不必出现在图像中。与简单元素不同,所有复合元素在默认情况下都被设置为必需。

禁止元素

有时,某个特定元素的出现应当表明某条假设链是不正确的。此类元素称为禁止元素。检测到这类元素时,将停止生成包含该元素的假设树。可以使用这些元素来防止错误的 Extraction Rules 活动与文档匹配。

配置元素类型

若要更改元素是必填项、可选项还是禁用状态,请在 Properties 窗格中使用 Element is 属性。