Saltar al contenido principal
Configure el comportamiento de detección de elementos marcándolos como obligatorios, opcionales o prohibidos para controlar la continuación de la búsqueda cuando los objetos estén ausentes o se detecten de forma incorrecta. Los documentos semiestructurados se diferencian de los documentos estructurados en que su conjunto de campos varía de una imagen a otra. Al crear un elemento, tenga en cuenta que el objeto correspondiente puede no aparecer en algunas imágenes, lo que imposibilita detectarlo en ellas. Las imágenes también pueden escanearse de forma incorrecta (p. ej., algunas áreas pueden salir demasiado oscuras o demasiado claras), lo que provoca pérdida de datos. En ese caso, el objeto correspondiente tampoco se detectará. El Extraction Rules Activity Editor permite que el programa siga buscando otros elementos si falta un elemento específico en una imagen. Para continuar la búsqueda en imágenes que no contienen un objeto concreto, dicho objeto debe establecerse como opcional.

Elementos obligatorios

Los objetos de imagen descritos mediante elementos obligatorios deben estar siempre presentes en una imagen y deben detectarse al verificar una actividad de Extraction Rules. No obstante, si no se detecta ese objeto, se interrumpe la concordancia.

Elementos opcionales

Los objetos de imagen descritos mediante elementos opcionales pueden estar ausentes en una imagen o puede que no se detecten. Sin embargo, a diferencia de los elementos obligatorios, esto no hace que se interrumpa la correspondencia, y los objetos de imagen descritos por otros elementos seguirán detectándose. De forma predeterminada, todos los elementos simples son opcionales, lo que significa que no es necesario que estén presentes en las imágenes. A diferencia de los elementos simples, todos los elementos compuestos se establecen como obligatorios de forma predeterminada.

Elementos prohibidos

A veces, la presencia de un elemento específico implica que una cadena de hipótesis es incorrecta. A estos elementos se les llama elementos prohibidos. Detectar este tipo de elemento detiene la generación del árbol de hipótesis en el que se detectó. Estos elementos pueden usarse para evitar que una actividad de Extraction Rules incorrecta se asocie a un documento.

Configuración del tipo de elemento

Para cambiar si un elemento es obligatorio, opcional o prohibido, utiliza la propiedad Element is en el panel Properties.