Saltar al contenido principal
Los documentos semiestructurados se diferencian de los documentos estructurados en que su conjunto de campos varía de una imagen a otra. Al crear un elemento, debe tener en cuenta que el objeto correspondiente puede no aparecer en algunas imágenes, lo que imposibilita su detección. Las imágenes también pueden escanearse incorrectamente (p. ej., algunas áreas pueden quedar demasiado oscuras o demasiado claras), lo que provoca pérdida de datos. En ese caso, el objeto correspondiente tampoco se detectará. Extraction Rules Activity Editor permite que el programa continúe buscando otros elementos si falta un elemento específico en una imagen. Para seguir realizando la correspondencia en imágenes que no contienen un objeto específico, ese objeto debe definirse como opcional.

Elementos obligatorios

Los objetos de imagen descritos mediante elementos obligatorios deben estar siempre presentes en una imagen y deben detectarse al verificar una actividad de Extraction Rules. No obstante, si no se detecta ese objeto, se interrumpe la concordancia.

Elementos opcionales

Los objetos de imagen descritos mediante elementos opcionales pueden estar ausentes en una imagen o puede que no se detecten. Sin embargo, a diferencia de los elementos obligatorios, esto no hace que se interrumpa la correspondencia, y los objetos de imagen descritos por otros elementos seguirán detectándose. De forma predeterminada, todos los elementos simples son opcionales, lo que significa que no es necesario que estén presentes en las imágenes. A diferencia de los elementos simples, todos los elementos compuestos se establecen como obligatorios de forma predeterminada.

Elementos prohibidos

A veces, la presencia de un elemento específico implica que una cadena de hipótesis es incorrecta. A estos elementos se les llama elementos prohibidos. Detectar este tipo de elemento detiene la generación del árbol de hipótesis en el que se detectó. Estos elementos pueden usarse para evitar que una actividad de Extraction Rules incorrecta se asocie a un documento.

Configuración del tipo de elemento

Para cambiar si un elemento es obligatorio, opcional o prohibido, utiliza la propiedad Element is en el panel Properties.