Saltar al contenido principal
Para la mayoría de los elementos de búsqueda de la actividad Extraction Rules, el panel Properties tiene dos secciones: What to search for y Where to search. Las excepciones son:
  • Los elementos Group y Repeating Group, que no tienen propiedades propias.
  • Los elementos de campo de entrada, que se toman de otras actividades anteriores a la actividad Extraction Rules y solo ofrecen la opción Get region from para cambiar de un campo de entrada a otro.

Qué buscar

La sección Qué buscar contiene propiedades específicas de cada elemento.

Persona, Organización, Dirección, Ubicación, Fecha, Duración, Dinero

Para todos los elementos de búsqueda que buscan entidades con nombre, puede especificar las siguientes propiedades:
  • Entities: tipo de entidad. Si cambia el tipo, el icon junto al elemento de búsqueda se actualizará automáticamente.
  • Instances: número de instancias. Se puede extraer la primera o todas las instancias encontradas.

Valor del diccionario

Para una frase del diccionario, especifique:
  • Origen de Text: un archivo TXT con una lista de palabras o frases que buscar, una variante por línea.
  • Usar morfología: active esta opción para buscar todas las formas de la palabra.
  • Instancias: el número de instancias. Se puede extraer la primera o todas las instancias detectadas.

Valor a partir de una expresión regular

Para una expresión regular, especifique:
  • Expresión regular: una expresión regular que define la búsqueda. El programa utiliza la sintaxis de expresiones regulares PCRE2.
  • Buscar partes de palabras: active esta opción para encontrar coincidencias incluso si no están separadas por espacios del resto del texto.
  • Instancias: número de instancias. Puede extraerse solo la primera o todas las instancias detectadas.

Objeto

Para un elemento de búsqueda de texto, haz clic en el icono de edición e introduce una lista de palabras o frases que deseas buscar, o haz clic en la imagen del documento para agregar palabras reconocidas del documento. A diferencia del elemento de búsqueda Value from Dictionary, las palabras clave se especifican directamente en lugar de en un archivo TXT, y también tienes la opción de permitir algunos errores de reconocimiento.
  • Fuente de texto: lista de palabras o frases a buscar, una variante por línea.
  • Usar morfología: activa esta opción para buscar todas las formas de la palabra.
  • Errores permitidos: porcentaje o número de caracteres distintos que aún permite encontrar el texto. Puede ser útil en casos de errores de reconocimiento.
Nota: Esta opción no estará disponible si activas la opción Usar morfología.
  • Instancias: número de apariciones. Se puede extraer solo la primera o todas las detectadas.
La sección Dónde buscar es idéntica para todos los elementos. En esta sección, puede acotar el área en la que el programa buscará el elemento. En las siguientes configuraciones, puede usar los elementos de búsqueda ubicados por encima del elemento actual en la lista:
  • Buscar en: el elemento de búsqueda se encuentra dentro del Documento completo o dentro de otro elemento de búsqueda.
Ejemplo: Busque el nombre de la organización en el preámbulo del documento.
  • Después: el elemento de búsqueda se ubica después de otro elemento de búsqueda en el texto reconocido.
    • Buscar en la misma oración: active esta opción para encontrar el elemento dentro de la misma oración.
Ejemplo: Busque el rol de la organización después de su nombre dentro de la misma oración.
  • Antes: el elemento de búsqueda se ubica antes de otro elemento de búsqueda en el texto reconocido.
    • Buscar en la misma oración: active esta opción para encontrar el elemento dentro de la misma oración.
Por ejemplo, si busca la fecha de nacimiento de alguien, primero puede crear un elemento de búsqueda auxiliar con la palabra clave «born», y luego especificar que la entidad Date se encuentra en algún lugar después de esta palabra clave dentro de la misma oración. Puede agregar varios elementos Después y Antes, afinando aún más su búsqueda.