Saltar al contenido principal
Un elemento de búsqueda le permite establecer condiciones para el tipo y las propiedades de un objeto que desea extraer. Dado que las actividades de PLN trabajan con texto no estructurado, las condiciones de búsqueda especifican la posición de los objetos en relación con otro texto, en lugar de su relación geométrica. También puede usar elementos de búsqueda auxiliares para acotar la búsqueda, indicando que el objeto deseado puede encontrarse dentro, antes o después de dichos elementos auxiliares.

Creación de un elemento de búsqueda

  • Puede crear rápidamente un elemento de búsqueda haciendo clic en uno de los objetos resaltados en la imagen. El nuevo elemento de búsqueda será del mismo tipo que el objeto en el que haga clic. Use el botón Show Image Objects de la barra de herramientas para seleccionar los objetos que se resaltarán.

Resaltado de objetos

Se pueden resaltar los siguientes tipos de objetos:
  • Persona
  • Organización
  • Dirección
  • Ubicación
  • Fecha
  • Duración
  • Dinero
  • Palabras reconocidas
Nota: Todos estos objetos se resaltarán de forma predeterminada, excepto las palabras reconocidas.
  • También puede crear un nuevo elemento de búsqueda desde el menú:
  1. Vaya a la pestaña Search Elements a la derecha de la ventana del documento.
  2. Haga clic en Create Element.
  3. Seleccione el tipo de elemento que desee en la lista que se abre.
Una vez creado el elemento, debe configurar sus propiedades en el panel Properties (consulte Element properties para obtener más información).
Nota: Las propiedades especificadas también se pueden ver y editar en formato de código (consulte Code syntax for Extraction Rules activity for NLP para obtener más información).

Tipos de elementos de búsqueda

Al crear un elemento de búsqueda, debe especificar su tipo, que dependerá del objeto que desea encontrar. A continuación se describen brevemente los tipos de elementos de búsqueda disponibles.

Persona

Nombres de personas, por ejemplo, John Doe, Jane Smith.

Organización

Nombres de organizaciones, por ejemplo, ABBYY, Acme Corp.

Dirección

Direcciones, por ejemplo: 123 Main St., Anytown AB 45678.

Ubicación

Nombres de ubicaciones, por ejemplo: Anytown, Corporate Place.

Fecha

Fechas en distintos formatos, por ejemplo: 14 de noviembre de 2009, 11/14/2009.

Duración

Periodos de tiempo, por ejemplo: doce (12) meses, 4 días.

Dinero

Montos de dinero; por ejemplo: $2670.00, 199 dólares con 99 centavos. Nota: Los elementos Person, Organization, Address, Location, Date, Duration y Money corresponden a las entidades con nombre que puedes configurar en la actividad Named Entities (NER) y se extraen con la misma tecnología.

Valor de diccionario

Una palabra o frase de un diccionario. El diccionario debe ser un archivo TXT de texto plano con una lista de variantes de búsqueda, una por línea.

Valor de una expresión regular

Un valor que coincide con una expresión regular que has especificado.

Objeto

Una palabra clave o frase, con la opción de buscar todas las formas de las palabras o permitir ciertos errores de reconocimiento.

Grupo

Una colección de elementos de búsqueda anidados. Los elementos que componen un grupo pueden ser tanto elementos simples como elementos de grupo. Un elemento de grupo no tiene propiedades propias. Los datos se extraerán según la configuración de sus elementos de búsqueda anidados. Los elementos de grupo pueden utilizarse para imponer una jerarquía lógica de elementos, lo que facilita la depuración y la navegación. Por ejemplo, agrupar el nombre, la dirección y la fecha de nacimiento de una persona permitirá extraer los datos de cada persona de manera consistente.

Grupo repetido

Este elemento está diseñado para buscar grupos repetidos de elementos. Los grupos repetidos se utilizan en casos en los que una entidad puede tener varias instancias, cada una con sus propias propiedades, pero no se sabe cuántas habrá. Las propiedades de cada instancia se especifican en los elementos anidados del grupo repetido. Por ejemplo, si está procesando currículos, puede crear un grupo repetido “Education” con los siguientes elementos anidados: “School_name”, “Degree”, “Start_date” y “Graduation_date”. Por otro lado, si los datos que busca se refieren a entidades distintas con roles diferentes, un grupo repetido no será la opción adecuada. Por ejemplo, si solo hay dos partes en un contrato, como comprador y vendedor, cree un grupo “Party1_Buyer” y un grupo “Party2_Seller” en lugar de un único grupo repetido “Party”.

Campo de entrada

Este elemento permite usar un campo extraído por otra actividad como componente para las reglas. Por ejemplo, si una actividad de Extraction Rules está precedida por una actividad de Segmentation, quizá quieras usar algunos de los segmentos para acotar la búsqueda.

Cambiar el tipo, el nombre y la posición de un elemento en la lista

Para cambiar el tipo de un elemento:
  • Haga clic con el botón derecho en un elemento y seleccione Convertir elemento en en el menú contextual.
  • Seleccione un elemento en la lista y haga clic en un objeto resaltado en la imagen. Esto le permitirá convertir el elemento de búsqueda seleccionado al tipo del objeto resaltado. Si hace clic en una palabra reconocida resaltada, puede convertir el elemento de búsqueda a Text y, al mismo tiempo, añadir la palabra seleccionada a la lista de palabras clave de este elemento de búsqueda.
  • Para los elementos de búsqueda que correspondan a entidades con nombre, use la propiedad Entities para cambiar el tipo de la entidad con nombre.
Nota: Cambiar el tipo de un elemento no convertirá elementos no agrupados en elementos de grupo y viceversa.
Para cambiar el nombre de un elemento:
  • Haga clic con el botón derecho en un elemento, seleccione Cambiar nombre en el menú contextual e introduzca un nuevo nombre.
  • Seleccione un elemento, haga clic en su nombre (o presione F2) e introduzca un nuevo nombre.
El nombre de un elemento puede contener letras inglesas, números y guiones bajos. Sin embargo, el nombre de un elemento no puede comenzar con un número. No se permiten espacios, símbolos especiales (.,:- \ /) ni nombres reservados. Para mover elementos en la lista:
  • Arrastre los elementos hacia arriba o hacia abajo para cambiar su posición en la lista.
  • Arrastre elementos sobre un elemento de grupo para colocarlos dentro del grupo.
Nota: Los elementos se buscan de arriba hacia abajo. Esto significa que los elementos usados en las condiciones de búsqueda de otro elemento deben preceder a ese elemento en la lista de elementos.