Saltar al contenido principal
La actividad Reglas de Extracción funciona con el texto reconocido de documentos no estructurados. Las reglas utilizan entidades con nombre, palabras clave y expresiones regulares para definir las condiciones de los campos que necesitas extraer.

Casos de uso

Agregue esta actividad a su flujo de procesamiento de documentos en los siguientes casos:
  • Si ha extraído varios objetos del mismo tipo mediante una actividad de Entidades con nombre (NER) y ahora necesita encontrar una instancia concreta. Por ejemplo, se pueden extraer varias entidades de Organization de un contrato de arrendamiento. Puede usar una actividad de Reglas de extracción para determinar al arrendador y al arrendatario.
  • Si no tiene suficientes documentos para usar una actividad de Deep Learning. En este caso, puede crear una actividad de Reglas de extracción y extraer los objetos necesarios usando palabras clave, expresiones regulares u otra lógica empresarial.
  • Si necesita extraer un objeto de un tipo no estándar. Por ejemplo, puede querer extraer una combinación de fecha y hora en lugar de solo la fecha.
  • Si necesita agrupar varios campos relacionados con el mismo objeto. Por ejemplo, puede usar una actividad de Reglas de extracción para agrupar el nombre, la fecha de nacimiento y la dirección de cada persona. Una actividad de Entidades con nombre (NER) también puede extraer los nombres y las direcciones, pero no le permitirá asociar las direcciones con sus respectivos nombres.

Cómo funciona

Esta actividad utiliza procesamiento de lenguaje natural (NLP) para encontrar elementos de búsqueda en el texto. Los elementos de búsqueda incluyen entidades con nombre y palabras o frases que coinciden con palabras clave o expresiones regulares. Junto con los campos extraídos por otras actividades, los elementos de búsqueda pueden utilizarse como componentes para crear reglas de extracción, que especifican la posición de los campos en relación con otro texto. Las reglas de extracción se pueden crear fácilmente desde la interfaz de usuario y personalizar posteriormente mediante un lenguaje específico. Los elementos de búsqueda se pueden asignar a campos, de modo que el texto reconocido en la región de un elemento de búsqueda se use para completar su campo asignado. Para obtener más información, consulte Configurar una actividad de Reglas de extracción.