Actividad de Deep Learning para documentos semiestructurados

La actividad de Deep Learning para documentos semiestructurados está diseñada para crear skills cognitivas con calidad de producción para extraer campos de documentos semiestructurados mediante redes neuronales.

Esta actividad no puede extraer estructuras complejas (por ejemplo, tablas anidadas, que son estructuras repetitivas dentro de otras tablas) ni campos de tipos distintos de Text. Para extraer estas estructuras, use la actividad Extraction Rules.

Casos de uso

Agregue esta actividad a su flujo de procesamiento de documentos cuando:

Su skill se usará para procesar múltiples variantes de un determinado tipo de documento.
Tiene previsto procesar variantes de documentos para las que su skill todavía no se ha entrenado. Por ejemplo, puede tener un Skill de documento con una actividad Fast Learning que se ha entrenado para extraer campos de contratos de préstamo (con diferentes estructuras de campos) procedentes de varios bancos. Si decide usar este skill existente para procesar contratos de préstamo de un banco nuevo que el skill aún no conoce, la calidad de la extracción puede no ser la adecuada. Para mejorarla, puede usar una actividad de Deep Learning en lugar de una actividad Fast Learning.

Cómo funciona

Deep Learning combina redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN) y tokens de procesamiento del lenguaje natural (NLP). Gracias a esta combinación, Deep Learning comprende patrones de imagen, la estructura de los documentos, el contenido de los campos y las etiquetas circundantes. Requiere una gran cantidad de documentos para entrenarse, pero generaliza a nuevos diseños de documentos que aún no ha visto, lo que proporciona un verdadero enfoque de extracción sin plantillas, la única forma de tratar documentos para los que no se dispone de un conjunto exhaustivo de diseños en la etapa de entrenamiento.

Requisitos de entrenamiento

Para obtener los mejores resultados, es fundamental etiquetar correctamente tantos documentos como sea posible. La cantidad de documentos de muestra utilizados para el entrenamiento influye significativamente en la calidad de la extracción de campos. La cantidad recomendada de documentos de muestra es la siguiente:

Para documentos de alta variabilidad: se requieren al menos 200-300 documentos de muestra (2-3 documentos de muestra por variante).
Para documentos de baja variabilidad: se requieren como mínimo 10 documentos de muestra (2-3 documentos de muestra por variante).

El requisito mínimo es 10, pero se recomienda contar con más de 500 documentos etiquetados, asegurándose de que el conjunto de entrenamiento contenga cantidades aproximadamente iguales de todas las variantes de documentos que pretende procesar (idealmente, al menos algunas muestras de cada variante). No es necesario proporcionar todas las variantes posibles, pero la tecnología necesita ver suficientes documentos variados para identificar patrones y generalizar a variantes que aún no ha encontrado. Por ejemplo, en el caso de las facturas, se espera que la tecnología generalice bien a nuevos proveedores cuando el conjunto de entrenamiento incluye entre 500 y 1.000 proveedores distintos, con dos o tres documentos de muestra de cada uno en el conjunto de entrenamiento. Aunque Deep Learning tiende a generalizar, es conveniente incluir en el conjunto de entrenamiento las variantes más habituales del documento, por ejemplo, las de los proveedores que emiten la mayor cantidad de facturas.

Características del entrenamiento

A diferencia de la actividad Fast Learning, que se entrena con una cantidad menor de documentos y está pensada para conjuntos de documentos más simples, el entrenamiento de la actividad de Deep Learning lleva mucho más tiempo. El entrenamiento de la red neuronal es un proceso iterativo. Cada iteración se denomina época. Al comienzo de una época, el conjunto de documentos se divide en un subconjunto de entrenamiento y un subconjunto de validación. Durante una época, todos los documentos del subconjunto de entrenamiento se procesan mediante un algoritmo de entrenamiento. Luego, se evalúa el rendimiento de la red neuronal con el subconjunto de validación y se actualizan las métricas de cada campo y del conjunto completo de documentos. Para obtener más información, consulte Configuración de una actividad de Deep Learning.

​Casos de uso

​Cómo funciona

​Requisitos de entrenamiento

​Características del entrenamiento

Casos de uso

Cómo funciona

Requisitos de entrenamiento

Características del entrenamiento