Actividad de Deep Learning para NLP

La actividad de Deep Learning para NLP está diseñada para entrenar la skill para que extraiga campos de documentos no estructurados mediante tecnología de procesamiento del lenguaje natural (NLP). La actividad de Deep Learning solo se puede configurar para un campo extraído previamente por otra actividad. Por ejemplo, puede extraer un párrafo de texto con una actividad de Segmentation y luego configurar una actividad de Deep Learning para extraer campos de ese párrafo.

Esta actividad solo admite campos de tipo Text.

Requisitos de entrenamiento

Como las actividades de Deep Learning se entrenan mediante el etiquetado de referencia, es importante que la ubicación de los campos se especifique correctamente en todas las imágenes de los documentos. Cuanto mayor sea el número de documentos etiquetados en el conjunto de entrenamiento, mayor será la calidad de la extracción de campos. El número recomendado de documentos de ejemplo es el siguiente:

Para documentos con alta variabilidad, se requieren al menos 150 documentos de ejemplo (2-3 documentos de ejemplo por variante).
Para documentos con baja variabilidad, se puede empezar el entrenamiento con 1 documento de ejemplo, pero se requieren al menos 2-3 documentos de ejemplo por variante.

Use conjuntos de documentos independientes

Puede usar un conjunto de documentos independiente para entrenar su actividad de Deep Learning. Para ello, seleccione la actividad de Deep Learning en la lista desplegable situada junto al nombre de la skill. Luego, en la lista desplegable a la izquierda del botón Cargar, seleccione el conjunto de documentos necesario o haga clic en Crear conjunto… para crear uno nuevo. Puede cargar, eliminar y rotar documentos en esta pestaña, tal como se describe en la sección documents.

Idiomas compatibles

Idiomas compatibles: inglés, francés, alemán, japonés, ruso, español, italiano, portugués (estándar) y neerlandés.

Configurar una actividad de Deep Learning

Agregar la actividad

En la pestaña Activities, agregue una actividad de Deep Learning al flujo de procesamiento de documentos. Tenga en cuenta que la actividad de Deep Learning debe colocarse después de la actividad que extraerá el campo que la actividad de Deep Learning utilizará como origen.

Seleccionar el campo de origen

En la lista desplegable Field del panel Propiedades de la actividad, seleccione el campo de origen correspondiente al fragmento de texto no estructurado del que se deben extraer los campos.

Seleccionar campos de salida

Seleccione los campos que se deben extraer del campo de origen. Puede seleccionar campos que estén en el mismo nivel de anidación que el campo de origen o un nivel por debajo.

Etiquetar documentos

Haga clic en Activity Editor y vaya a la pestaña Fields para etiquetar sus documentos especificando las regiones de los campos que se deben extraer del campo de origen. El proceso de etiquetado en Activity Editor es idéntico al proceso habitual de etiquetado de documentos, con una excepción: los campos que la actividad de Deep Learning debe extraer deben estar ubicados dentro de la región del campo de origen.Use las siguientes pautas para determinar el tamaño del conjunto de documentos:

La actividad de Deep Learning para NLP puede iniciarse con 1 documento de muestra, pero se requieren al menos 2-3 documentos de muestra por variante.
Si el conjunto de entrenamiento contiene entre 1 y 150 documentos, puede empezar a entrenar la actividad, pero Advanced Designer mostrará una advertencia que dice: “Recomendamos agregar al menos 150 documentos”.
Si el conjunto de entrenamiento contiene entre 150 y 10,000 documentos, puede empezar a entrenar la actividad de inmediato. Esta es la cantidad recomendada de documentos que debe tener el conjunto de entrenamiento.
Si el conjunto de entrenamiento contiene más de 10,000 documentos, Advanced Designer mostrará una advertencia indicando que la skill puede volverse inestable.

Entrenar la actividad

Haga clic en Train Activity para entrenar la actividad.

Revisar resultados

Una vez entrenada la actividad, la prueba se iniciará automáticamente. Cuando esta finalice, vaya a la pestaña Results y analice los resultados de extracción de campos de la actividad. Las estadísticas que se muestran en la pestaña Results son idénticas a las estadísticas generales de la skill que se muestran en la pestaña Results. Si es necesario, realice los cambios pertinentes en el etiquetado y vuelva a entrenar la actividad.

La actividad solo se puede entrenar y probar con documentos que tengan el etiquetado confirmado. Los documentos tienen etiquetado no confirmado si el etiquetado de referencia se generó automáticamente a partir del etiquetado predicho, a menos que copie el etiquetado predicho en la referencia mediante la opción correspondiente del menú contextual del documento. Puede comprobar el estado del etiquetado de cada documento en la pestaña documents. Para confirmar el etiquetado de un documento, debe revisarlo en la pestaña Fields.

​Requisitos de entrenamiento

​Use conjuntos de documentos independientes

​Idiomas compatibles

​Configurar una actividad de Deep Learning

Requisitos de entrenamiento

Use conjuntos de documentos independientes

Idiomas compatibles

Configurar una actividad de Deep Learning