La actividad de Deep Learning para NLP está diseñada para entrenar la skill para que extraiga campos de documentos no estructurados mediante tecnología de procesamiento del lenguaje natural (NLP). La actividad de Deep Learning solo se puede configurar para un campo extraído previamente por otra actividad. Por ejemplo, puede extraer un párrafo de texto con una actividad de Segmentation y luego configurar una actividad de Deep Learning para extraer campos de ese párrafo.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Requisitos de entrenamiento
- Para documentos con alta variabilidad, se requieren al menos 150 documentos de ejemplo (2-3 documentos de ejemplo por variante).
- Para documentos con baja variabilidad, se puede empezar el entrenamiento con 1 documento de ejemplo, pero se requieren al menos 2-3 documentos de ejemplo por variante.
Use conjuntos de documentos independientes
Idiomas compatibles
Configurar una actividad de Deep Learning
Agregar la actividad
En la pestaña Activities, agregue una actividad de Deep Learning al flujo de procesamiento de documentos. Tenga en cuenta que la actividad de Deep Learning debe colocarse después de la actividad que extraerá el campo que la actividad de Deep Learning utilizará como origen.
Seleccionar el campo de origen
En la lista desplegable Field del panel Activity Properties, seleccione el campo de origen correspondiente al fragmento de texto no estructurado del que se deben extraer los campos.
Seleccionar campos de salida
Seleccione los campos que se deben extraer del campo de origen. Puede seleccionar campos que estén en el mismo nivel de anidación que el campo de origen o un nivel por debajo.
Etiquetar documentos
Haga clic en Activity Editor y vaya a la pestaña Fields para etiquetar sus documentos especificando las regiones de los campos que se deben extraer del campo de origen. El proceso de etiquetado en Activity Editor es idéntico al proceso habitual de etiquetado de documentos, con una excepción: los campos que la actividad de Deep Learning debe extraer deben estar ubicados dentro de la región del campo de origen.Use las siguientes pautas para determinar el tamaño del conjunto de documentos:
- La actividad de Deep Learning para NLP puede iniciarse con 1 documento de muestra, pero se requieren al menos 2-3 documentos de muestra por variante.
- Si el conjunto de entrenamiento contiene entre 1 y 150 documentos, puede empezar a entrenar la actividad, pero Advanced Designer mostrará una advertencia que dice: “Recomendamos agregar al menos 150 documentos”.
- Si el conjunto de entrenamiento contiene entre 150 y 10,000 documentos, puede empezar a entrenar la actividad de inmediato. Esta es la cantidad recomendada de documentos que debe tener el conjunto de entrenamiento.
- Si el conjunto de entrenamiento contiene más de 10,000 documentos, Advanced Designer mostrará una advertencia indicando que la skill puede volverse inestable.
Revisar resultados
Una vez entrenada la actividad, la prueba se iniciará automáticamente. Cuando esta finalice, vaya a la pestaña Results y analice los resultados de extracción de campos de la actividad. Las estadísticas que se muestran en la pestaña Results son idénticas a las estadísticas generales de la skill que se muestran en la pestaña Results. Si es necesario, realice los cambios pertinentes en el etiquetado y vuelva a entrenar la actividad.
