Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Las skills para procesar documentos no estructurados solo pueden crearse en Advanced Designer; el Skill Designer en la nube no admite estos escenarios. Utilizan cuatro actividades principales de NLP para identificar entidades, segmentar texto y extraer campos de contenido libre, como contratos, cartas y correos electrónicos:
Cada una de estas actividades admite un conjunto limitado de idiomas. consulte la página de referencia de la actividad para ver la lista de idiomas.

Elige un escenario

EscenarioCuándo usarloActividades clave
Named Entities (NER) preentrenadas (documento completo)Las entidades pueden aparecer en cualquier parte; se requiere una configuración mínimaNER (+ Address Parsing)
Named Entities (NER) preentrenadas (párrafos específicos)La entidad siempre aparece en un párrafo conocidoSegmentation + NER (o Address Parsing)
Named Entities (NER) personalizadas (Deep Learning para NLP)Las preentrenadas no pueden desambiguar, o tu tipo de entidad no está contempladoSegmentation + Deep Learning para NLP
Todos los escenarios siguientes comparten un patrón común; solo cambian las actividades que agregas al flujo de procesamiento.

Flujo de trabajo habitual

1

Crear un Skill de documento

Abra Advanced Designer y haga clic en Create Document Skill en la página de inicio.
2

Cargar documentos

En la pestaña Documentos, cargue los documentos que usará para configurar el skill.
3

Definir campos y etiquetar

En la pestaña Campos, cree y configure los campos que el skill extraerá. Etiquete los documentos en la sección Reference.
4

Agregar y configurar actividades de NLP

En la pestaña Actividades, agregue las actividades correspondientes a su escenario (se describen a continuación). Abra cada actividad en el Activity Editor para configurarla y entrenarla.
5

Probar y publicar

Haga clic en Test Skill Using Selected Documents para evaluar los resultados. Cuando los resultados sean suficientemente buenos, publique el skill.

Named Entities (NER) preentrenadas (documento completo)

Use este escenario cuando las entidades que necesita puedan aparecer en cualquier parte del documento; por ejemplo, nombres de empresas y direcciones en una carta. Agregue una actividad Named Entities (NER) y asigne cada entidad a un campo. Si también necesita dividir una dirección en componentes (calle, ciudad, estado, país, código postal), agregue una actividad de Address Parsing y asigne los componentes a campos.
Flujo de procesamiento de documentos con una actividad Named Entities (NER)

Named Entities (NER) preentrenadas (párrafos específicos)

Use este escenario cuando la entidad se encuentre siempre en el mismo párrafo; por ejemplo, un monto de compra en la cláusula de precio de un contrato de compraventa. Primero, aísle el párrafo con una actividad de Segmentation y, a continuación, ejecute una actividad de Named Entities (NER) o Address Parsing sobre el campo segmentado. También puede aislar el párrafo con una actividad de Fast Learning o NLP Extraction Rules en lugar de Segmentation y, después, ejecutar NER o Address Parsing sobre el resultado.
Las actividades preentrenadas son fáciles de configurar y no requieren entrenamiento, pero una red neuronal entrenada con sus documentos puede extraer la información con mayor precisión. Si tiene un gran conjunto de documentos, pruebe también el escenario de Named Entities (NER) personalizadas que aparece a continuación y elija el que ofrezca mejores resultados.
Flujo de procesamiento de documentos con Segmentation como entrada para Named Entities (NER) y Address Parsing

Named Entities (NER) personalizadas (Deep Learning for NLP)

Use este escenario cuando las actividades preentrenadas no puedan distinguir las entidades que necesita; por ejemplo, para extraer solo el nombre de una organización de un párrafo que enumera ambas partes de un acuerdo, o para extraer un tipo de entidad que NER no cubre (como una dirección de correo electrónico). Combine una actividad de Segmentation con una actividad de Deep Learning for NLP: Segmentation aísla el párrafo y Deep Learning extrae los campos deseados.
El entrenamiento de una actividad de Deep Learning for NLP requiere al menos 50 documentos (se recomiendan 150). Para obtener los mejores resultados, pruebe también la actividad preentrenada Named Entities (NER) y elija la que extraiga con mayor precisión en sus documentos.
Flujo de procesamiento de documentos con Segmentation como entrada para una actividad de Deep Learning for NLP

actividad Named Entities (NER)

Extraiga entidades preentrenadas, como nombres, organizaciones y fechas, de texto libre.

actividad de Address Parsing

Separe las direcciones en calle, ciudad, estado, país y código postal.

actividad de Segmentation

Aísle el párrafo que contiene los datos que desea extraer.

actividad de Deep Learning for NLP

Entrene una red neuronal para extraer entidades personalizadas o difíciles de distinguir.