Las skills para procesar documentos no estructurados solo pueden crearse en Advanced Designer; el Skill Designer en la nube no admite estos escenarios. Utilizan cuatro actividades principales de NLP para identificar entidades, segmentar texto y extraer campos de contenido libre, como contratos, cartas y correos electrónicos:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- actividad de Segmentation
- actividad de Deep Learning for NLP
- actividad Named Entities (NER)
- actividad de Address Parsing
Cada una de estas actividades admite un conjunto limitado de idiomas. consulte la página de referencia de la actividad para ver la lista de idiomas.
Elige un escenario
| Escenario | Cuándo usarlo | Actividades clave |
|---|---|---|
| Named Entities (NER) preentrenadas (documento completo) | Las entidades pueden aparecer en cualquier parte; se requiere una configuración mínima | NER (+ Address Parsing) |
| Named Entities (NER) preentrenadas (párrafos específicos) | La entidad siempre aparece en un párrafo conocido | Segmentation + NER (o Address Parsing) |
| Named Entities (NER) personalizadas (Deep Learning para NLP) | Las preentrenadas no pueden desambiguar, o tu tipo de entidad no está contemplado | Segmentation + Deep Learning para NLP |
Flujo de trabajo habitual
Crear un Skill de documento
Abra Advanced Designer y haga clic en Create Document Skill en la página de inicio.
Cargar documentos
En la pestaña Documentos, cargue los documentos que usará para configurar el skill.
Definir campos y etiquetar
En la pestaña Campos, cree y configure los campos que el skill extraerá. Etiquete los documentos en la sección Reference.
Agregar y configurar actividades de NLP
En la pestaña Actividades, agregue las actividades correspondientes a su escenario (se describen a continuación). Abra cada actividad en el Activity Editor para configurarla y entrenarla.
Probar y publicar
Haga clic en Test Skill Using Selected Documents para evaluar los resultados. Cuando los resultados sean suficientemente buenos, publique el skill.
Named Entities (NER) preentrenadas (documento completo)

Named Entities (NER) preentrenadas (párrafos específicos)

Named Entities (NER) personalizadas (Deep Learning for NLP)
El entrenamiento de una actividad de Deep Learning for NLP requiere al menos 50 documentos (se recomiendan 150). Para obtener los mejores resultados, pruebe también la actividad preentrenada Named Entities (NER) y elija la que extraiga con mayor precisión en sus documentos.

actividad Named Entities (NER)
Extraiga entidades preentrenadas, como nombres, organizaciones y fechas, de texto libre.
actividad de Address Parsing
Separe las direcciones en calle, ciudad, estado, país y código postal.
actividad de Segmentation
Aísle el párrafo que contiene los datos que desea extraer.
actividad de Deep Learning for NLP
Entrene una red neuronal para extraer entidades personalizadas o difíciles de distinguir.
