Un conjunto de documentos «mixto» puede significar dos cosas en Advanced Designer:Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
- Un único conjunto que contiene documentos semiestructurados y no estructurados (distintos tipos de documento).
- Un único documento que contiene una estructura mixta; por ejemplo, un contrato no estructurado con tablas incrustadas, títulos, encabezados o pies de página.
Seleccione un escenario
| Escenario | Cuándo usarlo | Actividades clave |
|---|---|---|
| Semiestructurados + no estructurados en un solo conjunto | Ambos pertenecen a un mismo tipo lógico con campos de salida compartidos | Classify + IF + Fast Learning + Segmentation + Deep Learning for NLP |
| Celdas de tabla con campos integrados | Extraiga valores del interior de las celdas de una tabla (p. ej., nombres en un Closing Disclosure) | Fast Learning + NER (+ Address Parsing) |
| No estructurados con tablas/títulos/encabezados/pies de página integrados | Principalmente documentos no estructurados con fragmentos semiestructurados | Segmentation + Extraction Rules |
Flujo de trabajo habitual
Crear un Skill de documento
Abra Advanced Designer y haga clic en Create Document Skill en la página de inicio.
Cargar documentos
En la pestaña Documentos, cargue los documentos que usará para configurar el skill.
Definir campos y etiquetar
En la pestaña Campos, cree y configure los campos que extraerá el skill. Etiquete los documentos en la sección Reference.
Agregar y configurar actividades
En la pestaña Actividades, agregue las actividades adecuadas para su escenario (descrito a continuación). Abra cada actividad en el Activity Editor para configurarla y entrenarla.
Probar y publicar
Haga clic en Test Skill Using Selected Documents para evaluar los resultados. Cuando sean lo suficientemente buenos, publique el skill.
Documentos semiestructurados y no estructurados en un mismo conjunto
- Procese los documentos semiestructurados con una actividad Fast Learning.
- Procese los documentos no estructurados con una actividad de Segmentation, seguida de una actividad Deep Learning for NLP.

Celdas de tabla con campos integrados en el texto de la celda
- actividad Named Entities (NER) para entidades como nombres y organizaciones.
- actividad Address Parsing para desglosar las direcciones en componentes.


Classify By Text and Image
Clasifique documentos combinando texto y características visuales.
actividad Fast Learning
Extraiga campos de documentos semiestructurados y de celdas de tabla.
actividad de Segmentation
Aísle los párrafos que contienen campos sin estructura.
actividad Deep Learning for NLP
Extraiga entidades personalizadas o difíciles de desambiguar a partir de texto no estructurado.
actividad Named Entities (NER)
Extraiga entidades preentrenadas, como nombres, organizaciones y fechas.
Extraction Rules activity
Defina una extracción basada en reglas para fragmentos semiestructurados.
