Un Skill de documento extrae los valores de los campos de documentos estructurados y semiestructurados de un único tipo. Los documentos del mismo tipo comparten los mismos campos, reglas de validación y estructura; por ejemplo, las facturas, los acuerdos y las listas de envío constituyen cada uno un tipo de documento distinto.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Un Skill de documento procesa solo un archivo por transacción. Para procesar varios archivos en una sola transacción, use la actividad Extract de una Habilidad de proceso.
Documentos estructurados vs. semiestructurados
| Tipo | Ubicación del campo | Ejemplos | Dónde crear |
|---|---|---|---|
| Estructurado | Fija en cada instancia | Cuestionarios, formularios de solicitud, formularios fiscales | Vantage. Use Advanced Designer cuando necesite combinar el procesamiento de documentos estructurados con otras tecnologías de Vantage. |
| Semiestructurado | Varía en las etiquetas, la cantidad y la ubicación en cada instancia | Facturas, contratos, listas de envío | Vantage o Advanced Designer. |
Entrenamiento de una Skill de documento
Variantes de tipo de documento
Elegir una actividad según la escala
| Variantes en el conjunto de documentos | Enfoque recomendado | Precisión esperada |
|---|---|---|
| Cientos | Online learning en Vantage | Extracción casi perfecta |
| Miles | actividad Deep Learning | ~80–90 %, según la complejidad del documento |
| Un subconjunto de variantes esenciales | actividades Fast Learning y/o Extraction Rules | Alta precisión en documentos complejos |
Las actividades Deep Learning, Fast Learning y Extraction Rules solo están disponibles en Advanced Designer. Para usarlas, abra su Skill de documento en Advanced Designer; la skill puede seguir usándose como referencia desde Skill Designer y las Habilidades de proceso una vez publicada.
Recomendaciones para el entrenamiento y las pruebas
- Use un conjunto de entrenamiento representativo. Incluya al menos 2–3 documentos por variante. Incluso una sola muestra por variante es mejor que ninguna. Si el conjunto no cubre todas las variantes, use la actividad de Deep Learning: generaliza a partir de patrones de imagen, la estructura espacial, el contenido de los campos y las etiquetas circundantes, y puede procesar variantes con las que no se entrenó.
- Pruebe con distribuciones similares a las de producción. Use una muestra aleatoria extraída de su flujo real de documentos para que cada variante aparezca en el conjunto de prueba aproximadamente con la misma frecuencia con la que aparece en producción. Esto mantiene válida su estimación de exactitud.
Próximos pasos
Configurar un Skill de documento
Cree, entrene y publique un Skill de documento, incluidos los formularios estructurados y Online learning.
Añadir campos
Marque los campos en la pestaña Editor y configure las propiedades de los campos por tipo.
Etiquetado de documentos
Directrices para etiquetar documentos estructurados y semiestructurados durante el entrenamiento.
Analizar los datos extraídos
Revise las estadísticas de extracción de campos y corrija el etiquetado de referencia en la pestaña Result Review.
