Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Un Skill de documento extrae los valores de los campos de documentos estructurados y semiestructurados de un único tipo. Los documentos del mismo tipo comparten los mismos campos, reglas de validación y estructura; por ejemplo, las facturas, los acuerdos y las listas de envío constituyen cada uno un tipo de documento distinto.
Un Skill de documento procesa solo un archivo por transacción. Para procesar varios archivos en una sola transacción, use la actividad Extract de una Habilidad de proceso.

Documentos estructurados vs. semiestructurados

TipoUbicación del campoEjemplosDónde crear
EstructuradoFija en cada instanciaCuestionarios, formularios de solicitud, formularios fiscalesVantage. Use Advanced Designer cuando necesite combinar el procesamiento de documentos estructurados con otras tecnologías de Vantage.
SemiestructuradoVaría en las etiquetas, la cantidad y la ubicación en cada instanciaFacturas, contratos, listas de envíoVantage o Advanced Designer.

Entrenamiento de una Skill de documento

Para comenzar a entrenar una Skill de documento, etiquete los campos en un documento. A medida que entrene, Vantage sugiere automáticamente ubicaciones de campos para agilizar el proceso de etiquetado.

Variantes de tipo de documento

Los documentos de un mismo tipo casi siempre tienen campos, reglas de validación y estructura idénticos, pero las variantes del mismo tipo pueden diferir ligeramente, por ejemplo, según el año en que se emitió el documento. Una sola Skill de documento puede manejar cualquier número de variantes; el enfoque de entrenamiento adecuado depende de cuántas variantes necesite abarcar.

Elegir una actividad según la escala

Para formularios estructurados (hasta 10 variantes), use la Skill de documento de Vantage. Trate las variantes adicionales como tipos de documento distintos. Para documentos semiestructurados, el enfoque recomendado depende del número de variantes:
Variantes en el conjunto de documentosEnfoque recomendadoPrecisión esperada
CientosOnline learning en VantageExtracción casi perfecta
Milesactividad Deep Learning~80–90 %, según la complejidad del documento
Un subconjunto de variantes esencialesactividades Fast Learning y/o Extraction RulesAlta precisión en documentos complejos
Las actividades Deep Learning, Fast Learning y Extraction Rules solo están disponibles en Advanced Designer. Para usarlas, abra su Skill de documento en Advanced Designer; la skill puede seguir usándose como referencia desde Skill Designer y las Habilidades de proceso una vez publicada.

Recomendaciones para el entrenamiento y las pruebas

  • Use un conjunto de entrenamiento representativo. Incluya al menos 2–3 documentos por variante. Incluso una sola muestra por variante es mejor que ninguna. Si el conjunto no cubre todas las variantes, use la actividad de Deep Learning: generaliza a partir de patrones de imagen, la estructura espacial, el contenido de los campos y las etiquetas circundantes, y puede procesar variantes con las que no se entrenó.
  • Pruebe con distribuciones similares a las de producción. Use una muestra aleatoria extraída de su flujo real de documentos para que cada variante aparezca en el conjunto de prueba aproximadamente con la misma frecuencia con la que aparece en producción. Esto mantiene válida su estimación de exactitud.

Próximos pasos

Configurar un Skill de documento

Cree, entrene y publique un Skill de documento, incluidos los formularios estructurados y Online learning.

Añadir campos

Marque los campos en la pestaña Editor y configure las propiedades de los campos por tipo.

Etiquetado de documentos

Directrices para etiquetar documentos estructurados y semiestructurados durante el entrenamiento.

Analizar los datos extraídos

Revise las estadísticas de extracción de campos y corrija el etiquetado de referencia en la pestaña Result Review.