Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Use Advanced Designer para conjuntos de documentos semiestructurados que sean demasiado complejos para usar solo Skill Designer en la nube; por ejemplo, conjuntos con muchos diseños distintos, casos atípicos que requieran extracción basada en reglas o datos de entrenamiento insuficientes para el aprendizaje automático.

Elija un escenario

EscenarioCuándo usarloActividades clave
Muchas variantes de documentosSiguen apareciendo nuevas plantillasDeep Learning + Fast Learning
Outliers que requieren reglasLa mayoría de las variantes funcionan con ML, pero algunas requieren reglasClassify + IF + Deep Learning + Extraction Rules
Pocos datos de entrenamientoNo hay suficientes documentos para entrenar Deep LearningClassify + Extraction Rules por variante
Cada uno de los escenarios siguientes sigue el mismo patrón; solo cambian las actividades que se agregan al flujo de procesamiento.

Flujo de trabajo común

1

Crear un Skill de documento

Abre Advanced Designer y haz clic en Crear un Skill de documento en la página de inicio.
2

Cargar documentos

En la pestaña Documentos, carga los documentos que usarás para configurar el skill. En los escenarios que incluyen clasificación, agrega una cantidad similar de documentos para cada variante, de modo que el clasificador tenga datos de entrenamiento equilibrados.
3

Definir campos y etiquetar

En la pestaña Campos, crea y configura los campos que extraerá el skill. Etiqueta los documentos en la sección Reference.
4

Agregar y configurar actividades

En la pestaña Actividades, agrega las actividades para tu escenario (descritas a continuación). Abre cada actividad en el Activity Editor para configurarla y entrenarla.
5

Probar y publicar

Haz clic en Probar Skill con los documentos seleccionados para evaluar los resultados. Cuando los resultados sean lo bastante buenos, publica el skill.

Muchas variantes de documentos

Use este escenario cuando los documentos pertenezcan al mismo tipo, pero sus diseños varíen mucho; por ejemplo, facturas de muchos proveedores para las que seguirán apareciendo nuevas plantillas. Combine una actividad de Deep Learning con una actividad de Fast Learning:
  • Deep Learning se adapta a variantes no previstas. El entrenamiento requiere al menos 100 documentos etiquetados.
  • Fast Learning mejora la precisión en las plantillas específicas que ya conoce. También puede entrenarse de forma continua mediante el bucle de retroalimentación de Online Learning a partir de la revisión manual.
Flujo de procesamiento de documentos con Deep Learning seguido de Fast Learning

Casos atípicos que requieren extracción basada en reglas

Usa este escenario cuando la mayoría de las variantes funcionan con Deep Learning + Fast Learning, pero algunos documentos tienen tablas anidadas u otras características que el aprendizaje automático no puede captar con precisión. Separa los casos atípicos con una Actividad Classify y, a continuación, ramifica el flujo con una actividad IF:
  • Usa Classify By Company cuando las variantes procedan de distintas empresas cuyo nombre o dirección aparezca en el documento; por ejemplo, extractos bancarios de varios bancos.
  • Usa Classify By Text and Image en todos los demás casos. Este clasificador multimodal usa texto, diseño y patrones de imagen para distinguir las variantes.
Después de ramificar el flujo, envía los documentos atípicos a través de una actividad Extraction Rules adaptada a esos documentos.
Flujo de procesamiento de documentos con las actividades Classify, IF, Deep Learning y Extraction Rules

Datos de entrenamiento limitados

Use este escenario cuando no tenga suficientes documentos para entrenar una actividad de Deep Learning, pero sí tenga suficiente conocimiento del dominio para describir las reglas de extracción; por ejemplo, formularios fiscales que varían según el año. Divida los documentos con una actividad Classify (Classify By Company o Classify By Text and Image) y, a continuación, dirija cada variante a su propia actividad Extraction Rules. Opcionalmente, agregue una actividad de Fast Learning para que Vantage pueda perfeccionar la skill con el tiempo.
Flujo de procesamiento de documentos con una actividad Classify que se ramifica en varias actividades Extraction Rules

Actividad de Deep Learning

Generalice en una amplia variedad de diseños semiestructurados.

Actividad de Fast Learning

Mejore la precisión en plantillas conocidas con la retroalimentación de la revisión manual.

actividad Extraction Rules

Defina una extracción basada en reglas para casos atípicos o conjuntos de datos con pocos datos.

Actividades de Classify

Ramifique el flujo según la variante del documento antes de la extracción.