Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Para dividir un flujo de páginas de un archivo con varios documentos en documentos separados listos para su procesamiento, cree un skill de Document Splitter. Las skills de Document Splitter solo se pueden crear en Advanced Designer. En los escenarios siguientes se combinan las actividades Classify, Extraction Rules y Splitter Script para detectar los límites entre documentos.

Elige un escenario

EscenarioCuándo usarloActividades clave
Documentos del mismo tipo en un mismo flujoVarias facturas en un archivoExtraction Rules + Splitter Script (+ Classify)
Separar documentos y conservar anexosLos documentos incluyen páginas anexas explicativas que deben conservarseClassify + Splitter Script (+ Extraction Rules)
Separar documentos y determinar su tipoEl flujo contiene documentos de distintos tipos (p. ej., un paquete de solicitud de préstamo)Classify + Extraction Rules + Splitter Script
Reordenar y limpiar páginasLas páginas llegan desordenadas, con páginas en blanco o con ruidoExtraction Rules + Splitter Script

Documentos del mismo tipo en un flujo

Use este escenario cuando un archivo contenga varios documentos del mismo tipo; por ejemplo, un lote de facturas de un mismo proveedor correspondientes a un período de facturación. Cada factura tiene su propio número y puede incluir números de página; use esos datos para determinar los límites.

Separar documentos y almacenar anexos

Use este escenario cuando los documentos vayan acompañados de páginas explicativas (anexos) que deban conservarse, pero de las que no sea necesario extraer datos.
  • Use una Actividad Classify para etiquetar cada página como página del documento principal o como anexo.
  • Opcionalmente, agregue una actividad Extraction Rules para marcar las páginas que no contienen datos extraíbles; probablemente se trate de anexos.
  • Use la actividad Splitter Script para adjuntar cada anexo a su documento principal o generarlo como un documento independiente.

Separar documentos y determinar su tipo

Utilice este escenario cuando el flujo contenga documentos de distintos tipos; por ejemplo, un paquete de solicitud de préstamo con documentos de identidad, comprobantes de ingresos, extractos bancarios y facturas de servicios públicos.

Reordenar y limpiar páginas

Use este escenario cuando las páginas lleguen fuera de orden o incluyan páginas en blanco o con ruido debido a un escaneo irregular. Solo es posible reordenarlas si las páginas contienen alguna señal de orden, por ejemplo, números de página impresos.
  • Añada un campo para extraer los números de página (o cualquier otra señal de orden).
  • Añada un campo que detecte si la página contiene texto; las páginas que no lo contengan pueden tratarse como páginas en blanco o con ruido.
  • Use la Splitter Script activity para reordenar las páginas y enviar las páginas en blanco o con ruido a un documento de salida independiente.

Crear el skill de Document Splitter

Flujo de procesamiento del skill de Document Splitter con las actividades Classify, Extraction Rules y Splitter Script
1

Crear un skill de Document Splitter

Abra Advanced Designer y haga clic en Create Splitter Skill en la página de inicio.
2

Cargar documentos

En la pestaña Documentos, cargue los archivos. Cada conjunto de documentos debe contener los archivos de una sola transacción comercial. Los archivos de origen se convierten en páginas independientes; todas las actividades, excepto la actividad Splitter Script, procesan cada página por separado.
3

Agregar actividades de clasificación y extracción

Configure el flujo de procesamiento para extraer los datos necesarios para identificar los límites y tipos de documento. Agregue una Actividad Classify cuando el flujo contenga varios tipos de documento o cuando las primeras páginas sean visualmente distintas del resto. Agregue campos y otras actividades según sea necesario para capturar datos que ayuden a separar documentos del mismo tipo o etiquetar clases de documento.
4

Configurar la actividad Splitter Script

Agregue tipos de documento en el panel Splitter Script Properties y luego escriba el script que convierte el flujo de páginas en un conjunto de documentos. El script tiene acceso a todas las páginas de la transacción y puede leer los datos generados por otras actividades para decidir qué páginas inician un nuevo documento.
5

Probar y publicar

Haga clic en Test Skill Using Selected Documents para evaluar los resultados. Cuando los resultados sean satisfactorios, publique el skill.

actividad Splitter Script

Definir los límites del documento analizando los datos extraídos de cada página.

Actividades de Classify

Etiquetar cada página con su tipo de documento o su condición de primera página.

actividad Extraction Rules

Extraer identificadores como números de página, números de factura o palabras clave del documento.

skills de Document Splitter

Referencia de la estructura, la configuración y la publicación de los skills de Document Splitter.