Para dividir un flujo de páginas de un archivo con varios documentos en documentos separados listos para su procesamiento, cree un skill de Document Splitter. Las skills de Document Splitter solo se pueden crear en Advanced Designer. En los escenarios siguientes se combinan las actividades Classify, Extraction Rules y Splitter Script para detectar los límites entre documentos.Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Elige un escenario
| Escenario | Cuándo usarlo | Actividades clave |
|---|---|---|
| Documentos del mismo tipo en un mismo flujo | Varias facturas en un archivo | Extraction Rules + Splitter Script (+ Classify) |
| Separar documentos y conservar anexos | Los documentos incluyen páginas anexas explicativas que deben conservarse | Classify + Splitter Script (+ Extraction Rules) |
| Separar documentos y determinar su tipo | El flujo contiene documentos de distintos tipos (p. ej., un paquete de solicitud de préstamo) | Classify + Extraction Rules + Splitter Script |
| Reordenar y limpiar páginas | Las páginas llegan desordenadas, con páginas en blanco o con ruido | Extraction Rules + Splitter Script |
Documentos del mismo tipo en un flujo
- Agregue una actividad Extraction Rules para extraer números de factura y números de página.
- Agregue una Actividad Classify si la primera página de cada documento difiere visualmente de las demás.
- Use la actividad Splitter Script para comparar los valores extraídos entre páginas y decidir dónde comienza cada documento nuevo.
Separar documentos y almacenar anexos
- Use una Actividad Classify para etiquetar cada página como página del documento principal o como anexo.
- Opcionalmente, agregue una actividad Extraction Rules para marcar las páginas que no contienen datos extraíbles; probablemente se trate de anexos.
- Use la actividad Splitter Script para adjuntar cada anexo a su documento principal o generarlo como un documento independiente.
Separar documentos y determinar su tipo
- Use una Actividad Classify para etiquetar cada página con su tipo de documento.
- Agregue una actividad Extraction Rules para extraer cualquier dato que indique el comienzo de un nuevo documento.
- Use la actividad Splitter Script para definir reglas tanto para segmentar como para etiquetar cada documento de salida.
Reordenar y limpiar páginas
- Añada un campo para extraer los números de página (o cualquier otra señal de orden).
- Añada un campo que detecte si la página contiene texto; las páginas que no lo contengan pueden tratarse como páginas en blanco o con ruido.
- Use la Splitter Script activity para reordenar las páginas y enviar las páginas en blanco o con ruido a un documento de salida independiente.
Crear el skill de Document Splitter

Crear un skill de Document Splitter
Abra Advanced Designer y haga clic en Create Splitter Skill en la página de inicio.
Cargar documentos
En la pestaña Documentos, cargue los archivos. Cada conjunto de documentos debe contener los archivos de una sola transacción comercial. Los archivos de origen se convierten en páginas independientes; todas las actividades, excepto la actividad Splitter Script, procesan cada página por separado.
Agregar actividades de clasificación y extracción
Configure el flujo de procesamiento para extraer los datos necesarios para identificar los límites y tipos de documento. Agregue una Actividad Classify cuando el flujo contenga varios tipos de documento o cuando las primeras páginas sean visualmente distintas del resto. Agregue campos y otras actividades según sea necesario para capturar datos que ayuden a separar documentos del mismo tipo o etiquetar clases de documento.
Configurar la actividad Splitter Script
Agregue tipos de documento en el panel Splitter Script Properties y luego escriba el script que convierte el flujo de páginas en un conjunto de documentos. El script tiene acceso a todas las páginas de la transacción y puede leer los datos generados por otras actividades para decidir qué páginas inician un nuevo documento.
Probar y publicar
Haga clic en Test Skill Using Selected Documents para evaluar los resultados. Cuando los resultados sean satisfactorios, publique el skill.
actividad Splitter Script
Definir los límites del documento analizando los datos extraídos de cada página.
Actividades de Classify
Etiquetar cada página con su tipo de documento o su condición de primera página.
actividad Extraction Rules
Extraer identificadores como números de página, números de factura o palabras clave del documento.
skills de Document Splitter
Referencia de la estructura, la configuración y la publicación de los skills de Document Splitter.
