Saltar al contenido principal
Para dividir un flujo de Páginas de archivos que contienen varios documentos en documentos separados, listos para un procesamiento posterior, cree una Habilidad de Document Splitter.

Separación de documentos del mismo tipo

Suponga que tiene un archivo que contiene varios documentos del mismo tipo (por ejemplo, una colección de facturas de un proveedor para un período determinado). Cada factura tendrá su propio número y puede tener números de página impresos. Estos y otros datos pueden usarse para separar los documentos entre sí. Puede usar una actividad de Extraction Rules para configurar la extracción de números de factura y de página. También puede usar una actividad de Classify si la primera página de un documento difiere significativamente de las demás páginas. Luego puede usar la actividad Splitter Script para analizar los valores extraídos y determinar si la página actual es la primera página de un nuevo documento.

Separación de documentos y eliminación de anexos

Supongamos que los documentos que se van a procesar vienen acompañados de documentos explicativos que deben almacenarse, pero de los cuales no se debe extraer ningún dato. En este caso, puede usar una actividad Classify para clasificar las páginas en documentos del tipo requerido y en sus anexos. También puede usar una actividad Extraction Rules para comprobar si se puede encontrar algún dato valioso en una página. Una página sin datos valiosos probablemente sea una página de anexo. Luego puede usar la actividad Splitter Script para anexar las páginas de anexo a cada documento o colocarlas en documentos separados.

Separación de documentos y determinación de su tipo

Suponga que tiene un archivo que contiene varios documentos de distintos tipos (por ejemplo, una solicitud de préstamo acompañada de documentos de identidad, declaraciones de ingresos, estados de cuenta bancarios, facturas de servicios públicos y otros documentos). En este caso, puede usar la actividad Classify para clasificar cada página y la actividad Extraction Rules para extraer los datos necesarios que permitan determinar si la página actual es la primera de un nuevo documento. Luego puede usar la actividad Splitter Script para configurar reglas para separar documentos y determinar su tipo.

Reordenar páginas y eliminar páginas en blanco

Supongamos que necesita reordenar páginas o eliminar páginas en blanco o con “basura” resultantes de un escaneo desordenado. En general, solo es posible reordenar si las páginas contienen algún dato que indique el orden correcto (por ejemplo, números de página). En ese caso, puede crear un campo que extraiga los números de página. También puede crear un campo que busque cualquier texto en una página para descartar como “basura” las páginas en blanco. Con la actividad Splitter Script, puede reordenar las páginas según sus números y crear un documento aparte que contenga todas las páginas en blanco o con “basura”. Document Splitter Workflow

Pasos para crear una Habilidad de división de documentos

  1. Abra ABBYY Vantage Advanced Designer y cree una nueva Habilidad de división de documentos haciendo clic en Create Splitter Skill en la página de inicio.
  2. En la pestaña Documentos, cargue sus archivos. Cada conjunto de documentos debe contener archivos de una única transacción comercial. El conjunto de archivos de origen se convertirá en páginas independientes. Tenga en cuenta que todas las actividades, excepto la actividad Splitter Script, procesarán cada Página por separado.
  3. Configure el flujo de procesamiento de documentos para extraer datos que ayuden a determinar el tipo de documento de cada Página en la transacción y a identificar dónde termina un documento y comienza otro. a. Configure una actividad Classify para clasificar Páginas si el flujo de Páginas de origen contiene varios tipos de documentos o si la primera Página de cada documento difiere significativamente de las demás Páginas. b. Si es necesario, etiquete campos o agregue otras actividades para extraer datos que puedan utilizarse para separar documentos del mismo tipo o determinar la clase de un documento.
  4. Configure la actividad Splitter Script agregando tipos de documento en el panel Splitter Script Properties y configurando el script que convertirá el flujo de Páginas en un conjunto de documentos. El script tiene acceso a todas las Páginas de una transacción y puede analizar datos de las demás actividades para determinar qué Páginas son las primeras Páginas de nuevos documentos.
  5. Pruebe su skill haciendo clic en Test Skill Using Selected Documents y analice los resultados obtenidos.
  6. Cuando esté satisfecho con los resultados, publique su skill.