Saltar al contenido principal
Después de crear una skill de documento, siga estos pasos para configurar la skill:
  1. Cargue los documentos que planea usar para entrenar y probar el clasificador (cada archivo debe contener solo una imagen de documento). Para cargar sus documentos, vaya a la pestaña Documents en el Skill Designer y haga clic en el botón Upload documents ubicado en el centro del diseñador, en la barra de herramientas o en el panel Actions. Mientras se cargan los documentos, se muestra un indicador de progreso en la parte superior del Skill Designer, a la derecha de los marcadores. La descripción emergente del indicador muestra cuántos documentos aún deben cargarse y procesarse. Puede abrir una ventana de vista previa del documento haciendo clic en el icono ubicado a la izquierda del nombre del documento. El ancho predeterminado de esta ventana es el 35% del ancho de la ventana del navegador. Si es necesario, puede aumentar el ancho de la vista previa hasta el 80% del ancho de la ventana del navegador arrastrando el borde izquierdo de la ventana de vista previa. Los anchos especificados por el usuario se conservan hasta que se borre la caché del navegador.
  2. En sus documentos de entrenamiento, etiquete todos los campos de los que se deban extraer datos, especificando su ubicación en la imagen. También puede agregar reglas de validación y parámetros de la skill si es necesario. Para etiquetar campos en sus documentos de entrenamiento, vaya a la pestaña Editor del Skill Designer. Puede hacerlo haciendo clic en el nombre de la pestaña o seleccionando uno o más documentos de la lista y haciendo clic en Label Fields and Create Business Rules en el panel Actions.
  3. Entrene su skill y analice la precisión de extracción. Corrija los errores, si los hubiera. Para comenzar a entrenar su skill, haga clic en el botón Train en el panel Actions. Una vez completado el entrenamiento, aparece lo siguiente junto al botón Train: Completed. Puede detener el entrenamiento de la skill haciendo clic en Cancel debajo del botón Train en el panel Actions.
  4. Repita los pasos 1 a 3 hasta que esté satisfecho con los resultados.
  5. Publique su skill de producción en el Skill Catalog para ponerla a disposición.
  6. Si es necesario, puede derivar otras skills a partir de su skill. Estas skills heredan todas las reglas y campos de sus skills base. Además, las skills derivadas pueden actualizarse sin problemas a la última versión de sus skills base, conservando todos los cambios que haya realizado.

Configuración de una Skill de documento para procesar documentos estructurados

ABBYY Vantage ofrece un modo de aprendizaje automático para procesar documentos estructurados, es decir, documentos en los que la ubicación de los campos es la misma en cada instancia. Ejemplos de estos documentos incluyen cuestionarios, formularios de solicitud y formularios de declaración de impuestos. Este modo puede gestionar incluso documentos con múltiples variantes, como el Form 1040 del IRS para diferentes años, en los que el conjunto y la ubicación de los campos difieren ligeramente de un año a otro. Cada una de estas variantes representa un documento estructurado independiente y debe cargar un formulario en blanco para cada una. Para configurar una skill para procesar documentos estructurados, siga estos pasos:
  1. Cree una nueva Skill de documento y active el conmutador Documentos de formulario fijo para esa skill. Fixed Forms Toggle
  2. Cargue un formulario en blanco de muestra para cada variante de su documento. Para hacerlo, vaya a la pestaña Formulario en blanco en el Skill Designer y haga clic en el botón Cargar formulario en blanco ubicado en el centro del diseñador, en la barra de herramientas o en el panel Acciones. Si no dispone de un formulario en blanco, puede cargar un formulario completado y marcarlo como formulario en blanco.
Nota: Una skill puede gestionar hasta 10 variantes diferentes de un mismo formulario (por ejemplo, variantes del Form 1040 del IRS para diferentes años).
  1. Etiquete los campos de los que se debe extraer la información.
  2. En la configuración del campo, habilite la opción Eliminar fondo del campo para los campos en los que el fondo pueda afectar al reconocimiento.
  3. En el panel Acciones, haga clic en Entrenar.
  4. Haga clic en la pestaña Conjunto de prueba y cargue documentos de prueba completados. Asegúrese de que todos los campos estén etiquetados correctamente en cada documento. Si la ubicación de algún campo no coincide con la de ninguno de los formularios en blanco de muestra cargados, agregue un formulario en blanco de muestra para esa variante del documento.
  5. En el panel Acciones, pruebe su skill. Cuando finalice la operación, revise los resultados. Si no está satisfecho con los resultados, ajuste el etiquetado y vuelva a entrenar la skill.
  6. Publique su skill en el Skill Catalog para ponerla a disposición de uso.
Fixed Form Tabs Pestañas mostradas en el Skill Designer para una skill que procesa documentos estructurados Al procesar sus documentos, es posible que descubra que deberían tratarse más adecuadamente como semiestructurados en lugar de estructurados. En este caso:
  1. Haga clic en el icono a la derecha del nombre de la skill en el Skill Designer.
  2. Desactive el conmutador Documentos de formulario fijo.
Nota: Todos los campos etiquetados se conservan.
  1. Vuelva a entrenar su skill.
Si edita su skill en Advanced Designer y combina la actividad Forms con otras actividades, el conmutador Documentos de formulario fijo se deshabilita en Vantage y ya no podrá editar la skill fuera de Advanced Designer.

Trabajar con tablas y grupos repetidos

Al procesar documentos estructurados, Vantage puede manejar tablas y grupos repetidos si se conoce de antemano el número máximo de filas de la tabla o de instancias del grupo y los límites de la tabla o del grupo son fijos. Debe etiquetar todas las filas que puedan aparecer en todas las variantes del formulario.
Nota: En los resultados de procesamiento solo se muestran las filas con datos. Las filas vacías se ignoran.
Si no se conoce de antemano el número de filas o de instancias de un grupo, debe usar otra tecnología de Vantage; consulte Procesamiento de documentos estructurados.
Tip: Actualmente, solo se pueden manejar tablas con valores de texto. Si su tabla tiene columnas con casillas de verificación o códigos de barras, use un grupo repetido en su lugar.

Configuración de un idioma de reconocimiento

Al procesar un documento, Vantage selecciona un idioma de procesamiento de una lista de idiomas especificados. Al configurar una nueva skill, los siguientes cuatro idiomas se seleccionan de forma predeterminada: inglés, francés, alemán y español. La lista de idiomas de reconocimiento se puede modificar haciendo clic en el icon a la derecha del nombre de la skill en el Skill Designer. Los idiomas que se muestran en el cuadro de diálogo de configuración se ordenan alfabéticamente. Los idiomas seleccionados se muestran en la parte superior de la lista. Se debe seleccionar al menos un idioma. Para cerrar el cuadro de diálogo de configuración, haz clic en Save para conservar los cambios o en Cancel para descartarlos.
Nota: La cantidad de idiomas seleccionados puede afectar la velocidad de procesamiento del documento. Si estás completamente seguro de qué idiomas encontrará Vantage en tus documentos, te recomendamos restringir la selección a esos idiomas específicos.
Puedes modificar la lista de idiomas de reconocimiento de una skill incluso si la skill ya se haya entrenado. Para aplicar los cambios, vuelve a cargar los documents y vuelve a entrenar la skill.

Configuración del modo de aprendizaje en línea

El aprendizaje en línea está disponible para Skill de documento y para Skill de clasificación. El servicio de aprendizaje en línea recopila documentos en un conjunto de entrenamiento y luego entrena la skill usando los documentos recopilados. En la configuración de la Skill de documento, están disponibles los siguientes modos de aprendizaje en línea:
  • Recopilar y aprender. Opción predeterminada.
  • Solo recopilar. Si Skill Designer necesita recopilar documentos sin entrenar.
Para habilitar la recopilación de documentos sin entrenamiento, haga clic en el icono a la derecha del nombre de la skill en Skill Designer y seleccione el modo Solo recopilar en el cuadro de diálogo de configuración. Este modo le permite revisar los documentos añadidos al conjunto de entrenamiento antes de volver a entrenar la skill. Modo Solo recopilar

Véase también