Saltar al contenido principal
Para entrenar y probar una skill, necesita un conjunto de documentos etiquetados; es decir, documentos en los que se indiquen explícitamente las ubicaciones de los campos y sus tipos de datos. La forma más directa de obtener dicho conjunto es etiquetar algunos documentos manualmente, pero esto puede llevar mucho tiempo, especialmente si piensa usar Deep Learning, que requiere conjuntos grandes de documentos etiquetados. Para ahorrar tiempo y esfuerzo, ABBYY proporciona varias formas de reutilizar documentos etiquetados de otras Skills o a partir de resultados de procesamiento revisados manualmente.

Etiquetado manual de documentos

Etiquete cada documento subido marcando las ubicaciones de todos los campos y especificando los tipos de datos que se espera que contengan. Para garantizar resultados de entrenamiento confiables, siga estas pautas.

Importación de Documentos Etiquetados desde una Carpeta

Los documentos etiquetados también se pueden obtener de las siguientes fuentes: En cada caso, deberá exportar los documentos etiquetados a una carpeta. Luego podrá importar los documentos etiquetados desde esa carpeta y usarlos para entrenar su Habilidad.

Conjuntos de entrenamiento de la Habilidad

Al publicar una skill para su uso en producción, normalmente eliminará el conjunto de entrenamiento, dejando solo algunos documentos de muestra en la versión publicada. También tiene la opción de exportar su conjunto de entrenamiento a una carpeta si piensa utilizar el mismo conjunto de entrenamiento para entrenar una nueva versión de su skill. Para exportar los documentos y su etiquetado a una carpeta, haga clic en el icono more junto al nombre del conjunto de documentos y seleccione Export Set with Labeling. La carpeta de destino contendrá los siguientes archivos y subcarpetas:
  • documentdefinition.json.
  • skillsettings.json.
  • Una subcarpeta <Document name> que contiene las imágenes de los documentos, documentinfo.json y archivos labeling.json para cada documento.

Resultados de procesamiento revisados manualmente

Cuando los revisores corrigen los resultados del procesamiento durante la revisión manual, se crea un conjunto de documentos etiquetados. Para reutilizar estos documentos etiquetados, configure la exportación de los datos de campo a JSON con la opción Valores, metadatos y estructura de campo para cada documento habilitada y exporte las imágenes del documento en cualquier formato de imagen. La carpeta de destino contendrá una subcarpeta independiente para cada transacción. Cada subcarpeta <Transaction ID> contendrá lo siguiente:
  • El archivo <Applied skill name>.json con los datos de campo.
  • Imágenes exportadas, según el formato elegido: <Applied skill name>.pdf, <Applied skill name>.tiff, o la subcarpeta <Applied skill name>/Pages con archivos page_*.jpg para cada página.

FlexiCapture

Puede volver a utilizar documentos que se etiquetaron previamente en FlexiCapture. Para obtener más información, consulte Importar documentos etiquetados desde FlexiCapture.

Cómo importar

Para importar documentos etiquetados desde la carpeta creada durante la exportación, seleccione el conjunto All Documents, haga clic en el menú desplegable junto al botón Upload y luego seleccione la opción Import Labeled Documents From Folder… en la lista desplegable. A continuación, seleccione la carpeta que creó anteriormente. Nota: No realice ningún cambio en la carpeta creada durante la exportación. Si modifica la estructura de subcarpetas o cambia el nombre de alguno de los archivos, el procedimiento de importación puede generar un error.

Cómo se tratan los duplicados

Si alguno de los documentos importados tiene el mismo nombre que un documento existente, Advanced Designer le preguntará si desea actualizar el etiquetado del documento existente o importar el duplicado como un documento nuevo. Si selecciona Actualizar etiquetado:
  • En el caso de campos con nombres idénticos, su ubicación y configuración en el documento existente se sobrescribirán con las del documento importado.
  • Cualquier campo presente en el documento importado pero ausente en el documento existente se añadirá al documento existente.
Si selecciona Importar como Documentos nuevos, los duplicados se renombrarán e importarán conservando su etiquetado.