Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Etiquete un conjunto representativo de documentos para entrenar y probar un Skill de documento. Las siguientes pautas abarcan documentos estructurados y semiestructurados.
Para documentos no estructurados, consulte etiquetado de documentos no estructurados.

Documentos estructurados

Los documentos estructurados siempre incluyen el mismo tipo de información en las mismas ubicaciones exactas. Un ejemplo de documentos estructurados son los formularios preformateados. Solo necesita etiquetar unos pocos documentos de muestra para el entrenamiento, porque el diseño no varía. Utilice las siguientes pautas al etiquetar documentos estructurados:
  • Especifique con precisión la región de cada campo: los valores de campo por sí solos no son suficientes para el entrenamiento.
  • Para marcar la región de un campo, no haga clic en su valor; marque el marcador de posición completo.
  • Si un campo no contiene valor, marque el marcador de posición vacío.
  • Si un campo consta de varias partes, mantenga presionada la tecla Shift para añadir las partes. Todas las partes deben estar en la misma página.
  • Si un formulario fijo contiene una tabla, marque todas las filas, incluidas las vacías.
  • Si se agrega un campo después de que el etiquetado ya haya comenzado, etiquete el nuevo campo en cada documento del conjunto de entrenamiento donde aparezca.

Documentos semiestructurados

Los documentos semiestructurados suelen contener los mismos tipos de información o tipos similares, pero la ubicación, el tamaño y el número de campos pueden variar de un documento a otro. Algunos ejemplos son recibos, órdenes de pago y facturas. Use las siguientes pautas al etiquetar documentos semiestructurados:
  • Especifique con precisión la región de cada campo: los valores por sí solos no son suficientes para el entrenamiento.
  • Para marcar la región de un campo, haga clic en su valor —la palabra o palabras que contiene— y la región se creará automáticamente.
  • Si un campo no contiene ningún valor, no cree una región para él.
  • No marque partes de palabras: Vantage solo puede aprender con palabras completas.
  • Si un campo consta de varias partes, mantenga presionada la tecla Shift para agregarlas. Todas las partes deben estar en la misma página.
  • Para los datos repetitivos, primero analice sus documentos y elija la estructura adecuada:
    Si sus datos repetitivos se ven así…Use
    Una tabla con un encabezado común y valores que no tienen palabras clave adyacentesUn campo Table
    Datos menos estructurados en los que los valores tienen palabras clave junto a ellosUn grupo con Allow multiple items habilitado
    Diseños diferentes entre documentosElija la opción que mejor se adapte a la mayoría de sus documentos
  • Para etiquetar una tabla, marque las celdas de la primera fila una por una: Vantage crea automáticamente las columnas. Luego haga clic en Continue table from this row y verifique que toda la tabla esté etiquetada correctamente.
  • No coloque la región de un campo dentro de la región de otro campo, ya sea que el elemento principal sea un campo individual (como una dirección) o una celda de tabla. Para extraer datos de un fragmento de texto largo, use Advanced Designer.
  • Si agrega un campo después de que el etiquetado ya haya comenzado, revise todos los documentos y etiquete el nuevo campo en cada documento en el que aparezca.
Si las tablas son grandes y las páginas del documento se parecen, puede eliminar las páginas similares y etiquetar solo la primera página, la última y algunas intermedias.

Añadir campos

Marque los campos en la pestaña Editor y configure las propiedades de los campos según su tipo.

Etiquetado de documentos no estructurados

Guía de Advanced Designer para etiquetar documentos no estructurados.

Configurar una Skill de documento

Cree, entrene y publique una Skill de documento, incluidos los formularios estructurados y Online learning.

Entrenamiento y prueba de una Skill de documento

Guía de Advanced Designer para entrenar, probar y medir la calidad de una Skill de documento.