Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Un campo de texto extrae un valor de texto de un documento; por ejemplo, un nombre, una dirección, un identificador u otro texto. El tipo de datos del campo (Texto, Fecha, Number o Money) determina cómo Vantage reconoce y valida ese valor.

Agregar un campo de texto

Puede agregar un campo de texto de dos maneras.

Marque una región en la imagen del documento

Haga clic en un valor (se resalta en verde al pasar el cursor) o arrastre un rectángulo a su alrededor. El nuevo campo aparece en el formulario de datos.

Agregue un campo vacío y luego marque la región

Haga clic en Agregar campo en la barra de herramientas y luego arrastre un rectángulo alrededor del valor en la imagen. El contenido dentro de la región se convierte en el valor del campo.
Para cambiar el nombre de un campo, haga doble clic en el nombre en el formulario de datos o haga clic en el nombre en las propiedades del campo. Haga triple clic para seleccionar el nombre completo. Para abrir las propiedades del campo, haga clic en Opciones de campo.

Agregar varias regiones a un campo

Algunos valores abarcan varias líneas o páginas, por lo que un mismo campo puede necesitar varias regiones. Para agregar varias regiones a un campo nuevo:
1

Agregar el campo

Usa cualquiera de los métodos anteriores.
2

Seleccionar regiones adicionales

Mantén presionada Shift y haz clic o arrastra regiones adicionales del mismo campo.
Para agregar regiones a un campo existente, selecciona el campo en el formulario de datos y, a continuación, haz clic o arrastra su ubicación en la imagen. Si el valor abarca varias palabras, selecciónalas todas como una sola región. Las regiones pueden abarcar varias páginas o estar dentro de otra región. Una región anidada se resalta con un color más oscuro; cuando tiene el foco, se resalta en amarillo.

Propiedades generales

PropiedadDescripción
Nombre del campoÚnico dentro de la skill. No puede contener: . , / : * ? " < > |. Longitud máxima: 90 caracteres.
Tipo de datoEl tipo de datos que contiene el campo. Afecta a la precisión del reconocimiento. Consulte Tipos de datos para ver las opciones.
Permitir varios elementosIndica si el campo se repite (por ejemplo, varios nombres de hijos o números de cuenta).
Campo obligatorioSi está habilitado y el campo queda vacío después de la extracción, el documento pasa a revisión manual con un error.
Campo claveMarca el valor como que se puede buscar; se usa para localizar documentos.
Campo de dimensiónExpone el valor como dimensión de informes en Skill Monitor. Nota: El valor se trunca a 100 caracteres en la base de datos de informes (pero permanece sin cambios en el documento).

Tipos de datos

Tipo de datosDescripción
TextPuede contener letras latinas y cirílicas, dígitos, ideogramas y caracteres especiales.
FechaUna fecha y hora en cualquier formato. Separadores aceptados: punto (.), espacio, guion (-), barra inversa (\) y barra diagonal (/).
NumberPuede contener dígitos, separadores decimales y el carácter de porcentaje (%). Separadores decimales aceptados: punto (.), coma (,), guion (-), signo igual (=), espacio. Separadores de miles aceptados: punto (.), coma (,), comilla simple ('), espacio.
MoneyContiene tanto un valor numérico como un símbolo de divisa. El símbolo de divisa puede colocarse antes o después del monto.
La «l» minúscula (L), la «I» mayúscula (i) y el dígito «1» pueden parecer idénticos. En los campos Number o Money, un carácter ambiguo se reconoce como «1» porque no se permiten letras.

Configuración de apariencia

Estas propiedades describen la apariencia de los caracteres esperados en el campo.
  • Origen del texto — Indica si el campo contiene solo caracteres impresos, solo caracteres escritos a mano o ambos. Si agrega el campo dibujando un rectángulo, Vantage infiere este valor a partir de los caracteres que encuentra. Si agrega el campo con Agregar campo, el valor predeterminado es Printed. Consulte los idiomas compatibles con el reconocimiento de texto escrito a mano.
  • Eliminar el fondo del campo — Mejora el reconocimiento cuando el campo tiene un marco, casillas para caracteres individuales o texto de marcador de posición. Si habilita esta opción, cargue el documento del formulario en blanco que sirve como plantilla de fondo y etiquete el campo correspondiente en ese formulario. El formulario en blanco aparece en el conjunto de documentos, marcado con un icono.
  • Fuentes especiales — Mejora la precisión del reconocimiento cuando el campo usa una fuente específica. Puede seleccionar más de una fuente.
El reconocimiento de texto escrito a mano está habilitado de forma predeterminada en los nuevos Skills de documento. Para activarlo o desactivarlo, haga clic en el icono de configuración del skill situado a la derecha del nombre del skill, abra la pestaña Languages y seleccione o desmarque Handwritten en la sección Text Appearance.

Fuentes compatibles

FuenteDescripciónEjemplo de fuente
FaxUna fuente utilizada habitualmente por las máquinas de fax.Ejemplo de fuente Fax
GothicTextos impresos en tipografía gótica.Ejemplo de fuente Gothic
IndexUn conjunto especial de caracteres que incluye únicamente dígitos escritos con estilo de código postal.Ejemplo de fuente Index
Matrix printerTextos impresos con una impresora matricial.Ejemplo de fuente Matrix printer
MICR CMC-7Una fuente especial de código de barras MICR (CMC-7).Ejemplo de fuente MICR CMC-7
MICR E-13BCaracteres numéricos impresos con tinta magnética. Los caracteres MICR (reconocimiento de caracteres con tinta magnética) aparecen en diversos documentos, incluidos los cheques personales.Ejemplo de fuente MICR E-13B
OCR-AUna fuente monoespaciada diseñada para el Reconocimiento óptico de caracteres (OCR). Se utiliza ampliamente en bancos, compañías de tarjetas de crédito y empresas similares.Ejemplo de fuente OCR-A
OCR-BUna fuente diseñada para el reconocimiento óptico de caracteres.Ejemplo de fuente OCR-B
ReceiptPara texto de baja calidad, normalmente en una fuente monoespaciada o normal utilizada en recibos.Ejemplo de fuente Receipt
TypewriterTextos mecanografiados.Ejemplo de fuente Typewriter

Propiedades por tipo de dato

Las propiedades adicionales dependen del tipo de dato.

Texto

Configuración de Value:
  • Longitud máxima — Número máximo de caracteres permitidos. Si el valor extraído supera esta longitud, Vantage muestra un error. Si el proceso tiene una fase de revisión manual, el documento pasa a revisión manual.
  • Expresión regular — Un patrón que restringe el conjunto de caracteres válidos para el campo, lo que puede mejorar la precisión de la extracción. Por ejemplo, puede hacer que todos los caracteres se reconozcan como dígitos, exigir un formato específico de número de teléfono o validar que un campo contenga un peso numérico con sus unidades.
Ejemplo 1 — Números de teléfono como 1-(234)-567-8900 o 2 (987) 654 3211:
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Ejemplo 2 — Valores de peso como 50lb, 50lbs, 50Lb, 50Lbs, 50 lb o 50 lbs:
/^[\d]*(\s)?(L|l)b(s)?$/
Las expresiones regulares no afectan al reconocimiento de texto en documentos PDF.

Fecha

El valor puede incluir estas opciones de configuración:
  • Hora — Permite incluir un valor de hora. Si se desactiva, la hora no se extrae.
  • Día de la semana — Permite incluir un día de la semana en el campo. Si se desactiva, el día de la semana no se extrae.
  • Mes por nombre — Permite escribir el mes con palabras.

Orden aceptable de los componentes

Seleccione uno o más formatos de fecha: Día-Mes-Año, Mes-Día-Año o Año-Mes-Día. Si el formato detectado no coincide con ninguno de los formatos seleccionados, el documento pasa a revisión manual.

Fecha aceptable

Especifique un rango de fechas válido como una cantidad de meses antes y después del día en que se procesó el documento. Use números enteros. Una regla comprueba si la fecha extraída está dentro del rango; las fechas fuera de este pasan a revisión manual.

Number

La configuración de Value especifica qué tipo de número es el valor detectado (entero o decimal) y qué formatos numéricos se aceptan en el campo. Los valores que no cumplen los requisitos hacen que el documento pase a revisión manual.
  • Solo enteros — El valor debe ser un entero. Todos los separadores del número detectado se tratan como separadores de miles.
  • La parte fraccionaria puede contener más de dos dígitos — Actívelo cuando se espere que la parte decimal tenga más de dos dígitos. Separadores decimales aceptados: punto (.), coma (,), guion (-), signo igual (=), espacio.
  • Puede tener valores negativos — Permite valores negativos, indicados mediante un signo menos o entre paréntesis.
  • Puede incluir el símbolo ’%’ — Permite un carácter de porcentaje antes o después del valor.

El número debe estar dentro del intervalo

Establezca un valor mínimo y máximo (enteros o decimales, positivos o negativos). Una regla comprueba si el valor está dentro del rango; los valores fuera de este envían el documento a revisión manual.
Los campos de Money usan las mismas propiedades que Number, salvo que no se permite el carácter de porcentaje.

Etiquetado de documentos

Pautas para el etiquetado de documentos estructurados y semiestructurados durante el entrenamiento.

Idiomas de reconocimiento compatibles

Lista completa de idiomas de Reconocimiento óptico de caracteres (OCR) compatibles con las skills de Vantage.