Saltar al contenido principal

A

ABBYY FlexiCapture

Una solución de software para la captura de datos en un flujo único a partir de diversos tipos de documentos estructurados (formularios fijos), semiestructurados (formularios y documentos flexibles) y no estructurados (documentos de formato libre).

ABBYY FlexiLayout Studio

Un programa que permite crear un FlexiLayout de la estructura del documento, que luego puede utilizarse para el reconocimiento automático de documentos.

ABBYY FormDesigner

ABBYY FormDesigner se utiliza para diseñar plantillas de formularios legibles por máquina. Una vez reproducidos y cumplimentados, estos formularios pueden procesarse con el sistema automatizado de captura de formularios ABBYY FlexiCapture. El diseño de formularios es una etapa importante, ya que la calidad de la plantilla diseñada (su legibilidad por máquina) determina la eficacia de todas las etapas posteriores del procesamiento: escaneo, reconocimiento, verificación y exportación.

FCFORINVOICES

Un FC es una solución de software inteligente y fácil de usar para el procesamiento de facturas.

ADF

Alimentador automático de documentos. Dispositivo que alimenta documentos automáticamente y le permite escanear cualquier cantidad de documentos sin realizar operaciones manuales adicionales.

Administrador

Usuario de ABBYY FlexiCapture autorizado para configurar el programa para la entrada de documentos mediante la creación y edición de Definiciones de Document y perfiles de importación.

Alfabeto

Conjunto de caracteres que se utiliza en el idioma descrito.

Anclaje

Los anclajes son elementos especiales del diseño de formularios que el sistema utiliza para realizar el emparejamiento después del escaneo (elimina la inclinación, compensa los defectos lineales y no lineales del escaneo y calcula la ubicación de los bloques). Los anclajes más fiables son los cuadrados negros, que normalmente se encuentran en las esquinas de un formulario. Si la imagen no contiene anclajes especiales, pueden utilizarse otros elementos estáticos para el emparejamiento de la Definición de Document: separadores, es decir, líneas verticales u horizontales, como líneas de tabla, marcos, etc., o texto estático claro, como el encabezado del formulario, las etiquetas de los campos, la información explicativa, etc. La opción Use for Document Definition matching debe estar habilitada para los elementos estáticos que se utilicen en el emparejamiento de la Definición de Document.

Código de barras de anclaje

Elemento estático que representa un código de barras no destinado a la extracción de datos. Un código de barras de anclaje puede utilizarse para el emparejamiento o la identificación de una Definición de Document.

Texto de anclaje

Elemento estático que representa un texto presente en un formulario en blanco y que no está destinado a la extracción de datos. Puede ser cualquier texto explicativo o encabezado. El texto de anclaje puede utilizarse para el emparejamiento o la identificación de la Definición de Document.

Ángulo

Un anclaje en forma de ángulo.

Anexo

Páginas que no contienen campos, pero que se incluyen en el ensamblado de documentos. No se extraen datos de estas páginas, pero pueden guardarse como imágenes o archivos PDF con capacidad de búsqueda. (Administrador) Consulte Creación de Definiciones de Document para documentos con anexos.

Error de ensamblado

Este error se produce cuando un documento creado durante el ensamblado de documentos contiene páginas de otros documentos, cuando sus propias páginas están en un orden incorrecto o cuando los valores de los campos clave de las páginas del documento no coinciden.

Aprendizaje automático

Capacidad de ABBYY FlexiCapture para aprender automáticamente a detectar nuevos campos e identificar tipos de documento.

B

Código de barras

Elemento de formulario legible por máquina representado por barras blancas y negras alternas de cierta longitud que codifican información digital. Un código de barras en un documento puede usarse para extraer información (campo de código de barras) o para localizar e identificar una Definición de Document (código de barras de anclaje).

Campo de código de barras

Un campo de Definición de Document que contiene un código de barras para su reconocimiento.

Reconocimiento de códigos de barras

Conversión de la imagen gráfica de un código de barras en números o texto.

Tipo de lote

La propiedad de un lote que define cómo se deben procesar los documentos en los lotes correspondientes. (Administrador) Consulte Tipos de lote.

Formulario de líneas en blanco y negro

Formulario en el que los bordes de los campos de información están formados por líneas normales que no desaparecen durante el escaneo.

Cuadrado negro

Anclaje con forma de cuadrado negro.

Brillo

Un umbral de sensibilidad a la luz que determina a partir de qué punto el escáner interpreta los semitonos en escala de grises como blanco.

C

Marca de verificación

Elemento de formulario legible por máquina que contiene una marca (tilde, cruz, punto, tachado con tinta, etc.) realizada por la persona que rellena el formulario.

Campo de marca de verificación

Un campo de una Definición de Document que contiene una marca de verificación.

Grupo de marcas de verificación

Un elemento de un formulario legible por máquina que agrupa varias marcas de verificación situadas próximas entre sí. En un grupo de marcas de verificación se pueden seleccionar una o varias marcas de verificación.

Campo de grupo de marcas de verificación

Campo de una Definición de Document que contiene un grupo de marcas de verificación.

Clasificador

Proyecto creado en FlexiLayout Studio y destinado a la identificación preliminar de páginas antes de aplicar las Definiciones de Document, así como a seleccionar el FlexiLayout o la alternativa de layout correspondientes.

F-measure del clasificador

Una medida combinada de precisión y recall para la clasificación de documentos. Se expresa como un valor entre 0 y 1 o como un porcentaje entre 0 % y 100 %. El F-measure de una categoría se calcula como (β^2 + 1) * P * R / (β^2 * P + R), donde P es la precisión de la categoría, R es el recall de la categoría y β es un parámetro libre que determina la ponderación relativa de la precisión y el recall para el modelo dado. El valor máximo = 1 (100 %) cuando P = R = 1 (100 %). El F-measure de un lote de prueba o entrenamiento se calcula como (β^2 + 1) * P * R / (β^2 * P + R), donde P es la precisión del lote de prueba o entrenamiento, R es el recall del lote de prueba o entrenamiento y β es un parámetro libre que determina la ponderación relativa de la precisión y el recall para el modelo dado.

Página de códigos

Una tabla de valores que describe el conjunto de caracteres de un idioma determinado.

Formulario con fondo de color

Un formulario en el que todos los campos de datos son rectángulos blancos sobre un fondo de color que desaparece durante el escaneo.

Contraste

Relación entre el brillo de las zonas más oscuras y las más claras de una imagen.

Control

Un elemento de texto, un campo o un botón del formulario de datos. (Administrador) Para más detalles, consulte Insertar control.

Marca de verificación corregida

Una marca de verificación seleccionada por error y posteriormente tachada a mano. Si la opción Permitir correcciones está habilitada para el campo de marca de verificación, el programa reconocerá la marca de verificación tachada como no seleccionada.

Cruz

Un anclaje en forma de cruz.

Tipo de dato personalizado

Tipo de dato definido por el usuario. (Administrador) Consulte Crear tipos de datos personalizados.

D

Búsqueda en la base de datos

Emparejamiento de datos reconocidos con los registros correspondientes de la base de datos.

Conjunto de datos

Datos utilizados para comprobaciones automatizadas de documentos. Un conjunto de datos puede almacenarse como una tabla en FC y sincronizarse según una programación o recuperarse de una fuente externa.

Tipo de dato

Una de las características del campo es el tipo de dato: número, fecha, texto, apellido, nombre, dirección, etc. Un tipo de dato define el conjunto de palabras que pueden aparecer en un campo determinado. El tipo de dato es un parámetro de reconocimiento importante que influye en la calidad del reconocimiento. Un tipo de dato correctamente especificado puede reducir significativamente el número de caracteres reconocidos de forma incorrecta.

Archivo de descripción

Archivo auxiliar que define cómo se forma un lote al añadir imágenes desde una carpeta de seguimiento. (Administrador) Para obtener más información, consulte Archivo de descripción.

Dictionary

Se especifica un diccionario al crear un tipo de datos. Por ello, el tipo de datos asociado a un campo determina el diccionario que se utiliza durante el reconocimiento y la verificación. Además de los tipos de datos predeterminados con diccionarios ya preparados, el programa permite adjuntar tipos de datos creados a partir de diccionarios personalizados. Puede introducir manualmente los datos del diccionario o cargarlos desde un archivo.

Documento

Una combinación de una o varias imágenes de página y los datos extraídos de ellas.

Lote de documentos

Conjunto de documentos agrupados por el usuario. Normalmente, un lote contiene la pila de documentos escaneados en una sola pasada o importados desde una carpeta concreta. (Administrador) Consulte Lotes de documentos.

Clase de documento

Un conjunto de documentos o páginas que comparten varias características comunes.

Datos del documento

Datos capturados después del procesamiento (reconocimiento, verificación y edición de los resultados del reconocimiento) de las imágenes de las páginas del documento.

Definición de Document

Una Definición de Document define los principios de identificación y procesamiento de un tipo específico de documento y contiene:
  • La estructura del documento, es decir, una descripción del orden permitido de las páginas para los documentos de este tipo, que define cómo deben ensamblarse los documentos
  • Definiciones de secciones del documento
  • Una lista de reglas que deben cumplir los datos de los campos
  • La ubicación de los campos y sus firmas en la ventana de datos (vista del formulario de datos)
  • Configuración de exportación de documentos
  • Configuración de procesamiento de documentos

Identificación de la Definición de Document

Proceso de selección de la Definición de Document requerida con ayuda de identificadores.

Emparejamiento de Definición de Document

Proceso de seleccionar una Definición de Document y hacer coincidir sus campos con una imagen.

Publicación de la Definición de Document

Permite acceder a una nueva versión de la Definición de Document una vez editada. Una versión publicada participa en el procesamiento de documentos de lotes de trabajo, mientras que una versión local no publicada solo puede participar en el procesamiento de Definiciones de Document de lotes de prueba. (Administrador) Consulte Edición y publicación de una Definición de Document.

Sección de la Definición de Document

Un componente de una Definición de Document. Corresponde a una o varias páginas que contienen un conjunto de campos lógicamente completo. Los campos de una sección pueden continuar de una página a la siguiente (por ejemplo, tablas de varias páginas), mientras que los conjuntos de campos de distintas secciones no se superponen. Una definición de sección puede ser flexible o fija.

Identificación de documentos

Proceso de asignar documentos a uno de varios tipos de documento predefinidos.

Conjunto de documentos

Un conjunto de documentos relacionados entre sí de forma lógica que se utilizan para un propósito específico. Por ejemplo, un proceso empresarial puede iniciarse con un conjunto de documentos proporcionados por un solicitante, que consta de un formulario de solicitud cumplimentado y algunos documentos adjuntos. Según la información facilitada por el solicitante en el formulario de solicitud, algunos de los documentos adjuntos pueden ser opcionales, mientras que otros deben adjuntarse a la solicitud.

Texto del documento

Todo el texto capturado del documento durante el reconocimiento preliminar, antes de aplicar FlexiLayout. Puede optar por guardar este texto (requiere espacio adicional en el disco duro) para usarlo durante la verificación.

Tipo de documento

Conjunto de documentos que comparten varias características y desempeñan una función específica en los procesos empresariales. Algunos ejemplos de tipos de documento son las facturas, los contratos y los pasaportes.

Variante de documento

Varios documentos que pertenecen al mismo tipo y comparten varias características. Algunos ejemplos de variantes de documento son las facturas de distintos proveedores y los extractos de crédito del mismo banco.

Impresora matricial

Un tipo de texto reconocible que representa texto impreso con una impresora matricial.

dpi

Puntos por pulgada. Número de puntos por pulgada; unidad de medida de la resolución de la imagen.

E

Entidad

Un campo o un grupo de campos que contiene información que debe extraerse con tecnología de NLP. Algunos ejemplos de entidades son: personas, empresas, lugares, montos y fechas.

Variable de entorno

Una cadena que se utiliza para almacenar texto, por ejemplo, la configuración del sistema. Las variables de entorno pueden usarse para almacenar cadenas de conexión a bases de datos y variables que se utilizan al especificar los nombres de los archivos exportados.

Error / advertencia

El error / la advertencia se produce cuando los datos extraídos de uno o más campos no cumplen las reglas que se aplican durante las comprobaciones automáticas o no coinciden con el formato especificado. Hay dos tipos diferentes de errores y advertencias:
  • errores / advertencias de un solo campo se generan mediante reglas y formatos que afectan a un solo campo;
  • errores / advertencias de varios campos se generan mediante reglas que afectan a varios campos.

Texto explicativo

Elemento de formulario legible por máquina que representa un texto descriptivo (nombre del formulario, nombres de los campos, explicaciones de los campos, etc.).

Exportación

Proceso de transferencia de datos procesados a un sistema de información externo o a un archivo.

Perfil de exportación

Conjunto de opciones de configuración que determina qué se hace con los datos procesados: el formato de los archivos de salida, la ruta de salida, las condiciones de exportación, etc.

Base de datos externa

Archivo de texto o base de datos compatible con ODBC que almacena datos de referencia. Los datos de referencia pueden incluir los posibles valores de los campos capturados o la información necesaria para capturar esos campos.

F

Campo

Elemento del documento destinado a la extracción de datos. Los campos pueden ser simples (sin estructura interna) o compuestos, como el campo de tipo tabla, donde cada celda puede considerarse un campo subordinado independiente de la tabla. (Administrador) Consulte Creación de campos de Definición de Document.

Región del campo

Una región de la imagen resaltada en la Definición de Document y destinada a la extracción de datos.

Verificación de campos

En el modo de verificación de campos, los caracteres dudosos se revisan en el contexto del campo completo. Los campos con la opción Enviar a verificación de campos habilitada se envían a verificación de campos. Recomendamos enviar a verificación de campos aquellos campos cuyo conjunto de valores se conoce o puede determinarse fácilmente. Algunos ejemplos de estos campos son los nombres de países o ciudades: sabemos qué valores puede tener este campo.

Campo con varias instancias

Campo que se utiliza para describir varios objetos del mismo tipo (objetos recurrentes). En esencia, estos múltiples objetos constituyen un solo campo y comparten las mismas propiedades. Los campos con varias instancias se utilizan para evitar tener que crear varios campos idénticos. Los campos con varias instancias se exportan a archivos o tablas de base de datos independientes. (Administrador) Consulte Campos con varias instancias.

Campo con varias regiones

Un campo compuesto por varias regiones de la imagen. Estas regiones pueden estar separadas entre sí e incluso estar en distintas páginas. Los valores de todas las regiones que pertenecen al mismo campo se combinan y se exportan juntos como un único campo. Suele usarse para objetos ubicados en varias páginas, como tablas grandes. (Administrador) Consulte Campos con varias regiones.

Campo sin región

Un campo detectado en una Definición de Document, pero sin región en la imagen. (Administrador) Consulte Campos sin región.

Formulario fijo

Documento con campos de información fijos cuyo formato, número y disposición están estrictamente definidos y no cambian de un documento a otro.

Definición de Document fija

Una definición de un documento o de una de sus secciones diseñada para procesar formularios fijos. Los campos de una Definición de Document fija tienen ubicaciones fijas.

FlexiLayout

Descripción de la estructura de un documento semiestructurado. Esta descripción se crea con ABBYY FlexiLayout Studio y se exporta a ABBYY FlexiCapture. Formato de archivo: *.afl. FlexiLayout es un tipo de instrucción para detectar e identificar campos en un formulario flexible.

Variante de FlexiLayout

Un FlexiLayout para una variante de documento que se desarrolló específicamente para ella o que se entrenó con ella. Se utiliza junto con un FlexiLayout genérico.

Definición de Document flexible

Definición de un documento o de su sección diseñada para procesar documentos semiestructurados. Se crea adjuntando un FlexiLayout. Los campos de esta Definición de Document no tienen posiciones fijas. Se detectan con la ayuda de un FlexiLayout. (Administrador) Consulte Creación de una Definición de Document para el procesamiento de documentos semiestructurados.

Formulario

Documento compuesto por una o varias páginas, diseñado para que una persona lo complete a mano o por cualquier otro medio de impresión.

Texto enmarcado

Tipo de marcación de texto en la que un marco delimitador encierra el texto.

Texto en un marco delimitador sobre un peine

G

Formulario con fondo gris

Formulario en el que todos los campos de información son rectángulos blancos sobre un fondo gris que desaparece durante el escaneo.

Verificación en grupo

Los campos que tienen habilitada la opción Enviar a verificación en grupo se envían a verificación en grupo. Recomendamos enviar a verificación en grupo los caracteres de los campos numéricos, así como las marcas de verificación.

H

Texto manuscrito en letra de imprenta

Un tipo de texto reconocible que corresponde a texto escrito a mano en caracteres de imprenta separados.

Texto escrito a mano

Un tipo de texto reconocible cuyas letras están unidas total o parcialmente. Nota: Actualmente, solo se puede reconocer texto escrito a mano en inglés.

Carpeta de seguimiento

Una carpeta en el disco duro de un equipo local o remoto que se utiliza para importar imágenes. Normalmente se usa para la carga periódica de imágenes sin la intervención del usuario. (Administrador) Consulte Perfiles de importación de imágenes.

Identificador

Elemento estático que se utiliza para seleccionar con certeza una Definición de Document entre varias Definiciones de Document con la misma ubicación de los anclajes. La opción Use for Document Definition identification debe estar habilitada en las propiedades de dichos elementos estáticos.

Proveedor de identidad

Un sistema de terceros, como Azure AD, OneLogin u Okta, que gestiona la información de identidad y proporciona servicios de autenticación a sus clientes, lo que permite al usuario final acceder a todos los recursos autorizados de su red local introduciendo sus credenciales solo una vez.

Carácter ignorado

Estos caracteres se excluyen de las palabras; es decir, las palabras se asignan a un tipo de datos concreto sin estos caracteres.

Image

Una imagen electrónica de una página escaneada de un documento en papel.

Eliminación de motas de la imagen

Eliminación del ruido de la imagen. El ruido puede aparecer durante el escaneado, y se recomienda eliminarlo para mejorar el reconocimiento de datos. Durante la eliminación de motas, el programa también elimina puntos del fondo o líneas de borde de formularios rasterizados.

Importación de imágenes

Proceso de agregar imágenes a un lote para su procesamiento. La importación puede realizarse agregando imágenes desde archivos, desde un escáner o mediante perfiles de importación. (Administrador, Verificación) Consulte Añadir imágenes de página.

Rotación de la imagen

Rotación de una imagen en torno a su centro.

Perfil de importación

Conjunto de opciones que se utiliza para agregar imágenes a un lote: origen de importación, opciones de procesamiento de imágenes, opciones de limpieza de Hot Folder, etc. (Administrador) Consulte Perfiles de importación de imágenes.

Carácter reconocido de forma incorrecta

Estado que se asigna automáticamente a un carácter durante el proceso de reconocimiento si se ha reconocido con un grado considerable de incertidumbre.

Campo de índice

Un campo cuyo valor se usa para indexar documentos con fines de ordenación y búsqueda. (Administrador) Consulte Campos de índice.

Imagen invertida

Una imagen con texto claro sobre un fondo oscuro.

Factura

Documento que enumera los bienes suministrados, su cantidad, precio, características (como color, peso, etc.), condiciones de envío y datos de las partes. Las facturas pueden procesarse mediante una solución independiente, FCFORINVOICES. (Administrador, Verificación) Consulte ABBYY FlexiCapture for Invoices.

ICR, Reconocimiento inteligente de caracteres

Se refiere a tecnologías o sistemas diseñados para el procesamiento masivo de documentos cumplimentados a mano con letras y números en letra de imprenta; es decir, el reconocimiento de caracteres escritos en letra de imprenta.

K

Campo clave

Un campo que permite comprobar automáticamente la agrupación de páginas en documentos. Los valores de los campos clave deben ser idénticos en todas las páginas del mismo documento.

L

Idioma (local)

Propiedad de un campo que determina el idioma de escritura y los parámetros regionales correspondientes (como el formato de la fecha o de la dirección).

Diseño

La ubicación de los campos en la imagen de un documento. Los diseños se pueden generar automáticamente o crear manualmente. (Administrator) Consulte también Reference layout.

Letras en marcos delimitadores

Letras en marcos delimitadores separados

Letras sobre un peine

M

Texto impreso

Un tipo de texto reconocible que se ha impreso mediante equipos tipográficos o con una impresora láser o de inyección de tinta con una resolución mínima de 300 dpi.

Formulario legible por máquina

Formulario diseñado especialmente para la captura automatizada. Contiene elementos de trabajo (anclajes, códigos de barras, líneas, etc.) necesarios para procesarlo correctamente.

Campo de entrada manual

Un campo de Definición de Document que contiene texto ilegible (por ejemplo, texto compuesto por letras fusionadas) y que debe introducirse con el teclado.

MRC (Mixed Raster Content)

Un método de compresión utilizado para imágenes que contienen tanto texto como fragmentos ráster. La imagen se analiza y se divide en fragmentos, y para cada uno se selecciona un algoritmo de compresión óptimo. Este enfoque ofrece mejores tasas de compresión sin perder la calidad visual de las imágenes.

Texto monoespaciado

Tipo de marcado de texto en el que cada letra se encuentra dentro de un marco delimitador de la misma altura y anchura, pero cuyo borde desaparece durante el escaneo.

Documento de varias páginas

Un documento compuesto por varias páginas.

Multitenencia

Una función que permite a varios usuarios independientes utilizar ABBYY FlexiCapture. Los datos de cada tenant están completamente aislados de los de otros tenants, y el sistema asigna una parte de sus recursos a cada tenant.

N

NER (Reconocimiento de entidades nombradas) Una tarea de extracción de información basada en la búsqueda de atributos en texto no estructurado y en su clasificación en categorías predefinidas. NLP (Procesamiento del lenguaje natural) Un subcampo de la inteligencia artificial y la lingüística matemática. Se ocupa del análisis y la síntesis computacional de los lenguajes naturales. Una de sus posibles aplicaciones es la extracción de información relevante a partir de texto. Incluye lo siguiente: traducción automática, chatbots, clasificación, análisis de sentimiento, extracción de datos, etc.

Modelo de NLP

Mecanismo que determina qué entidades y segmentos deben extraerse de los textos y cómo. El área temática y el algoritmo de extracción se seleccionan durante el entrenamiento de un modelo de NLP.

O

OCR (Reconocimiento óptico de caracteres)

Reconocimiento óptico de texto impreso.

OMR (Reconocimiento óptico de marcas)

Esta tecnología permite a ABBYY FlexiCapture reconocer tanto marcas habituales (marcas de verificación, cruces, etc.) en formularios con un alto grado de fiabilidad como identificar correctamente las marcas realizadas por error y posteriormente tachadas con tinta.

Operador

Usuario de ABBYY FlexiCapture encargado de la entrada de documentos: agregar imágenes, realizar el reconocimiento y la verificación, y exportar los datos reconocidos.

Rol de operador

Propiedad de una cuenta de usuario en ABBYY FlexiCapture que determina a qué datos puede acceder el usuario y qué acciones pueden realizarse con ellos. (Administrador, Verificación) Consulte cómo trabajar con un proyecto configurado.

Superposición

El proceso de combinar un escaneo de un formulario rellenado con una imagen de un ejemplar en blanco del mismo formulario en el editor de Definición de Document.

P

Página

Imagen de la página de un documento en papel y de los resultados de su procesamiento.

Diseño de página

Esquema que muestra la ubicación de los campos en una imagen.

Orientación de la página

Posición de la página con respecto a la alineación estándar: de arriba abajo, de izquierda a derecha. La orientación de la página puede determinarse automáticamente durante el reconocimiento de la imagen de página; para ello, ABBYY FlexiCapture le permite especificar las orientaciones posibles.

Imagen

Elemento de un formulario de lectura mecánica que no se somete a reconocimiento, sino que está destinado a exportarse como un objeto gráfico (por ejemplo, un archivo).

Campo de imagen

Un campo de Definición de Document que contiene una imagen. Precisión Una característica que permite al usuario evaluar la calidad de la clasificación automática. Se calcula dividiendo el número de documentos de clase A identificados correctamente por el número total de documentos identificados como clase A, tanto correcta como incorrectamente.

Prerreconocimiento

Reconocimiento integral del texto de las imágenes de documentos para facilitar la detección de campos mediante una Definición de Document.

Rendimiento de procesamiento

La cantidad media de páginas, documentos o lotes procesados durante un período de tiempo determinado.

(Distribuido) Etapa de procesamiento

(Distribuido) Etapa del flujo de trabajo en la que se realizan determinadas acciones sobre un documento o lote (ya sea de forma automática o por un Operador). (Administrador, Developer, Distribuido) Consulte Etapas de procesamiento y colas.

Carácter prohibido

Indicar estos caracteres puede aumentar considerablemente la velocidad y la calidad del reconocimiento. Por ejemplo, si va a reconocer textos escritos solo con letras mayúsculas, indique todas las letras minúsculas como caracteres prohibidos.

Proyecto

Un proyecto es un entorno único que reúne los lotes de documentos y la configuración necesarios para procesarlos, como las Definiciones de Document, los perfiles de importación, etc. (Administrador) Consulte Creación de un proyecto.

(Distributed) Q

(Distribuido) Cola

(Distribuido) Documentos agrupados en tareas y/o lotes, a la espera de ser procesados en una determinada etapa de procesamiento. (Administrador, Developer, Distribuido) Consulte Etapas de procesamiento y colas.

R

Formulario ráster

Un formulario en el que los campos de información aparecen como rectángulos blancos sobre un fondo gris compuesto por líneas de trama o por rectángulos delimitados por líneas de trama.

Línea de trama

Una línea compuesta por puntos equidistantes. Exhaustividad Una característica que permite al usuario evaluar la calidad de la clasificación automática. Se calcula dividiendo el número de documentos de la clase A identificados correctamente por el número total de documentos de la clase A.

Reconocimiento

Proceso de emparejamiento entre elementos de imagen y caracteres específicos.

Idioma de reconocimiento

Idioma que ABBYY FlexiCapture utiliza para el reconocimiento de texto. Clases de referencia Una clase de referencia es la clase que un experto ha asignado a un documento durante la clasificación manual. Tanto una sección de un documento como una variante de documento pueden constituir una clase de referencia.

Reference layout

Un layout creado por el usuario que sirve de referencia para los layouts creados automáticamente. Esta comparación permite evaluar hasta qué punto el programa detecta correctamente las regiones de campo.

(Administrador) Expresión regular

(Administrador) Descripción de la estructura de una palabra o de cualquier valor introducido mediante un lenguaje especial. El programa permite especificar no solo el conjunto de caracteres permitidos, sino también la estructura del contenido de los campos. Puede describir la estructura con una expresión regular al establecer restricciones para un campo de texto o al crear un tipo de datos personalizado. Consulte Alfabeto utilizado en expresiones regulares.

Resolución

Parámetro de imagen. La resolución se mide en puntos por pulgada (dpi). Clases de resultado Una clase de resultado es una clase asignada a un documento durante una clasificación automática.

Validación de reglas

Comprobación automática de los datos reconocidos según reglas predefinidas. Consulte Validación de reglas.

Reglas

Ciertas condiciones aplicadas a los datos de los campos y comprobadas automáticamente por el programa. (Administrador, Verificación) Consulte validación de reglas.

S

Escaneo

Proceso de obtener una imagen electrónica de un formulario en papel con un escáner. Segmento Fragmento de texto compuesto por uno o más párrafos que contiene datos que deben extraerse. Un segmento también puede ser un campo que deba extraerse (por ejemplo, las condiciones para dar por terminado un acuerdo). Segmentación Proceso de identificar segmentos. La segmentación precede a la extracción de información y resulta útil en el caso de documentos extensos, ya que limita la búsqueda de entidades a fragmentos de texto específicos.

Sección

Una parte lógicamente distinta de un documento que contiene un conjunto de campos extraíbles. Las secciones se usan para diversos fines durante el proceso de reconocimiento, como componer documentos a partir de páginas. Las secciones pueden incluir una sola página o varias páginas, y pueden ser fijas o flexibles. (Administrador) Consulte Creación de Definiciones de Document para documentos de varias páginas.

Documento semiestructurado

Documento que contiene un conjunto de campos de información cuyo diseño, número y estructura pueden variar considerablemente entre distintas instancias del documento. Consulte Qué tipos de documentos se pueden procesar con ABBYY FlexiCapture.

Separador

Un elemento de un formulario legible por máquina que representa una línea vertical u horizontal.

Campo de servicio

Un campo que no está asociado a ninguna región en la imagen del documento. Los valores de los campos de servicio se determinan automáticamente según los datos del origen indicados en sus propiedades. (Administrador) Consulte Campos de servicio.

Conjunto de caracteres permitidos

Este conjunto está determinado por el tipo de dato. Es decir, el tipo de datos asociado a un campo determina el conjunto de caracteres utilizado durante el reconocimiento.Además de seleccionar los caracteres incluidos en este conjunto, puede configurar parámetros adicionales para restringirlo. Por ejemplo, puede especificar:
  • Caracteres que sabe que no aparecerán al reconocer un determinado campo: caracteres prohibidos (por ejemplo, puede especificar todas las letras minúsculas como prohibidas para un campo en el que solo pueden aparecer caracteres en mayúscula).
  • Caracteres que pueden aparecer dentro de las palabras sin afectar a su verificación: caracteres ignorados (por ejemplo, guiones, tildes, etc.).

Texto simple

Un tipo de marcado de texto en el que el texto se inserta en un bloque sin delimitadores.

Entrada de datos en un solo flujo

Extracción automatizada de datos de documentos analógicos (impresos) y digitales (imágenes escaneadas).

Entrada de documentos de un solo flujo

Conversión automatizada de documentos impresos a formato electrónico.

SLA (acuerdo de nivel de servicio)

Un acuerdo que regula la prestación de servicios de TI. En ABBYY FlexiCapture 12, un SLA regula los plazos de procesamiento de los lotes.

Elementos estáticos

Elementos no reconocibles destinados al emparejamiento y la identificación de la Definición de Document. Dichos elementos son: anclajes, texto de anclaje, separadores, códigos de barras de anclaje.

Sección de resumen

La sección de resumen es una sección de Definición de Document que muestra todos los campos principales de un conjunto de documentos. Esto facilita mucho la revisión de los documentos de un conjunto por parte de los Operadores, ya que pueden ver todos los errores y los datos con baja confianza en un solo lugar y abrir solo los documentos que deban revisarse, en lugar de abrir cada documento.

T

Tabla

Datos organizados en una cuadrícula bidimensional que no necesariamente es visible. El programa procesa tablas compuestas por columnas con datos del mismo tipo y filas repetidas.

Campo de tabla

Un campo de Definición de Document que contiene una tabla. Es un campo compuesto en el que cada columna de la tabla representa un conjunto de campos del mismo tipo: texto, marcas de verificación, códigos de barras o imágenes.

(Distributed) Tarea

(Distributed) Conjunto de documentos del mismo lote que se procesan conjuntamente. Según la configuración del proyecto y la etapa de procesamiento, una tarea puede contener un número distinto de documentos. Si una etapa de procesamiento requiere que un lote se procese en su totalidad, el lote completo se incluye en la tarea. Cuando las tareas de verificación se generan automáticamente, cada tarea contiene 10 documentos (si un lote contiene menos de 10 documentos no verificados, todos se procesan como una sola tarea).

Tenant

Una instancia aislada de ABBYY FlexiCapture que puede utilizarse de manera independiente del resto de usuarios.

Lotes de prueba

Lotes de documentos diseñados para probar y configurar la Definición de Document. Se utilizan copias locales de los lotes de documentos para procesar los lotes de prueba. (Administrador) Consulte lotes de documentos.

Campo de texto

Elemento de formulario legible por máquina diseñado para introducir texto al completar un formulario.

Marcado del campo de texto

Un elemento gráfico que delimita un campo de texto: marco delimitador, peine, línea.

Marcado de texto

El diseño de una región de la página destinada a la entrada de texto. (Administrador) Consulte ejemplos de formato de texto en el tema Campo de entrada.

Orientación del texto

Orientación del texto en un campo con respecto a la página.

Reconocimiento de texto (OCR, ICR)

Conversión de una imagen en texto.

Muestra de texto

Archivo que contiene muestras de todos los caracteres del alfabeto.

Entrenamiento [Definición de Document]

Una función de FCFORINVOICES que permite a los usuarios entrenar el programa para capturar datos de determinados tipos de facturas. El entrenamiento mejora la calidad de la captura de datos y puede realizarse tanto al configurar el programa como durante el procesamiento de facturas.

Lotes de entrenamiento

Lote de documentos utilizado para entrenar y probar una Definición de Document para una variante de documento específica. Entrenar una Definición de Document con un lote de entrenamiento crea una variante de FlexiLayout. Consulte también lote de documentos, variante de documento, variante de FlexiLayout.

Mecanografiado

Un tipo de texto reconocible que representa un texto impreso a máquina.

U

Texto subrayado

Diccionario de usuario

Un diccionario auxiliar creado por el usuario que contiene palabras que no figuran en los diccionarios integrados. Los diccionarios integrados pueden complementarse con un diccionario de usuario para mejorar la calidad de la captura de datos. Por lo general, un diccionario de usuario contiene términos especializados, abreviaturas, nombres de empresas, etc.

Región no reconocible

Una región de la imagen excluida del reconocimiento. Se requiere una región no reconocible para excluir una región con texto explicativo o una imagen que dificulta el reconocimiento de campos. (Administrador) Consulte Excluir una región del reconocimiento.

Documento no estructurado

Documento que contiene información presentada en formato libre. Algunos ejemplos de este tipo de documentos son contratos, cartas, pedidos o gráficos. (Administrador) Consulte Creación de Definiciones de Document para documentos no estructurados y semiestructurados.

V

Proveedor

Persona jurídica o física que vende bienes o presta servicios. Los proveedores emiten facturas por los bienes o servicios que suministran. Los datos de las facturas pueden capturarse mediante FCFORINVOICES.

Verificación

La verificación consiste en comprobar que se hayan reconocido los datos, que las páginas se hayan agrupado correctamente en documentos y que las reglas no hayan devuelto errores. (Standalone) La verificación se realiza en la Operator Station. (Distributed) La verificación se realiza en la Data Verification Station (donde se verifica la exactitud del reconocimiento) y en la Verification Station (donde se pueden realizar todo tipo de comprobaciones). (Administrator, Verification) consulte Verification.

W

Lotes de trabajo

Lotes de documentos destinados a la captura de datos. Solo se utilizan las Definiciones de Document publicadas para procesar los lotes de trabajo. (Administrador) Consulte Lotes de documentos.

Estilo de escritura

Esta opción se utiliza para configurar el estilo de escritura de los caracteres en letra de imprenta en formularios. La elección del estilo de escritura depende de la región en la que se procesen los formularios (Rusia, Alemania, la República Checa, USA, etc.).

X

XFD

XML Form Definition (*.xfd), un formato de archivo especial para formularios diseñado con ABBYY FormDesigner. Un archivo con formato XML Form Definition se utiliza para crear Definiciones de Document en ABBYY FlexiCapture.