A
ABBYY FlexiCapture
Una solución de software para la captura de datos en un flujo único a partir de diversos tipos de documentos estructurados (formularios fijos), semiestructurados (formularios y documentos flexibles) y no estructurados (documentos de formato libre).ABBYY FlexiLayout Studio
Un programa que permite crear un FlexiLayout de la estructura del documento, que luego puede utilizarse para el reconocimiento automático de documentos.ABBYY FormDesigner
ABBYY FormDesigner se utiliza para diseñar plantillas de formularios legibles por máquina. Una vez reproducidos y cumplimentados, estos formularios pueden procesarse con el sistema automatizado de captura de formularios ABBYY FlexiCapture. El diseño de formularios es una etapa importante, ya que la calidad de la plantilla diseñada (su legibilidad por máquina) determina la eficacia de todas las etapas posteriores del procesamiento: escaneo, reconocimiento, verificación y exportación.FCFORINVOICES
ADF
Administrador
Alfabeto
Anclaje
Details...
Details...
Los anclajes son elementos especiales del diseño de formularios que el sistema utiliza para realizar el emparejamiento después del escaneo (elimina la inclinación, compensa los defectos lineales y no lineales del escaneo y calcula la ubicación de los bloques). Los anclajes más fiables son los cuadrados negros, que normalmente se encuentran en las esquinas de un formulario. Si la imagen no contiene anclajes especiales, pueden utilizarse otros elementos estáticos para el emparejamiento de la Definición de Document: separadores, es decir, líneas verticales u horizontales, como líneas de tabla, marcos, etc., o texto estático claro, como el encabezado del formulario, las etiquetas de los campos, la información explicativa, etc. La opción Use for Document Definition matching debe estar habilitada para los elementos estáticos que se utilicen en el emparejamiento de la Definición de Document.
Código de barras de anclaje
Elemento estático que representa un código de barras no destinado a la extracción de datos. Un código de barras de anclaje puede utilizarse para el emparejamiento o la identificación de una Definición de Document.Texto de anclaje
Elemento estático que representa un texto presente en un formulario en blanco y que no está destinado a la extracción de datos. Puede ser cualquier texto explicativo o encabezado. El texto de anclaje puede utilizarse para el emparejamiento o la identificación de la Definición de Document.Ángulo
Un anclaje en forma de ángulo.Anexo
Páginas que no contienen campos, pero que se incluyen en el ensamblado de documentos. No se extraen datos de estas páginas, pero pueden guardarse como imágenes o archivos PDF con capacidad de búsqueda. (Administrador) Consulte Creación de Definiciones de Document para documentos con anexos.Error de ensamblado
Aprendizaje automático
B
Código de barras
Elemento de formulario legible por máquina representado por barras blancas y negras alternas de cierta longitud que codifican información digital. Un código de barras en un documento puede usarse para extraer información (campo de código de barras) o para localizar e identificar una Definición de Document (código de barras de anclaje).Campo de código de barras
Un campo de Definición de Document que contiene un código de barras para su reconocimiento.Reconocimiento de códigos de barras
Conversión de la imagen gráfica de un código de barras en números o texto.Tipo de lote
Formulario de líneas en blanco y negro
Cuadrado negro
Brillo
Un umbral de sensibilidad a la luz que determina a partir de qué punto el escáner interpreta los semitonos en escala de grises como blanco.C
Marca de verificación
Elemento de formulario legible por máquina que contiene una marca (tilde, cruz, punto, tachado con tinta, etc.) realizada por la persona que rellena el formulario.Campo de marca de verificación
Grupo de marcas de verificación
Un elemento de un formulario legible por máquina que agrupa varias marcas de verificación situadas próximas entre sí. En un grupo de marcas de verificación se pueden seleccionar una o varias marcas de verificación.Campo de grupo de marcas de verificación
Campo de una Definición de Document que contiene un grupo de marcas de verificación.Clasificador
Proyecto creado en FlexiLayout Studio y destinado a la identificación preliminar de páginas antes de aplicar las Definiciones de Document, así como a seleccionar el FlexiLayout o la alternativa de layout correspondientes.F-measure del clasificador
Una medida combinada de precisión y recall para la clasificación de documentos. Se expresa como un valor entre 0 y 1 o como un porcentaje entre 0 % y 100 %. El F-measure de una categoría se calcula como (β^2 + 1) * P * R / (β^2 * P + R), donde P es la precisión de la categoría, R es el recall de la categoría y β es un parámetro libre que determina la ponderación relativa de la precisión y el recall para el modelo dado. El valor máximo = 1 (100 %) cuando P = R = 1 (100 %). El F-measure de un lote de prueba o entrenamiento se calcula como (β^2 + 1) * P * R / (β^2 * P + R), donde P es la precisión del lote de prueba o entrenamiento, R es el recall del lote de prueba o entrenamiento y β es un parámetro libre que determina la ponderación relativa de la precisión y el recall para el modelo dado.Página de códigos
Formulario con fondo de color
Contraste
Relación entre el brillo de las zonas más oscuras y las más claras de una imagen.Control
Marca de verificación corregida
Cruz
Un anclaje en forma de cruz.Tipo de dato personalizado
Tipo de dato definido por el usuario. (Administrador) Consulte Crear tipos de datos personalizados.D
Búsqueda en la base de datos
Conjunto de datos
Tipo de dato
Detalles...
Detalles...
Una de las características del campo es el tipo de dato: número, fecha, texto, apellido, nombre, dirección, etc. Un tipo de dato define el conjunto de palabras que pueden aparecer en un campo determinado. El tipo de dato es un parámetro de reconocimiento importante que influye en la calidad del reconocimiento. Un tipo de dato correctamente especificado puede reducir significativamente el número de caracteres reconocidos de forma incorrecta.
Archivo de descripción
Archivo auxiliar que define cómo se forma un lote al añadir imágenes desde una carpeta de seguimiento. (Administrador) Para obtener más información, consulte Archivo de descripción.Dictionary
Details...
Details...
Se especifica un diccionario al crear un tipo de datos. Por ello, el tipo de datos asociado a un campo determina el diccionario que se utiliza durante el reconocimiento y la verificación. Además de los tipos de datos predeterminados con diccionarios ya preparados, el programa permite adjuntar tipos de datos creados a partir de diccionarios personalizados. Puede introducir manualmente los datos del diccionario o cargarlos desde un archivo.
Documento
Lote de documentos
Conjunto de documentos agrupados por el usuario. Normalmente, un lote contiene la pila de documentos escaneados en una sola pasada o importados desde una carpeta concreta. (Administrador) Consulte Lotes de documentos.Clase de documento
Datos del documento
Datos capturados después del procesamiento (reconocimiento, verificación y edición de los resultados del reconocimiento) de las imágenes de las páginas del documento.Definición de Document
Una Definición de Document define los principios de identificación y procesamiento de un tipo específico de documento y contiene:- La estructura del documento, es decir, una descripción del orden permitido de las páginas para los documentos de este tipo, que define cómo deben ensamblarse los documentos
- Definiciones de secciones del documento
- Una lista de reglas que deben cumplir los datos de los campos
- La ubicación de los campos y sus firmas en la ventana de datos (vista del formulario de datos)
- Configuración de exportación de documentos
- Configuración de procesamiento de documentos
Identificación de la Definición de Document
Emparejamiento de Definición de Document
Publicación de la Definición de Document
Permite acceder a una nueva versión de la Definición de Document una vez editada. Una versión publicada participa en el procesamiento de documentos de lotes de trabajo, mientras que una versión local no publicada solo puede participar en el procesamiento de Definiciones de Document de lotes de prueba. (Administrador) Consulte Edición y publicación de una Definición de Document.Sección de la Definición de Document
Identificación de documentos
Conjunto de documentos
Texto del documento
Tipo de documento
Variante de documento
Impresora matricial
Un tipo de texto reconocible que representa texto impreso con una impresora matricial.dpi
E
Entidad
Variable de entorno
Error / advertencia
El error / la advertencia se produce cuando los datos extraídos de uno o más campos no cumplen las reglas que se aplican durante las comprobaciones automáticas o no coinciden con el formato especificado. Hay dos tipos diferentes de errores y advertencias:- errores / advertencias de un solo campo se generan mediante reglas y formatos que afectan a un solo campo;
- errores / advertencias de varios campos se generan mediante reglas que afectan a varios campos.
Texto explicativo
Elemento de formulario legible por máquina que representa un texto descriptivo (nombre del formulario, nombres de los campos, explicaciones de los campos, etc.).Exportación
Proceso de transferencia de datos procesados a un sistema de información externo o a un archivo.Perfil de exportación
Conjunto de opciones de configuración que determina qué se hace con los datos procesados: el formato de los archivos de salida, la ruta de salida, las condiciones de exportación, etc.Base de datos externa
F
Campo
Elemento del documento destinado a la extracción de datos. Los campos pueden ser simples (sin estructura interna) o compuestos, como el campo de tipo tabla, donde cada celda puede considerarse un campo subordinado independiente de la tabla. (Administrador) Consulte Creación de campos de Definición de Document.Región del campo
Verificación de campos
Detalles...
Detalles...
En el modo de verificación de campos, los caracteres dudosos se revisan en el contexto del campo completo. Los campos con la opción Enviar a verificación de campos habilitada se envían a verificación de campos. Recomendamos enviar a verificación de campos aquellos campos cuyo conjunto de valores se conoce o puede determinarse fácilmente. Algunos ejemplos de estos campos son los nombres de países o ciudades: sabemos qué valores puede tener este campo.
Campo con varias instancias
Campo con varias regiones
Campo sin región
Un campo detectado en una Definición de Document, pero sin región en la imagen. (Administrador) Consulte Campos sin región.Formulario fijo
Documento con campos de información fijos cuyo formato, número y disposición están estrictamente definidos y no cambian de un documento a otro.Definición de Document fija
Una definición de un documento o de una de sus secciones diseñada para procesar formularios fijos. Los campos de una Definición de Document fija tienen ubicaciones fijas.FlexiLayout
Descripción de la estructura de un documento semiestructurado. Esta descripción se crea con ABBYY FlexiLayout Studio y se exporta a ABBYY FlexiCapture. Formato de archivo: *.afl. FlexiLayout es un tipo de instrucción para detectar e identificar campos en un formulario flexible.Variante de FlexiLayout
Definición de Document flexible
Definición de un documento o de su sección diseñada para procesar documentos semiestructurados. Se crea adjuntando un FlexiLayout. Los campos de esta Definición de Document no tienen posiciones fijas. Se detectan con la ayuda de un FlexiLayout. (Administrador) Consulte Creación de una Definición de Document para el procesamiento de documentos semiestructurados.Formulario
Documento compuesto por una o varias páginas, diseñado para que una persona lo complete a mano o por cualquier otro medio de impresión.Texto enmarcado
Tipo de marcación de texto en la que un marco delimitador encierra el texto.Mostrar...
Mostrar...

Texto en un marco delimitador sobre un peine
Mostrar...
Mostrar...

G
Formulario con fondo gris
Verificación en grupo
Detalles...
Detalles...
Los campos que tienen habilitada la opción Enviar a verificación en grupo se envían a verificación en grupo. Recomendamos enviar a verificación en grupo los caracteres de los campos numéricos, así como las marcas de verificación.
H
Texto manuscrito en letra de imprenta
Un tipo de texto reconocible que corresponde a texto escrito a mano en caracteres de imprenta separados.Texto escrito a mano
Un tipo de texto reconocible cuyas letras están unidas total o parcialmente. Nota: Actualmente, solo se puede reconocer texto escrito a mano en inglés.Carpeta de seguimiento
Una carpeta en el disco duro de un equipo local o remoto que se utiliza para importar imágenes. Normalmente se usa para la carga periódica de imágenes sin la intervención del usuario. (Administrador) Consulte Perfiles de importación de imágenes.I
Identificador
Elemento estático que se utiliza para seleccionar con certeza una Definición de Document entre varias Definiciones de Document con la misma ubicación de los anclajes. La opción Use for Document Definition identification debe estar habilitada en las propiedades de dichos elementos estáticos.Proveedor de identidad
Un sistema de terceros, como Azure AD, OneLogin u Okta, que gestiona la información de identidad y proporciona servicios de autenticación a sus clientes, lo que permite al usuario final acceder a todos los recursos autorizados de su red local introduciendo sus credenciales solo una vez.Carácter ignorado
Detalles...
Detalles...
Estos caracteres se excluyen de las palabras; es decir, las palabras se asignan a un tipo de datos concreto sin estos caracteres.
Image
Una imagen electrónica de una página escaneada de un documento en papel.Eliminación de motas de la imagen
Eliminación del ruido de la imagen. El ruido puede aparecer durante el escaneado, y se recomienda eliminarlo para mejorar el reconocimiento de datos. Durante la eliminación de motas, el programa también elimina puntos del fondo o líneas de borde de formularios rasterizados.Importación de imágenes
Proceso de agregar imágenes a un lote para su procesamiento. La importación puede realizarse agregando imágenes desde archivos, desde un escáner o mediante perfiles de importación. (Administrador, Verificación) Consulte Añadir imágenes de página.Rotación de la imagen
Rotación de una imagen en torno a su centro.Perfil de importación
Conjunto de opciones que se utiliza para agregar imágenes a un lote: origen de importación, opciones de procesamiento de imágenes, opciones de limpieza de Hot Folder, etc. (Administrador) Consulte Perfiles de importación de imágenes.Carácter reconocido de forma incorrecta
Estado que se asigna automáticamente a un carácter durante el proceso de reconocimiento si se ha reconocido con un grado considerable de incertidumbre.Campo de índice
Un campo cuyo valor se usa para indexar documentos con fines de ordenación y búsqueda. (Administrador) Consulte Campos de índice.Imagen invertida
Factura
ICR, Reconocimiento inteligente de caracteres
K
Campo clave
Un campo que permite comprobar automáticamente la agrupación de páginas en documentos. Los valores de los campos clave deben ser idénticos en todas las páginas del mismo documento.L
Idioma (local)
Propiedad de un campo que determina el idioma de escritura y los parámetros regionales correspondientes (como el formato de la fecha o de la dirección).Diseño
Letras en marcos delimitadores
Mostrar...
Mostrar...

Letras en marcos delimitadores separados
Mostrar...
Mostrar...

Letras sobre un peine
Mostrar...
Mostrar...

M
Texto impreso
Un tipo de texto reconocible que se ha impreso mediante equipos tipográficos o con una impresora láser o de inyección de tinta con una resolución mínima de 300 dpi.Formulario legible por máquina
Campo de entrada manual
Un campo de Definición de Document que contiene texto ilegible (por ejemplo, texto compuesto por letras fusionadas) y que debe introducirse con el teclado.MRC (Mixed Raster Content)
Un método de compresión utilizado para imágenes que contienen tanto texto como fragmentos ráster. La imagen se analiza y se divide en fragmentos, y para cada uno se selecciona un algoritmo de compresión óptimo. Este enfoque ofrece mejores tasas de compresión sin perder la calidad visual de las imágenes.Texto monoespaciado
Tipo de marcado de texto en el que cada letra se encuentra dentro de un marco delimitador de la misma altura y anchura, pero cuyo borde desaparece durante el escaneo.Documento de varias páginas
Un documento compuesto por varias páginas.Multitenencia
N
NER (Reconocimiento de entidades nombradas) Una tarea de extracción de información basada en la búsqueda de atributos en texto no estructurado y en su clasificación en categorías predefinidas. NLP (Procesamiento del lenguaje natural) Un subcampo de la inteligencia artificial y la lingüística matemática. Se ocupa del análisis y la síntesis computacional de los lenguajes naturales. Una de sus posibles aplicaciones es la extracción de información relevante a partir de texto. Incluye lo siguiente: traducción automática, chatbots, clasificación, análisis de sentimiento, extracción de datos, etc.Modelo de NLP
O
OCR (Reconocimiento óptico de caracteres)
OMR (Reconocimiento óptico de marcas)
Operador
Rol de operador
Superposición
P
Página
Imagen de la página de un documento en papel y de los resultados de su procesamiento.Diseño de página
Esquema que muestra la ubicación de los campos en una imagen.Orientación de la página
Posición de la página con respecto a la alineación estándar: de arriba abajo, de izquierda a derecha. La orientación de la página puede determinarse automáticamente durante el reconocimiento de la imagen de página; para ello, ABBYY FlexiCapture le permite especificar las orientaciones posibles.Imagen
Elemento de un formulario de lectura mecánica que no se somete a reconocimiento, sino que está destinado a exportarse como un objeto gráfico (por ejemplo, un archivo).Campo de imagen
Un campo de Definición de Document que contiene una imagen. Precisión Una característica que permite al usuario evaluar la calidad de la clasificación automática. Se calcula dividiendo el número de documentos de clase A identificados correctamente por el número total de documentos identificados como clase A, tanto correcta como incorrectamente.Prerreconocimiento
Rendimiento de procesamiento
(Distribuido) Etapa de procesamiento
Carácter prohibido
Detalles...
Detalles...
Indicar estos caracteres puede aumentar considerablemente la velocidad y la calidad del reconocimiento. Por ejemplo, si va a reconocer textos escritos solo con letras mayúsculas, indique todas las letras minúsculas como caracteres prohibidos.
Proyecto
Un proyecto es un entorno único que reúne los lotes de documentos y la configuración necesarios para procesarlos, como las Definiciones de Document, los perfiles de importación, etc. (Administrador) Consulte Creación de un proyecto.(Distributed) Q
(Distribuido) Cola
R
Formulario ráster
Línea de trama
Una línea compuesta por puntos equidistantes. Exhaustividad Una característica que permite al usuario evaluar la calidad de la clasificación automática. Se calcula dividiendo el número de documentos de la clase A identificados correctamente por el número total de documentos de la clase A.Reconocimiento
Proceso de emparejamiento entre elementos de imagen y caracteres específicos.Idioma de reconocimiento
Reference layout
Un layout creado por el usuario que sirve de referencia para los layouts creados automáticamente. Esta comparación permite evaluar hasta qué punto el programa detecta correctamente las regiones de campo.(Administrador) Expresión regular
(Administrador) Descripción de la estructura de una palabra o de cualquier valor introducido mediante un lenguaje especial. El programa permite especificar no solo el conjunto de caracteres permitidos, sino también la estructura del contenido de los campos. Puede describir la estructura con una expresión regular al establecer restricciones para un campo de texto o al crear un tipo de datos personalizado. Consulte Alfabeto utilizado en expresiones regulares.Resolución
Parámetro de imagen. La resolución se mide en puntos por pulgada (dpi). Clases de resultado Una clase de resultado es una clase asignada a un documento durante una clasificación automática.Validación de reglas
Comprobación automática de los datos reconocidos según reglas predefinidas. Consulte Validación de reglas.Reglas
Ciertas condiciones aplicadas a los datos de los campos y comprobadas automáticamente por el programa. (Administrador, Verificación) Consulte validación de reglas.S
Escaneo
Proceso de obtener una imagen electrónica de un formulario en papel con un escáner. Segmento Fragmento de texto compuesto por uno o más párrafos que contiene datos que deben extraerse. Un segmento también puede ser un campo que deba extraerse (por ejemplo, las condiciones para dar por terminado un acuerdo). Segmentación Proceso de identificar segmentos. La segmentación precede a la extracción de información y resulta útil en el caso de documentos extensos, ya que limita la búsqueda de entidades a fragmentos de texto específicos.Sección
Una parte lógicamente distinta de un documento que contiene un conjunto de campos extraíbles. Las secciones se usan para diversos fines durante el proceso de reconocimiento, como componer documentos a partir de páginas. Las secciones pueden incluir una sola página o varias páginas, y pueden ser fijas o flexibles. (Administrador) Consulte Creación de Definiciones de Document para documentos de varias páginas.Documento semiestructurado
Documento que contiene un conjunto de campos de información cuyo diseño, número y estructura pueden variar considerablemente entre distintas instancias del documento. Consulte Qué tipos de documentos se pueden procesar con ABBYY FlexiCapture.Separador
Un elemento de un formulario legible por máquina que representa una línea vertical u horizontal.Campo de servicio
Conjunto de caracteres permitidos
Detalles...
Detalles...
Este conjunto está determinado por el tipo de dato. Es decir, el tipo de datos asociado a un campo determina el conjunto de caracteres utilizado durante el reconocimiento.Además de seleccionar los caracteres incluidos en este conjunto, puede configurar parámetros adicionales para restringirlo. Por ejemplo, puede especificar:
- Caracteres que sabe que no aparecerán al reconocer un determinado campo: caracteres prohibidos (por ejemplo, puede especificar todas las letras minúsculas como prohibidas para un campo en el que solo pueden aparecer caracteres en mayúscula).
- Caracteres que pueden aparecer dentro de las palabras sin afectar a su verificación: caracteres ignorados (por ejemplo, guiones, tildes, etc.).
Texto simple
Un tipo de marcado de texto en el que el texto se inserta en un bloque sin delimitadores.Entrada de datos en un solo flujo
Extracción automatizada de datos de documentos analógicos (impresos) y digitales (imágenes escaneadas).Entrada de documentos de un solo flujo
Conversión automatizada de documentos impresos a formato electrónico.SLA (acuerdo de nivel de servicio)
Elementos estáticos
Elementos no reconocibles destinados al emparejamiento y la identificación de la Definición de Document. Dichos elementos son: anclajes, texto de anclaje, separadores, códigos de barras de anclaje.Sección de resumen
T
Tabla
Campo de tabla
(Distributed) Tarea
Tenant
Lotes de prueba
Lotes de documentos diseñados para probar y configurar la Definición de Document. Se utilizan copias locales de los lotes de documentos para procesar los lotes de prueba. (Administrador) Consulte lotes de documentos.Campo de texto
Marcado del campo de texto
Marcado de texto
El diseño de una región de la página destinada a la entrada de texto. (Administrador) Consulte ejemplos de formato de texto en el tema Campo de entrada.Orientación del texto
Orientación del texto en un campo con respecto a la página.Reconocimiento de texto (OCR, ICR)
Conversión de una imagen en texto.Muestra de texto
Entrenamiento [Definición de Document]
Lotes de entrenamiento
Mecanografiado
Un tipo de texto reconocible que representa un texto impreso a máquina.U
Texto subrayado
Mostrar...
Mostrar...

Diccionario de usuario
Un diccionario auxiliar creado por el usuario que contiene palabras que no figuran en los diccionarios integrados. Los diccionarios integrados pueden complementarse con un diccionario de usuario para mejorar la calidad de la captura de datos. Por lo general, un diccionario de usuario contiene términos especializados, abreviaturas, nombres de empresas, etc.Región no reconocible
Una región de la imagen excluida del reconocimiento. Se requiere una región no reconocible para excluir una región con texto explicativo o una imagen que dificulta el reconocimiento de campos. (Administrador) Consulte Excluir una región del reconocimiento.Documento no estructurado
Documento que contiene información presentada en formato libre. Algunos ejemplos de este tipo de documentos son contratos, cartas, pedidos o gráficos. (Administrador) Consulte Creación de Definiciones de Document para documentos no estructurados y semiestructurados.V
Proveedor
Verificación
La verificación consiste en comprobar que se hayan reconocido los datos, que las páginas se hayan agrupado correctamente en documentos y que las reglas no hayan devuelto errores. (Standalone) La verificación se realiza en la Operator Station. (Distributed) La verificación se realiza en la Data Verification Station (donde se verifica la exactitud del reconocimiento) y en la Verification Station (donde se pueden realizar todo tipo de comprobaciones). (Administrator, Verification) consulte Verification.W
Lotes de trabajo
Lotes de documentos destinados a la captura de datos. Solo se utilizan las Definiciones de Document publicadas para procesar los lotes de trabajo. (Administrador) Consulte Lotes de documentos.Estilo de escritura
Details...
Details...
Esta opción se utiliza para configurar el estilo de escritura de los caracteres en letra de imprenta en formularios. La elección del estilo de escritura depende de la región en la que se procesen los formularios (Rusia, Alemania, la República Checa, USA, etc.).
