Preprocesamiento de imágenes

¿Por qué mejorar las imágenes?

La mejora de la calidad de las imágenes tiene un doble objetivo. Por un lado, debemos mejorar la calidad de las imágenes para hacerlas más adecuadas para el Reconocimiento óptico de caracteres (OCR).

Por otro lado, debemos mejorar el aspecto de las imágenes, lo cual es necesario, por ejemplo, cuando almacenamos imágenes de documentos en archivos.

Dado que las tecnologías de ABBYY se centran en el análisis y reconocimiento de documentos, el sistema incluye un conjunto de potentes tecnologías de preprocesamiento de imágenes: binarización adaptativa, corrección de distorsiones, enderezamiento de líneas de texto, división de páginas enfrentadas, entre otras. No se necesitan herramientas de terceros para obtener resultados precisos de OCR. ABBYY ofrece un conjunto completo de tecnologías de preprocesamiento orientadas al OCR.

Al recibir las imágenes, ABBYY FineReader Engine realiza diversas funciones de preprocesamiento para mejorar la calidad de las imágenes de los documentos de cara a su posterior reconocimiento o archivado:


	Esta función de procesamiento de documentos es especialmente importante para la entrada masiva de imágenes cuando se desconoce la dirección en que se digitalizan las páginas del documento o esta puede variar. El sistema detecta automáticamente la orientación de cada página y la corrige si es necesario.
	Se utiliza para digitalizar libros en doble página, tanto la página izquierda como la derecha. La calidad del reconocimiento es mayor si la imagen se divide en dos, de modo que cada mitad corresponda a una sola página del libro. El reconocimiento y el análisis de maquetación se realizan entonces por separado para cada página, junto con la corrección de inclinación si es necesario.
	Es una función esencial de procesamiento de documentos que se aplica a documentos digitalizados que requieren compensación por inclinación de imagen. No requiere bordes ni líneas de referencia. ABBYY FineReader Engine 12 ofrece varios métodos para corregir la inclinación de imágenes: mediante pares de cuadrados negros, líneas o líneas de texto.
	Al capturar texto de libros escaneados o fotografiados, las líneas de texto pueden quedar irregulares y ser difíciles de procesar mediante Reconocimiento óptico de caracteres (OCR). Las tecnologías de ABBYY ofrecen algoritmos especiales que corrigen la inclinación y enderezan las líneas de texto para lograr un reconocimiento preciso.
	Al digitalizar documentos de calidad baja o media, es posible obtener imágenes con mucho ruido, con gran cantidad de puntos o manchas. Estas manchas, cuando aparecen cerca de letras o números, pueden afectar la calidad del OCR. Esta función elimina dicho ruido. El usuario puede especificar el tamaño de las manchas que desea eliminar. Puede aplicarse tanto a una imagen completa como a cualquier bloque (o zona) individual de la imagen.
	Esta tecnología identifica automáticamente fotografías digitales y corrige las distorsiones que suelen introducir las cámaras digitales. El sistema detecta los defectos típicos de las imágenes digitales, como líneas de texto distorsionadas, distorsiones 3D trapezoidales, enfoque deficiente, manchas, zonas oscurecidas en páginas enfrentadas de libros gruesos, reflejos, ruido ISO, etc. El sistema corrige estos defectos de forma automática, por lo que el usuario no necesita recurrir a aplicaciones de terceros para retocar las fotografías.
	La tecnología de filtrado de textura ayuda a eliminar el “ruido” de fondo, como el color y la textura, lo que mejora la precisión en documentos difíciles de leer, como papel de periódico, documentos en color, faxes y fotocopias.


	Es el proceso de convertir imágenes a blanco y negro, eliminar el ruido, el fondo y las texturas, y obtener texto nítido. Este proceso garantiza la mejor calidad de Reconocimiento óptico de caracteres (OCR). Los parámetros necesarios se determinan para cada fragmento por separado. En el caso de papel de periódico fino, el texto impreso en el reverso puede verse en los escaneos. La binarización adaptativa elimina este texto. La innovadora tecnología de binarización adaptativa ajusta dinámicamente el umbral de brillo de cada fragmento de imagen durante el reconocimiento. Al aplicar parámetros de reconocimiento individuales, produce resultados precisos en documentos con fondos y texturas de contraste variable en escala de grises o en color.
	Es la binarización de imágenes en escala de grises mediante puntos muy pequeños. Esto mejora el aspecto del documento, ya que parece tener más tonos.

Es el proceso de convertir imágenes a blanco y negro, eliminar el ruido, el fondo y las texturas, y obtener texto nítido. Este proceso garantiza la mejor calidad de Reconocimiento óptico de caracteres (OCR). Los parámetros necesarios se determinan para cada fragmento por separado. En el caso de papel de periódico fino, el texto impreso en el reverso puede verse en los escaneos. La binarización adaptativa elimina este texto.

La innovadora tecnología de binarización adaptativa ajusta dinámicamente el umbral de brillo de cada fragmento de imagen durante el reconocimiento. Al aplicar parámetros de reconocimiento individuales, produce resultados precisos en documentos con fondos y texturas de contraste variable en escala de grises o en color.

Es la binarización de imágenes en escala de grises mediante puntos muy pequeños. Esto mejora el aspecto del documento, ya que parece tener más tonos.

Filtros para imágenes binarias
Escalado de imagen	En documentos escaneados a baja resolución (menos de 120 dpi) y en documentos con letra pequeña (menos de 10 pt), las imágenes pueden ampliarse digitalmente para obtener una mejor calidad de Reconocimiento óptico de caracteres (OCR).

Consulte también

Características principales

​¿Por qué mejorar las imágenes?