¿Por qué mejorar las imágenes?


Preprocesamiento de imágenes
Esta función de procesamiento de documentos es especialmente importante para la entrada masiva de imágenes cuando se desconoce la dirección en que se digitalizan las páginas del documento o esta puede variar. El sistema detecta automáticamente la orientación de cada página y la corrige si es necesario. | |
Se utiliza para digitalizar libros en doble página, tanto la página izquierda como la derecha. La calidad del reconocimiento es mayor si la imagen se divide en dos, de modo que cada mitad corresponda a una sola página del libro. El reconocimiento y el análisis de maquetación se realizan entonces por separado para cada página, junto con la corrección de inclinación si es necesario. | |
Es una función esencial de procesamiento de documentos que se aplica a documentos digitalizados que requieren compensación por inclinación de imagen. No requiere bordes ni líneas de referencia. ABBYY FineReader Engine 12 ofrece varios métodos para corregir la inclinación de imágenes: mediante pares de cuadrados negros, líneas o líneas de texto. | |
Al capturar texto de libros escaneados o fotografiados, las líneas de texto pueden quedar irregulares y ser difíciles de procesar mediante Reconocimiento óptico de caracteres (OCR). Las tecnologías de ABBYY ofrecen algoritmos especiales que corrigen la inclinación y enderezan las líneas de texto para lograr un reconocimiento preciso. | |
Al digitalizar documentos de calidad baja o media, es posible obtener imágenes con mucho ruido, con gran cantidad de puntos o manchas. Estas manchas, cuando aparecen cerca de letras o números, pueden afectar la calidad del OCR. Esta función elimina dicho ruido. El usuario puede especificar el tamaño de las manchas que desea eliminar. Puede aplicarse tanto a una imagen completa como a cualquier bloque (o zona) individual de la imagen. | |
Esta tecnología identifica automáticamente fotografías digitales y corrige las distorsiones que suelen introducir las cámaras digitales. El sistema detecta los defectos típicos de las imágenes digitales, como líneas de texto distorsionadas, distorsiones 3D trapezoidales, enfoque deficiente, manchas, zonas oscurecidas en páginas enfrentadas de libros gruesos, reflejos, ruido ISO, etc. El sistema corrige estos defectos de forma automática, por lo que el usuario no necesita recurrir a aplicaciones de terceros para retocar las fotografías.
| |
La tecnología de filtrado de textura ayuda a eliminar el “ruido” de fondo, como el color y la textura, lo que mejora la precisión en documentos difíciles de leer, como papel de periódico, documentos en color, faxes y fotocopias.
| |
Es el proceso de convertir imágenes a blanco y negro, eliminar el ruido, el fondo y las texturas, y obtener texto nítido. Este proceso garantiza la mejor calidad de Reconocimiento óptico de caracteres (OCR). Los parámetros necesarios se determinan para cada fragmento por separado. En el caso de papel de periódico fino, el texto impreso en el reverso puede verse en los escaneos. La binarización adaptativa elimina este texto. La innovadora tecnología de binarización adaptativa ajusta dinámicamente el umbral de brillo de cada fragmento de imagen durante el reconocimiento. Al aplicar parámetros de reconocimiento individuales, produce resultados precisos en documentos con fondos y texturas de contraste variable en escala de grises o en color. | |
Es la binarización de imágenes en escala de grises mediante puntos muy pequeños. Esto mejora el aspecto del documento, ya que parece tener más tonos. | |
Filtros para imágenes binarias | |
|---|---|
Escalado de imagen | En documentos escaneados a baja resolución (menos de 120 dpi) y en documentos con letra pequeña (menos de 10 pt), las imágenes pueden ampliarse digitalmente para obtener una mejor calidad de Reconocimiento óptico de caracteres (OCR). |


