Saltar al contenido principal
El formato PDF se utiliza a menudo en archivos electrónicos para almacenar datos. Es el formato preferido por su versatilidad y por la posibilidad de conservar tanto imágenes como texto. Las tecnologías desarrolladas por ABBYY permiten guardar los textos reconocidos en los formatos PDF y PDF/A. Uno de los principales objetivos del archivado es lograr el menor tamaño de archivo posible sin perder calidad de los datos. Para minimizar el tamaño de los archivos PDF y PDF/A, se utiliza una tecnología de compresión especial llamada MRC (Mixed Raster Content).

Entrada de PDF para Linux y Windows

Procesamiento inteligente de PDF

ABBYY FineReader Engine analiza la información interna de los archivos PDF de origen, como:

  • anotaciones,
  • metadatos,
  • objetos de texto,
  • diccionarios de fuentes
  • flujos de contenido

El SDK mejora el rendimiento y la velocidad de la conversión de PDF mediante una selección de texto eficiente y precisa. Si el texto está incrustado en el archivo PDF, el motor de Reconocimiento óptico de caracteres (OCR) examina la integridad de la capa de texto y decide si extraer el texto o aplicar OCR bloque por bloque.

Captura de la información interna del PDF

Extrae enlaces internos del PDF, hipervínculos y propiedades del documento, como: asunto, autor, título y palabras clave.

Las restricciones del documento PDF de entrada influirán en la importación y el procesamiento del documento. Por ejemplo, si no se permite copiar texto, el documento PDF no se procesará. Asegúrese de que los archivos PDF que va a procesar no estén protegidos contra la copia.

Salida en PDF

Compatibilidad con seguridad y cifrado de PDF

ABBYY FineReader Engine 12 admite una amplia variedad de configuraciones de seguridad de PDF, lo que amplía su utilidad para organismos gubernamentales y otras organizaciones con altos requisitos de seguridad.

  • Opciones de contraseña de “Apertura de archivo” diseñadas para impedir el acceso no autorizado a un documento.
  • Restricción de determinadas operaciones, como imprimir, editar o extraer el contenido del archivo, mediante la asignación de contraseñas de permisos.
  • Compatibilidad con los estándares de cifrado más recientes.

intro_KeyFeatures_PDFConversion

Salida en formato Tagged PDF

Tagged PDF puede adaptarse para ajustarse a distintos anchos de página o de pantalla. Es ideal para su uso en dispositivos portátiles (PDA) o con lectores de pantalla, normalmente utilizados por usuarios con discapacidad visual.

Tamaño de página

Posibilidad de establecer el tamaño de todas las páginas de un archivo de salida durante la conversión a PDF.

Exportación de metadatos

ABBYY FineReader Engine 12 permite exportar metadatos (marcadores, hipervínculos, referencias cruzadas, etc.).

Conversión al formato PDF/A

Conversión al formato PDF/A, recomendado como estándar para la conservación a largo plazo de documentos orientados por páginas.

Las tecnologías de ABBYY permiten guardar documentos en formatos PDF/A con distintos niveles de conformidad: PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/A-2b, PDF/A-2u, PDF/A-3a, PDF/A-3b, PDF/A-3u.

El formato PDF/A-1a presenta las siguientes características: mejor conservación del formato del documento, de la estructura lógica y de su apariencia habitual, así como la posibilidad de mantener la apariencia del documento al utilizar pantallas de distintos tamaños (el contenido del documento se organiza de una manera específica para lograrlo).

El formato PDF/A-1b se utiliza únicamente para reproducir la apariencia del documento.

Los formatos PDF/A-2a, PDF/A-2b y PDF/A-2u admiten compresión de imágenes JPEG 2000, transparencia y capas. La diferencia es que todo el texto en PDF/A-2u tiene asignación Unicode.

Los formatos PDF/A-3a, PDF/A-3b y PDF/A-3u permiten adjuntar documentos en cualquier formato (como Excel, Word, HTML, CAD o XML) a un documento PDF.

Conversión al formato PDF/UA

ABBYY FineReader Engine 12 admite la exportación a PDF conforme al estándar PDF/UA. El formato PDF/UA admite Tagged PDF y tecnologías de asistencia.

Exportación de CJK a PDF

Permite convertir al formato PDF documentos en chino (tanto simplificado como tradicional), japonés y coreano.

Compresión MRC de PDF (PDF/A)

Se utiliza una tecnología de compresión especial llamada MRC (Mixed Raster Content) para minimizar el tamaño de los archivos PDF y PDF/A. intro_KeyFeatures_PDFConversion2 Los archivos de imagen de documentos suelen ser muy grandes debido al fondo, que a menudo ocupa hasta el 90 % del tamaño del archivo. Sin embargo, el fondo puede resultar innecesario en el documento final. Lo importante es el texto y las imágenes. La tecnología de compresión MRC permite detectar el fondo en color y eliminarlo o comprimirlo en gran medida. Así, el texto y las imágenes quedan sobre un fondo blanco, lo que contribuye a reducir el tamaño del archivo. Los objetos de imagen (diagramas, gráficos, logotipos, fotos, dibujos, sellos, firmas, etc.) también se comprimen ligeramente, pero solo en la medida en que no se reduzca la calidad. La tecnología MRC analiza los contornos de caracteres similares en el documento, crea una plantilla media de caracteres y la utiliza en lugar de cada carácter. Esto mejora la legibilidad, ya que corrige algunos defectos del texto y hace que los contornos de los caracteres sean más precisos. Como resultado, se obtiene una imagen más pequeña que incluso tiene mejor aspecto que antes. El documento resultante tendrá un fondo uniforme y discreto con texto e imágenes nítidos. Esta “reconstrucción” del documento puede ser útil cuando tiene que trabajar con imágenes de baja calidad debido a: mala iluminación, fotos desenfocadas, parámetros incorrectos de escaneado/fotografía, papel oscuro sin recubrimiento o deterioro del documento. Todo ello hace que la imagen tenga un fondo oscuro con texturas adicionales. El texto aparece borroso y resulta difícil de leer. La tecnología MRC permite mejorar el aspecto del documento y obtener un tamaño de archivo hasta 8-10 veces menor que con JPEG.

Conversión de PDF clara y sencilla

ABBYY FineReader Engine proporciona a los desarrolladores herramientas específicas para elegir el modo de conversión de PDF óptimo según sus necesidades concretas.
Escenario de exportación de PDFDescripción
MaxQualityOptimiza la exportación a PDF (PDF/A) para obtener la mejor calidad posible del archivo resultante.
BalancedLa exportación a PDF (PDF/A) ofrece un equilibrio entre la calidad del archivo resultante, su tamaño y el tiempo de procesamiento.
MinSizeOptimiza la exportación a PDF (PDF/A) para obtener el menor tamaño posible del archivo resultante.
MaxSpeedOptimiza la exportación a PDF (PDF/A) para lograr la máxima velocidad de procesamiento.

Consulte también

Características principales