Vai al contenuto principale
Il formato PDF è spesso utilizzato negli archivi elettronici per l’archiviazione dei dati. È il formato preferito per la sua versatilità e per la possibilità di conservare sia immagini sia testo. Le tecnologie sviluppate da ABBYY consentono di salvare i testi riconosciuti nei formati PDF e PDF/A. Uno degli obiettivi principali dell’archiviazione è ottenere file delle dimensioni più ridotte possibile senza compromettere la qualità dei dati. Per ridurre al minimo le dimensioni dei file PDF e PDF/A, viene utilizzata una speciale tecnologia di compressione chiamata MRC (Mixed Raster Content).

PDF di input per Linux e Windows

Elaborazione intelligente dei PDF

ABBYY FineReader Engine analizza le informazioni interne contenute nei file PDF di origine, quali:

  • annotazioni,
  • metadati,
  • oggetti di testo,
  • dizionari dei font
  • flussi di contenuto

L’SDK migliora le prestazioni e la velocità della conversione PDF grazie a una selezione del testo efficiente e accurata. Se il testo è incorporato nel file PDF, il motore OCR verifica l’integrità del livello di testo e decide se estrarre il testo o applicare l’OCR blocco per blocco.

Acquisizione delle informazioni interne del PDF

Estrae i collegamenti interni del PDF, i collegamenti ipertestuali e le proprietà del documento, quali oggetto, autore, titolo e parole chiave.

Le restrizioni applicate al documento PDF di input influiscono sull’importazione e sull’elaborazione del documento. Ad esempio, se la copia del testo non è consentita, il documento PDF non verrà elaborato. Assicurati che i file PDF che intendi elaborare non siano protetti dalla copia.

Output in PDF

Supporto per la protezione e la crittografia PDF

ABBYY FineReader Engine 12 supporta un’ampia gamma di impostazioni di sicurezza PDF, ampliandone l’utilizzo per enti governativi e altre organizzazioni che richiedono elevati livelli di sicurezza.

  • Impostazioni della password “Open File” progettate per impedire l’accesso non autorizzato a un documento.
  • Limitazione di determinate operazioni, come stampa, modifica o estrazione del contenuto del file, mediante l’assegnazione di password di autorizzazione.
  • Supporto per gli standard di crittografia più recenti.

intro_KeyFeatures_PDFConversion

Output in formato Tagged PDF

Il Tagged PDF può essere riadattato a diverse larghezze di pagina o di schermo. Ideale per l’uso con dispositivi portatili (PDA) o screen reader, generalmente utilizzati da utenti con disabilità visive.

Dimensioni della pagina

Possibilità di impostare le dimensioni di tutte le pagine di un file di output durante la conversione in PDF.

Esportazione dei metadati

ABBYY FineReader Engine 12 consente di esportare i metadati (segnalibri, collegamenti ipertestuali, riferimenti incrociati e così via).

Conversione nel formato PDF/A

Conversione nel formato PDF/A, consigliato come standard per la conservazione a lungo termine dei documenti orientati alla pagina.

Le tecnologie ABBYY consentono di salvare i documenti nei formati PDF/A con diversi livelli di conformità: PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/A-2b, PDF/A-2u, PDF/A-3a, PDF/A-3b, PDF/A-3u.

Il formato PDF/A-1a offre le seguenti caratteristiche: migliore conservazione della formattazione del documento, della struttura logica e dell’aspetto standard, nonché la possibilità di mantenere l’aspetto del documento su display di dimensioni diverse (il contenuto del documento è organizzato in modo specifico per ottenere questo risultato).

Il formato PDF/A-1b viene utilizzato solo per riprodurre l’aspetto del documento.

I formati PDF/A-2a, PDF/A-2b e PDF/A-2u supportano la compressione delle immagini JPEG 2000, la trasparenza e i livelli. La differenza è che in PDF/A-2u tutto il testo dispone di una mappatura Unicode.

I formati PDF/A-3a, PDF/A-3b e PDF/A-3u supportano l’allegazione a un documento PDF di documenti in qualsiasi formato (ad esempio Excel, Word, HTML, CAD, XML).

Conversione nel formato PDF/UA

ABBYY FineReader Engine 12 supporta l’esportazione in PDF conforme allo standard PDF/UA. Il formato PDF/UA supporta Tagged PDF e tecnologie assistive.

Esportazione da CJK a PDF

Consente la conversione in formato PDF di documenti in cinese (sia semplificato che tradizionale), giapponese e coreano.

Compressione MRC di PDF (PDF/A)

Per ridurre al minimo le dimensioni dei file PDF e PDF/A viene utilizzata una speciale tecnologia di compressione chiamata MRC (Mixed Raster Content). intro_KeyFeatures_PDFConversion2 I file immagine dei documenti sono solitamente molto grandi a causa dello sfondo, che spesso rappresenta fino al 90% delle dimensioni del file. Tuttavia, nel documento risultante lo sfondo può essere superfluo. Ciò che conta davvero sono il testo e le immagini. La tecnologia di compressione MRC consente di individuare lo sfondo a colori e di eliminarlo oppure di comprimerlo in misura significativa. In questo modo restano testo e immagini su uno sfondo bianco, contribuendo a ridurre le dimensioni del file. Anche gli oggetti immagine (diagrammi, grafici, loghi, foto, disegni, timbri, firme, ecc.) vengono compressi leggermente, ma solo nella misura in cui la qualità non ne risenta. La tecnologia MRC analizza i contorni di caratteri simili nel documento, crea un modello medio del carattere e lo utilizza al posto del carattere stesso. Questo migliora la leggibilità, perché alcuni difetti del testo vengono corretti e i contorni dei caratteri diventano più precisi. Di conseguenza, si ottiene un’immagine più piccola che appare persino migliore di prima. Il documento risultante avrà uno sfondo uniforme e discreto con testo e immagini nitidi. Questa “ricostruzione” del documento può essere utile quando si ha a che fare con immagini di bassa qualità dovute a: scarsa illuminazione, foto sfocata, parametri di scansione/foto errati, carta scura non patinata o deterioramento del documento. Tutto ciò fa sì che l’immagine presenti uno sfondo scuro con texture aggiuntive. Il testo appare sfocato e difficile da leggere. La tecnologia MRC consente di migliorare l’aspetto del documento e di ottenere file fino a 8-10 volte più piccoli rispetto al JPEG.

Conversione PDF semplice e chiara

ABBYY FineReader Engine offre agli sviluppatori strumenti specifici per ottenere la modalità di conversione PDF ottimale per le proprie esigenze.
Scenario di esportazione PDFDescrizione
MaxQualityOttimizza l’esportazione in PDF (PDF/A) per ottenere la migliore qualità del file risultante.
BalancedL’esportazione in PDF (PDF/A) offrirà un equilibrio tra la qualità del file risultante, le sue dimensioni e il tempo di elaborazione.
MinSizeOttimizza l’esportazione in PDF (PDF/A) per ottenere le dimensioni minime del file risultante.
MaxSpeedOttimizza l’esportazione in PDF (PDF/A) per ottenere la massima velocità di elaborazione.

Vedi anche

Funzionalità principali