Passer au contenu principal
Le format PDF est souvent utilisé dans les archives électroniques à des fins de stockage de données. C’est le format privilégié en raison de sa polyvalence et de sa capacité à conserver à la fois les images et le texte. Les technologies développées par ABBYY permettent d’enregistrer les textes reconnus aux formats PDF et PDF/A. L’un des principaux objectifs de l’archivage est d’obtenir la taille de fichier la plus réduite possible, sans perte de qualité des données. Une technologie de compression spéciale appelée MRC (Mixed Raster Content) est utilisée pour réduire au minimum la taille des fichiers PDF et PDF/A.

PDF en entrée pour Linux et Windows

Traitement intelligent des PDF

ABBYY FineReader Engine analyse les informations internes des fichiers PDF source, notamment :

  • les annotations,
  • les métadonnées,
  • les objets texte,
  • les dictionnaires de polices
  • les flux de contenu

Le SDK améliore les performances et la rapidité de conversion PDF grâce à une sélection de texte efficace et précise. Si le fichier PDF contient du texte incorporé, le moteur de Reconnaissance optique de caractères (OCR) vérifie l’intégrité de la couche de texte et décide soit d’extraire le texte, soit d’appliquer l’OCR bloc par bloc.

Extraction des informations internes du PDF

Il extrait les liens internes du PDF, les hyperliens et les propriétés du document, telles que : le sujet, l’auteur, le titre et les mots-clés.

Les restrictions appliquées au document PDF en entrée influent sur l’importation et le traitement du document. Par exemple, si la copie de texte n’est pas autorisée, le document PDF ne sera pas traité. Assurez-vous que les fichiers PDF que vous allez traiter ne sont pas protégés contre la copie.

Sortie PDF

Prise en charge de la sécurité et du chiffrement PDF

ABBYY FineReader Engine 12 prend en charge diverses options de sécurité PDF, ce qui étend son utilisation aux organismes publics et aux autres organisations exigeant un niveau de sécurité élevé.

  • Paramètres de mot de passe « Open File » conçus pour empêcher tout accès non autorisé à un document.
  • Restriction de certaines opérations, telles que l’impression, la modification ou l’extraction du contenu du fichier, grâce à l’attribution de mots de passe d’autorisation.
  • Prise en charge des normes de chiffrement les plus récentes.

intro_KeyFeatures_PDFConversion

Sortie au format Tagged PDF

Le format Tagged PDF peut être « réajusté » pour s’adapter à différentes largeurs de page ou d’écran. Idéal pour une utilisation sur des appareils portables (PDA) ou avec des lecteurs d’écran généralement utilisés par les personnes malvoyantes.

Taille de page

Possibilité de définir la taille de toutes les pages d’un fichier de sortie lors de la conversion en PDF.

Exportation des métadonnées

ABBYY FineReader Engine 12 permet d’exporter les métadonnées (signets, hyperliens, références croisées, etc.).

Conversion au format PDF/A

Conversion au format PDF/A, recommandé comme norme pour l’archivage à long terme des documents orientés page.

Les technologies d’ABBYY permettent d’enregistrer les documents dans des formats PDF/A avec différents niveaux de conformité : PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/A-2b, PDF/A-2u, PDF/A-3a, PDF/A-3b, PDF/A-3u.

Le format PDF/A-1a présente les caractéristiques suivantes : conservation optimale de la mise en forme du document, de sa structure logique et de son apparence générale, ainsi que possibilité de préserver l’apparence du document sur des affichages de différentes tailles (le contenu du document est organisé de manière spécifique à cet effet).

Le format PDF/A-1b est utilisé uniquement pour reproduire l’apparence du document.

Les formats PDF/A-2a, PDF/A-2b et PDF/A-2u prennent en charge la compression d’image JPEG 2000, la transparence et les calques. La différence est que, dans PDF/A-2u, l’intégralité du texte dispose d’un mappage Unicode.

Les formats PDF/A-3a, PDF/A-3b et PDF/A-3u prennent en charge l’ajout à un document PDF de documents dans n’importe quel format (comme Excel, Word, HTML, CAD, XML).

Conversion au format PDF/UA

ABBYY FineReader Engine 12 prend en charge l’exportation au format PDF conformément à la norme PDF/UA. Le format PDF/UA prend en charge Tagged PDF ainsi que les technologies d’assistance.

Exportation de CJK vers PDF

Permet de convertir en PDF des documents en chinois (simplifié et traditionnel), en japonais et en coréen.

Compression MRC des PDF (PDF/A)

Une technologie de compression spéciale appelée MRC (Mixed Raster Content) est utilisée pour réduire au minimum la taille des fichiers PDF et PDF/A. intro_KeyFeatures_PDFConversion2 Les images de document sont généralement très volumineuses à cause de l’arrière-plan, qui représente souvent jusqu’à 90 % de la taille du fichier. Or, cet arrière-plan peut être inutile dans le document final. Ce sont le texte et les images qui importent. La technologie de compression MRC permet de repérer l’arrière-plan en couleur et de le supprimer ou de le compresser fortement. Il ne reste alors que le texte et les images sur fond blanc, ce qui contribue à réduire la taille du fichier. Les objets graphiques (diagrammes, graphiques, logos, photos, dessins, cachets, signatures, etc.) sont également légèrement compressés, mais uniquement dans une mesure qui n’altère pas la qualité. La technologie MRC analyse les contours des caractères similaires dans le document, crée un gabarit moyen de caractère et l’utilise à la place du caractère lui-même. Cela améliore la lisibilité, car certains défauts du texte sont corrigés et les contours des caractères deviennent plus précis. Vous obtenez ainsi une image plus petite, dont l’aspect est même meilleur qu’auparavant. Le document obtenu présente un arrière-plan discret et uniforme, avec un texte net et des images nettes. Cette « reconstruction » du document peut être utile lorsque vous devez traiter des images de faible qualité dues à : un mauvais éclairage, une photo floue, des paramètres de numérisation/prise de vue incorrects, un papier foncé non couché ou la détérioration du document. Tout cela produit une image avec un arrière-plan sombre et des textures supplémentaires. Le texte paraît flou et difficile à lire. La technologie MRC permet d’améliorer l’apparence du document et de réduire la taille du fichier jusqu’à 8 à 10 fois par rapport au JPEG.

Conversion PDF simple et claire

ABBYY FineReader Engine fournit aux développeurs des outils spécifiques pour sélectionner le mode de conversion PDF optimal, adapté à leurs besoins.
Scénario d’export PDFDescription
MaxQualityOptimise l’export PDF (PDF/A) afin d’obtenir la meilleure qualité possible pour le fichier résultant.
BalancedL’export PDF (PDF/A) offre un équilibre entre la qualité du fichier résultant, sa taille et le temps de traitement.
MinSizeOptimise l’export PDF (PDF/A) afin d’obtenir la taille minimale du fichier résultant.
MaxSpeedOptimise l’export PDF (PDF/A) afin d’obtenir la vitesse de traitement la plus élevée.

Voir aussi

Fonctionnalités clés