Zum Hauptinhalt springen
Das PDF-Format wird in elektronischen Archiven häufig zur Speicherung von Daten verwendet. Es gilt als Format der Wahl, da es vielseitig ist und sowohl Bilder als auch Text enthalten kann. Die von ABBYY entwickelten Technologien ermöglichen es, erkannte Texte in den Formaten PDF und PDF/A zu speichern. Eines der Hauptziele der Archivierung ist es, die kleinstmögliche Dateigröße zu erreichen, ohne dabei Einbußen bei der Datenqualität hinzunehmen. Um die Größe von PDF- und PDF/A-Dateien zu minimieren, wird eine spezielle Komprimierungstechnologie namens MRC (Mixed Raster Content) verwendet.

PDF-Eingabe für Linux und Windows

Intelligente PDF-Verarbeitung

ABBYY FineReader Engine analysiert interne Informationen in den PDF-Quelldateien, zum Beispiel:

  • Anmerkungen,
  • Metadaten,
  • Textobjekte,
  • Schriftartwörterbücher
  • Content-Streams

Das SDK verbessert Leistung und Geschwindigkeit der PDF-Konvertierung durch eine effiziente und präzise Textauswahl. Wenn Text in die PDF-Datei eingebettet ist, prüft die OCR-Engine die Integrität der Textebene und entscheidet für jeden Block, ob der Text extrahiert oder OCR angewendet wird.

Erfassung interner PDF-Informationen

Dabei werden interne PDF-Links, Hyperlinks und Dokumenteigenschaften wie Betreff, Autor, Titel und Schlüsselwörter extrahiert.

Beschränkungen des Eingabe-PDF-Dokuments wirken sich auf den Import und die Verarbeitung des Dokuments aus. Wenn zum Beispiel das Kopieren von Text nicht zulässig ist, wird das PDF-Dokument nicht verarbeitet. Stellen Sie bitte sicher, dass die PDF-Dateien, die Sie verarbeiten möchten, keinen Kopierschutz haben.

PDF-Ausgabe

Unterstützung für PDF-Sicherheit und -Verschlüsselung

ABBYY FineReader Engine 12 unterstützt eine Vielzahl von PDF-Sicherheitseinstellungen und eignet sich dadurch auch für Behörden und andere Organisationen mit hohen Sicherheitsanforderungen.

  • Einstellungen für das Passwort zum „Öffnen der Datei“, um unbefugten Zugriff auf ein Dokument zu verhindern.
  • Einschränkung bestimmter Vorgänge wie Drucken, Bearbeiten oder Extrahieren von Dateiinhalten durch die Vergabe von Berechtigungskennwörtern.
  • Unterstützung der neuesten Verschlüsselungsstandards.

intro_KeyFeatures_PDFConversion

Ausgabe im Tagged-PDF-Format

Tagged PDF kann an unterschiedliche Seiten- oder Bildschirmbreiten angepasst werden. Ideal für die Verwendung mit Handheld-Geräten (PDAs) oder Screenreadern, wie sie typischerweise von sehbehinderten Benutzern verwendet werden.

Seitengröße

Möglichkeit, die Größe für alle Seiten einer Ausgabedatei während der PDF-Konvertierung festzulegen.

Metadatenexport

ABBYY FineReader Engine 12 ermöglicht den Export von Metadaten (Lesezeichen, Hyperlinks, Querverweise usw.).

Konvertierung in das PDF/A-Format

Konvertierung in das PDF/A-Format, das als Standard für die langfristige Archivierung seitenorientierter Dokumente empfohlen wird.

Die Technologien von ABBYY ermöglichen das Speichern von Dokumenten in PDF/A-Formaten mit unterschiedlichen Konformitätsstufen: PDF/A-1a, PDF/A-1b, PDF/A-2a, PDF/A-2b, PDF/A-2u, PDF/A-3a, PDF/A-3b, PDF/A-3u.

Das Format PDF/A-1a hat folgende Merkmale: bestmögliche Beibehaltung der Dokumentformatierung, der logischen Struktur und des üblichen Erscheinungsbilds sowie die Möglichkeit, das Erscheinungsbild des Dokuments auch bei der Anzeige auf unterschiedlich großen Bildschirmen beizubehalten (der Dokumentinhalt ist dafür auf bestimmte Weise organisiert).

Das Format PDF/A-1b wird ausschließlich zur Wiedergabe des Dokumenterscheinungsbilds verwendet.

Die Formate PDF/A-2a, PDF/A-2b und PDF/A-2u unterstützen JPEG-2000-Bildkomprimierung, Transparenz und Ebenen. Der Unterschied besteht darin, dass der gesamte Text in PDF/A-2u über eine Unicode-Zuordnung verfügt.

Die Formate PDF/A-3a, PDF/A-3b und PDF/A-3u unterstützen das Anhängen von Dokumenten beliebiger Formate (z. B. Excel, Word, HTML, CAD, XML) an ein PDF-Dokument.

Konvertierung in das PDF/UA-Format

ABBYY FineReader Engine 12 unterstützt den Export in PDF gemäß dem PDF/UA-Standard. Das Format PDF/UA unterstützt Tagged PDF und assistive Technologien.

CJK-zu-PDF-Export

Ermöglicht die Konvertierung von Dokumenten in chinesischer (vereinfacht und traditionell), japanischer und koreanischer Sprache in das PDF-Format.

PDF-(PDF/A)-MRC-Komprimierung

Eine spezielle Komprimierungstechnologie namens MRC (Mixed Raster Content) wird verwendet, um die Größe von PDF- und PDF/A-Dateien zu minimieren. intro_KeyFeatures_PDFConversion2 Bilddateien von Dokumenten sind in der Regel sehr groß, vor allem wegen des Hintergrunds, der oft bis zu 90 % der Dateigröße ausmacht. Im Zieldokument ist dieser Hintergrund jedoch unter Umständen nicht erforderlich. Entscheidend sind Text und Bilder. Mit der MRC-Komprimierungstechnologie kann der farbige Hintergrund erkannt und entfernt oder stark komprimiert werden. Dadurch bleiben Text und Bilder vor einem weißen Hintergrund erhalten, was zu einer kleineren Dateigröße beiträgt. Bildobjekte (Diagramme, Grafiken, Logos, Fotos, Zeichnungen, Stempel, Unterschriften usw.) werden ebenfalls leicht komprimiert, jedoch nur in einem Maß, das die Qualität nicht beeinträchtigt. Die MRC-Technologie analysiert die Konturen ähnlicher Zeichen im Dokument, erstellt eine durchschnittliche Zeichenvorlage und verwendet diese anstelle des jeweiligen Zeichens. Dies führt zu einer besseren Lesbarkeit, weil einige Textfehler korrigiert werden und die Zeichenkonturen präziser werden. Als Ergebnis erhalten Sie ein kleineres Bild, das sogar besser aussieht als zuvor. Das resultierende Dokument hat einen dezenten, unauffälligen Hintergrund mit feinem Text und Bildern. Diese „Rekonstruktion“ des Dokuments kann nützlich sein, wenn Sie aufgrund der folgenden Ursachen mit Bildern von geringer Qualität arbeiten müssen: schlechte Beleuchtung, unscharfe Fotos, falsche Scan-/Fotoparameter, dunkles ungestrichenes Papier oder ein beschädigtes Dokument. All dies führt dazu, dass das Bild einen dunklen Hintergrund mit zusätzlichen Texturen aufweist. Der Text wirkt verschwommen und ist schwer zu lesen. Die MRC-Technologie sorgt für ein besseres Erscheinungsbild des Dokuments und eine bis zu 8- bis 10-mal kleinere Dateigröße als JPEG.

Klare und einfache PDF-Konvertierung

ABBYY FineReader Engine bietet Entwicklern spezielle Tools, um den optimalen PDF-Konvertierungsmodus für ihre jeweiligen Anforderungen auszuwählen.
PDF-ExportszenarioBeschreibung
MaxQualityOptimiert den PDF-(PDF/A-)Export, um die bestmögliche Qualität der Ausgabedatei zu erzielen.
BalancedDer PDF-(PDF/A-)Export ist ausgewogen in Bezug auf die Qualität der Ausgabedatei, deren Größe und die Verarbeitungszeit.
MinSizeOptimiert den PDF-(PDF/A-)Export, um die Dateigröße der Ausgabedatei auf ein Minimum zu reduzieren.
MaxSpeedOptimiert den PDF-(PDF/A-)Export, um die Verarbeitungsgeschwindigkeit zu maximieren.

Siehe auch

Hauptfunktionen