Zum Hauptinhalt springen
Das Ergebnis der Dokumenterkennung hängt von den bei der Verarbeitung verwendeten Schriftarten und ihren Einstellungen ab. ABBYY FineReader Engine bietet die Möglichkeit, verfügbare Schriftarten zu verwenden. In manchen Fällen müssen Sie die Schriftarten jedoch manuell festlegen:
  • Ihr Dokument enthält bestimmte Schriftarten (zum Beispiel nicht lateinische Schriftarten)
  • Sie verwenden ein Betriebssystem mit einem eingeschränkten Satz von Schriftarten oder ganz ohne Schriftarten. Zum Beispiel:
  • Windows Server Core in einem Docker-Container
  • Beliebige Serverversionen von Linux-Distributionen ohne grafische Benutzeroberfläche
In diesen Fällen ist es wichtig, die Schriftarten festzulegen, bevor Sie Ihre Anwendung starten, da mehrere Verarbeitungsschritte korrekt konfigurierte Schriftarten erfordern:
  • Öffnen von PDF-Dateien
  • Dokumentsynthese
  • Export in PDF
Dieser Artikel enthält nützliche Informationen dazu, wie Sie Schriftarten manuell festlegen, und beschreibt die ABBYY FineReader Engine-Funktionen für die Arbeit mit Schriftarten.

Öffnen von PDF-Dateien

Beim Öffnen von PDF-Dateien werden Systemschriftarten verwendet. Wenn Sie zusätzliche Schriftarten benötigen, können Sie diese mit dem Systemdienstprogramm Font Book installieren.
Das PDF enthält Informationen darüber, welche Schriftarten bei seiner Erstellung verwendet wurden. Diese Informationen sind für die PDF-Rasterung erforderlich, beispielsweise um den sichtbaren Text aus dem Bild zu verarbeiten und die verwendeten Schriftarten sowie deren Parameter zu ermitteln. Um das Ausgabe-PDF mit korrekt dargestellten Schriftarten zu öffnen, verwenden Sie eine der folgenden Methoden:
  • Kopieren Sie die gewünschten Schriftarten manuell in den Ordner Data/Resources/Font im Distributionspaket. Diese Methode registriert keine Schriftarten in Ihrem Betriebssystem und wirkt sich nur auf das Öffnen von PDF-Dateien aus. Standardmäßig werden die Schriftarten aus diesem Ordner bei der Dokumentsynthese und beim Export nicht verwendet.
  • Kopieren Sie die gewünschten Schriftarten manuell in den Systemordner /usr/share/fonts. Diese Methode registriert Schriftarten im Betriebssystem. Die Schriftarten aus diesem Ordner werden für die Dokumentsynthese oder den Export verwendet, wenn Sie sie in der Eigenschaft ISynthesisParamsForDocument::FontSet angeben (siehe Abschnitt „Dokumentsynthese und Export in PDF“). Standardmäßig werden diese Schriftarten bei der Synthese nur verwendet, wenn sie in das Eingabe-PDF eingebettet wurden (siehe Beschreibung des Filters FNF_Auto in der Enumeration FontNamesFiltersEnum).
  • Installieren Sie das Paket zur Installation der Schriftarten (verwenden Sie das Paket ttf-mscorefonts-installer in Debian-ähnlichen Systemen und das Paket msttcore-fonts-installer in RHEL-ähnlichen Systemen). Diese Methode installiert die Schriftarten automatisch und verwendet dieselben Besonderheiten für die Einrichtung der Schriftarten bei Synthese und Export wie die vorherige Methode.
Nach dem Kopieren der Schriftarten in den Systemordner oder nach der Installation mit dem Paket müssen Sie in einigen Betriebssystemen den Schriftarten-Cache mit dem Befehl fc-cache -f aktualisieren.
Die erforderlichen einzubindenden Schriftarten:
  • Arial
  • Times New Roman
  • Courier New
Um verschiedene Stile einer einzelnen Schriftart im Text zu erkennen, empfehlen wir, mehrere grundlegende Schriftschnitte gleichzeitig einzubinden (normal, fett und kursiv).
Windows
Das PDF enthält Informationen darüber, welche Schriftarten bei seiner Erstellung verwendet wurden. Diese Informationen sind für die PDF-Rasterung erforderlich, beispielsweise um den sichtbaren Text aus dem Bild zu verarbeiten und die verwendeten Schriftarten sowie deren Parameter zu ermitteln. Um das Ausgabe-PDF mit korrekt dargestellten Schriftarten zu öffnen, müssen Sie die Dateien der erforderlichen Schriftarten in den Ordner Data\Resources\Font im Distributionspaket kopieren. ABBYY FineReader Engine bettet diese Schriftarten während des Betriebs automatisch ein.Die erforderlichen einzubindenden Schriftarten:
  • Arial
  • Times New Roman
  • Courier New

Dokumentsynthese und Export in PDF

Bei der Dokumentsynthese oder beim Export in PDF wählt ABBYY FineReader Engine die am besten geeignete Schriftart aus der in der Eigenschaft ISynthesisParamsForDocument::FontSet angegebenen Schriftartensammlung aus. Standardmäßig ist die Anzahl der Schriftarten in dieser Sammlung so optimiert, dass ein ausgewogenes Verhältnis zwischen Verarbeitungsgeschwindigkeit und Qualität der Ausgabedokumente erreicht wird. So legen Sie die Schriftarten manuell fest:
  1. Wählen Sie einen beliebigen Ordner auf Ihrem Rechner aus, der als Speicherort für Schriftarten dienen soll.
  2. Kopieren Sie die Dateien der benötigten Schriftarten in diesen Ordner. Die für Dokumentsynthese und Export empfohlenen Schriftarten sind in der Enumeration FontNamesFiltersEnum aufgeführt.
  3. Geben Sie den Ordner mit den Schriftarten über die Eigenschaft Folder des Objekts CustomFontSet an.
Beachten Sie die folgenden Empfehlungen, wenn Sie den Standardschriftartensatz ändern möchten:
  • Mit FRE for Linux können Sie Schriftarten aus dem Abschnitt zum Öffnen von PDF-Dateien nicht nur zum Öffnen von PDF-Dateien verwenden, sondern auch bei der Synthese und beim Export beliebiger Eingabedokumente. Geben Sie dazu in der Eigenschaft Folder des Objekts CustomFontSet den Pfad zum Schriftartenordner an, den Sie zuvor im Abschnitt zum Öffnen von PDF-Dateien ausgewählt haben.
  • Sie können einen vordefinierten Schriftartenfilter für eine bestimmte Sprache verwenden, z. B. FNF_Chinese oder FNF_Japanese. Verwenden Sie dazu die Eigenschaft FontNamesFilter des Objekts SystemFontSet oder CustomFontSet.
  • Sie können bestimmte in Ihrem Dokument verwendete Schriftfamilien in der Eigenschaft FontNamesCustomFilter des Objekts SystemFontSet oder CustomFontSet angeben.
  • Sie können den Filter FNF_FineReader für die Schriftarten in der Eigenschaft FontNamesFilter des Objekts SystemFontSet oder CustomFontSet angeben. Dieser Filter ermöglicht FineReader Engine, bei der Dokumentsynthese mehr Schriftarten zu verwenden und im Vergleich zum Standardmodus besser geeignete Schriftarten auszuwählen. Die Verarbeitung kann dadurch jedoch langsamer werden. Dies kann zum Beispiel beim Konvertieren in ein bearbeitbares Format nützlich sein. Bevor Sie diesen Filter angeben, prüfen Sie die Liste der verwendeten Schriftarten und vergewissern Sie sich, dass diese auf Ihrer Arbeitsstation vorhanden sind.
Für die Dokumentsynthese mit Systemschriftarten unter macOS 10.15 Catalina oder höher sind zusätzliche Schritte erforderlich (siehe Abschnitt Frequently Asked Questions).

Siehe auch

Arbeiten mit Sprachen ABBYY FineReader Engine 12 in einem Docker-Container ausführen (Linux und Windows)