Zum Hauptinhalt springen
Bilder werden vorverarbeitet, wenn sie zu einem Batch hinzugefügt werden. Genauer gesagt werden sie auf Dokumente verteilt, von Störungen bereinigt und gedreht. Bei Bedarf können Sie eine komplexere Vorverarbeitung konfigurieren, etwa automatisches Zuschneiden, das Entfernen von Farbmarkierungen usw. Für Bilder mit geringer Qualität können Sie spezielle Profile zur Bildoptimierung verwenden. Bilder werden bearbeitet, um mögliche Fehler zu korrigieren, die bei der Verarbeitung von Dokumentfotos (einschließlich Fotos von mobilen Geräten) und Dokumentscans mit komplexem Hintergrund auftreten können, der die Erkennung und Datenextraktion erschwert (zum Beispiel Zertifikate, Reisepässe usw.). In dieser Stufe können Sie die Qualität der Erkennungsergebnisse für Bilder mit geringer Qualität verbessern. Sie können die Vorverarbeitungsoptionen auf der Registerkarte Image Processing auswählen. Die Vorverarbeitungsoptionen können ausgewählt werden für:
  1. Ein Projekt. In diesem Fall werden die ausgewählten Optionen standardmäßig verwendet, wenn neue Bilder manuell zu Projekt-Batches hinzugefügt werden. Wählen Sie im Hauptfenster Projekt → Projekteigenschaften… aus und klicken Sie dann auf die Registerkarte Image Processing.
  2. Ein Importprofil. Diese Optionen werden verwendet, wenn dieses Importprofil zum Hinzufügen neuer Bilder verwendet wird. Wählen Sie beim Erstellen eines neuen Importprofils in der Stufe Image Processing die Optionen für die Bildvorverarbeitung aus.
  3. Manuell hinzugefügte Bilder. Wenn Sie Bilder hinzufügen aus einer Datei, klicken Sie im Dialogfeld Load Images auf die Schaltfläche Image Processing Settings… Hinweis: Wenn Bilder manuell gescannt werden, wird keine Bildvorverarbeitung durchgeführt. Gescannte Bilder werden nur dann vorverarbeitet, wenn ein Importprofil verwendet wird.
  4. Ein Batch-Typ. In diesem Fall werden die ausgewählten Optionen verwendet, wenn Bilder aus Batches des angegebenen Typs verarbeitet werden. Wählen Sie beim Erstellen eines Batch-Typs auf der Registerkarte Image Processing die Optionen für die Bildvorverarbeitung aus. Die für einen Batch-Typ angegebenen Optionen gelten auch für:
    • Bilder, die von der Scanning Station oder Web-Scanning-Station empfangen werden, wenn sie auf der entsprechenden Station nicht zu Dokumenten zusammengestellt wurden. Die im Abschnitt Image processing angegebenen Optionen gelten für empfangene Bilder, unabhängig davon, ob sie zu Dokumenten zusammengestellt wurden oder nicht.
    • Bilder, die durch Web Service API-Methoden hinzugefügt werden (wenn das Flag ExcludeFromAutomaticAssembling auf false gesetzt ist). Weitere Informationen finden Sie in der Hilfedatei zur Web Services API.
    • Bilder, die aus einem Hot Folder hinzugefügt werden (wenn die Option Use image processing options from batch type ausgewählt ist). Weitere Informationen finden Sie unter Bildimportprofile.
    • Bilder, die manuell aus einer Datei hinzugefügt werden. In diesem Fall werden die für den Batch-Typ angegebenen Optionen standardmäßig verwendet.
Benutzer können eine der folgenden Optionen für die Bildvorverarbeitung auswählen:
  • Leere Seiten löschen. Aktivieren Sie diese Option, damit leere Seiten bei der Verarbeitung übersprungen werden.
  • Optionen, die festlegen, nach welchen Prinzipien Bilder zu Dokumenten hinzugefügt werden:
    • Automatisch, wenn die Dokumentdefinition angewendet wird Wählen Sie diese Option, wenn Bilder beim Matching (während der Erkennung) in Dokumente aufgeteilt werden sollen. In diesem Fall werden Bilder nicht sofort beim Hinzufügen in Dokumente aufgeteilt. Stattdessen werden Dokumente erst zusammengestellt, nachdem die Seiten anhand der in der entsprechenden Dokumentdefinition beschriebenen Struktur analysiert und erkannt wurden. Weitere Informationen finden Sie unter Erstellen von Dokumentdefinitionen für mehrseitige Dokumente und Zusammenstellen von Seiten zu Dokumenten.
    • Für jede Bilddatei Wenn diese Option ausgewählt ist, wird für jede Datei ein neues Dokument erstellt (eine Bilddatei kann mehrere Seiten enthalten).
    • Für Bilder, die getrennt werden durch Ein neues Dokument wird erstellt, wenn das Programm auf ein Trennblatt stößt. Um leere Seiten als Trennseiten zu verwenden, wählen Sie in der Dropdown-Liste die Option Leere Seiten aus. Geben Sie im Dialogfeld Leere-Seiten-Erkennung, das daraufhin geöffnet wird, die Parameter an, anhand derer leere Seiten erkannt werden. Um Seiten mit Barcodes als Trennseiten zu verwenden, wählen Sie in der Dropdown-Liste die Option Seiten mit Barcode aus. Zusätzliche Parameter können Sie über die Schaltfläche Settings… festlegen. Beachten Sie, dass sich der Dokumentbezeichner in den entsprechenden Barcodewert ändert, wenn Sie einen Barcodewert angeben. Wenn Trennseiten nicht zum Batch hinzugefügt werden sollen, wählen Sie Trennseiten löschen aus. Wenn diese Option nicht aktiviert ist, werden Trennseiten zum Batch hinzugefügt und bilden jeweils die erste Seite eines Dokuments. Hinweis: Sie müssen keine Trennseiten verwenden, um Seiten in Dokumente aufzuteilen. Trennseiten sind nur in einem Fall unverzichtbar: wenn das Erscheinungsbild einer Seite keine eindeutige Zuordnung zum vorherigen oder zum nächsten Dokument zulässt. Das ist zum Beispiel dann der Fall, wenn ein Dokument eine beliebige Anzahl identischer Seiten enthalten kann und der Batch mehr als ein solches Dokument enthält. Hinweis: Bei Dokumenten, die in der Scanning Station gescannt oder hinzugefügt wurden, werden die Optionen für die Batch- und Dokumententrennung in der Scanning Station in den Batch-Typ-Einstellungen festgelegt.
  • Optionen zur Verarbeitung eingehender Bilder:
  • Auto (FlexiCapture entscheidet, welche Verbesserungen angewendet werden). Das Programm wählt automatisch die am besten geeigneten Bildverbesserungen aus. Dieser Modus wird für Bilder normaler Qualität empfohlen, die keine komplexe Verarbeitung erfordern. Wichtig! Ab ABBYY FlexiCapture 12 Release 5 wurde Basic image processing durch Auto (FlexiCapture entscheidet, welche Verbesserungen angewendet werden) ersetzt. Wenn in Ihren Projekten die standardmäßigen Einstellungen für Basic image processing verwendet wurden, wird der neue Modus Auto automatisch ausgewählt, wenn Sie Ihre Projekte auf ABBYY FlexiCapture 12 Release 5 oder höher aktualisieren. Weitere Informationen finden Sie unter Basic image processing veraltet.
Zusätzlich können Sie in diesem Modus:
  • einen Bildquellentyp auswählen: Photo, Scan, Digital-born und Auto. Um optimale Verarbeitungsergebnisse zu erzielen, wählen Sie den Bildquellentyp aus, der Ihren Bildern entspricht. Standardmäßig ist Auto ausgewählt; diese Option ist für die Verarbeitung gemischter Bildtypen vorgesehen.
  • die Option Crop image deaktivieren.
  • die Option Correct page orientation deaktivieren.
Hinweis: Die Entzerrung auf Grundlage schwarzer Trennlinien oder schwarzer Quadrate ist im Bildverbesserungsmodus Auto nicht enthalten. Sie können jedoch ein Profil zur Bildoptimierung erstellen und darin das Werkzeug Deskew aktivieren.
  • Profil zur Bildoptimierung verwenden. Verwenden Sie ein spezielles Profil zur Bildoptimierung. Diese Option wird für bestimmte Bilder empfohlen, die in einem einheitlichen oder gemischten Bildstrom verarbeitet werden und komplexere Bearbeitungswerkzeuge erfordern. Wenn Sie Fotos verarbeiten möchten, die in einem gemischten Bildstrom eingespeist werden und einen Werkzeugsatz erfordern, der vom Standard abweicht, markieren Sie die Option Use special profile for photos und wählen Sie das zweite Profil aus.
    • Originalbild während der Verarbeitung speichern. Mit dieser Option können Sie Originalbilder im Dateispeicher speichern. So können Sie zum Originalbild zurückkehren, wenn nach der automatischen Verarbeitung wichtige Daten gelöscht wurden. Hinweis: Das Speichern von Originalbildern erhöht den von einem Projekt belegten Speicherplatz und verlangsamt die Verarbeitung. Daher wird empfohlen, diese Option nur dann zu aktivieren, wenn Sie wirklich zum Originalbild zurückkehren müssen, z. B. wenn Funktionen wie das Zuschneiden von Bildern oder das Entfernen von Stempeln in den Vorverarbeitungsoptionen aktiviert sind.
  • PDF-Verarbeitungsoptionen:
  • Automatisch (FlexiCapture wählt zwischen PDF-Textebene und OCR) – Der optimale Verarbeitungstyp wird abhängig von der Verfügbarkeit und Qualität einer Textebene automatisch ausgewählt.
    • PDF-Textebene bevorzugen, falls verfügbar – Der Text in der Textebene wird verwendet, sofern er verfügbar ist.
    • Nur OCR verwenden – OCR wird für alle Dokumente durchgeführt, auch für solche mit einer Textebene.
  • Vorverarbeitungsoptionen für Dateien in Office-Formaten. Zusätzlich zur Verarbeitung importierter Dokumentbilddateien können Sie auch Dokumente in Office-Formaten importieren und sie mithilfe eines integrierten Konvertierungsmoduls oder einer Drittanbietersoftware in PDF umwandeln. Um eine Drittanbietersoftware für die Umwandlung in PDF zu verwenden, wählen Sie eine oder beide der folgenden Optionen aus:
  • Verwendung von LibreOffice® zulassen (unterstützt LibreOffice 4.2, 4.3, 4.4 und 5)
    • Verwendung von Microsoft® Office zulassen (unterstützt Microsoft Office 2010, 2013, 2016 und 2019)
Sie können Dokumentbilder und Office-Dateien gleichzeitig importieren (siehe Unterstützte Eingabeformate). Hinweis:
  1. Wenn Sie aus E-Mail importieren, können Nachrichtentexte als Dokumente verwendet werden.
  2. Wenn beide Vorverarbeitungsoptionen für Office-Dateien ausgewählt sind, wählt ABBYY FlexiCapture automatisch die am besten geeignete Office-Anwendung aus. Die ausgewählte Anwendung wird im entsprechenden Taskprotokoll angegeben.
  3. Die Umwandlung in PDF mit einer Drittanbieteranwendung funktioniert nur, wenn die entsprechende Anwendung auf der Processing Station installiert ist, die zum Importieren von Dokumenten verwendet wird.
  4. Wenn Sie Microsoft Office zum Umwandeln von Office-Dateien verwenden:
    • Ihre Kopie von Microsoft Office muss aktiviert sein.
      • Sie müssen das Programm als Administrator ausführen (klicken Sie auf die Schaltfläche Authentication…, um das Dialogfeld für die Authentifizierungseinstellungen zu öffnen).