Bildvorverarbeitung

Warum Bilder verbessern?

Die Verbesserung der Bildqualität hat zwei Aspekte. Einerseits müssen wir die Qualität der Bilder verbessern, damit sie sich besser für Optical Character Recognition (OCR) eignen.

Andererseits müssen wir das Erscheinungsbild der Bilder verbessern, was beispielsweise erforderlich ist, wenn Dokumentbilder in Archiven gespeichert werden.

Da die Technologien von ABBYY auf Dokumentanalyse und -erkennung ausgerichtet sind, umfasst das System eine Reihe leistungsstarker Technologien zur Bildvorverarbeitung: adaptive Binärisierung, Korrektur von Verzerrungen, Begradigung von Textzeilen, Trennung von Doppelseiten und weitere. Für präzise OCR-Ergebnisse sind keine Tools von Drittanbietern erforderlich. ABBYY bietet ein vollständiges Spektrum an Vorverarbeitungstechnologien für OCR.

Nach dem Einlesen von Bildern führt ABBYY FineReader Engine eine Reihe von Bildvorverarbeitungsfunktionen aus, um die Qualität der Dokumentbilder für die weitere Erkennung oder Archivierung zu verbessern:


	Diese Funktion zur Dokumentenbildverarbeitung ist besonders wichtig bei der Massenverarbeitung von Bildern, wenn die Ausrichtung der gescannten Dokumentseiten unbekannt ist oder variieren kann. Das System erkennt die Ausrichtung jeder Seite automatisch und korrigiert sie bei Bedarf.
	Diese Funktion wird beim Scannen von Büchern als Doppelseiten verwendet – sowohl für linke als auch für rechte Seiten. Die Erkennungsqualität ist höher, wenn die Seite in zwei Einzelseiten aufgeteilt wird, wobei jede Seite einer einzelnen Buchseite entspricht. Erkennung und Layout-Analyse werden anschließend für jede Seite separat durchgeführt, bei Bedarf einschließlich der Schieflagekorrektur.
	Dies ist eine wesentliche Funktion der Dokumentenbildverarbeitung, die auf gescannte Dokumente angewendet wird, bei denen eine Korrektur der Bildschieflage erforderlich ist. Sie erfordert keine Randlinien oder Führungslinien. ABBYY FineReader Engine 12 bietet mehrere Methoden zur Schieflagekorrektur von Bildern: mithilfe von Paaren schwarzer Quadrate, Linien oder Textzeilen.
	Beim Erfassen von Text aus gescannten oder fotografierten Büchern können Textzeilen ungleichmäßig und schwer mittels Optical Character Recognition (OCR) zu verarbeiten sein. ABBYY-Technologien bieten spezielle Algorithmen, die die Schieflage korrigieren und Textzeilen für eine präzise Texterkennung begradigen.
	Beim Scannen von Dokumenten mit geringer bis mittlerer Qualität können stark verrauschte Bilder mit zahlreichen Punkten oder Flecken entstehen. Treten diese Flecken in der Nähe von Buchstaben oder Zahlen auf, kann dies die OCR-Qualität beeinträchtigen. Diese Funktion entfernt solches Rauschen. Die Größe der zu entfernenden Flecken kann vom Benutzer festgelegt werden. Die Funktion lässt sich sowohl auf ein gesamtes Bild als auch auf einzelne Blöcke (oder Zonen) des Bildes anwenden.
	Diese Technologie erkennt Digitalfotos automatisch und korrigiert Verzerrungen, die typischerweise durch Digitalkameras entstehen. Das System berücksichtigt typische Mängel, die häufig in digitalen Bildern auftreten, wie z. B. verzerrte Textzeilen und trapezförmige 3D-Verzerrungen, unscharfe Aufnahmen, Verschmierungen, abgedunkelte Bereiche auf gegenüberliegenden Seiten dicker Bücher, Lichtreflexe, ISO-Rauschen usw. Diese Mängel werden vom System automatisch korrigiert, sodass der Benutzer keine Drittanbieteranwendungen zur Fotokorrektur benötigt.
	Die Texturfilterungstechnologie filtert Hintergrund-„Rauschen” wie Farbe und Textur heraus und erhöht so die Erkennungsgenauigkeit bei schwer lesbaren Dokumenten wie Zeitungsdrucken, Farbdokumenten, Faxen und Kopien.


	Dabei werden Bilder in Schwarzweiß umgewandelt, Rauschen entfernt, der Hintergrund entfernt, Texturen entfernt und scharfer Text erzeugt. Der Prozess gewährleistet die beste Optical Character Recognition (OCR)-Qualität. Die erforderlichen Parameter werden für jedes Fragment separat ermittelt. Bei dünnem Zeitungspapier kann der auf der Rückseite gedruckte Text auf den Scans sichtbar sein. Die adaptive Binarisierung entfernt diesen Text. Die innovative Technologie der adaptiven Binarisierung passt den Helligkeitsschwellenwert für jedes Bildfragment während der Erkennung dynamisch an. Durch die Anwendung individueller Erkennungsparameter liefert sie präzise Erkennungsergebnisse für Dokumente mit grauem oder farblich variablem Kontrasthintergrund und Texturen.
	Dabei werden Graustufenbilder mithilfe sehr kleiner Punkte binarisiert. Dies verbessert das Erscheinungsbild des Dokuments, da es mehr Schattierungen aufzuweisen scheint.

Dabei werden Bilder in Schwarzweiß umgewandelt, Rauschen entfernt, der Hintergrund entfernt, Texturen entfernt und scharfer Text erzeugt. Der Prozess gewährleistet die beste Optical Character Recognition (OCR)-Qualität. Die erforderlichen Parameter werden für jedes Fragment separat ermittelt. Bei dünnem Zeitungspapier kann der auf der Rückseite gedruckte Text auf den Scans sichtbar sein. Die adaptive Binarisierung entfernt diesen Text.

Die innovative Technologie der adaptiven Binarisierung passt den Helligkeitsschwellenwert für jedes Bildfragment während der Erkennung dynamisch an. Durch die Anwendung individueller Erkennungsparameter liefert sie präzise Erkennungsergebnisse für Dokumente mit grauem oder farblich variablem Kontrasthintergrund und Texturen.

Dabei werden Graustufenbilder mithilfe sehr kleiner Punkte binarisiert. Dies verbessert das Erscheinungsbild des Dokuments, da es mehr Schattierungen aufzuweisen scheint.

Filter für Binärbilder
Bildskalierung	Bei Dokumenten, die mit niedriger Auflösung (weniger als 120 dpi) gescannt wurden, und bei Dokumenten mit kleinen Schriftgrößen (weniger als 10 pt) können die Bilder digital vergrößert werden, um eine bessere Optical Character Recognition (OCR)-Qualität zu erzielen.

Siehe auch

Hauptfunktionen

​Warum Bilder verbessern?