Zum Hauptinhalt springen
Ein Element vom Typ Zeichenkette wird verwendet, um nach Ziffernfolgen zu suchen. Wenn die Bildqualität sehr gut ist, kann sogar ein regulärer Ausdruck als Alphabet angegeben werden. Wenn die Qualität der Bilder im Batch jedoch unterschiedlich ist, müssen wir die Liste der Zeichen angeben, die im entsprechenden Feld erkannt werden können. Wenn die Qualität der Bilder oder des Drucks unzureichend ist, können Ziffern fälschlicherweise als andere Zeichen erkannt werden. Zum Beispiel kann „8“ als „B“, „7“ als „?“, „5“ als „S“, „4“ als „H“ oder als Buchstabenkombination „LI“ erkannt werden usw. Das kann passieren, wenn die Ziffern „zusammenkleben“, was häufig vorkommt, wenn Dokumente mit einer Schreibmaschine ausgefüllt werden. Wie gut die Erkennungsergebnisse mit den tatsächlichen Zeichen übereinstimmen, hängt von der Bildqualität ab. Wenn auf allen oder den meisten verarbeiteten Bildern Zeichen häufig falsch interpretiert werden, sollten Sie diese Erkennungsvarianten im Fenster Edit Alphabet des entsprechenden Elements Zeichenkette zum Alphabet hinzufügen. Durch die Angabe dieser Zeichen weisen Sie das Programm an, die Hypothese nicht abzuwerten, wenn diese Zeichen im Suchbereich vorkommen.
Es ist natürlich nicht nötig, alle möglichen Erkennungsvarianten anzugeben. Wenn die Qualität der Bilder schlecht ist, kann es äußerst zeitaufwendig sein, alle diese Varianten zu finden. Wenn die Erkennungsergebnisse aufgrund der niedrigen Bildqualität unvorhersehbar sind, sollten Sie die Suche stattdessen anhand anderer Elementeigenschaften durchführen, etwa anhand der string-Länge, der Länge von Leerzeichen in der Zeichenkette usw.
Geben Sie die Zeichen an, deren Umrisse denen von Ziffern ähneln. Die Wahrscheinlichkeit einer falschen Erkennung ist bei solchen Zeichen höher als bei den übrigen. Falls erforderlich, können Sie auch andere Zeichen angeben, wenn sie häufig mit Ziffern verwechselt werden. Betrachten wir das Projekt 1.fsp (Ordner Digital strings\Project1). Das Projekt hat 3 Seiten.
  • Seite 1 – die Ziffer 4 wird als Buchstabenkombination „LI“ erkannt;
  • Seite 2 – die Teilzeichenkette 13 wird als Buchstabe „å“ erkannt;
  • Seite 3 – die Ziffer 0 wird als „a“ erkannt, 2 und 5 werden als „S“ erkannt, 6 und 8 als „B“.
Um die Ziffernfolge zu erkennen, haben wir ein Element vom Typ Zeichenkette erstellt, es DigitalString genannt und nur Ziffern als Alphabet angegeben. Den maximalen Prozentsatz an Nicht-Ziffern-Zeichen haben wir auf 20 gesetzt. Nach dem Ausführen des FlexiLayout-Matching auf allen Seiten wurde das Ziffernfeld auf Seite 3 nicht vollständig erkannt. Der Qualitätswert der Hypothese liegt bei etwa 0,98. Auf den Seiten 1 und 2 wurde die Zeichenkette erkannt. Da sie jedoch Zeichen außerhalb des Alphabets enthält, wurden die entsprechenden Hypothesen abgewertet, und ihre Qualität betrug 0,978 bzw. 0,982. Sehen wir uns nun die Ergebnisse des FlexiLayout-Matching an, wenn wir dem Alphabet die Zeichen hinzufügen, die fälschlicherweise anstelle von Ziffern erkannt wurden: L, I, e, a, B, S. Das Ergebnis des FlexiLayout-Matching ist im Projekt 2.fsp zu sehen (Ordner %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks\Digital strings\Project2). Die übrigen Einstellungen in den Projekten sind identisch. Wie Sie sehen, wurde die Zeichenkette auf Seite 3 vollständig erkannt, und die Qualität aller erzeugten Hypothesen beträgt 1.