Suche nach Ziffernfolgen

Ein Element vom Typ Zeichenkette wird verwendet, um nach Ziffernfolgen zu suchen. Wenn die Bildqualität sehr gut ist, kann sogar ein regulärer Ausdruck als Alphabet angegeben werden. Wenn die Qualität der Bilder im Batch jedoch unterschiedlich ist, müssen Sie die Liste der Zeichen angeben, die im entsprechenden Feld erkannt werden können. Wenn die Qualität der Bilder oder des Drucks unzureichend ist, können Ziffern fälschlicherweise als andere Zeichen erkannt werden. Zum Beispiel kann 8 als B, 7 als ?, 5 als S und 4 als H oder als Buchstabenkombination LI erkannt werden. Das kann passieren, wenn die Ziffern „zusammenkleben“, was häufig vorkommt, wenn Dokumente mit einer Schreibmaschine ausgefüllt werden.

Fügen Sie dem Alphabet fälschlich erkannte Zeichen hinzu

Wie gut die Erkennungsergebnisse mit den tatsächlichen Zeichen übereinstimmen, hängt von der Bildqualität ab. Wenn auf allen oder den meisten verarbeiteten Bildern Zeichen häufig falsch interpretiert werden, sollten Sie diese Erkennungsvarianten im Fenster Edit Alphabet des entsprechenden Character String-Elements zum Alphabet hinzufügen. Durch die Angabe dieser Zeichen weisen Sie FlexiLayout Studio an, die Hypothese nicht abzuwerten, wenn diese Zeichen im Suchbereich vorkommen.

Es ist nicht nötig, alle möglichen Erkennungsvarianten anzugeben. Wenn die Qualität der Bilder schlecht ist, kann es äußerst zeitaufwendig sein, alle diese Varianten zu finden.Wenn die Erkennungsergebnisse aufgrund der niedrigen Bildqualität unvorhersehbar sind, sollten Sie die Suche stattdessen anhand anderer Elementeigenschaften durchführen, etwa anhand der string-Länge und der Länge von Leerzeichen in der Zeichenkette.

Geben Sie die Zeichen an, deren Umrisse denen von Ziffern ähneln. Die Wahrscheinlichkeit einer falschen Erkennung ist bei solchen Zeichen höher als bei den übrigen. Sie können auch andere Zeichen angeben, wenn sie häufig mit Ziffern verwechselt werden.

Screenshot des Fensters „Edit Alphabet“, in dem Ziffern und falsch erkannte Zeichen zum Alphabet des Character String-Elements hinzugefügt wurden

Abgleich mit einem Alphabet, das nur Ziffern enthält

Betrachten Sie das Projekt 1.fsp (Ordner Digital strings\Project1). Das Projekt hat drei Seiten, jede mit einem anderen Erkennungsfehler:

Seite	Erkennungsfehler
Seite 1	Die Ziffer `4` wird als Buchstabenkombination `LI` erkannt.
Seite 2	Die Teilzeichenfolge `13` wird als Buchstabe `å` erkannt.
Seite 3	Die Ziffer `0` wird als `a` erkannt, `2` und `5` als `S` sowie `6` und `8` als `B`.

Um die Ziffernzeichenkette zu erkennen, verwendet das Projekt ein Character String-Element mit dem Namen DigitalString, dessen Alphabet nur Ziffern enthält. Der maximale Anteil nicht numerischer Zeichen ist auf 20 festgelegt. Nach dem Ausführen des Abgleichs des FlexiLayouts für alle Seiten wurde das Ziffernfeld auf Seite 3 nicht vollständig erkannt. Der Quality-Wert der Hypothese liegt bei etwa 0,98. Auf den Seiten 1 und 2 wurde die Zeichenkette erkannt. Da sie jedoch Zeichen enthält, die nicht zum Alphabet gehören, wurden die entsprechenden Hypothesen abgewertet; ihre Quality beträgt 0,978 bzw. 0,982.

Erneuter Abgleich mit dem erweiterten Alphabet

Betrachten wir nun die Ergebnisse des Abgleichs des FlexiLayouts, wenn dem Alphabet die Zeichen hinzugefügt werden, die fälschlicherweise anstelle von Ziffern erkannt wurden (L, I, e, a, B, S). Das Ergebnis des Abgleichs des FlexiLayouts ist im Projekt 2.fsp zu sehen (Ordner %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\Tips and Tricks\Digital strings\Project2). Die übrigen Einstellungen in den Projekten sind identisch. Wie Sie sehen, wurde die Zeichenkette auf Seite 3 vollständig erkannt, und die Qualität aller erzeugten Hypothesen beträgt 1.

Die Eigenschaft Optional eines Gruppenelements

Zurück

Vereinfachen Sie ein FlexiLayout mit einem Hilfselement und einer Nullhypothese

Weiter

⌘I

Introducing ABBYY FlexiLayout Studio

Program interface

Projects

Batches

FlexiLayouts

Multi-page FlexiLayout

Pre-recognition

Elements

Blocks

Working with tables

Hypotheses and trees of hypotheses

Debugging the FlexiLayout

Classification

Export

FlexiLayout language

Tips and tricks

Appendix

Tutorial

Fügen Sie dem Alphabet fälschlich erkannte Zeichen hinzu

Abgleich mit einem Alphabet, das nur Ziffern enthält

Erneuter Abgleich mit dem erweiterten Alphabet

​Fügen Sie dem Alphabet fälschlich erkannte Zeichen hinzu

​Abgleich mit einem Alphabet, das nur Ziffern enthält

​Erneuter Abgleich mit dem erweiterten Alphabet

Fügen Sie dem Alphabet fälschlich erkannte Zeichen hinzu

Abgleich mit einem Alphabet, das nur Ziffern enthält

Erneuter Abgleich mit dem erweiterten Alphabet