Zum Hauptinhalt springen
Das Programm bildet White Gap-Hypothesen, indem es Histogramme der Kandidatenobjekte erstellt. Standardmäßig sucht das Programm nach einem White Gap zwischen Any Text-Objekten. Um nach einem White Gap zwischen anderen Objekttypen zu suchen (z. B. zwischen Trennlinien), müssen Sie im Dialogfeld Properties des Elements White Gap eine entsprechende Einschränkung festlegen (Registerkarte Advanced, Feld „Advanced pre-search relations“). Wenn Sie beispielsweise ein White Gap in einem Bereich finden möchten, in dem alle Objekttypen vorkommen können, müssen Sie den folgenden Ausdruck eingeben: Type: PictureObject + SeparatorObject+ AnyText + PunctuationMark + CheckMarkObject;.

Ein Histogramm wird wie folgt erstellt:

Das Programm projiziert alle Objekte eines bestimmten Typs, die im Suchbereich erkannt wurden, auf die horizontale oder vertikale Achse. Die Projektion ist die Summe der Breiten bzw. Höhen der Objekte. Wenn nach einer horizontalen Lücke gesucht wird, erstellt das Programm eine Projektion auf die vertikale Achse. Wenn nach einer vertikalen Lücke gesucht wird, erstellt das Programm eine Projektion auf die horizontale Achse; wenn nach einer horizontalen Lücke gesucht wird, erstellt das Programm eine Projektion auf die vertikale Achse. Die lineare Größe jedes Objekts der angegebenen Größe wird zur Projektion addiert. Um beispielsweise eine vertikale White Gap zwischen den Textobjekten zu finden, summiert das Programm die Höhen aller Textobjekte, die sich im Suchbereich oberhalb eines bestimmten Punkts auf der horizontalen Achse befinden und den Suchbereich des Elements schneiden. Anschließend sucht das Programm nach Regionen, in denen die Höhe des Histogramms unter einem bestimmten Wert liegt. Diese Regionen entsprechen Bereichen, in denen die Anzahl der Objekte relativ klein ist und ihre Projektion unter einem bestimmten vordefinierten Wert liegt. Das Programm muss zulassen, dass sich eine bestimmte Anzahl von Objekten in der White Gap befindet, da reale Bilder oft Sprenkel und anderes beim Scannen entstehendes Rauschen enthalten, das bei der Suche nach Lücken zwischen Spalten oder Absätzen ignoriert werden muss. Hintergrundrauschen wirkt sich kaum auf das Gesamtprofil aus. Angenommen, wir haben Textobjekte H1, H2,…, H9 im Suchbereich. In der folgenden Abbildung sind diese Objekte schwarz hervorgehoben. Nehmen wir an, dass die Suche weitere Objekttypen enthält (rot hervorgehoben). Um die vertikale White Gap zu finden, müssen wir die Projektionen der Textobjekte auf die horizontale Achse aufsummieren. Das resultierende Histogramm ist in der folgenden Abbildung dargestellt. Sie sehen, dass Nicht-Textobjekte im Histogramm ignoriert werden. Als Nächstes müssen wir das Maximum des Histogramms bestimmen (in der Abbildung als Max markiert). Der Wert dieses Maximums wird dann mit dem in Threshold coefficient (%) festgelegten Wert multipliziert (K=0.2). Das Ergebnis ist der maximal zulässige Wert der weiße Lücke-Schwellenwert (in der Abbildung als weiße Lücke-Schwellenwert markiert). Wenn der resultierende weiße Lücke-Schwellenwert >0 ist, dürfen andere Objekte im Bereich der White Gap vorhanden sein. Sobald der weiße Lücke-Schwellenwert berechnet wurde, wird er mit den in Lower threshold limit und Upper threshold limit festgelegten Werten verglichen. Wenn weiße Lücke-Schwellenwert < Lower threshold limit, wird weiße Lücke-Schwellenwert der Wert von Lower threshold limit zugewiesen, und dieser Wert wird für die Suche nach der White Gap verwendet. Wenn weiße Lücke-Schwellenwert > Upper threshold limit, wird weiße Lücke-Schwellenwert der Wert von Upper threshold limit zugewiesen. Anschließend werden die Höhen im Histogramm mit dem weiße Lücke-Schwellenwert verglichen, um Bereiche zu finden, in denen der Wert des Histogramms kleiner ist als der weiße Lücke-Schwellenwert. Die Eigenschaft Min width**/height** legt die minimale absolute Breite der White Gap fest. Wenn der Wert W2 ist, werden die beiden anderen Hypothesen verworfen. Eine White Gap-Hypothese hat die folgenden Eigenschaften:
EigenschaftBeschreibung
Element nameDer vollständige Name des Elements.
PageDie Nummer der Seite, auf der das Element erkannt wurde.
Surrounding rectDie Koordinaten des Rectangle, das die Region der Hypothese umgibt.
WidthDie Breite der Region der Hypothese.
HeightDie Höhe der Region der Hypothese.
OrientierungDie Orientierung der erkannten White Gap.
Maximalwert des Histogramms im SuchbereichDer Höchstwert des Histogramms im Suchbereich.
weiße Lücke-SchwellenwertDer Punkt im Histogramm, unterhalb dessen das Programm beginnt, White Gap-Hypothesen zu formulieren.
Maximalwert des Histogramms innerhalb der HypotheseDer Höchstwert des Histogramms innerhalb der Hypothese.
DetectedZeigt an, ob das durch das Element beschriebene Objekt gefunden wurde (true) oder ob eine Nullhypothese formuliert wurde (false).
From the best pathZeigt an, ob die gefundene Hypothese zum best path im Tree of Hypotheses gehört (true) oder nicht (false).
Qualität der VorsucheGibt an, wie gut die Hypothese mit den Eigenschaften des Elements übereinstimmt, die durch die Einstellungen im Dialogfeld Properties und durch den Code in den Advanced pre-search relations angegeben werden.
Qualität der NachsucheDie Qualität der Hypothese, nachdem die Bedingungen im Feld Advanced post-search relations angewendet wurden.
Chain qualityDie Qualität der Kette von Hypothesen, vom ersten Unterelement der Gruppe bis zum aktuellen Unterelement. Chain quality wird berechnet, indem die Qualitäten aller Unterelemente in der Kette multipliziert werden, und dient zum Vergleich konkurrierender Hypothesenketten.

Weitere Informationen:

White Gap Suchbereich Zusätzliche Sucheinschränkungen