Zum Hauptinhalt springen
ParameterBeschreibung
String Value()Der Wert des Textes im Bild innerhalb der Region der Hypothese.
Das Programm berücksichtigt alle Textobjekte, die den Suchbereich horizontal schneiden (vertikal müssen die Objekte vollständig innerhalb des Suchbereichs liegen). Die Textobjekte werden anschließend in Zeilen gruppiert. Zeilen werden von links nach rechts aufgebaut. Das Programm bricht den Aufbau einer Zeile ab, wenn die maximale Leerzeichenlänge (festgelegt in der Eigenschaft Max. Leerzeichenlänge) überschritten wird. In den resultierenden Zeilen identifiziert das Programm Zeichenketten, von denen jede nur Zeichen aus einem der benutzerdefinierten Zeichensätze enthält. In ähnlicher Weise teilt das Programm Zeilen in Fragmente auf. Als Nächstes formuliert das Programm für jedes Fragment eine Hypothese. Je nachdem, ob Eingebettete Hypothesen zulassen ausgewählt ist oder nicht, werden Hypothesen nach zwei unterschiedlichen Prinzipien formuliert. Angenommen, das Programm hat in einem vorherigen Schritt drei Fragmente erkannt. Wenn Eingebettete Hypothesen zulassen ausgewählt ist, werden Hypothesen wie folgt formuliert: Hypothese 1: Fragment 1 Hypothese 2: Fragment 1 + Fragment 2 Hypothese 3: Fragment 1 + Fragment 2 + Fragment 3 Hypothese 4: Fragment 2 Hypothese 5: Fragment 2 + Fragment 3 Hypothese 6: Fragment 3 Für jede Hypothese prüft das Programm, dass der Anteil der Zeichen jedes Zeichensatzes den im Feld Anteil im Text, % festgelegten Wert nicht überschreitet. Ebenso prüft das Programm, dass der Prozentsatz nichtalphabetischer Zeichen den im Feld Zulässige Fehler festgelegten Wert nicht überschreitet. Wenn mindestens eine der Prüfungen fehlschlägt, wird keine Hypothese formuliert. Wenn Eingebettete Hypothesen zulassen nicht ausgewählt ist, werden die eingebetteten Hypothesen in der obigen Liste verworfen. Eingebettete Hypothesen sind solche, die innerhalb einer anderen Hypothese in der obigen Liste enthalten sind. Wenn die Prüfungen für alle Hypothesen erfolgreich waren, bleibt nur die folgende Hypothese bestehen: Fragment 1 + Fragment 2 + Fragment 3. Wenn Eingebettete Hypothesen zulassen nicht ausgewählt ist, formuliert das Programm Hypothesen maximaler Länge, die alle Bedingungen erfüllen. Auch wenn eingebettete Hypothesen ausgeschlossen sind, können sich Hypothesen überschneiden. Dies kann ein einzelnes Zeichen oder Wort sein oder eine Zeichenfolge, die Teil anderer Hypothesen ist, für die jedoch keine separaten Hypothesen formuliert wurden. Beispielsweise kann das Programm zwei Hypothesen formulieren (d. h. zwei Zeichenketten) – eine, die mit einem bestimmten Wort oder Ausdruck endet, und eine andere, die mit diesem Wort oder Ausdruck beginnt. Z. B. Hypothese 1: Fragment 1 + Fragment 2 Hypothese 2: Fragment 2 + Fragment 3 Sobald alle möglichen Hypothesen generiert wurden, berechnet das Programm für jede die Qualität der Suchbedingung (dies ist eine Schätzung, wie gut eine Hypothese die in den Suchbedingungen festgelegten Suchbeschränkungen erfüllt). In dieser Phase wird die Qualität anhand folgender Kriterien berechnet: ob die Länge der Hypothese in Zeichen innerhalb des in der Eigenschaft Zeichenzahl angegebenen unscharfen Intervalls liegt, ob die Länge der gesamten Lücke in der Zeile innerhalb des in TotalGapLength angegebenen unscharfen Intervalls liegt und ob die Anzahl der Wörter in der Zeile innerhalb des in Wortzahl angegebenen unscharfen Intervalls liegt. Die Gesamtqualität einer Hypothese wird berechnet, indem alle Teilqualitäten miteinander multipliziert werden.