Zum Hauptinhalt springen
ParameterBeschreibung
String Value()Der Wert des Textes auf dem Bild innerhalb der Region der Hypothese.
Das Programm berücksichtigt alle Textobjekte, die den Suchbereich horizontal schneiden (vertikal müssen die Objekte vollständig in den Suchbereich passen). Die Textobjekte werden anschließend zu Zeilen gruppiert. Zeilen werden von links nach rechts aufgebaut. Das Programm beendet den Aufbau einer Zeile, wenn die maximale Länge von Leerzeichen (festgelegt in der Eigenschaft Max. Leerzeichenlänge) überschritten wird. In den resultierenden Zeilen identifiziert das Programm Zeichenfolgen, von denen jede nur Zeichen aus einem der benutzerdefinierten Zeichensätze enthält. In ähnlicher Weise teilt das Programm Zeilen in Fragmente. Als Nächstes formuliert das Programm für jedes der Fragmente eine Hypothese. Abhängig davon, ob Eingebettete Hypothesen zulassen ausgewählt ist oder nicht, werden Hypothesen nach zwei unterschiedlichen Prinzipien formuliert. Angenommen, das Programm hat in einem vorherigen Schritt drei Fragmente erkannt. Wenn Eingebettete Hypothesen zulassen ausgewählt ist, werden Hypothesen wie folgt formuliert: Hypothese 1: Fragment 1 Hypothese 2: Fragment 1 + Fragment 2 Hypothese 3: Fragment 1 + Fragment 2 + Fragment 3 Hypothese 4: Fragment 2 Hypothese 5: Fragment 2 + Fragment 3 Hypothese 6: Fragment 3 Für jede Hypothese prüft das Programm, dass der Anteil der Zeichen jedes Zeichensatzes den im Feld Anteil im Text, % festgelegten Wert nicht überschreitet. Ebenso prüft das Programm, dass der Prozentsatz nichtalphabetischer Zeichen den im Feld Zulässige Fehler festgelegten Wert nicht überschreitet. Wenn mindestens eine der Prüfungen fehlschlägt, wird keine Hypothese formuliert. Wenn Eingebettete Hypothesen zulassen nicht ausgewählt ist, werden die eingebetteten Hypothesen in der obigen Liste verworfen. Eingebettete Hypothesen sind solche, die in einer anderen Hypothese in der obigen Liste enthalten sind. Wenn die Prüfungen für alle Hypothesen erfolgreich waren, bleibt nur die folgende Hypothese bestehen: Fragment 1 + Fragment 2 + Fragment 3. Wenn Eingebettete Hypothesen zulassen nicht ausgewählt ist, formuliert das Programm also Hypothesen mit maximaler Länge, die alle Bedingungen erfüllen. Auch wenn eingebettete Hypothesen ausgeschlossen sind, können sich Hypothesen überschneiden. Dies kann ein einzelnes Zeichen oder Wort sein oder eine Zeichenfolge, die Teil anderer Hypothesen ist, für die jedoch keine separaten Hypothesen formuliert wurden. Beispielsweise kann das Programm zwei Hypothesen formulieren (d. h. zwei Zeichenfolgen) – eine, die mit einem bestimmten Wort oder einer bestimmten Wortgruppe endet, und eine andere, die mit diesem Wort bzw. dieser Wortgruppe beginnt. Z. B. Hypothese 1: Fragment 1 + Fragment 2 Hypothese 2: Fragment 2 + Fragment 3 Sobald alle möglichen Hypothesen generiert wurden, berechnet das Programm die Qualität der Suchbedingung für jede (dies ist eine Schätzung dafür, wie gut eine Hypothese die in den Suchbedingungen festgelegten Suchbeschränkungen erfüllt). In diesem Stadium wird die Qualität anhand folgender Kriterien berechnet: ob die Länge der Hypothese in Zeichen innerhalb des in der Eigenschaft Zeichenzahl angegebenen unscharfen Intervalls liegt, ob die Länge der Gesamtlücke in der Zeile innerhalb des in TotalGapLength angegebenen unscharfen Intervalls liegt und ob die Anzahl der Wörter in der Zeile innerhalb des in der Wortanzahl angegebenen unscharfen Intervalls liegt. Die Gesamtqualität einer Hypothese wird berechnet, indem alle Einzelqualitäten multipliziert werden.