Zum Hauptinhalt springen
Das Programm sucht nach Tabellen und unterteilt sie mithilfe von Trennlinien und White Gaps im Bild in Spalten und Zeilen. Zusätzlich werden Tabellenkopfzeilen und Tabellenfußzeilen verwendet, um die Tabellenerkennung zu erleichtern. Kopf- und Fußzeilen dienen als obere und untere Grenzen für Tabellenkörper; aus ihnen werden keine Informationen extrahiert. Die Kopfzeile enthält die Namen der Spalten, die zur Unterteilung der Tabelle in Spalten verwendet werden können. Sobald eine Tabelle erkannt wurde, formuliert das Programm Hypothesen für das gesamte Table-Element sowie für seine Spalten, Zeilen und Zellen. Eine Tabelle-Hypothese hat die folgenden Eigenschaften:
EigenschaftBeschreibung
Element nameDer vollständige Name des Elements.
PageDie Nummer der Seite, auf der das Element erkannt wurde.
Surrounding rectDie Koordinaten des Rectangle, das die Region der Hypothese umgibt.
WidthDie Breite der Region der Hypothese.
HeightDie Höhe der Region der Hypothese.
Header gefundenZeigt an, ob die Tabellenkopfzeile gefunden wurde.
Footer gefundenZeigt an, ob die Tabellenfußzeile gefunden wurde.
Tabellenkörper gefundenZeigt an, ob der Tabellenkörper gefunden wurde.
Order nameDer Name der erkannten Spaltenreihenfolge in der Tabelle.
DetectedZeigt an, ob das durch das Element beschriebene Objekt gefunden wurde (true) oder ob eine Nullhypothese formuliert wurde (false).
From the best pathZeigt an, ob die gefundene Hypothese zum besten Pfad im Hypothesenbaum gehört (true) oder nicht (false).
Pre-search qualityWie gut die Hypothese mit den Eigenschaften des Elements übereinstimmt, die durch die Einstellungen im Dialogfeld Properties und durch den Code im Feld Advanced pre-search relations angegeben sind.
Post-search qualityDie Qualität der Hypothese, nachdem die Bedingungen im Feld Advanced post-search relations angewendet wurden.
Chain qualityDie Qualität der Hypothesenkette vom ersten Unterelement der Gruppe bis zum aktuellen Unterelement. Die Chain quality wird durch Multiplikation der Qualitäten aller Unterelemente in der Kette berechnet und zum Vergleich konkurrierender Hypothesenketten verwendet.
Eine Tabellenkopfzeile-Hypothese hat die folgenden Eigenschaften:
EigenschaftBeschreibung
Element nameDer vollständige Name des Elements.
PageDie Nummer der Seite, auf der das Element erkannt wurde.
Surrounding rectDie Koordinaten des Rectangle, das die Region der Hypothese umgibt.
WidthDie Breite der Region der Hypothese.
HeightDie Höhe der Region der Hypothese.
Liste der SpaltennamenZeigt die gefundenen Tabellenspalten an.
DetectedZeigt an, ob das durch das Element beschriebene Objekt gefunden wurde (true) oder ob eine Nullhypothese formuliert wurde (false).
From the best pathZeigt an, ob die gefundene Hypothese zum besten Pfad im Hypothesenbaum gehört (true) oder nicht (false).
Pre-search qualityWie gut die Hypothese mit den Eigenschaften des Elements übereinstimmt, die durch die Einstellungen im Dialogfeld Properties und durch den Code im Feld Advanced pre-search relations angegeben sind.
Post-search qualityDie Qualität der Hypothese, nachdem die Bedingungen im Feld Advanced post-search relations angewendet wurden.
Chain qualityDie Qualität der Hypothesenkette vom ersten Unterelement der Gruppe bis zum aktuellen Unterelement. Die Chain quality wird durch Multiplikation der Qualitäten aller Unterelemente in der Kette berechnet und zum Vergleich konkurrierender Hypothesenketten verwendet.
Eine Tabellenfußzeile-Hypothese hat die folgenden Eigenschaften:
PropertyBeschreibung
Element nameDer vollständige Name des Elements.
SeiteDie Nummer der Seite, auf der das Element erkannt wurde.
Surrounding rectDie Koordinaten des Rechtecks, das die Region der Hypothese umschließt.
WidthDie Breite der Region der Hypothese.
HeightDie Höhe der Region der Hypothese.
DetectedZeigt an, ob das durch das Element beschriebene Objekt gefunden wurde (true) oder ob eine Nullhypothese erstellt wurde (false).
From the best pathZeigt an, ob die gefundene Hypothese zum besten Pfad im Hypothesenbaum gehört (true) oder nicht (false).
Pre-search qualityGibt an, wie gut die Hypothese mit den Eigenschaften des Elements übereinstimmt, die durch die Einstellungen im Dialogfeld Properties und durch den Code im Feld Advanced pre-search relations festgelegt sind.
Post-search qualityDie Qualität der Hypothese, nachdem die Bedingungen im Feld Advanced post-search relations angewendet wurden.
Chain qualityDie Qualität der Hypothesenkette vom ersten Unterelement der Gruppe bis zum aktuellen Unterelement. Chain quality wird berechnet, indem die Qualitäten aller Unterelemente in der Kette multipliziert werden, und dient zum Vergleich konkurrierender Hypothesenketten.
Eine Hypothese für den Tabellenkörper hat die folgenden Eigenschaften:
PropertyBeschreibung
Element nameDer vollständige Name des Elements.
SeiteDie Nummer der Seite, auf der das Element erkannt wurde.
Surrounding rectDie Koordinaten des Rechtecks, das die Region der Hypothese umschließt.
WidthDie Breite der Region der Hypothese.
HeightDie Höhe der Region der Hypothese.
Order nameZeigt den Namen der gefundenen Spaltenreihenfolge an.
Found columnsZeigt die Namen der gefundenen Spalten an.
Rows numberZeigt die Anzahl der in der Tabelle gefundenen Zeilen an.
DetectedZeigt an, ob das durch das Element beschriebene Objekt gefunden wurde (true) oder ob eine Nullhypothese erstellt wurde (false).
From the best pathZeigt an, ob die gefundene Hypothese zum besten Pfad im Hypothesenbaum gehört (true) oder nicht (false).
Pre-search qualityGibt an, wie gut die Hypothese mit den Eigenschaften des Elements übereinstimmt, die durch die Einstellungen im Dialogfeld Properties und durch den Code im Feld Advanced pre-search relations festgelegt sind.
Post-search qualityDie Qualität der Hypothese, nachdem die Bedingungen im Feld Advanced post-search relations angewendet wurden.
Chain qualityDie Qualität der Hypothesenkette vom ersten Unterelement der Gruppe bis zum aktuellen Unterelement. Chain quality wird berechnet, indem die Qualitäten aller Unterelemente in der Kette multipliziert werden, und dient zum Vergleich konkurrierender Hypothesenketten.

Mehr:

Arbeiten mit Tabellen Suchbereich Zusätzliche Suchbeschränkungen