Was ist eine mehrseitige Tabelle?
ABBYY FlexiLayout Studio kann mehrseitige Tabellen erkennen, d. h. Tabellen, die sich über mehrere Seiten eines Dokuments erstrecken und deren Spalten auf allen Seiten in derselben Reihenfolge und Anzahl vorliegen. Die Breite und die genaue Lage der Spalten können von Seite zu Seite leicht variieren (die vom Programm maximal zulässige Abweichung beträgt 1 Zoll).
Der Kürze halber verwenden wir für jeden Teil einer mehrseitigen Tabelle, der sich auf einer einzelnen Seite befindet, den Begriff einseitige Untertabelle.
Die Kopf- und Fußzeile einer mehrseitigen Tabelle
Mehrseitige Tabellen können eine Kopfzeile haben, die entweder auf jeder Seite wiederholt wird oder nur einmal auf der ersten Seite erscheint. Die Option Header is on each page teilt dem Programm mit, ob die Kopfzeile auf jeder Seite erkannt werden soll. Wenn die Option deaktiviert ist, sucht ABBYY FlexiLayout Studio nur in der ersten einseitigen Untertabelle nach der Kopfzeile.
Dasselbe gilt für die Fußzeile einer Tabelle, die entweder nur einmal auf der letzten Seite oder auf jeder Seite am unteren Rand vorkommen kann. Die Option Footer is on each page teilt dem Programm mit, ob die Fußzeile auf jeder Seite erkannt werden soll. Wenn die Option deaktiviert ist, sucht ABBYY FlexiLayout Studio nur in der letzten einseitigen Untertabelle nach der Fußzeile.
Suche nach einer mehrseitigen Tabelle
Das Programm beginnt die Suche nach einer mehrseitigen Tabelle auf der ersten Seite des vom Benutzer angegebenen Suchbereichs und setzt sie auf den folgenden Seiten fort. Die Suche wird beendet, wenn eine der folgenden Bedingungen erfüllt ist:
- Wenn die Fußzeile nur auf der letzten Seite vorkommen darf und erkannt wurde.
- Wenn das Programm das Ende des für die Tabelle angegebenen Suchbereichs erreicht hat.
- Wenn das Programm auf einer Seite keine einseitigen Untertabellen erkannt hat, d. h., es hat weder die Kopfzeile noch die Fußzeile oder den Tabellenkörper gefunden.
Verwenden der Region eines anderen Elements, um den Namen einer Spalte in einer mehrseitigen Tabelle zu erkennen
Bei mehrseitigen Tabellen können Sie weiterhin zwei Methoden verwenden, um nach der Kopf- und Fußzeile einer Tabelle oder ihrer Untertabellen zu suchen: entweder durch Angabe von Schlüsselwörtern (die Option Nach Schlüsselwort erkennen) oder indem Sie ein bereits erkanntes Element in eine Kopf- oder Fußzeile umwandeln (die Option Gefundenes Element verwenden als…). Wenn Sie die erste Methode verwenden, sucht das Programm auf den Seiten, auf denen die Kopf- oder Fußzeile vorkommen kann, nach den angegebenen Schlüsselwörtern (definiert durch die Option Kopf-/Fußzeile kommt auf jeder Seite vor). Wenn sich die Spaltennamen auf den verarbeiteten Bildern mit Schlüsselwörtern nicht zuverlässig erkennen lassen, verwenden Sie die Option Gefundenes Element verwenden als….
Wenn die Kopf- und Fußzeile einer mehrseitigen Tabelle nur auf der ersten bzw. letzten Seite vorkommen, können Sie bereits erkannte einfache Elemente verwenden, genau wie bei einseitigen Tabellen. Diese Methode wird in Sample 3 verwendet (siehe das Projekt unter %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\English\Invoice). Wenn die Kopf- oder Fußzeile jedoch auf jeder Seite erkannt werden muss, verwenden Sie am besten die Subelemente einer bereits erkannten wiederholbaren Gruppe. Mit einer wiederholbaren Gruppe können Sie die Kopfzeile auf jeder Seite finden, indem Sie sie in der wiederholbaren Gruppe nur einmal beschreiben und die mögliche Anzahl von Instanzen für die wiederholbare Gruppe angeben. Wenn das Table-Element im Elementbaum unterhalb der wiederholbaren Gruppe beschrieben ist, verwenden Sie alle Instanzen (AllInstances) der gewünschten Subelemente, um die Spaltennamen auf die wiederholbare Gruppe zu beziehen. Eine Veranschaulichung dieses Ansatzes finden Sie im Beispielprojekt unter %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\English\Invoice with Repeatable Groups).
Wenn es auf einer Seite mehrere Instanzen der ausgewählten wiederholbaren Gruppe gibt, werden die ersten Instanzen als Spaltenname verwendet.
Suche nach sich wiederholenden Tabellen
In manchen Dokumenten kann es auf einer Seite mehrere identische Tabellen geben (die Anordnung der Tabellen und die Reihenfolge der Spalten in diesen Tabellen können gleich sein). Manchmal ist die letzte Tabelle in der Reihe unterbrochen und wird auf der folgenden Seite fortgesetzt. Zwischen den Tabellen können Textdaten oder visuelle Formatierungselemente vorkommen, z. B. Tabellenüberschriften oder erläuternde Hinweise.
Sie können solche Tabellen erkennen, indem Sie das Table-Element, das eine Instanz der Tabelle beschreibt, in eine wiederholbare Gruppe einfügen. So können Sie den gesamten Satz von Tabellen in einem einzigen Table-Element beschreiben und die Wiederholungen der Instanzen in den Eigenschaften der wiederholbaren Gruppe festlegen, die das Table-Element umfasst.
Wenn Sie die Option Gefundenes Element verwenden als… verwenden, um Spaltennamen anhand eines bereits erkannten Elements zu erkennen, ist es zweckmäßiger, dieses Element in derselben wiederholbaren Gruppe oberhalb des Table-Elements zu platzieren. Wenn Sie in diesem Fall ein Hilfselement auswählen, das zum Erkennen des Spaltennamens verwendet werden soll, verweisen Sie innerhalb der wiederholbaren Gruppe auf die aktuelle Instanz (CurrentInstance) des Hilfselements. Wenn das Programm dann nach jeder Instanz des Spaltennamens sucht, verwendet es die entsprechende Instanz des Hilfselements. Eine Veranschaulichung dieses Ansatzes finden Sie im Beispielprojekt unter %public%\ABBYY\FlexiCapture\12.0\Samples\FLS\English\Prices).