- Gibt es ein Muster oder eine Methode in der Anordnung der Felder auf den Bildern?
- Auf welche Elemente kann man sich bei der Suche nach den Datenfeldern verlassen?
- In welcher Reihenfolge sollen wir nach den Elementen suchen? (Das ist wichtig, denn bei jedem nachfolgenden Schritt können wir uns nur auf die Elemente des vorherigen Schritts verlassen.)
- Das Header-Element darf nur mit der ersten Seite des Dokuments übereinstimmen.
- Das Footer-Element darf nur mit der letzten Seite des Dokuments übereinstimmen. Wir empfehlen, in dieser Gruppe erforderliche Subelemente zu erstellen, damit das Footer-Element nicht mit einer anderen Dokumentseite abgeglichen wird.
- Auf der ersten Seite gibt es eine Gruppe von Feldern, die aus InvoiceNumber, InvoiceDate, DeliveryAddress besteht. Der Name des Feldes InvoiceNumber steht immer am Anfang jedes Dokuments, während InvoiceDate und DeliveryAddress nicht immer vorhanden sind.
- Die Felder InvoiceNumber und InvoiceDate können sich entweder rechts von ihren jeweiligen Namen oder darunter befinden.
- Bei DeliveryAddress sollten wir ebenfalls entweder rechts oder unterhalb des entsprechenden Namens suchen, nachdem wir den Suchbereich eingeschränkt haben. Zusätzlich benötigen wir ein Element, um den Suchbereich nach unten hin zu begrenzen.
- Da diese Felder auf manchen Bildern keine Werte haben, können Sie den Matching-Prozess beschleunigen, indem Sie die folgende Bedingung angeben: Suchen Sie nicht nach dem Wert eines Feldes, wenn der Name des Feldes nicht erkannt wurde.
- Wir können diese Gruppe von Feldern als Bezeichner für unser Dokument verwenden. Wir werden diese Felder als Teil eines zusammengesetzten Header-Elements mit dem Namen InvoiceHeader beschreiben.
- Auf der letzten Seite des Dokuments stehen unter der Tabelle die Wörter TOTAL AMOUNT MUST, Carried over, Total CHF, TOTAL. Diese Wörter können jedoch auch an anderen Stellen im Dokument vorkommen (z. B. im Namen oder im Tabellenkörper). Um diese Wörter zu finden, müssen wir zusätzliche Referenzelemente verwenden (z. B. Tabellenspaltennamen). Diese Referenzelemente helfen uns dabei, den Suchbereich einzuschränken.
- Die Elemente, die die letzte Seite des Dokuments beschreiben, werden Teil eines zusammengesetzten Footer-Elements mit dem Namen InvoiceFooter sein.
- Damit das Footer-Element nur mit der letzten Seite des Dokuments übereinstimmt, muss es ein erforderliches Element enthalten. Da die Wörter, die die letzte Seite identifizieren (siehe 3 oben), auf jeder letzten Seite jedes Dokuments vorkommen, machen wir das Element, das sie beschreibt, zu einem erforderlichen Element.
- Die Tabelle (nennen Sie sie InvoiceTable) beginnt auf der ersten Seite und endet auf der letzten. Außerdem gehen der Tabelle auf der ersten Seite immer die Spaltennamen voraus. Um das Ende der Tabelle zu identifizieren (auf der letzten Seite), verwenden wir ein Hilfselement (z. B. das erforderliche Element aus der Gruppe InvoiceFooter). Hinweis. Die Gesamtheit aller Seiten eines Dokuments wird als mehrseitige Arbeitsfläche bezeichnet. Eine mehrseitige Arbeitsfläche entsteht, indem alle Seiten eines Dokuments von oben nach unten ohne Lücken zusammengefügt werden, wobei die linke Begrenzung aller Seiten auf derselben Achse liegt, die durch den Punkt (0, 0) verläuft. Die Reihenfolge, in der die Seiten zusammengefügt werden, wird durch die Reihenfolge der Seiten im Batch bestimmt. Daher können wir nur den Anfang der Tabelle (ihre Kopfzeile auf der ersten Seite) und das Ende der Tabelle (ihre Fußzeile auf der letzten Seite) angeben. Das Programm sucht nach der Tabelle im gesamten Dokument, d. h. auf der gesamten mehrseitigen Arbeitsfläche.
- Nach dem Namen des Unternehmens im Feld Company suchen wir immer auf der ersten Seite und immer im oberen Drittel der Seite.
- Der Name des Feldes Gesamtbetrag befindet sich immer auf der letzten Seite, unter der Tabelle. Der Wert des Feldes befindet sich entweder rechts vom Namen oder darunter.
