Zum Hauptinhalt springen
FCFORINVOICES ermöglicht es Ihnen, die Erkennungsqualität während der Dokumentverarbeitung zu verbessern. Wenn das Programm die richtige Position eines Feldes auf einem Dokumentbild nicht erkennt, können Sie die korrekte Position angeben. Das Programm verwendet diese dann bei der Erkennung anderer Dokumente. Training ist nur verfügbar, wenn ABBYY FlexiCapture das Unternehmen zuverlässig identifizieren kann, indem es den entsprechenden Datensatz in einer Datenbank findet. Wenn Sie keine Datenbanken haben, aber dennoch Feld-Training verwenden möchten, können Sie Unternehmensinformationen sammeln, indem Sie Ihren Datensätzen während der Dokumenterfassung weitere Datensätze hinzufügen. Weitere Informationen finden Sie unter Lieferanten und Geschäftsbereiche in der Datenbank nachschlagen. In diesem Artikel wird erläutert, wie Sie FCFORINVOICES mit der lokal installierten Version der Verifizierungsstation trainieren. Außerdem werden einige trainingsbezogene Aspekte behandelt, die Operatoren kennen müssen. Führen Sie die folgenden Schritte aus, um das Programm während der Dokumentverarbeitung zu trainieren:
  1. Erfassen Sie einen Batch von Dokumenten (z. B. Rechnungen, die im vergangenen Monat verarbeitet wurden) und beginnen Sie, sie dem Programm zuzuführen. Siehe So erfassen Sie Rechnungen.
  2. Sobald die Dokumente dem Programm zugeführt wurden, werden sie automatisch erkannt (dies geschieht nur, wenn die Option Recognize added images automatically auf der Registerkarte Document Processing des Dialogfelds Options aktiviert ist; um dieses Dialogfeld zu öffnen, klicken Sie auf Tools → Options…) und die Daten werden mithilfe von Validierungsregeln geprüft.
  3. Wenn der Status eines erkannten Dokuments nicht Valid ist oder wenn Sie aus anderen Gründen annehmen, dass das Programm einige Felder nicht erkannt hat, öffnen Sie das Dokument im Dokumenteditor.
  4. Überprüfen Sie das Datenformular. Die Feldgruppe Vendor/Issuer muss korrekt ausgefüllt sein.
Das Training wird für jede Dokumentvariante separat durchgeführt. Dokumente desselben Unternehmens werden als derselben Dokumentvariante zugehörig betrachtet. Wenn das Programm das ausstellende Unternehmen nicht identifizieren kann, wählen Sie es entweder aus Ihrer Unternehmensdatenbank aus oder geben Sie es manuell anhand des Dokumentbilds ein und speichern Sie es durch Klicken auf Save in Ihrer Unternehmensdatenbank. Je nach den Einstellungen Ihres Projekts müssen Sie möglicherweise auch die eindeutige ID des ausstellenden Unternehmens angeben, damit dessen Dokument für das Training verwendet werden kann. Geben Sie dazu die eindeutige ID des Unternehmens in das Feld VATID ein (dieses Feld kann in manchen Projekten je nach Land einen anderen Namen haben). Die VATID ist eine eindeutige Identifikationsnummer, die Unternehmen für Steuerzwecke zugewiesen wird. Wenn Dokumente desselben Unternehmens stark unterschiedliche Layouts aufweisen, sollten Sie die Clustering-Funktion verwenden. Einzelheiten finden Sie unter Training mit Clustering.
  1. Das Training ist nur erfolgreich, wenn die Regionen aller Felder korrekt identifiziert werden. Sie müssen daher sicherstellen, dass die Regionen den tatsächlichen Positionen der jeweiligen Felder auf dem Bild entsprechen. Weitere Informationen dazu, wie Positionen auf einem Dokument markiert werden, finden Sie unter Positionen trainieren. Gehen Sie dazu im Bildfenster des Dokumenteditors wie folgt vor: Passen Sie die Regionen an oder zeichnen Sie Regionen für die Felder, die das Programm nicht erkannt hat. Danach analysiert das Programm das Dokument. Wenn das Regions-Markup geändert wurde und das Training für Dokumente dieses Unternehmens nicht verboten ist, wird das Dokument dem Batch hinzugefügt.
  • Positionieren Sie den Mauszeiger in einem gewünschten Feld im Datenformular, suchen Sie die entsprechende Region auf dem Bild (sie wird blau hervorgehoben) und klicken Sie darauf (oder ziehen Sie mit der Maus ein Rechteck auf).
  • Positionieren Sie den Mauszeiger auf einer gewünschten Region auf dem Bild (sie wird blau hervorgehoben), klicken Sie darauf (oder zeichnen Sie die Region mit der Maus) und wählen Sie dann das entsprechende Feld aus der sich öffnenden Dropdown-Liste aus.
  • Passen Sie die Position einer Region auf dem Bild an, indem Sie ihre Begrenzungen mit der Maus verschieben.
  • Löschen Sie eine falsch positionierte Region aus dem Bild: Positionieren Sie den Mauszeiger auf ihrem Rechteck, und wenn in der oberen rechten Ecke ein rotes Kreuz erscheint, klicken Sie auf das rote Kreuz. Das Regions-Markup wird gelöscht. Erstellen Sie nun die korrekte Region für dieses Feld.
  • Beginnen Sie im Datenformular, einen Wert in ein Feld einzugeben. Es wird eine Dropdown-Liste angezeigt, in der die aus dem Bild erfassten Wörter aufgeführt sind, die dem von Ihnen eingegebenen Wort ähneln. Wählen Sie das richtige Wort aus der Liste aus, und die Position dieses Worts auf dem Bild wird zur Region des Feldes.
Das Programm wird anhand aller Felder des Dokuments trainiert, nicht nur anhand derer, deren Regionen Sie gezeichnet oder angepasst haben.
  1. Öffnen Sie das nächste Dokument und wiederholen Sie die Schritte 4 und 5.
  2. Um den Trainingsprozess zu starten, muss ein Trainings-Batch mindestens ein Dokument enthalten. Wenn Clustering verwendet wird, wird für jeden Cluster ein separates FlexiLayout erstellt; andernfalls wird für jedes Unternehmen ein FlexiLayout erstellt (weitere Informationen finden Sie unter „Training mit Clustering“).
  3. Das Programm testet die trainierte FlexiLayout-Variante, indem es sie auf alle Dokumente im Trainings-Batch anwendet und die Ergebnisse mit dem in Schritt 5 erhaltenen angepassten Markup vergleicht. Stellt das Programm fest, dass das trainierte FlexiLayout bessere Ergebnisse liefert als die frühere Version, wird es beim nächsten Erkennen von Dokumenten dieser Dokumentvariante verwendet.
Stellt das Programm fest, dass die trainierte FlexiLayout-Variante schlechtere Ergebnisse liefert als die frühere Version, müssen Sie sie mit Dokumenten des betreffenden Unternehmens weiter trainieren (Schritte 4 und 5). Der Trainingsprozess ist abgeschlossen, wenn die trainierte FlexiLayout-Variante alle Feldregionen korrekt identifizieren kann. Training beim Einrichten von ABBYY FlexiCapture für Rechnungen