Zum Hauptinhalt springen
In diesem Artikel wird beschrieben, wie die Hauptfelder einer Rechnung erkannt und erfasst werden. Das Programm beginnt mit der Verarbeitung einer Rechnung, indem es den Text entsprechend den Einstellungen der Dokumentdefinition erkennt:
  • Der Erkennungsmodus (Fast / Balanced / Normal / Accurate) bestimmt die Erkennungsgeschwindigkeit und die Qualität der Textebene, die als Ergebnis erzeugt wird. Um einen Erkennungsmodus festzulegen, klicken Sie im Document Definition Editor auf Dokumentdefinition → Eigenschaften der Dokumentdefinition… Recognition).
  • Erkennungssprachen sind die Sprachen, die für die Erkennung verwendet werden. Um Erkennungssprachen festzulegen, klicken Sie im Document Definition Editor auf Document Definition → Eigenschaften der Dokumentdefinition… Einstellung der Dokumentdefinition und dann in der Gruppe Länder und Sprachen auf Edit, um die gewünschten Sprachen auszuwählen. Hinweis: In FlexiCapture for Invoices sind Erkennungssprachen an die Ländereinstellungen gebunden. Wenn Sie der Gruppe Länder und Sprachen ein Rechnungsland hinzufügen, werden die zugehörigen Sprachen automatisch in den Einstellungen der Dokumentdefinition angezeigt. Rechnungsfelder werden während der Erkennung extrahiert.

Zum Erkennen und Erfassen von Feldern auf einer Rechnung kann das Programm Folgendes verwenden:

Beide Methoden werden im Folgenden beschrieben, ebenso der Algorithmus, der entweder die mit diesen beiden Methoden erzielten Ergebnisse kombiniert oder das beste Ergebnis auswählt.

Arbeiten mit einem FlexiLayout

Folgendes kann zur Ermittlung des Vendors und des Geschäftsbereichs verwendet werden:
  • Einstellungen der Document Definition: IBAN-, VATID- und NationalVATID-Formate sowie die zugehörigen Schlüsselwörter;
  • Datensatz-Felder: IBAN, VATID, NationalVATID, Name, Straße, Stadt, PLZ.
Weitere Informationen zu den Spalten BusinessUnits und Vendors in den Datensätzen und ihrer Verwendung finden Sie unter BusinessUnits-Datensatz und Vendors-Datensatz.

Automatischer Algorithmus zur Unternehmensidentifikation

Der Detailgrad und die Qualität der in den Datensatz-Spalten eingetragenen Informationen haben einen erheblichen Einfluss auf die Erkennungsqualität. Um sicherzustellen, dass die Suchergebnisse so präzise wie möglich sind, beachten Sie Folgendes:
  • Die eindeutigen Unternehmenskennungen sind ausgefüllt Das Ausfüllen von Spalten mit eindeutigen Werten (VATID, NationalVATID, IBAN) erhöht die Wahrscheinlichkeit einer korrekten Erkennung erheblich, da diese Werte für jedes Unternehmen eindeutig sind.
  • Keine mehrfach vorkommenden Firmendatensätze Wenn keine Datensätze mehrfach vorkommen, steigt die Wahrscheinlichkeit, dass das Unternehmen korrekt erkannt wird. Weitere Informationen zum Entfernen doppelter Datensätze finden Sie unter Doppelte Datensätze in der externen Datenbank entfernen.
  • Es gibt keine irrelevanten Datensätze Veraltete oder ungültige Datensätze im Datensatz können dazu führen, dass das Unternehmen aufgrund zufälliger Ähnlichkeiten zwischen verschiedenen Feldwerten falsch erkannt wird.
  • Alle Felder sind in jedem Unternehmensdatensatz ausgefüllt Geben Sie möglichst viele Informationen zu den Unternehmen an. Je mehr Felder im Datensatz ausgefüllt sind, desto höher ist die Wahrscheinlichkeit, dass das Unternehmen korrekt erkannt wird.
  • Spalten mit mehreren Werten werden verwendet, um dieselben Informationen zu speichern, die unterschiedlich bezeichnet werden, und nicht völlig verschiedene Informationen Wenn ein Unternehmen beispielsweise mehrere Adressen hat, muss für jede davon ein separater Datensatz vorhanden sein, auch wenn alle anderen Felder dieselben Informationen enthalten. Weitere Informationen finden Sie unter Vorbereiten von Vendor- und Geschäftsbereich-Datenbanken.
Der automatische Algorithmus zur Erkennung von Vendor und Geschäftsbereich umfasst die folgenden Schritte:
  1. Suche nach eindeutigen Bezeichnern
Die folgenden Felder gelten als eindeutige Unternehmenskennungen:
  • VATID,
    • NationalVATID,
    • IBAN.
FCFORINVOICES durchsucht das Dokumentbild nach den oben aufgeführten Werten. In den Eigenschaften der Dokumentdefinition (Registerkarte „Einstellungen der Dokumentdefinition”, Gruppe „Länder und Sprachen”) werden die Formate VATID, NationalVATID und IBAN (Registerkarte „Formate”) sowie Schlüsselwörter (Registerkarte „Schlüsselwörter”) für jedes Land mithilfe regulärer Ausdrücke festgelegt.Hinweis: Korrekt ausgefüllte Schlüsselwörter und Bezeichnerformate verbessern die Erkennungsqualität erheblich.Das Programm sucht für solche Felder nach exakten Übereinstimmungen im Bild. Reguläre Ausdrücke können dabei auch mögliche Erkennungsfehler berücksichtigen. Dies erfolgt mithilfe erweiterter regulärer Ausdrücke (siehe Erweiterte reguläre Ausdrücke).Hinweis: ABBYY FlexiCapture for Invoices bietet vordefinierte reguläre Ausdrücke. Bei Bedarf können Sie jedoch eigene reguläre Ausdrücke erstellen. Navigieren Sie dazu in der Registerkarte „Document Definition-Einstellungen” zur Gruppe „Länder und Sprachen”, wählen Sie das entsprechende Land aus und klicken Sie auf Bearbeiten….Erkannte Werte werden wie folgt normalisiert:
  • Buchstaben werden großgeschrieben,
    • Leerzeichen sowie die folgenden Zeichen werden entfernt: ” . ”, ” , ”, ” ”, ” / ”, ” **** ”.
Wenn das Buchstabenpräfix eines Felds mithilfe eines regulären Ausdrucks in den Ländereigenschaften auf der Registerkarte „Formats” angegeben wird, wird das erkannte Präfix durch das primäre Präfix ersetzt (das in den Ländereigenschaften auf der Registerkarte „Formats” festgelegt ist). Beispielsweise kann der Bezeichner „DE12345” als „OE12345” erkannt werden. Das erkannte Präfix OE wird dann durch das korrekte Präfix DE ersetzt. Die auf einem Dokumentbild erkannten Felder VATID, NationalVATID und IBAN werden verwendet, um den Datensatz abzufragen. Die Spaltenwerte für VATID, NationalVATID und IBAN aus den Feldern des Datensatzes werden auf dieselbe Weise normalisiert wie die auf dem Bild erkannten Werte; anschließend werden sie (mittels Exact Matching) mit den normalisierten Werten der auf dem Bild erkannten Felder abgeglichen.
  1. Suche nach Unternehmensname und Adresse
Eine Abfrage, die den gesamten Dokumenttext verwendet, um die am genauesten übereinstimmenden Datensätze zu finden, wird an den Datensatz gesendet.Die auf dem Bild erkannten Werte für Name, Street, ZIP und City werden mit den entsprechenden Datensatz-Einträgen abgeglichen. Hinweis: Um bestmögliche Suchergebnisse für Namen und Unternehmen zu erzielen, stellen Sie sicher, dass die entsprechenden Datensatz-Spalten ausgefüllt sind. Unternehmensname und Adressinformationen sind besonders wichtig, wenn das Unternehmen nicht anhand von VATID, NationalVATID oder IBAN identifiziert werden kann.
  1. Bildung von Hypothesen
Die in den Schritten 1 und 2 gefundenen Unternehmen werden zur Bildung einer Reihe von Hypothesen herangezogen. ABBYY FlexiCapture for Invoices wertet diese Hypothesen aus und wählt anschließend die 5 Vendor-Datensätze und 5 Geschäftsbereich-Datensätze aus, die am zuverlässigsten mit den Feldwerten im Dokumentbild übereinstimmen. Aus diesen Datensätzen werden dann 25 Paare aus Vendors und Geschäftsbereichen gebildet, wobei jedes Paar als separate Hypothese behandelt wird. Ein neuronaler Netzwerkalgorithmus bewertet die Hypothesen anschließend nach ihrer Zuverlässigkeit; das am besten passende Vendor-Geschäftsbereich-Paar wird zur endgültigen Hypothese und damit zum Ergebnis der Vendor- und Geschäftsbereichserkennung.Hinweis: Wenn nur die Vendor-Datenbank verbunden ist, kann die Qualität der Auswertung von Vendor-Geschäftsbereich-Paaren beeinträchtigt werden. Es wird empfohlen, eine Geschäftsbereich-Datenbank zu verbinden, auch wenn die Erkennung von Geschäftsbereichen nicht erforderlich ist. Weitere Informationen finden Sie unter Datenbanken verbinden.Hinweis: Wenn die Anzahl der Geschäftsbereiche sehr gering ist (z. B. 1), hat das Einbinden einer solchen Datenbank keinen wesentlichen Einfluss auf die Auswertung. Es kann jedoch die Erkennungsqualität in Fällen verbessern, in denen ein Geschäftsbereich fälschlicherweise als Vendor erkannt wird.

Hypothesis-Filterung

Hypothesen werden anhand der Übereinstimmungszuverlässigkeit (Eintrag im Datensatz und dem Feldwert des Dokumentbilds) in folgende Kategorien unterteilt:
  • zuverlässiges Matching des Dokumentbildes;
  • keine zuverlässige Übereinstimmung mit dem Dokumentbild.
Je nach Verifizierungsszenario können Sie entscheiden, ob die Zuverlässigkeit der Hypothesen bei der Erkennung des Vendors und des Geschäftsbereichs berücksichtigt werden soll. Wenn ABBYY FlexiCapture for Invoices die endgültige Hypothese ausschließlich aus zuverlässigen Hypothesen auswählen soll, können Sie diese mithilfe des Registry-Flags InvoiceReader/ShouldFilterUnsureCompanyHypotheses filtern, das auf die folgenden Werte gesetzt werden kann:
  • true — die Filterung ist aktiviert, und die endgültige Hypothese wird ausschließlich aus den verlässlichen Hypothesen ausgewählt (Standardwert);
  • false — die Filterung ist deaktiviert, und die endgültige Hypothese wird ohne Berücksichtigung ihrer Zuverlässigkeit aus allen Hypothesen ausgewählt;
Beachten Sie, dass Hypothesis Filtering für Vendors und Geschäftsbereiche unterschiedlich funktioniert:
  • Bei der Erkennung von Vendors werden unzuverlässige Hypothesen für Vendors nicht berücksichtigt. Wenn keine zuverlässigen Hypothesen vorliegen, wird kein Vendor erkannt.
  • Bei der Erkennung von Geschäftsbereichen:
    • wenn mindestens eine zuverlässige Hypothese gefunden wurde, werden keine unzuverlässigen Hypothesen berücksichtigt;
    • wenn die in den Schritten 1 bis 3 ermittelte Menge von Hypothesen keine zuverlässige Hypothese enthält, wird der Flag-Wert ignoriert. Die endgültige Hypothese wird aus den unzuverlässigen Hypothesen ausgewählt.
Dies liegt an den Unterschieden zwischen Vendor- und Geschäftsbereich-Datensätzen:
  • In der Regel gibt es deutlich weniger Datensätze zu Geschäftsbereichen eines Unternehmens als Vendor-Datensätze. Außerdem ändern sie sich wesentlich seltener, sodass sie sich leichter aktuell halten lassen. Daher erhöht die Erkennung einer zuverlässigen Hypothese die Wahrscheinlichkeit, dass auch die endgültige Hypothese korrekt ist. Die Erkennung eines Geschäftsbereichs ist jedoch auch dann wichtig, wenn keine zuverlässigen Hypothesen gefunden wurden, da der wichtigste Faktor für die Zuverlässigkeit des Erkennungsergebnisses die Bewertung der Zuverlässigkeit der Vendor-BU-Paare ist.
  • Es gibt in der Regel deutlich mehr Vendor-Datensätze, und der Datensatz enthält mehr Spalten, weil Vendoren auf ihren Rechnungen mehr Informationen über ihr eigenes Unternehmen angeben als der Geschäftsbereich. Datensätze können zudem veraltete Informationen enthalten, sodass die Zuverlässigkeit der Hypothesenfilterung sowohl von der Qualität des Datensatzes als auch vom Typ des Verifizierungsszenarios abhängt.
Hinweis: Um die Erkennungswahrscheinlichkeit zuverlässiger Hypothesen zu verbessern, halten Sie Datensätze aktuell und erfassen Sie so viele Informationen wie möglich zu Vendors und Geschäftsbereichen.

Ergebnisse der Erkennung von Vendor und Geschäftsbereich

Die wichtigsten Ergebnisse der Erkennung von Vendor und Geschäftsbereich auf der Rechnung sind:
  • der Bezeichner des Vendor-Datensatzes im Datensatz „Vendors“
  • der Bezeichner des Datensatzes des Geschäftsbereichs im BusinessUnits-Datensatz
Hinweis: Wenn der Vendors-Datensatz angibt, dass die Id von der BusinessUnitId abhängt (siehe Vendors-Datensatz), enthält das Ergebnis der Vendor-Erkennung die Id, die der BusinessUnitId entspricht.Ein Geschäftsbereich wird möglicherweise nicht zuverlässig erkannt. In diesem Fall wird der Registrierungsparameter fc_Predefined:InvoiceIsVendorSuspicious (fc_Predefined:InvoiceIsBusinessUnitSuspicious) des Dokuments auf true gesetzt.Die Regionen der folgenden Felder können durch die Vendor- und Geschäftsbereichserkennung ermittelt werden:Für den Vendor:
  • Name
  • USt-IdNr.
  • NationalVatID
  • IBAN
  • Straße
  • PLZ
  • Stadt
Für den Geschäftsbereich:
  • Name
  • USt-IdNr.
  • Straße
  • PLZ
  • Stadt
Anhand der Positionen dieser Regionen im Bild können Sie genau sehen, wo das Programm die Felder der Feldgruppen „Vendor” und „Geschäftsbereich” gefunden hat – was die Erkennung des Vendors und des Geschäftsbereichs ermöglicht hat.Hinweis: Wenn die Feldwerte für IBAN und VATID im Vendors-Datensatz fehlen, können Schlüsselwörter und das Format verwendet werden, um die entsprechenden Werte auf dieselbe Weise zu ermitteln wie Bankdaten (sofern der entsprechende Vendor gefunden wurde).Hinweis: Die Suche nach einer beliebigen Feldregion kann durch Training oder durch Anwenden eines zusätzlichen FlexiLayouts angepasst werden (siehe Erfassen zusätzlicher Rechnungsfelder). Dies hat keinen Einfluss auf die Erkennung von Vendor und Geschäftsbereich, kann jedoch die Position der Regionen der Felder in diesen Feldgruppen nach dem Matching der Document Definition mit den Rechnungen beeinflussen.Ein wichtiges Ergebnis der Erkennung des Vendors und des Geschäftsbereichs ist, dass Informationen über die jeweiligen Länder aus dem Feld „CountryCode” der im Datensatz gefundenen Datensätze abgerufen werden. Diese Informationen werden anschließend verwendet, um Schlüsselwörter und Steuersätze auszuwählen und andere Rechnungsfelder zu erfassen. Sie dienen außerdem als Bedingung für die Ausführung der Validierungsregeln für die Rechnung.

So ändern Sie, wie das Programm den Vendor oder Geschäftsbereich erkennt

Je besser ein Vendor- oder Geschäftsbereich-Eintrag im Datensatz mit dem aus einem Rechnungsbild extrahierten Text übereinstimmt, desto genauer erkennt das Programm den Vendor oder Geschäftsbereich.Zunächst müssen Sie die Daten in der externen Datenbank ermitteln, die den Datensatz-Spalten entsprechen, anhand derer das Unternehmen auf einer Rechnung gefunden wird. Die externe Datenbank und der Datensatz müssen ordnungsgemäß verbunden sein (siehe Vendor- und Geschäftsbereich-Datenbanken verwenden).Wenn ein und dasselbe Unternehmen sowohl in der Liste der Vendors als auch in der Liste der Geschäftsbereiche vorkommt, müssen Sie für die jeweiligen Einträge in beiden Datensätzen dieselbe VATID angeben (auch wenn auf Rechnungen keine VATID vorhanden ist). Dadurch wird verhindert, dass das Programm den Vendor und den Geschäftsbereich falsch zuordnet.Um mögliche Abweichungen bei Feldwerten in Bildern auszugleichen, verwenden Sie:

Verwendung vorab festgelegter Vendor- und Geschäftsbereichswerte zusammen mit extrahierten Werten

Der Vendor oder der Geschäftsbereich des Unternehmens auf der Rechnung kann im Voraus anhand der Quelle der Rechnung bestimmt werden (Name des Scanning-Operators oder E-Mail-Adresse des Absenders der Nachricht). Sie können den Vendor und/oder den Geschäftsbereich vor der automatischen Erkennung explizit angeben. Setzen Sie dazu den Wert des Registrierungsparameters des Dokuments fc_Predefined:InvoicePredefinedVendorId (fc_Predefined:InvoicePredefinedBusinessUnitId) auf den Bezeichner (Id) eines Eintrags im Datensatz Vendors oder BusinessUnits. Dadurch wird die automatische Erkennung des Vendor und/oder des Geschäftsbereichs nicht verhindert. So erhalten Sie zusätzlich zum vorab festgelegten Vendor und/oder Geschäftsbereich einen Konfidenzwert (dieser Wert gibt an, wie gut die vorab festgelegten Werte mit den aus dem Bild extrahierten Werten übereinstimmen) sowie die Regionen der Felder aus den Feldgruppen Vendor und/oder Geschäftsbereich.

InvoiceNumber, InvoiceDate

Der Kopf einer Rechnung enthält unter anderem die Felder InvoiceNumber und InvoiceDate.Diese Felder werden mithilfe von Schlüsselwörtern erkannt, die in den Spracheigenschaften der Dokumentdefinition angegeben sind. Der Vendor und der Geschäftsbereich werden zuerst erkannt und liefern Informationen über die Länder des Vendor und des Geschäftsbereichs. Die Länder bestimmen die Sprachen (die einem Land entsprechenden Sprachen werden in der Dokumentdefinition angegeben). Die Schlüsselwörter zum Auffinden von Feldern werden aus den Ländern des Vendor und des Geschäftsbereichs übernommen.Sie können die Art und Weise ändern, wie das Programm nach Feldregionen sucht, indem Sie Schlüsselwörter bearbeiten (siehe Keywords) und Training verwenden (siehe Training).

Wie bestimmt das Programm, dass ein Dokument eine Rechnung ist?

FC bestimmt, ob ein Dokument eine Rechnung ist, wenn das FlexiLayout angewendet wird.Die unten aufgeführten Bedingungen weisen darauf hin, dass ein Dokument eine Rechnung ist. Nicht alle dieser Bedingungen müssen erfüllt sein, aber jede einzelne hat ein bestimmtes Gewicht.
  • Die Felder InvoiceNumber und InvoiceDate wurden erkannt.
  • Schlüsselwörter aus dem Element InvoiceIdentifiers located wurden erkannt (siehe Keywords).
  • Auf dem Dokument wurde ein Vendor oder ein Geschäftsbereich erkannt.
Ein Dokument kann als Gutschrift identifiziert werden, wenn Schlüsselwörter aus dem Element CreditNoreKeyword im Bild erkannt wurden oder wenn das Dokument einen negativen Gesamtbetrag hat.
FCFORINVOICES erfasst die folgenden Felder aus einer Rechnung:

Der Gesamtbetrag der Rechnung (Total) und die Währung der Rechnung (Currency)

Ja

Ja

Steuern:

  • Der Gesamtbetrag ohne Steuern (NetAmount0)
  • Die Rechnungssumme vor Steuern (TotalNetAmount)
  • Der zu zahlende Steuerbetrag (TotalTaxAmount)

Ja

Ja

  • Steuergruppen (Betrag vor Steuern (NetAmount), zu zahlender Steuerbetrag (TaxAmount), Steuersatz (TaxRate))

Nein

Ja

Zusätzliche Steuer (AdditionalCosts)

Ja

Ja

Informationen aus der Dokumentdefinition werden verwendet, um Summen und Steuersätze zu ermitteln:
  • Im Land des Vendors geltende Steuersätze (Sie können diese auf der Registerkarte Steuersätze in den Ländereigenschaften angeben, siehe Land- und Spracheinstellungen)
  • Schlüsselwörter für Steuersätze (Sie können diese auf der Registerkarte Schlüsselwörter in den Spracheigenschaften angeben. Siehe auch Schlüsselwörter).
Das Programm versucht, im Bild bis zu zwei Steuersätze zu finden. Wenn die Rechnung mehr als zwei Steuersätze enthält, können zusätzliche Felder erstellt und im Datenformular manuell ausgefüllt werden.Das Programm verwendet Schlüsselwörter, um die Felder TotalTax und TotalNetto zu erkennen. Sie können diese Schlüsselwörter in den Eigenschaften eines Landes oder einer Sprache angeben, je nachdem, wie das Schlüsselwort verwendet werden soll (Einzelheiten finden Sie unter Land- und Spracheinstellungen). Weitere Informationen zu Schlüsselwörtern finden Sie unter Schlüsselwörter.Es gibt zwei Arten von Schlüsselwörtern für das Feld Total, die sich in unterschiedlichen Kategorien befinden (weitere Informationen zu den Kategorien lokalisierter Elemente finden Sie unter Schlüsselwörter):
  • AmountTotalHighConfidenceLabels: Schlüsselwörter, die nur in der Nähe des Feldes Total vorkommen, z. B. „Diesen Betrag zahlen.“
  • AmountTotalLowConfidenceLabels: Schlüsselwörter, die in der Nähe des Feldes Total vorkommen können, aber auch in der Nähe anderer Felder auftreten. So kann das Schlüsselwort „Total“ in der Nähe des Feldes Total erscheinen, aber auch in der Nähe eines Feldes, das das Gesamtgewicht aller Positionen auf einer Rechnung enthält.
Hinweis. Wenn Sie sich nicht sicher sind, zu welcher dieser beiden Kategorien ein Schlüsselwort hinzugefügt werden soll, fügen Sie es zu AmountTotalHighConfidenceLabels hinzu. Wenn Sie auf Rechnungen stoßen, bei denen das Schlüsselwort dazu führt, dass das Programm ein anderes Feld als das Feld Total identifiziert, können Sie es nach AmountTotalLowConfidenceLabels verschieben.Zusätzlich zu Schlüsselwörtern sucht das Programm beim Versuch, das Feld Total zu erkennen, nach den folgenden Elementen:
  • Zahlen, die in derselben Zeile oder derselben Spalte im Bild zwei- oder dreimal vorkommen. Solche Zahlen können auf Rechnungen, in denen keine Steuern angegeben sind, das Feld Total sein.
  • Zahlen, die die Summe der Zahlen oberhalb von ihnen in derselben Spalte sind.
  • Die größten Zahlen (nach Absolutwert) am Ende des Dokuments.
Das Programm sucht nur dann nach dem Feld Currency, wenn zuvor ein Feld Total erkannt wurde. Dabei werden Schlüsselwörter aus den Ländereigenschaften in der Dokumentdefinition verwendet.Alle Felder in der Feldgruppe Beträge, die im Bild nicht erkannt werden konnten, werden automatisch berechnet, mit Ausnahme des Feldes Total. Dieses Feld muss im Bild erkannt werden.Wenn das Programm Informationen aus den Feldern in der Feldgruppe Beträge nicht korrekt extrahieren kann, wird das Feld Total als verifizierungsbedürftig markiert.Wenn das Programm die Felder Total und Currency nicht mit hoher Sicherheit erkennen kann oder sie überhaupt nicht erkennt, können Sie Training verwenden, um die Extraktionsqualität zu verbessern.
FCFORINVOICES kann alle Bestellnummern und die zugehörigen Summen aus der Rechnung extrahieren.Diese Funktion ist standardmäßig deaktiviert (siehe Bestellabgleich).Um Bestellnummern zu extrahieren, benötigen Sie einen Datensatz mit einer Liste möglicher Bestellnummern und der zugehörigen Summen (siehe PurchaseOrders-Datensatz).Das Feld Bestellung kann auf folgende Weise extrahiert werden:
  • mit einem regulären Ausdruck;
  • mit einem Datensatz, der mögliche Bestellnummern enthält (siehe PurchaseOrders-Datensatz).
Wenn ein Datensatz mit möglichen Bestellnummern verwendet wird, sucht FCFORINVOICES in Bildern nach Nummern aus diesem Datensatz. Idealerweise enthält die Datenbank so wenige Bestellnummern wie möglich. Um ihre Anzahl zu verringern, können Sie mehrere Maßnahmen ergreifen:
  • Verwenden Sie die Spalte VendorId des Datensatzes. In diesem Fall verwendet das Programm nur Bestellnummern des Vendors der Rechnung.
  • Filtern Sie Bestellungen heraus, für die bereits eine Rechnung eingegangen ist, und fügen Sie dem Datensatz nur die Nummern von Bestellungen hinzu, für die noch keine Rechnung eingegangen ist.
Das Programm sucht in der Datenbank nach Summen, die zu den erkannten Bestellnummern passen.Das Programm sucht außerdem im Bild nach allen Bestellnummern, einschließlich derjenigen, die sich in den Positionen der Rechnung befinden.Bestellungen werden in der Regel vom ERP-System des Käufers erzeugt. Daher sind Rechnungen, die an einen bestimmten Geschäftsbereich adressiert sind, meist ähnlich. In der Regel lassen sie sich mit einem regulären Ausdruck beschreiben.Wenn ein regulärer Ausdruck für Bestellnummern vorhanden ist, erkennt das Programm in Bildern alle Nummern, die diesem Ausdruck entsprechen. Der reguläre Ausdruck kann in einer XML-Konfigurationsdatei mit den folgenden Tags angegeben werden:
.<InvoiceSettings>
...
<OrderNumber>
   <Value>
      <RegularExpression></RegularExpression>
   </Value>
</OrderNumber>
</InvoiceSettings>
Weitere Informationen zu XML-Konfigurationsdateien finden Sie unter Einstellungen der Rechnungsverarbeitung in XML-Dateien bearbeiten.
FCFORINVOICES kann Rechnungspositionen aus Bildern extrahieren.Die Extraktion von Rechnungspositionen ist standardmäßig deaktiviert (siehe Zusätzliche Felder).Eine Liste der Felder, die das Programm automatisch extrahiert, finden Sie unter Erfasste Felder.FCFORINVOICES sucht zunächst im Bild nach einer Tabelle. Während dieser Suche verwendet es die Schlüsselwörter für Spaltenüberschriften, die für jede Sprache in den Eigenschaften der Dokumentdefinition angegeben sind. Schlüsselwörter für Spalten von Rechnungspositionen werden auch zur Klassifizierung von Positionen verwendet, d. h. zur Bestimmung des Typs jeder Spalte einer Rechnungsposition.Danach verwendet das Programm Informationen über erkannte Spalten und mathematische Ausdrücke, um Rechnungspositionen in der Tabelle der Rechnung zu finden.Abschließend durchsucht das Programm die Rechnungspositionen nach Feldern aus den Spalten.Training kann verwendet werden, um die Qualität der automatischen Extraktion von Positionen zu verbessern.

Verwendung neuronaler Netze

Einer der Hauptvorteile neuronaler Netze ist ihre Fähigkeit, selbstständig zu lernen: Neuronale Netze können komplexe Abhängigkeiten in Eingabedaten erkennen und daraus nützliche Verallgemeinerungen ableiten. Das Programm enthält zwei neuronale Netze, mit denen die folgenden Felder erfasst werden können:
  • InvoiceNumber
  • InvoiceDate
  • Gesamtbetrag
  • Vendor \ Name
  • Vendor \ Adresse
  • Geschäftsbereich \ Name
  • Geschäftsbereich \ Adresse
  • Bestellungen \ Bestellnummer
  • LineItems:
    • OrderNumber
    • OrderDate
    • Position
    • ArticleNumber
    • Beschreibung
    • Menge
    • Maßeinheit
    • Stückpreis
    • Nettogesamtpreis
    • VATPercentage
Für maximale Präzision verwendet das Programm sowohl ein FlexiLayout als auch seine neuronalen Netze, um Rechnungsfelder zu erfassen. Die Felder, die das Programm mit seinen neuronalen Netzen nicht extrahieren kann, werden mithilfe des FlexiLayouts extrahiert. Wenn ein Feld sowohl durch die neuronalen Netze als auch durch das FlexiLayout extrahiert werden kann, kombiniert das Programm die mit beiden Methoden erzielten Ergebnisse auf intelligente Weise. Wie die Ergebnisse kombiniert werden, hängt vom jeweiligen Feld ab (Einzelheiten finden Sie unter Kombinieren der Felderkennungsergebnisse).

Deaktivieren der neuronalen Netzwerke

Standardmäßig werden die neuronalen Netzwerke als zweite Methode zum Erfassen von Dokumentfeldern verwendet. Wenn Sie in Ihrem Rechnungsprojekt andere Dokumente als Rechnungen verarbeiten möchten, sollten Sie das neuronale Netzwerk deaktivieren, da es speziell für die Erfassung von Rechnungsfeldern trainiert wurde und bei anderen Dokumenttypen möglicherweise nicht gut funktioniert. So deaktivieren Sie das neuronale Netzwerk für die Gruppe Positionen (wiederholte Gruppe):
  • Öffnen Sie den Document Definition Editor.
  • Klicken Sie auf Document Definition Properties… Document Definition Settings Additional Fields and Features.
  • Deaktivieren Sie die Option Thorough extraction of invoice line items.
So deaktivieren Sie das neuronale Netzwerk für die Gruppen Rechnungskopf, Vendor, Geschäftsbereich und Bestellung:
  • Öffnen Sie den Document Definition Editor.
  • Klicken Sie auf Document Definition Properties… Document Definition Settings Additional Fields and Features.
  • Deaktivieren Sie die Option Thorough extraction of invoice header fields.

Kombinieren der Ergebnisse der Felderkennung

Wie das Programm die Ergebnisse der Felderkennung kombiniert oder das beste Ergebnis auswählt, hängt vom jeweiligen Feld ab. In der Regel haben die Ergebnisse des jeweiligen neuronalen Netzwerks Vorrang. Ausnahmen von dieser Regel sind Suchen auf Basis von Datensätzen und Suchen mit regulären Ausdrücken, die für bestimmte Kundendokumente erstellt wurden. Feldgruppe Rechnungskopf Bei den folgenden Feldern haben die vom neuronalen Netzwerk ermittelten Ergebnisse immer Vorrang:
  • Rechnungsnummer
  • Rechnungsdatum
  • Gesamtbetrag
Geschäftsbereich und Vendor Standardmäßig werden der Geschäftsbereich und der Vendor anhand eines Datensatzes erkannt, sofern ein Datensatz ausgewählt ist. Zusätzlich können die folgenden Felder mithilfe des neuronalen Netzwerks erkannt werden, wenn im Datensatz kein entsprechender Datensatz vorhanden ist:
  • Name
  • VATID (ABN)
  • Adresse
Wenn kein Datensatz ausgewählt ist, wird nur das neuronale Netzwerk verwendet. Feldgruppe Bestellung Das neuronale Netzwerk wird nur verwendet, wenn der Wert nicht mithilfe eines Datensatzes oder eines regulären Ausdrucks erkannt wird. Positionen (wiederholte Gruppe) Bei Positionsfeldern haben die vom neuronalen Netzwerk ermittelten Ergebnisse Vorrang. Wenn das neuronale Netzwerk die gesamte Positionentabelle erkennt, wird diese Tabelle für die weitere Verarbeitung verwendet. Andernfalls verwendet das Programm die mithilfe von FlexiLayout erkannten Positionen. Wenn das neuronale Netzwerk für jede Position nur die Felder Description und TotalPriceNetto erkennt, werden diese durch die mithilfe von FlexiLayout erkannten Felder ergänzt.