Zum Hauptinhalt springen
Dieser Artikel beschreibt die verschiedenen Normalisierungstypen, die verwendet werden können, wenn Spalten aus einer externen Datenbank zu einem Datensatz in einer FCFORINVOICES Document Definition hinzugefügt werden, sowie die Einstellungen dieser Normalisierungstypen. Mit der Normalisierung kann das Format von Werten geändert werden, die zwar unterschiedlich geschrieben sind, aber im Wesentlichen dasselbe bedeuten. Sie sorgt für eine einheitliche Formatierung von Werten, damit diese miteinander verglichen werden können. So können beispielsweise die Adresse und der Name eines Unternehmens auf verschiedene Weise geschrieben werden. Da sich diese Werte auf dasselbe Unternehmen und dieselbe Adresse beziehen, müssen sie normalisiert werden, damit das Programm einen korrekten Vergleich durchführen kann. Der Normalisierungstyp kann für jede Spalte in einem Datensatz angegeben werden, wenn diese Spalten Spalten in einer externen Datenbank zugeordnet werden. Die Normalisierung wird nur auf Werte angewendet, die im Datensatz gespeichert sind (die Option Cache data muss in den Eigenschaften des Datensatzes aktiviert sein). Werte in der externen Datenbank werden nicht geändert.
FCFORINVOICES bietet zwei Arten der Normalisierung für Werte aus dem Datensatz.

1. Text

Diese Art der Normalisierung ist nützlich, wenn Zeichenfolgen wie Firmennamen und Adressen verglichen werden.
  1. Leerraum (einschließlich Zeilenumbrüchen und Tabulatorzeichen) sowie Trennsymbole werden durch normale Leerzeichen ersetzt.
  2. Punkte, die als Trennzeichen verwendet werden (also Punkte zwischen Wörtern), werden durch Leerzeichen ersetzt, und Punkte in Abkürzungen werden entfernt.
  3. Normalisierung von Konjunktionssymbolen (&, +, -, /, ~):
    • Gruppen von Wörtern, die mit einem Wort aus einem einzelnen Buchstaben beginnen und durch dasselbe Konjunktionssymbol getrennt sind, werden zu einem einzigen Wort zusammengefügt, z. B. wird R & D zu R&D;
    • in allen anderen Fällen werden Konjunktionssymbole durch Leerzeichen ersetzt, z. B. wird Procter&Gamble zu Procter Gamble.
  4. Doppelte Leerzeichen werden entfernt.
  5. Eine vordefinierte Liste wird verwendet, um Wörter aufzuteilen. Zum Beispiel wird CoKG in Co KG aufgeteilt.
  6. Leerzeichen im erkannten Text werden verwendet, um ihn in einzelne Wörter aufzuteilen.
  7. Eine vordefinierte Liste wird verwendet, um Suffixe in jedem Wort zu ersetzen. Zum Beispiel können Sie das Suffix strasse durch das Suffix str ersetzen.
  8. Zeichenfolgen aus Wörtern werden automatisch anhand einer vordefinierten Liste ersetzt. Zum Beispiel können Sie das Wort Limited durch die Abkürzung Ltd ersetzen.
Die Normalisierungsparameter werden in der Datei Normalization.xml angegeben, die im Projektordner gespeichert ist.
Die Datei Normalization.xml kann geändert werden, nachdem der Datensatz erstellt wurde (separat für jeden Datensatz). Gehen Sie wie folgt vor, um die Standard-Normalisierungseinstellungen zu ändern:
  1. Laden Sie die Einstellungsdatei mit dem FCAdminTools-Befehl DownloadNormalizationSettings herunter.
  2. Nehmen Sie die entsprechenden Änderungen vor.
  3. Laden Sie die Einstellungsdatei mit dem FCAdminTools-Befehl UpdateNormalizationSettings hoch.
Wichtig! Nach dem Aktualisieren der Einstellungsdatei müssen Sie den Datensatz aktualisieren. Weitere Informationen finden Sie unter Datensätze aktualisieren.
Am Normalisierungsalgorithmus können in zukünftigen Programmversionen erhebliche Änderungen vorgenommen werden.

2. Alphanumerischer Code

Dieser Normalisierungstyp ist nützlich, wenn alphanumerische Codes wie Steuer-ID-Nummern, Bankkonten und Postleitzahlen verglichen werden. Aus den Werten werden alle Symbole außer Ziffern und Buchstaben entfernt, sodass Sie Werte vergleichen können, ohne Leerzeichen, Bindestriche, Schrägstriche und andere beliebige Zeichen zu berücksichtigen, die diese Werte enthalten können. Wenn die Normalisierung angewendet wird, wird beim Zuordnen der Datensatzspalte zu einer Spalte in einer externen Datenbank die Option Store normalized value verfügbar.
  • Wenn diese Option aktiviert ist, werden normalisierte Werte im Datensatz gespeichert.
  • Wenn diese Option deaktiviert ist, werden die ursprünglichen Werte aus der externen Datenbank in den Datensatz kopiert.
Diese Option wirkt sich nicht auf die Datenextraktion oder automatisierte Prüfungen aus, bestimmt jedoch, welcher Wert dem Benutzer angezeigt wird, wenn er nach einem Eintrag in einem Wörterbuch sucht.