Wie funktioniert die Normalisierung während der Datenextraktion im Programm?
Wie funktioniert die Normalisierung während der Datenextraktion im Programm?
FCFORINVOICES bietet zwei Arten der Normalisierung für Werte aus dem Datensatz.
1. Text
- Leerraum (einschließlich Zeilenumbrüchen und Tabulatorzeichen) sowie Trennsymbole werden durch normale Leerzeichen ersetzt.
- Punkte, die als Trennzeichen verwendet werden (also Punkte zwischen Wörtern), werden durch Leerzeichen ersetzt, und Punkte in Abkürzungen werden entfernt.
- Normalisierung von Konjunktionssymbolen (&, +, -, /, ~):
- Gruppen von Wörtern, die mit einem Wort aus einem einzelnen Buchstaben beginnen und durch dasselbe Konjunktionssymbol getrennt sind, werden zu einem einzigen Wort zusammengefügt, z. B. wird R & D zu R&D;
- in allen anderen Fällen werden Konjunktionssymbole durch Leerzeichen ersetzt, z. B. wird Procter&Gamble zu Procter Gamble.
- Doppelte Leerzeichen werden entfernt.
- Eine vordefinierte Liste wird verwendet, um Wörter aufzuteilen. Zum Beispiel wird CoKG in Co KG aufgeteilt.
- Leerzeichen im erkannten Text werden verwendet, um ihn in einzelne Wörter aufzuteilen.
- Eine vordefinierte Liste wird verwendet, um Suffixe in jedem Wort zu ersetzen. Zum Beispiel können Sie das Suffix strasse durch das Suffix str ersetzen.
- Zeichenfolgen aus Wörtern werden automatisch anhand einer vordefinierten Liste ersetzt. Zum Beispiel können Sie das Wort Limited durch die Abkürzung Ltd ersetzen.
Mehr ...
Mehr ...
Die Datei Normalization.xml kann geändert werden, nachdem der Datensatz erstellt wurde (separat für jeden Datensatz). Gehen Sie wie folgt vor, um die Standard-Normalisierungseinstellungen zu ändern:
- Laden Sie die Einstellungsdatei mit dem FCAdminTools-Befehl DownloadNormalizationSettings herunter.
- Nehmen Sie die entsprechenden Änderungen vor.
- Laden Sie die Einstellungsdatei mit dem FCAdminTools-Befehl UpdateNormalizationSettings hoch.
Am Normalisierungsalgorithmus können in zukünftigen Programmversionen erhebliche Änderungen vorgenommen werden.
2. Alphanumerischer Code
- Wenn diese Option aktiviert ist, werden normalisierte Werte im Datensatz gespeichert.
- Wenn diese Option deaktiviert ist, werden die ursprünglichen Werte aus der externen Datenbank in den Datensatz kopiert.
