Zum Hauptinhalt springen
Dokumente mancher Unternehmen können besonders komplex aufgebaut sein. Um Daten aus solchen Dokumenten korrekt zu extrahieren, müssen Sie unternehmensspezifische Extraktionsabläufe einrichten. Das lässt sich innerhalb eines einzelnen Document-Skills mit der Aktivität „Nach Unternehmen klassifizieren“ umsetzen. Diese Aktivität klassifiziert Dokumente mithilfe von Datenkatalogen nach Unternehmen.

Verwenden von Datenkatalogen

Ein Datenkatalog ist eine Sammlung von Daten mit spezifischen Informationen. Dazu können beispielsweise unternehmensbezogene Angaben wie Firmennamen, Adressen, Bankkontonummern usw. gehören. Datenkataloge können verwendet werden, um auf dem Dokument nach beliebigen Unternehmen zu suchen, z. B. nach Vendors, Empfangsempfängern, Banken, Reedereien usw. Ein Datenkatalog kann mit Daten aus einer CSV-Datei befüllt werden, deren Struktur der des Datenkatalogs entspricht. Weitere Informationen zur Verwendung von Datenkatalogen finden Sie im Abschnitt „Verwenden von Datenkatalogen“ im Skill Designer Guide. Wenn Dokumente mithilfe einer Classify By Company-Aktivität verarbeitet werden, werden spezifische Unternehmensdaten im verbundenen Datenkatalog gesucht. Das Ergebnis ist ein eindeutiger Unternehmensbezeichner, der im entsprechenden Feld im Skill erfasst wird. Dieser Unternehmensbezeichner wird anschließend verwendet, um einen unternehmensspezifischen Algorithmus zur Dokumentverarbeitung einzurichten. Der Unternehmensbezeichner ist das einzige Feld, das für das Funktionieren einer Classify By Company-Aktivität erforderlich ist; Sie können jedoch weitere Felder mit Informationen über das Unternehmen aus dem Datenkatalog befüllen, um das Einrichten zusätzlicher Extraktionsaktivitäten für diese Felder zu vermeiden. Dazu müssen Sie die Spalten des Datenkatalogs den entsprechenden Feldern im Skill zuordnen. Eine Classify By Company-Aktivität verwendet Datenkataloge des Typs Document Issuer Companies, die auf dem Vantage-Server verfügbar sind, mit dem Sie verbunden sind. In einigen Fällen möchten Sie das Dokument nach einem Paar verbundener Unternehmen durchsuchen (z. B. einem Lieferanten und einem Käufer von Waren). Fügen Sie dazu einen zweiten, optionalen Datenkatalog des Typs Document Receiver Companies hinzu. Wenn Sie zwei nicht verbundene Unternehmen finden müssen, können Sie entweder diese Option verwenden oder zwei Classify By Company-Aktivitäten hinzufügen.

Suche nach einem Unternehmenspaar

Jede Geschäftseinheit Ihres Unternehmens kann ihre eigene Lieferantendatenbank haben. Wenn ein Lieferant mit mehreren Geschäftseinheiten zusammenarbeitet, hat er mehrere Einträge mit unterschiedlichen IDs. In diesem Fall müssen Sie den genauen Eintrag für den Lieferanten finden, der zur jeweiligen Geschäftseinheit gehört. Tragen Sie dazu die Spalte Company Correlation ID im Datenkatalog Document Issuer Companies ein. Die Suche sucht dann nach Unternehmenspaaren, bei denen die Correlation ID des Dokumentausstellers mit der Dokumentempfänger-ID übereinstimmt. Wenn einige Correlation IDs fehlen, haben Paare mit übereinstimmenden Correlation IDs Vorrang. Bei der Suche nach Unternehmenspaaren werden Hypothesen anhand der Korrelation zwischen einem Lieferanten und einer Geschäftseinheit gebildet. Eine Classify By Company-Aktivität wählt fünf Datensätze von Dokumentempfänger-Unternehmen aus, die am zuverlässigsten mit den Feldwerten auf dem Dokumentbild übereinstimmen. Anschließend wählt die Aktivität für jeden Datensatz fünf Datensätze von Dokumentaussteller-Unternehmen aus, bei denen die Company Correlation ID mit der Receiver Company ID identisch ist. Wenn der Datenkatalog keine Datensätze enthält, bei denen die Company Correlation ID mit der Receiver Company ID identisch ist, werden stattdessen Datensätze mit leerer Company Correlation ID ausgewählt.
Wichtig: Um gültige Paare zu finden, müssen Sie für alle Datensätze die richtigen Company Correlation IDs eintragen.
Als Ergebnis wird das am besten passende Aussteller–Empfänger-Paar ausgewählt. Weitere Informationen zur Unternehmenserkennung finden Sie unter Funktionsweise der Unternehmenserkennung. Wenn Ihre Dokumentaussteller-Unternehmen mit beliebigen Dokumentempfängern zusammenarbeiten können, müssen Sie die Spalte Company Correlation ID in Ihrem Datenkatalog Document Issuer Companies nicht ausfüllen; die Suche berücksichtigt dann alle möglichen Unternehmenspaare.

Typen von Datenkatalogen

Der Datenkatalog für Dokumentaussteller-Unternehmen

NameBeschreibung
Issuer Company IDWird durch Erkennung des Dokumentausstellers ermittelt. Identifiziert den Dokumentaussteller in einem externen Informationssystem.

Hinweis: Dies ist der eindeutige Bezeichner des Eintrags im Datenkatalog, wenn alle Geschäftseinheiten des Unternehmens dieselbe Kundendatenbank verwenden. Andernfalls wird der Eintrag im Datenkatalog eindeutig durch eine Kombination aus Issuer Company ID und Company Correlation ID identifiziert.
Company Correlation IDDer Bezeichner der Geschäftseinheit des Unternehmens.

Hinweis: Wenn die Geschäftseinheiten des Unternehmens unterschiedliche Kundendatenbanken verwenden, muss diese Spalte im Datenkatalog ausgefüllt werden, da der eindeutige Schlüssel des Eintrags im Datenkatalog eine Kombination aus Issuer Company ID und Company Correlation ID ist. Weitere Informationen finden Sie unter Suche nach einem Unternehmenpaar.
Tax IDDiese Spalten können für die Suche nach einer eindeutigen Unternehmenskennung verwendet werden.
National Tax IDDiese Spalten können für die Suche nach einer eindeutigen Unternehmenskennung verwendet werden.
IBANDiese Spalten können für die Suche nach einer eindeutigen Unternehmenskennung verwendet werden.
NameDiese Spalten können für die Suche nach Unternehmensname und -adresse verwendet werden.
Postal CodeDiese Spalten können für die Suche nach Unternehmensname und -adresse verwendet werden.
StreetDiese Spalten können für die Suche nach Unternehmensname und -adresse verwendet werden.
CityDiese Spalten können für die Suche nach Unternehmensname und -adresse verwendet werden.
State or ProvinceDiese Spalten werden im Unternehmenserkennungsprozess nicht verwendet. Sie können nur zum Ausfüllen der Dokumentfelder verwendet werden.
CountryDiese Spalten werden im Unternehmenserkennungsprozess nicht verwendet. Sie können nur zum Ausfüllen der Dokumentfelder verwendet werden.
Bank AccountDiese Spalten werden im Unternehmenserkennungsprozess nicht verwendet. Sie können nur zum Ausfüllen der Dokumentfelder verwendet werden.
Bank CodeDiese Spalten werden im Unternehmenserkennungsprozess nicht verwendet. Sie können nur zum Ausfüllen der Dokumentfelder verwendet werden.

Der Datenkatalog „Document Receiver Companies“

NameBeschreibung
Receiver Company IDDurch Erkennung des Dokumentempfängers ermittelt. Identifiziert den Dokumentempfänger in einem externen Informationssystem. Der eindeutige Schlüssel des Eintrags im Datenkatalog.
Steuer-IDDiese Spalte kann für die Suche nach einer eindeutigen Unternehmenskennung verwendet werden.
NameDiese Spalte kann für die Suche nach Unternehmensname und Adresse verwendet werden.
Postal CodeDiese Spalte kann für die Suche nach Unternehmensname und Adresse verwendet werden.
StreetDiese Spalte kann für die Suche nach Unternehmensname und Adresse verwendet werden.
CityDiese Spalte kann für die Suche nach Unternehmensname und Adresse verwendet werden.
State or ProvinceDiese Spalte wird im Unternehmenserkennungsprozess nicht verwendet. Sie kann nur zum Ausfüllen der Dokumentfelder verwendet werden.
CountryDiese Spalte wird im Unternehmenserkennungsprozess nicht verwendet. Sie kann nur zum Ausfüllen der Dokumentfelder verwendet werden.