Passer au contenu principal
Les documents de certaines entreprises peuvent présenter des structures particulièrement complexes. Pour extraire correctement les données de tels documents, vous devez configurer des activités d’extraction propres à chaque entreprise. Cela peut être fait au sein d’une seule Compétence de document en utilisant une activité Classifier par entreprise. Cette activité classe les documents par entreprise à l’aide de catalogues de données.

Utiliser des catalogues de données

Un catalogue de données est un ensemble de données contenant des informations spécifiques. Par exemple, il peut s’agir d’informations relatives à l’entreprise, comme des raisons sociales, des adresses, des numéros de compte bancaire, etc. Les catalogues de données peuvent être utilisés pour rechercher toute entreprise mentionnée dans le document, comme les fournisseurs, les destinataires, les banques, les compagnies maritimes, etc. Un catalogue de données peut être alimenté à partir d’un fichier CSV dont la structure est identique à celle du catalogue. Pour plus d’informations sur l’utilisation des catalogues de données, consultez la section Using data catalogs du Skill Designer Guide. Lorsque des documents sont traités à l’aide d’une activité Classify By Company, des données spécifiques à l’entreprise sont recherchées dans le catalogue de données connecté. Le résultat est un identifiant d’entreprise unique, enregistré dans le champ correspondant de la compétence. Cet identifiant d’entreprise est ensuite utilisé pour configurer un algorithme de traitement de documents propre à l’entreprise. L’identifiant d’entreprise est le seul champ requis pour qu’une activité Classify By Company fonctionne ; toutefois, vous pouvez renseigner d’autres champs à l’aide des informations sur l’entreprise stockées dans le catalogue de données afin d’éviter de configurer des activités d’extraction supplémentaires pour ces champs. Pour ce faire, vous devez mapper les colonnes du catalogue de données aux champs appropriés dans la compétence. Une activité Classify By Company utilise des catalogues de données de type Document Issuer Companies, disponibles sur le serveur Vantage auquel vous êtes connecté. Dans certains cas, vous pouvez souhaiter rechercher dans le document une paire d’entreprises liées (par exemple, un fournisseur et un acheteur). Pour ce faire, ajoutez un second catalogue de données facultatif de type Document Receiver Companies. Si vous devez trouver deux entreprises non liées, vous pouvez soit utiliser cette option, soit ajouter deux activités Classify By Company.

Recherche d’une paire d’entreprises

Chacune des unités opérationnelles de votre entreprise peut disposer de sa propre base de fournisseurs. Si un fournisseur travaille avec plusieurs unités, il aura plusieurs entrées avec des identifiants différents. Dans ce cas, vous devrez trouver l’entrée exacte du fournisseur correspondant à l’unité. Pour ce faire, renseignez la colonne Company Correlation ID dans le catalogue de données Document Issuer Companies. La recherche identifiera alors des paires d’entreprises où l’identifiant de corrélation de l’émetteur du document correspond à l’identifiant du destinataire du document. Si certains identifiants de corrélation manquent, les paires avec des identifiants de corrélation correspondants seront prioritaires. Lors de la recherche de paires d’entreprises, des hypothèses sont générées à partir de la corrélation entre un fournisseur et une unité opérationnelle. Une activité Classify By Company sélectionne cinq enregistrements d’entreprises destinataires de documents qui correspondent le plus fiablement aux valeurs des champs sur l’image du document. Ensuite, pour chaque enregistrement, l’activité sélectionne cinq enregistrements d’entreprises émettrices de documents où le Company Correlation ID est identique au Receiver Company ID. Si le catalogue de données ne contient aucun enregistrement où le Company Correlation ID est identique au Receiver Company ID, des enregistrements avec un Company Correlation ID vide sont sélectionnés à la place.
Important ! Pour trouver des paires valides, vous devez renseigner les Company Correlation ID corrects pour tous les enregistrements.
Au final, la meilleure paire émetteur–destinataire est sélectionnée. Pour plus d’informations sur la détection des entreprises, voir Fonctionnement de la détection d’entreprise. Si les entreprises émettrices de vos documents peuvent travailler avec n’importe lequel des destinataires, vous n’avez pas besoin de renseigner la colonne Company Correlation ID dans votre catalogue de données Document Issuer Companies, et la recherche prendra en compte toutes les paires d’entreprises possibles.

Types de catalogue de données

Le catalogue de données des entreprises émettrices de documents

NomDescription
ID de l’entreprise émettriceObtenu en détectant l’émetteur du document. Identifie l’émetteur du document dans un système d’information externe.

Remarque : Il s’agit de l’identifiant unique de l’entrée dans le catalogue de données si toutes les unités opérationnelles de l’entreprise utilisent la même base de données clients. Dans le cas contraire, l’entrée du catalogue de données est identifiée de manière unique par une combinaison de ID de l’entreprise émettrice et ID de corrélation d’entreprise.
ID de corrélation d’entrepriseL’identifiant de l’unité opérationnelle de l’entreprise.

Remarque : Si les unités opérationnelles de l’entreprise utilisent des bases de données clients différentes, cette colonne du catalogue de données doit être renseignée, car la clé unique de l’entrée dans le catalogue de données sera une combinaison de ID de l’entreprise émettrice et ID de corrélation d’entreprise. Pour plus d’informations, voir Recherche d’une paire d’entreprises.
Identifiant fiscal (TIN)Ces colonnes peuvent être utilisées dans une recherche par identifiant unique d’entreprise.
Identifiant fiscal nationalCes colonnes peuvent être utilisées dans une recherche par identifiant unique d’entreprise.
IBANCes colonnes peuvent être utilisées dans une recherche par identifiant unique d’entreprise.
NomCes colonnes peuvent être utilisées dans une recherche par nom et adresse d’entreprise.
Code postalCes colonnes peuvent être utilisées dans une recherche par nom et adresse d’entreprise.
RueCes colonnes peuvent être utilisées dans une recherche par nom et adresse d’entreprise.
VilleCes colonnes peuvent être utilisées dans une recherche par nom et adresse d’entreprise.
État ou provinceCes colonnes ne sont pas utilisées dans le processus de détection d’entreprise. Elles ne servent qu’à renseigner les champs du document.
PaysCes colonnes ne sont pas utilisées dans le processus de détection d’entreprise. Elles ne servent qu’à renseigner les champs du document.
Compte bancaireCes colonnes ne sont pas utilisées dans le processus de détection d’entreprise. Elles ne servent qu’à renseigner les champs du document.
Code banqueCes colonnes ne sont pas utilisées dans le processus de détection d’entreprise. Elles ne servent qu’à renseigner les champs du document.

Le catalogue de données des entreprises destinataires du Document

NameDescription
Receiver Company IDObtenu lors de la détection du destinataire du document. Identifie le destinataire dans un système d’information externe. Clé unique de l’entrée dans le catalogue de données.
Tax IDCette colonne peut être utilisée pour une recherche par identifiant unique d’entreprise.
NameCes colonnes peuvent être utilisées pour une recherche par nom et adresse de l’entreprise.
Postal CodeCes colonnes peuvent être utilisées pour une recherche par nom et adresse de l’entreprise.
StreetCes colonnes peuvent être utilisées pour une recherche par nom et adresse de l’entreprise.
CityCes colonnes peuvent être utilisées pour une recherche par nom et adresse de l’entreprise.
State or ProvinceCes colonnes ne sont pas utilisées dans le processus de détection d’entreprise. Elles ne servent qu’à renseigner les champs du document.
CountryCes colonnes ne sont pas utilisées dans le processus de détection d’entreprise. Elles ne servent qu’à renseigner les champs du document.