Come funziona il rilevamento delle aziende

Il livello di dettaglio e la qualità dei record nel catalogo di dati influiscono in modo significativo sull’accuratezza del rilevamento delle aziende. Quanto più i record dell’emittente e del destinatario del documento corrispondono al testo estratto dall’immagine del documento, tanto più accurata sarà l’identificazione delle aziende dell’emittente e del destinatario.

Best practice per un rilevamento accurato

Per garantire che i risultati del rilevamento siano il più accurati possibile, assicurati che:

Gli identificatori aziendali univoci siano compilati. La compilazione delle colonne con valori univoci (Codice fiscale, Numero di identificazione del contribuente (TIN), IBAN) aumenterà significativamente la probabilità di un rilevamento corretto, poiché questi valori sono univoci per tutte le aziende.
Non ci siano record aziendali duplicati. L’assenza di record duplicati aumenterà la probabilità di rilevare correttamente l’azienda.
Non ci siano record non pertinenti. Record obsoleti o non validi nel catalogo di dati possono causare un rilevamento errato dell’azienda a causa di somiglianze casuali tra vari valori di field.
Tutti i field siano compilati per ciascun record aziendale. Fornisci quante più informazioni accurate possibile sulle aziende. Più sono accurate le informazioni, maggiore è la probabilità di rilevare correttamente le aziende.

Processo di rilevamento dell’azienda

Il rilevamento dell’azienda prevede i seguenti passaggi:

Passaggio 1: Ricerca dell’identificatore univoco

I valori dei seguenti field sono considerati identificatori univoci dell’azienda:

Codice fiscale
National Tax ID
IBAN

Un’attività Classify By Company cerca nell’immagine del documento i valori dei field elencati sopra utilizzando parole chiave ed espressioni regolari. Se non ne sono specificati, questo passaggio viene ignorato. I valori di Codice fiscale, National Tax ID e IBAN rilevati su un’immagine del documento vengono utilizzati per interrogare il catalogo di dati. Successivamente, i valori di Codice fiscale, National Tax ID e IBAN ricevuti dal catalogo di dati vengono confrontati con i valori rilevati sull’immagine (viene utilizzata una corrispondenza esatta). Ai fini del confronto, i valori vengono normalizzati come segue:

le lettere vengono convertite in maiuscolo
vengono rimossi gli spazi e i seguenti caratteri: ”.”, ”,”, ”—”, ”/”, ”****“

Passaggio 2: Ricerca del nome e dell’indirizzo dell’azienda

L’intero testo riconosciuto nell’immagine del documento viene utilizzato per interrogare il catalogo di dati. Successivamente, i valori di Nome, Via, CAP e Città restituiti dal catalogo di dati vengono confrontati con i valori rilevati sull’immagine (con corrispondenza esatta).

Per ottenere i migliori risultati di ricerca, assicurati che le colonne corrispondenti nel catalogo di dati siano compilate. Le informazioni sul nome e sull’indirizzo dell’azienda sono particolarmente importanti quando l’azienda non può essere identificata tramite codice fiscale, identificativo fiscale nazionale o IBAN.

Passaggio 3: Generazione delle ipotesi

Sulla base delle aziende trovate nei passaggi 1 e 2, viene generato un insieme di ipotesi. L’attività Classify By Company valuta queste ipotesi e seleziona cinque record di azienda emittente del documento e cinque record di azienda destinataria del documento che corrispondono con maggiore affidabilità ai valori dei field rilevati sull’immagine del documento. Questi record vengono quindi utilizzati per formare 25 coppie, ciascuna trattata come un’ipotesi separata. Un modello addestrato valuta quindi le ipotesi in base all’affidabilità, selezionando la coppia emittente–destinatario con la corrispondenza migliore.

Anche se il numero di aziende destinatarie del documento è molto ridotto (ad esempio, se è presente una sola azienda destinataria), è comunque consigliabile utilizzare un catalogo di dati Document Receiver Companies, poiché impedirà che un’azienda destinataria venga rilevata erroneamente come azienda emittente.

Se il catalogo di dati Document Issuer Companies specifica che l’Issuer Company ID dipende dal Receiver Company ID, le ipotesi vengono generate in base a questa correlazione (vedere Ricerca di una coppia di aziende).

Risultati del rilevamento delle aziende emittente e ricevente del documento

A seguito del rilevamento delle aziende emittente e ricevente in un documento, verranno individuati i seguenti identificatori:

L’identificatore dell’azienda emittente nel catalogo di dati Document Issuer Companies
L’identificatore dell’azienda ricevente nel catalogo di dati Document Receiver Companies

Se nel catalogo di dati Document Issuer Companies è specificato che l’ID dell’azienda emittente dipende dall’ID dell’azienda ricevente, il risultato del rilevamento dell’azienda emittente conterrà l’ID dell’azienda emittente corrispondente all’ID dell’azienda ricevente. Per ulteriori informazioni, vedere Ricerca di una coppia di aziende.

Advanced Designer

​Best practice per un rilevamento accurato

​Processo di rilevamento dell’azienda

​Passaggio 1: Ricerca dell’identificatore univoco

​Passaggio 2: Ricerca del nome e dell’indirizzo dell’azienda

​Passaggio 3: Generazione delle ipotesi

​Risultati del rilevamento delle aziende emittente e ricevente del documento

Best practice per un rilevamento accurato

Processo di rilevamento dell’azienda

Passaggio 1: Ricerca dell’identificatore univoco

Passaggio 2: Ricerca del nome e dell’indirizzo dell’azienda

Passaggio 3: Generazione delle ipotesi

Risultati del rilevamento delle aziende emittente e ricevente del documento