Vai al contenuto principale
Il livello di dettaglio e la qualità dei record del catalogo di dati influenzano in modo significativo l’accuratezza del rilevamento delle aziende. Quanto più i record dell’emittente e del destinatario di un documento corrispondono al testo estratto dall’immagine del documento, tanto più accuratamente vengono identificate le aziende dell’emittente e del destinatario.

Best practice per un rilevamento accurato

Per garantire che i risultati del rilevamento siano il più accurati possibile, assicurati che:
  • Gli identificatori aziendali univoci siano compilati. La compilazione delle colonne con valori univoci (Codice fiscale, Numero di identificazione del contribuente (TIN), IBAN) aumenterà significativamente la probabilità di un rilevamento corretto, poiché questi valori sono univoci per tutte le aziende.
  • Non ci siano record aziendali duplicati. L’assenza di record duplicati aumenterà la probabilità di rilevare correttamente l’azienda.
  • Non ci siano record non pertinenti. Record obsoleti o non validi nel catalogo di dati possono causare un rilevamento errato dell’azienda a causa di somiglianze casuali tra vari valori di field.
  • Tutti i field siano compilati per ciascun record aziendale. Fornisci quante più informazioni accurate possibile sulle aziende. Più sono accurate le informazioni, maggiore è la probabilità di rilevare correttamente le aziende.

Processo di rilevamento dell’azienda

Il rilevamento dell’azienda prevede i seguenti passaggi:

Passaggio 1: Ricerca dell’identificatore univoco

I valori dei seguenti field sono considerati identificatori univoci dell’azienda:
  • Codice fiscale
  • National Tax ID
  • IBAN
Un’attività Classify By Company cerca nell’immagine del documento i valori dei field elencati sopra utilizzando parole chiave ed espressioni regolari. Se non ne sono specificati, questo passaggio viene ignorato. I valori di Codice fiscale, National Tax ID e IBAN rilevati su un’immagine del documento vengono utilizzati per interrogare il catalogo di dati. Successivamente, i valori di Codice fiscale, National Tax ID e IBAN ricevuti dal catalogo di dati vengono confrontati con i valori rilevati sull’immagine (viene utilizzata una corrispondenza esatta). Ai fini del confronto, i valori vengono normalizzati come segue:
  • le lettere vengono convertite in maiuscolo
  • vengono rimossi gli spazi e i seguenti caratteri: ”.”, ”,”, ””, ”/”, ”****“

Passaggio 2: Ricerca del nome e dell’indirizzo dell’azienda

L’intero testo riconosciuto nell’immagine del documento viene utilizzato per interrogare il catalogo di dati. Successivamente, i valori di Nome, Via, CAP e Città restituiti dal catalogo di dati vengono confrontati con i valori rilevati sull’immagine (con corrispondenza esatta).
Nota: Per ottenere i migliori risultati di ricerca, assicurati che le colonne corrispondenti nel catalogo di dati siano compilate. Le informazioni sul nome e sull’indirizzo dell’azienda sono particolarmente importanti quando l’azienda non può essere identificata tramite codice fiscale, identificativo fiscale nazionale o IBAN.

Passaggio 3: Generazione delle ipotesi

Sulla base delle aziende trovate nei passaggi 1 e 2, viene generato un insieme di ipotesi. L’attività Classify By Company valuta queste ipotesi e seleziona cinque record di azienda emittente del documento e cinque record di azienda destinataria del documento che corrispondono con maggiore affidabilità ai valori dei field rilevati sull’immagine del documento. Questi record vengono quindi utilizzati per formare 25 coppie, ciascuna trattata come un’ipotesi separata. Un modello addestrato valuta quindi le ipotesi in base all’affidabilità, selezionando la coppia emittente–destinatario con la corrispondenza migliore.
Nota: Anche se il numero di aziende destinatarie del documento è molto ridotto (ad esempio, se è presente una sola azienda destinataria), è comunque consigliabile utilizzare un catalogo di dati Document Receiver Companies, poiché impedirà che un’azienda destinataria venga rilevata erroneamente come azienda emittente.
Se il catalogo di dati Document Issuer Companies specifica che l’Issuer Company ID dipende dal Receiver Company ID, le ipotesi vengono generate in base a questa correlazione (vedere Ricerca di una coppia di aziende).

Risultati del rilevamento delle aziende emittente e destinataria del documento

A seguito del rilevamento delle aziende emittente e destinataria in un documento, verranno individuati i seguenti identificatori:
  • L’identificatore dell’azienda emittente nel catalogo di dati Document Issuer Companies
  • L’identificatore dell’azienda destinataria nel catalogo di dati Document Receiver Companies
Nota: Se nel catalogo di dati Document Issuer Companies è specificato che l’ID dell’azienda emittente dipende dall’ID dell’azienda destinataria (vedere Ricerca di una coppia di aziende), il risultato del rilevamento dell’azienda emittente del documento conterrà l’ID dell’azienda emittente corrispondente all’ID dell’azienda destinataria.