Vai al contenuto principale

Panoramica

Un Document skill estrae i valori dei field da documenti strutturati e semistrutturati di un unico tipo. I documenti dello stesso tipo condividono gli stessi field, le Regole di validazione e la stessa struttura: ad esempio, fatture, contratti ed elenchi di spedizione rappresentano ciascuno un unico tipo di documento.
Un Document skill elabora un solo file per transaction. Per elaborare più file in una singola transaction, usa l’attività Extract di un Process skill.

Documenti strutturati e semi-strutturati

TipoPosizione del fieldEsempiDove creare
StrutturatoFissa in ogni istanzaQuestionari, moduli di richiesta, moduli fiscaliVantage. Usa Advanced Designer quando devi combinare l’elaborazione di documenti strutturati con altre tecnologie di Vantage.
Semi-strutturatoVaria per etichetta, numero e posizione in ogni istanzaFatture, contratti, distinte di spedizioneVantage o Advanced Designer.

Addestramento di una Document skill

Per iniziare ad addestrare una Document skill, etichetta i Field su un documento. Durante l’addestramento, Vantage suggerisce automaticamente le posizioni dei Field per velocizzare il processo di etichettatura.

Varianti del tipo di documento

I documenti dello stesso tipo presentano quasi sempre field, regole di validazione e struttura identici, ma le varianti dello stesso tipo possono differire leggermente — ad esempio, in base all’anno in cui il documento è stato emesso. Una singola Document skill può gestire un numero qualsiasi di varianti; l’approccio di addestramento più adatto dipende dal numero di varianti da coprire.

Scegliere un’attività in base alla scala

Varianti nel tuo set di documentiApproccio consigliatoAccuratezza prevista
CentinaiaOnline Learning in VantageEstrazione pressoché impeccabile
Migliaiaattività Deep Learning~80–90%, a seconda della complessità dei documenti
Solo le varianti più essenzialiattività Fast Learning e/o Extraction RulesAccuratezza elevata su documenti complessi
Moduli strutturati (fino a 10 varianti)Vantage Document skillElevata. Considera le varianti aggiuntive come tipi di documento separati.
Le attività Deep Learning, Fast Learning ed Extraction Rules sono disponibili solo in Advanced Designer. Per usarle, apri il tuo Document skill in Advanced Designer: una volta pubblicato, lo skill può comunque essere richiamato da Skill Designer e dai Process skill.

Raccomandazioni per l’addestramento e il test

  • Usa un set di addestramento rappresentativo. Includi almeno 2–3 documenti per variante. Anche un solo sample per variante è meglio di nessuno. Quando il set non copre tutte le varianti, usa l’attività Deep Learning: generalizza a partire da pattern di immagine, struttura spaziale, contenuti dei field ed etichette circostanti, e può elaborare varianti su cui non è stata addestrata.
  • Esegui i test con distribuzioni simili a quelle di produzione. Usa un sample casuale ricavato dal flusso reale dei tuoi documenti, in modo che ogni variante compaia nel set di test con una frequenza approssimativamente uguale a quella con cui compare in produzione. In questo modo, la stima dell’accuratezza resta valida.