Suggerimento: È possibile creare e modificare skill per documenti strutturati anche in Advanced Designer quando è necessario combinare l’elaborazione di documenti strutturati con altre tecnologie di Vantage.I documenti semi‑strutturati hanno un set specifico di Field, la cui etichettatura, il numero e la posizione variano da documento a documento dello stesso tipo. Un tipico esempio di documenti semi‑strutturati sono le fatture emesse da aziende diverse, che variano per numero e formattazione delle Righe articolo. Ogni fattura riporterà un numero della fattura e il Totale, ma la posizione esatta di queste informazioni varierà da una fattura all’altra. Per iniziare ad addestrare la tua Document skill, etichetta i Field su un documento. Man mano che addestri la tua skill, il programma inizierà a suggerire automaticamente le posizioni dei Field per facilitare il processo di etichettatura.
Nota: Attualmente, solo un file può essere elaborato da una Document skill nell’ambito di una singola transaction. Se devi elaborare più file, utilizza l’attività Extract della Process skill.
Varianti del tipo di documento
- Per centinaia di varianti, le skill addestrate con l’Apprendimento online in Vantage saranno in grado di estrarre i dati quasi senza errori.
- Per migliaia di varianti, le skill addestrate con l’attività Deep Learning saranno in grado di estrarre i dati con un’accuratezza di circa l’80%–90%, a seconda della complessità dei tipi di documento.
- Per le varianti più importanti di un tipo di documento, le skill addestrate con le attività Fast Learning e/o Extraction Rules garantiranno un’estrazione accurata dei dati da documenti complessi.
- Per i documenti strutturati, che presentano sempre lo stesso tipo di informazioni nelle stesse posizioni esatte, consigliamo di usare fino a 10 varianti. Se un modulo fisso ha molte varianti, consigliamo di trattarle tutte come tipi di documento distinti.
- Durante l’addestramento di una skill, usare un set di documenti rappresentativo contenente almeno 2-3 documenti per ciascuna variante. Se ci sono molte varianti e il set non contiene almeno un documento per ogni variante, è possibile usare l’attività Deep Learning. Questa riconosce i pattern delle immagini, la struttura spaziale dei documenti, i contenuti dei field e le etichette circostanti e può elaborare varianti non utilizzate per l’addestramento.
- Durante il test di una skill, usare una distribuzione dei documenti simile a quella del flusso reale di documenti in produzione: la percentuale di documenti di una specifica variante nel set di addestramento dovrebbe rispecchiare la frequenza con cui la variante appare nel flusso dei documenti. In questo modo la stima dell’accuratezza sarà valida. Per farlo, si testano le skill usando un campione casuale di documenti dal flusso reale di documenti in produzione.
- Un campione di una variante è meglio di nessun campione.
