Varianti del tipo di documento
- Per centinaia di varianti, le skill addestrate utilizzando Online Learning in Vantage saranno in grado di estrarre i dati quasi senza errori.
- Per migliaia di varianti, le skill addestrate utilizzando l’attività Deep Learning saranno in grado di estrarre i dati con un’accuratezza compresa tra circa l’80% e il 90%, a seconda della complessità dei tipi di documento.
- Per le varianti più importanti di un tipo di documento, le skill addestrate utilizzando le attività Fast Learning e/o Extraction Rules garantiranno un’estrazione accurata dei dati da documenti complessi.
- Per i documenti strutturati, che presentano sempre lo stesso tipo di informazioni nelle stesse posizioni esatte, si consiglia di utilizzare fino a 10 varianti. Se un modulo fisso ha molte varianti, si consiglia di trattarle tutte come tipi di documento diversi.
- Quando si addestra una skill, utilizzare un set di documenti rappresentativo contenente almeno 2-3 documenti per ciascuna variante. Se ci sono molte varianti e il set non contiene almeno un documento per ogni variante, è possibile utilizzare l’attività Deep Learning. Questa riconosce i pattern delle immagini, la struttura spaziale dei documenti, il contenuto dei field e le etichette circostanti e può elaborare varianti che non sono state utilizzate per l’addestramento.
- Quando si testa una skill, utilizzare una distribuzione dei documenti simile a quella del flusso reale di documenti in produzione: la percentuale di documenti di una specifica variante nel set di addestramento dovrebbe essere rappresentativa della frequenza con cui la variante compare nel flusso di documenti. Questo garantirà che la stima dell’accuratezza sia valida. Per farlo, si testano le skill utilizzando un campione casuale di documenti dal flusso reale di documenti in produzione.
- È meglio avere un campione per variante che nessun campione.
