Varianti di tipo di documento
- Per centinaia di varianti, le skill addestrate con l’Online Learning in Vantage saranno in grado di estrarre i dati quasi senza errori.
- Per migliaia di varianti, le skill addestrate con l’attività Deep Learning saranno in grado di estrarre i dati con un’accuratezza di circa l’80%-90%, a seconda della complessità dei tipi di documento.
- Per le varianti più importanti di un tipo di documento, le skill addestrate con le attività Fast Learning e/o Extraction Rules garantiranno un’estrazione accurata dei dati da documenti complessi.
- Per i documenti strutturati, che presentano sempre lo stesso tipo di informazioni nelle stesse posizioni esatte, consigliamo di utilizzare fino a 10 varianti. Se un modulo fisso ha molte varianti, consigliamo di trattarle tutte come tipi di documento diversi. Per ulteriori informazioni, vedere Elaborazione di documenti strutturati.
Addestramento e test di una Document skill
- Set di addestramento
- Set di test
- Set cieco (un set di test aggiuntivo che contiene documenti di esempio non inclusi in nessuno dei due set sopra)
Requisiti del set di training
- Deep Learning activity for semi-structured documents:
- Per documenti ad alta variabilità, sono necessari almeno 200-300 documenti di esempio (2-3 documenti di esempio per variante). In generale, consigliamo di avere circa 1.000 documenti nel set.
- Per documenti a bassa variabilità, in genere sono sufficienti 100 documenti di esempio.
- Segmentation activity:
- Per documenti ad alta variabilità, consigliamo di avere almeno 100 documenti di esempio.
- Per documenti a bassa variabilità, consigliamo di averne almeno 20.
- Deep Learning for NLP activity:
- Per documenti ad alta variabilità, consigliamo di avere almeno 300 documenti di esempio (2-3 esempi per variante).
- Per documenti a bassa variabilità, consigliamo di averne almeno 50.
Nota: Anche se non disponi del numero consigliato di documenti di esempio, avere un documento di esempio per variante è meglio di niente.
Requisiti del set di test
Requisiti per il blind set
Nota: Assicurati di utilizzare documenti diversi per l’addestramento e il test della tua skill.
Configurazione di una Document skill
- Fai clic sul pulsante Impostazioni accanto al nome della skill per visualizzare e modificare le relative impostazioni.
- Nella scheda Documenti, carica alcuni documenti.
- Nella scheda Fields, etichetta i field da cui verranno estratti i valori, specificandone le posizioni.
- Nella scheda Activities, configura il flusso di elaborazione del documento.
- Nella scheda Results, testa la tua skill per verificarne le prestazioni sui documenti di esempio.
- Nella scheda Publish, pubblica la tua skill.
