Panoramica
Un Document skill elabora un solo file per transaction. Per elaborare più file in una singola transaction, usa l’attività Extract di un Process skill.
Documenti strutturati e semi-strutturati
| Tipo | Posizione del field | Esempi | Dove creare |
|---|---|---|---|
| Strutturato | Fissa in ogni istanza | Questionari, moduli di richiesta, moduli fiscali | Vantage. Usa Advanced Designer quando devi combinare l’elaborazione di documenti strutturati con altre tecnologie di Vantage. |
| Semi-strutturato | Varia per etichetta, numero e posizione in ogni istanza | Fatture, contratti, distinte di spedizione | Vantage o Advanced Designer. |
Addestramento di una Document skill
Varianti del tipo di documento
Scegliere un’attività in base alla scala
| Varianti nel tuo set di documenti | Approccio consigliato | Accuratezza prevista |
|---|---|---|
| Centinaia | Online Learning in Vantage | Estrazione pressoché impeccabile |
| Migliaia | attività Deep Learning | ~80–90%, a seconda della complessità dei documenti |
| Solo le varianti più essenziali | attività Fast Learning e/o Extraction Rules | Accuratezza elevata su documenti complessi |
| Moduli strutturati (fino a 10 varianti) | Vantage Document skill | Elevata. Considera le varianti aggiuntive come tipi di documento separati. |
Le attività Deep Learning, Fast Learning ed Extraction Rules sono disponibili solo in Advanced Designer. Per usarle, apri il tuo Document skill in Advanced Designer: una volta pubblicato, lo skill può comunque essere richiamato da Skill Designer e dai Process skill.
Raccomandazioni per l’addestramento e il test
- Usa un set di addestramento rappresentativo. Includi almeno 2–3 documenti per variante. Anche un solo sample per variante è meglio di nessuno. Quando il set non copre tutte le varianti, usa l’attività Deep Learning: generalizza a partire da pattern di immagine, struttura spaziale, contenuti dei field ed etichette circostanti, e può elaborare varianti su cui non è stata addestrata.
- Esegui i test con distribuzioni simili a quelle di produzione. Usa un sample casuale ricavato dal flusso reale dei tuoi documenti, in modo che ogni variante compaia nel set di test con una frequenza approssimativamente uguale a quella con cui compare in produzione. In questo modo, la stima dell’accuratezza resta valida.
