Attività Deep Learning per documenti semi-strutturati

L’attività Deep Learning per documenti semi-strutturati è progettata per sviluppare skill cognitive di livello produttivo, in grado di estrarre field da documenti semi-strutturati utilizzando reti neurali.

Questa attività non estrae strutture complesse (ad esempio tabelle annidate, che sono strutture ricorrenti all’interno di altre tabelle) né field di tipo diverso da Text. Per estrarre tali strutture, utilizzare l’attività Extraction Rules.

Casi d’uso

Aggiungi questa attività al tuo flusso di elaborazione dei documenti quando:

La tua skill verrà utilizzata per elaborare più varianti dello stesso tipo di documento.
Hai in programma di elaborare varianti di documenti per cui la tua skill non è ancora stata addestrata. Ad esempio, potresti avere una Document skill con un’attività Fast Learning che è stata addestrata per estrarre field da contratti di prestito (con diverse strutture di field) provenienti da varie banche. Se decidi di usare questa skill esistente per elaborare contratti di prestito di una nuova banca non ancora conosciuta dalla skill, la qualità dell’estrazione potrebbe risultare inferiore agli standard. Per migliorare la qualità dell’estrazione, puoi usare un’attività Deep Learning invece di un’attività Fast Learning.

Come funziona

Il Deep Learning combina Convolutional Neural Networks (CNN), Recurrent Neural Networks (RNN) e token di Natural Language Processing (NLP). Grazie a questa combinazione, il Deep Learning riconosce gli schemi nelle immagini, la struttura dei documenti, i contenuti dei field e le etichette circostanti. Richiede un numero elevato di documenti per l’addestramento, ma generalizza a nuovi layout di documenti che non ha ancora incontrato, offrendo un vero approccio di estrazione senza template, che è l’unico modo per gestire documenti per i quali non è disponibile un insieme esaustivo di layout nella fase di addestramento.

Requisiti di training

Per ottenere risultati ottimali, è essenziale etichettare correttamente il maggior numero possibile di documenti. Il numero di documenti di esempio utilizzati per il training influisce in modo significativo sulla qualità dell’estrazione dei field. Il numero consigliato di documenti di esempio è il seguente:

Per documenti ad alta variabilità: sono necessari almeno 200-300 documenti di esempio (2-3 documenti di esempio per variante).
Per documenti a bassa variabilità: sono necessari almeno 10 documenti di esempio (2-3 documenti di esempio per variante).

Il requisito minimo è 10, ma si raccomanda di disporre di oltre 500 documenti etichettati, assicurandosi che il set di training contenga un numero approssimativamente uguale di tutte le varianti di documento che si desidera elaborare (idealmente, almeno alcuni esempi per ciascuna variante). Non è necessario fornire tutte le varianti possibili, ma la tecnologia deve vedere un numero sufficiente di documenti diversi per individuare pattern e generalizzare a varianti che non ha ancora incontrato. Ad esempio, nel caso delle fatture, ci si aspetta che la tecnologia generalizzi bene a nuovi fornitori quando il set di training contiene da 500 a 1.000 fornitori diversi, con due o tre documenti di esempio per ciascuno nel set di training. Sebbene il Deep Learning tenda a generalizzare, è utile includere nel set di training le varianti più diffuse del documento, ad esempio i fornitori che emettono il maggior numero di fatture.

Caratteristiche dell’addestramento

A differenza dell’attività Fast Learning, che viene addestrata su un numero inferiore di documenti ed è pensata per insiemi di documenti più lineari, l’addestramento dell’attività Deep Learning richiede molto più tempo e necessita di maggiori risorse di sistema (attualmente 16 core della CPU e 64 GB di RAM). L’addestramento della rete neurale è un processo iterativo. Ogni iterazione è chiamata epoca (epoch). All’inizio di un’epoca, l’insieme di documenti viene suddiviso in un sottoinsieme di addestramento e un sottoinsieme di validazione. Durante un’epoca, tutti i documenti del sottoinsieme di addestramento vengono elaborati da un algoritmo di addestramento. Quindi, le prestazioni della rete neurale vengono valutate utilizzando il sottoinsieme di validazione e le metriche per ogni field e per l’intero insieme di documenti vengono aggiornate. Per ulteriori informazioni, consultare Configurare un’attività Deep Learning.

Advanced Designer

​Casi d’uso

​Come funziona

​Requisiti di training

​Caratteristiche dell’addestramento

Casi d’uso

Come funziona

Requisiti di training

Caratteristiche dell’addestramento