- Nella scheda Activities, aggiungere un’attività di Segmentazione al flusso di elaborazione dei documenti. Si noti che l’attività di Segmentazione deve precedere l’attività che estrarrà i field dai segmenti di testo.
- Nel riquadro Activity Properties, selezionare tutti i field che corrispondono ai segmenti da estrarre.
Nota: Sono supportati solo i field di tipo Text che hanno il tipo di dati impostato su Text.
- Fare clic su Activity Editor. Apportare ulteriori modifiche all’etichettatura del documento nella scheda Fields se necessario.
- Fare clic su Train Activity. L’addestramento può essere eseguito in modalità Fast o Thorough.
- La modalità Fast è selezionata per impostazione predefinita. Questa modalità funziona anche con set di documenti ridotti e consente di addestrare rapidamente l’attività.
- Se i risultati ottenuti in modalità Fast non sono soddisfacenti, valutare il passaggio alla modalità Thorough, che addestra un modello di Deep Learning. Questa modalità richiede un numero maggiore di documenti nel set di addestramento e tempi di training più lunghi, ma può offrire prestazioni migliori su un’ampia varietà di documenti. Il set di documenti deve contenere almeno 50 documenti etichettati, ma si consiglia di averne almeno 150. Per passare alla modalità Thorough, utilizzare il menu a discesa accanto al pulsante Train Activity.
- Potrebbe essere utile testare entrambe le modalità e scegliere quella che funziona meglio per i propri documenti.
Nota: La modalità Thorough funziona solo con documenti in lingua inglese.
- Una volta addestrata l’attività, il test avvierà automaticamente. Al termine del test, passare alla scheda Results e analizzare i risultati di estrazione dei field per l’attività. Le statistiche mostrate nella scheda Results sono identiche alle statistiche generali della skill visualizzate nella scheda Results. Se necessario, apportare le modifiche opportune all’etichettatura e addestrare nuovamente l’attività.
Nota: L’attività può essere addestrata e testata solo utilizzando documenti con etichettatura confermata. I documenti hanno etichettatura non confermata se l’etichettatura di riferimento è stata generata automaticamente sulla base dell’etichettatura prevista, a meno che non si copi l’etichettatura prevista in quella di riferimento utilizzando l’opzione corrispondente nel menu contestuale del documento. È possibile verificare lo stato dell’etichettatura per ciascun documento nella scheda Documents. Per confermare l’etichettatura di un documento, è necessario rivederlo nella scheda Fields.Lingue supportate: inglese, russo, tedesco, francese, spagnolo, italiano, portoghese (standard), giapponese e olandese.
