Vai al contenuto principale
L’attività di Deep Learning per NLP è progettata per addestrare la Skill a estrarre field da documenti non strutturati utilizzando la tecnologia di elaborazione del linguaggio naturale (NLP). L’attività di Deep Learning può essere configurata solo per un field che è già stato estratto in precedenza da un’altra attività. Ad esempio, puoi estrarre un paragrafo di testo utilizzando un’attività di Segmentation e quindi configurare un’attività di Deep Learning per estrarre field da quel paragrafo.
Nota: Questa attività supporta solo field di tipo Text.

Requisiti di training

Poiché le attività di Deep Learning vengono addestrate utilizzando l’etichettatura di riferimento, è importante che la posizione dei field sia specificata correttamente su tutte le immagini dei documenti. Maggiore è il numero di documenti etichettati nel set di training, maggiore sarà la qualità dell’estrazione dei field. Il numero consigliato di documenti di esempio è il seguente:
  • Per documenti ad alta variabilità è necessario disporre di almeno 150 documenti di esempio (2-3 documenti di esempio per variante).
  • Per documenti a bassa variabilità possiamo iniziare il training con 1 documento di esempio, ma sono necessari almeno 2-3 documenti di esempio per variante.

Utilizzo di set di documenti separati

È possibile utilizzare un set di documenti separato per addestrare la propria attività di Deep Learning. A tale scopo, selezionare l’attività di Deep Learning dall’elenco a discesa accanto al nome dello skill. Quindi, nell’elenco a discesa a sinistra del pulsante Upload, selezionare il set di documenti desiderato oppure fare clic su Create Set… per crearne uno nuovo. In questa scheda è possibile caricare, eliminare e ruotare i documenti come descritto nella sezione Documenti.

Lingue supportate

Lingue supportate: inglese, francese, tedesco, giapponese, russo, spagnolo, italiano, portoghese (standard) e olandese.

Configurare un’attività Deep Learning

Per configurare un’attività Deep Learning, procedi come segue:
  1. Nella scheda Activities, aggiungi un’attività Deep Learning al flusso di elaborazione dei documenti. Tieni presente che l’attività Deep Learning deve essere posizionata dopo l’attività che estrarrà il field che verrà utilizzato come origine per l’attività Deep Learning.
  2. Usa l’elenco a discesa Field nel riquadro Activity Properties per selezionare il field di origine corrispondente al frammento di testo non strutturato da cui devono essere estratti i field.
  3. Seleziona i field che devono essere estratti dal field di origine. Puoi selezionare field che si trovano allo stesso livello di annidamento del field di origine o a un livello immediatamente inferiore.
  4. Fai clic su Activity Editor e vai alla scheda Fields per etichettare i documenti specificando le regioni per i field che devono essere estratti dal field di origine. Il processo di etichettatura in Activity Editor è identico al normale processo di etichettatura dei documenti con un’eccezione: i field da estrarre tramite l’attività Deep Learning devono trovarsi all’interno della regione del field di origine.
Utilizza le seguenti linee guida per determinare la dimensione del set di documenti:
  • L’attività Deep Learning per NLP può essere avviata con 1 documento di esempio, ma sono necessari almeno 2–3 documenti di esempio per variante.
  • Se il set di training contiene tra 1 e 150 documenti, puoi iniziare il training dell’attività, ma Advanced Designer visualizzerà un avviso con il messaggio “We recommend adding atleast 150 documents”.
  • Se il set di training contiene tra 150 e 10.000 documenti, puoi iniziare subito il training dell’attività. Questo è il numero consigliato di documenti da avere nel set di training.
  • Se il set di training contiene più di 10.000 documenti, Advanced Designer visualizzerà un avviso indicando che la skill potrebbe diventare instabile.
  1. Fai clic su Train Activity per eseguire il training dell’attività.
  2. Una volta completato il training dell’attività, il test dell’attività si avvierà automaticamente. Al termine del test, vai alla scheda Results e analizza i risultati di estrazione dei field per l’attività. Le statistiche visualizzate nella scheda Results sono identiche alle statistiche generali per la skill visualizzate nella scheda Results. Se necessario, apporta le modifiche richieste alla tua etichettatura ed esegui nuovamente il training dell’attività.
L’attività può essere sottoposta a training e test solo utilizzando documenti con etichettatura confermata. I documenti hanno un’etichettatura non confermata se l’etichettatura di riferimento è stata generata automaticamente sulla base dell’etichettatura predetta, a meno che tu non copi l’etichettatura predetta in quella di riferimento utilizzando l’opzione corrispondente nel menu contestuale del documento. Puoi verificare lo stato dell’etichettatura per ciascun documento nella scheda Documents. Per confermare l’etichettatura di un documento, devi rivederlo nella scheda Fields.