Vai al contenuto principale
Per addestrare un classificatore, ti servirà un set di training che contenga documenti a cui è già stata assegnata una classe di riferimento.

Creazione di un set di training

  1. Nel Classification Skill Designer, aprire la scheda Documents.
  2. Creare le classi appropriate utilizzando il comando Create Class nel riquadro Actions oppure facendo clic su Create class sopra l’elenco delle classi nella parte sinistra dello schermo.
    Suggerimento: Per rinominare una classe esistente, fare clic sull’icona accanto al nome della classe e selezionare Rename class.
  3. Selezionare una classe dall’elenco delle classi nella parte sinistra dello schermo e caricare i documenti facendo clic su Upload documents al centro della schermata Classification Skill, sul pulsante Upload nella barra degli strumenti o su Upload Documents nel riquadro Actions. Durante il caricamento dei documenti, un indicatore di avanzamento viene visualizzato nella parte superiore dello Skill Designer, a destra dei segnalibri. Il tooltip dell’indicatore contiene informazioni sul numero di documenti che devono ancora essere caricati ed elaborati.
    Nota: I documenti caricati nel gruppo No class non vengono utilizzati per l’addestramento e il test del classificatore.
Per ciascuna classe viene visualizzato il numero di documenti appartenenti a tale classe. Se il tuo set di documenti contiene pochissime classi o se le classi differiscono significativamente tra loro, puoi avere un numero ridotto di documenti per classe. Al contrario, se le classi sono molto numerose o se le differenze tra le classi non sono abbastanza marcate, si consiglia di caricare tra 10 e 100 documenti per ciascuna classe, poiché utilizzare un numero inferiore di documenti può comportare errori di classificazione in questo caso. In ogni caso, non si consiglia di caricare più di 1.000 documenti per una classe. Per massimizzare l’accuratezza della classificazione, includere documenti di esempio per le varianti di documento più comuni di ciascuna classe (circa un documento per variante). Per impostazione predefinita, tutti i documenti caricati sono visualizzati come elenco. Ciò rende i file facili da consultare se hanno nomi informativi. È anche possibile passare alla visualizzazione a miniature, che può essere preferibile se si dispone di documenti visivamente differenti. Per passare tra queste due modalità di visualizzazione, utilizzare i seguenti pulsanti della barra degli strumenti:
  • Visualizzazione elenco
  • Visualizzazione miniature
Se vengono caricati più di 50 documenti, verranno visualizzati su più pagine. In entrambe le visualizzazioni, è possibile aprire una finestra di anteprima del documento facendo clic sul pulsante situato a sinistra del nome del documento. La larghezza predefinita di questa finestra è pari al 35% della larghezza della finestra del browser. Se necessario, è possibile aumentare la larghezza della finestra di anteprima fino all’80% della larghezza della finestra del browser trascinando il bordo sinistro della finestra di anteprima. Le larghezze specificate dall’utente verranno mantenute fino a quando la cache del browser non verrà svuotata. Se necessario, è possibile modificare manualmente l’orientamento delle pagine dei documenti in ciascuna classe facendo clic su Rotate nella barra degli strumenti, che ruota le pagine di 90° in senso antiorario. In alternativa, è possibile selezionare una delle seguenti opzioni dall’elenco a discesa: Rotate Left, Rotate Right o Rotate 180°. È inoltre possibile utilizzare la finestra di anteprima del documento per modificare l’orientamento della pagina di un documento specifico facendo clic sul pulsante e scegliendo un’opzione di rotazione appropriata. Se un file non è stato caricato per qualche motivo (ad esempio perché in un formato non supportato), il suo nome verrà visualizzato in rosso.

Modifica della classe assegnata a un documento

Puoi modificare la classe di riferimento assegnata a un documento caricato procedendo come segue:
  1. Seleziona uno o più documenti a cui assegnare una nuova classe, spuntando la casella di controllo a sinistra dei rispettivi nomi.
  2. Dall’elenco che verrà visualizzato nel riquadro Actions, seleziona la classe appropriata per il documento o i documenti e fai clic sul pulsante Assign. Se la classe corretta non compare nell’elenco, inserisci un nuovo nome nel field Search for class nel riquadro Actions e fai clic su Create.

Rimozione di documenti da un set

È possibile rimuovere documenti da un set in uno dei seguenti modi:
  • Contrassegna uno o più documenti da rimuovere selezionando la casella di controllo a sinistra dei rispettivi nomi. Puoi contrassegnare tutti i documenti di una classe specifica selezionando la casella di controllo a sinistra del nome di quella classe sopra l’elenco dei documenti (se i documenti della classe sono distribuiti su più pagine, verranno contrassegnati solo quelli visualizzati nella pagina corrente). Fai clic sull’icona accanto a uno dei documenti contrassegnati e poi su Delete. Conferma la scelta nella finestra di dialogo che verrà visualizzata. In questo modo verranno eliminati i documenti contrassegnati.
    Suggerimento: Anche se un documento non è contrassegnato per l’eliminazione, puoi comunque eliminarlo facendo clic sull’icona accanto al suo nome.
  • Fai clic sull’icona accanto al nome di una classe nell’elenco delle classi e poi su Delete All Documents. Conferma la scelta nella finestra di dialogo che verrà visualizzata. In questo modo verranno eliminati tutti i documenti della classe selezionata. In alternativa, puoi fare clic su Delete Class with All Documents, che eliminerà sia la classe sia tutti i documenti in essa contenuti.

Addestrare un classificatore

Per addestrare un classificatore utilizzando un set di training appositamente preparato, fare clic sul pulsante Train nel riquadro Actions. Il pulsante Train sarà attivo solo se nel set di training sono presenti almeno due classi diverse e non vuote. Una volta completato l’addestramento, l’icona Completed verrà visualizzata accanto al pulsante Train. Inoltre, cambierà anche la visualizzazione dell’elenco delle classi nella scheda Documents. Oltre al numero di documenti caricati per ciascuna classe, verrà mostrato anche il numero di documenti con una classe prevista diversa dalla classe di riferimento. Classification Skill Training Documents Amount È possibile interrompere l’addestramento del classificatore facendo clic su Cancel sotto il pulsante Train nel riquadro Actions.

Vedi anche

Analizzare i risultati della classificazione