Vai al contenuto principale
È possibile utilizzare un set di documenti separato per addestrare l’attività di Segmentazione. Per farlo, selezionare l’attività di Segmentazione dall’elenco a discesa accanto al nome della Skill. Quindi, nell’elenco a discesa a sinistra del pulsante Upload, selezionare il set di documenti necessario oppure fare clic su Create Set… per crearne uno nuovo. In questa scheda è possibile caricare, eliminare e ruotare i documenti come descritto nella sezione Documents. Per configurare un’attività di Segmentazione:
  1. Nella scheda Activities, aggiungere un’attività di Segmentazione al flusso di elaborazione dei documenti. Si noti che l’attività di Segmentazione deve precedere l’attività che estrarrà i field dai segmenti di testo.
  2. Nel riquadro Activity Properties, selezionare tutti i field che corrispondono ai segmenti da estrarre.
Nota: Sono supportati solo i field di tipo Testo che hanno il tipo di dati impostato su Testo.
  1. Fare clic su Activity Editor. Apportare ulteriori modifiche all’etichettatura del documento nella scheda Fields, se necessario.
  2. Fare clic su Train Activity. L’addestramento può essere eseguito in modalità Fast o Thorough.
    • La modalità Fast è selezionata per impostazione predefinita. Funziona anche con set di documenti ridotti e consente un addestramento rapido.
    • Se i risultati ottenuti in modalità Fast non sono soddisfacenti, valutare il passaggio alla modalità Thorough, che addestra un modello di Deep Learning. Questa modalità richiede più documenti nel set di training e tempi di addestramento più lunghi, ma può offrire prestazioni migliori su un’ampia varietà di documenti. Il set di documenti deve contenere almeno 50 documenti etichettati, ma si consiglia di averne almeno 150. Per passare alla modalità Thorough, utilizzare il menu a discesa accanto al pulsante Train Activity.
    • Potrebbe essere utile testare entrambe le modalità e scegliere quella che funziona meglio per i propri documenti.
Nota: La modalità Thorough funziona solo con documenti in lingua inglese.
  1. Una volta completato l’addestramento, il test dell’attività inizierà automaticamente. Al termine del test, passare alla scheda Results e analizzare i risultati dell’estrazione dei field per l’attività. Le statistiche visualizzate nella scheda Results sono identiche alle statistiche generali della Skill visualizzate nella scheda Results. Se necessario, apportare le modifiche necessarie all’etichettatura e addestrare nuovamente l’attività.
Nota: L’attività può essere addestrata e testata solo utilizzando documenti con etichettatura confermata. I documenti hanno etichettatura non confermata se l’etichettatura di riferimento è stata generata automaticamente sulla base dell’etichettatura prevista, a meno che non si copi l’etichettatura prevista in quella di riferimento utilizzando l’opzione corrispondente nel menu contestuale del documento. È possibile verificare lo stato di etichettatura di ciascun documento nella scheda Documents. Per confermare l’etichettatura di un documento, è necessario rivederlo nella scheda Fields.
Lingue supportate: inglese, russo, tedesco, francese, spagnolo, italiano, portoghese (standard), giapponese e olandese.