Vai al contenuto principale
Per addestrare e testare una skill, è necessario un set di documenti etichettati, ovvero documenti in cui sono indicati esplicitamente le posizioni dei field e i relativi tipi di dati. Il modo più semplice per ottenere un set di questo tipo è etichettare manualmente alcuni documenti, ma ciò può richiedere molto tempo — soprattutto se si intende utilizzare il Deep Learning, che richiede set di documenti etichettati di grandi dimensioni. Per risparmiare tempo ed effort, ABBYY offre diversi modi per riutilizzare documenti etichettati da altre skill o da risultati di elaborazione revisionati manualmente.

Etichettatura manuale dei documenti

Etichetta ogni documento caricato contrassegnando le posizioni di tutti i field e specificando i tipi di dati previsti. Per garantire risultati di training affidabili, segui queste linee guida.

Importazione di documenti etichettati da una cartella

I documenti etichettati possono anche essere ottenuti dalle seguenti fonti: In ogni caso, è necessario esportare i documenti etichettati in una cartella. Quindi sarà possibile importare i documenti etichettati da quella cartella e usarli per addestrare la Skill.

Set di training della Skill

Quando si pubblica una Skill per l’uso in produzione, di solito si rimuove il set di training, lasciando solo alcuni documenti di esempio nella versione pubblicata. È inoltre possibile esportare il set di training in una cartella se si intende utilizzare lo stesso set di training per addestrare una nuova versione della Skill. Per esportare i documenti e le relative etichette in una cartella, fare clic sull’icon accanto al nome del set di documenti e selezionare Esporta set con etichettatura. La cartella di destinazione conterrà i seguenti file e sottocartelle:
  • documentdefinition.json.
  • skillsettings.json.
  • Una sottocartella <Document name> contenente le immagini dei documenti e, per ciascun documento, i file documentinfo.json e labeling.json.

Risultati di elaborazione sottoposti a revisione manuale

Quando i risultati dell’elaborazione vengono corretti durante la revisione manuale, viene creato un set di documenti etichettati. Per riutilizzare tali documenti etichettati, configura l’esportazione dei dati dei field in JSON con l’opzione Valori, metadati e struttura dei field per ogni documento abilitata e l’esportazione delle immagini del documento in qualsiasi formato immagine. La cartella di destinazione conterrà una sottocartella separata per ogni transaction. Ogni sottocartella <Transaction ID> conterrà quanto segue:
  • Il file <Applied skill name>.json con i dati dei field.
  • Immagini esportate, a seconda del formato scelto: <Applied skill name>.pdf, <Applied skill name>.tiff oppure la sottocartella <Applied skill name>/Pages con file page_*.jpg per ogni pagina.

FlexiCapture

Puoi riutilizzare i documenti precedentemente etichettati in FlexiCapture. Per ulteriori dettagli, vedi Importazione di documenti etichettati da FlexiCapture.

Come importare

Per importare i documenti etichettati dalla cartella creata durante l’esportazione, seleziona il set Tutti i documenti, fai clic sul menu a discesa accanto al pulsante Carica e quindi seleziona l’opzione Importa documenti etichettati da cartella… nell’elenco a discesa. Quindi seleziona la cartella creata in precedenza. Nota: Non apportare modifiche alla cartella creata durante l’esportazione. Se modifichi la struttura delle sottocartelle o rinomini alcuni file, la procedura di importazione potrebbe generare un errore.

Come vengono gestiti i duplicati

Se uno dei documenti importati ha lo stesso nome di un documento esistente, Advanced Designer ti chiederà se desideri aggiornare l’etichettatura del documento esistente o importare il duplicato come nuovo documento. Se selezioni Aggiorna etichettatura:
  • In caso di field con lo stesso nome, la loro posizione e le impostazioni nel documento esistente verranno sovrascritte con quelle del documento importato.
  • Qualsiasi field presente nel documento importato ma assente nel documento esistente verrà aggiunto al documento esistente.
Se selezioni Importa come nuovi documenti, i duplicati verranno rinominati e importati mantenendo intatta la loro etichettatura.