Vai al contenuto principale
Dopo aver creato una Document skill, seguire questi passaggi per configurare la skill:
  1. Caricare i documenti che si intende utilizzare per addestrare e testare il classificatore (ogni file deve contenere un’unica immagine di documento). Per caricare i documenti, andare alla scheda Documents nello Skill Designer e fare clic sul pulsante Upload documents situato al centro del designer, sulla barra degli strumenti o nel riquadro Actions. Durante il caricamento dei documenti, nella parte superiore dello Skill Designer, a destra dei segnalibri, viene visualizzato un indicatore di avanzamento. Il tooltip dell’indicatore contiene informazioni sul numero di documenti che devono ancora essere caricati ed elaborati. È possibile aprire una finestra di anteprima del documento facendo clic sull’icona situata a sinistra del nome del documento. La larghezza predefinita di questa finestra è pari al 35% della larghezza della finestra del browser. Se necessario, è possibile aumentare la larghezza della finestra di anteprima fino all’80% della larghezza della finestra del browser trascinando il bordo sinistro della finestra di anteprima. Le larghezze specificate dall’utente vengono mantenute fino all’eliminazione della cache del browser.
  2. Nei documenti di addestramento, etichettare tutti i field da cui devono essere estratti i dati, specificandone la posizione sull’immagine. Se necessario, è anche possibile aggiungere Regole di validazione e Parameter della skill. Per etichettare i field nei documenti di addestramento, andare alla scheda Editor dello Skill Designer. È possibile farlo facendo clic sul nome della scheda oppure selezionando uno o più documenti dall’elenco e facendo clic su Label Fields and Create Business Rules nel riquadro Actions.
  3. Addestrare la skill e analizzare l’accuratezza dell’estrazione. Correggere eventuali errori. Per avviare l’addestramento della skill, fare clic sul pulsante Train nel riquadro Actions. Al termine dell’addestramento, accanto al pulsante Train viene visualizzato: Completed. È possibile interrompere l’addestramento della skill facendo clic su Cancel sotto il pulsante Train nel riquadro Actions.
  4. Ripetere i passaggi da 1 a 3 finché non si è soddisfatti dei risultati.
  5. Pubblicare la skill di produzione nello Skill Catalog per renderla disponibile all’uso.
  6. Se necessario, è possibile creare skill derivate a partire dalla propria skill. Tali skill ereditano tutte le regole e i field dalle rispettive skill di base. Inoltre, le skill derivate possono essere aggiornate in modo trasparente alla versione più recente delle skill di base, preservando tutte le modifiche apportate.

Configurazione di una Document skill per l’elaborazione di documenti strutturati

ABBYY Vantage offre una modalità di machine learning per l’elaborazione di documenti strutturati, cioè documenti in cui la posizione dei field è la stessa in ogni istanza del documento. Esempi di tali documenti includono questionari, moduli di richiesta e moduli per la dichiarazione dei redditi. Questa modalità può gestire anche documenti che hanno più varianti, come l’IRS Form 1040 per anni diversi, in cui l’insieme e la posizione dei field differiscono leggermente di anno in anno. Ciascuna di queste varianti rappresenta un documento strutturato separato e devi caricare un modulo vuoto per ciascuna. Per configurare una skill per l’elaborazione di documenti strutturati, segui questi passaggi:
  1. Crea una nuova Document skill e attiva l’interruttore Fixed-form documents per quella skill. Fixed Forms Toggle
  2. Carica un modulo vuoto di esempio per ciascuna variante del tuo documento. Per farlo, vai alla scheda Blank Form nello Skill Designer e fai clic sul pulsante Upload Blank Form situato al centro del designer, sulla barra degli strumenti o nel riquadro Actions. Se non disponi di un modulo vuoto, puoi caricare un modulo compilato e contrassegnarlo come modulo vuoto.
Nota: Una skill può gestire fino a 10 varianti diverse di un modulo (ad esempio, varianti dell’IRS Form 1040 per anni diversi).
  1. Etichetta i field da cui devono essere estratti i dati.
  2. Nelle impostazioni del field, abilita l’opzione Eliminate field background per i field in cui lo sfondo può influenzare il riconoscimento.
  3. Nel riquadro Actions, fai clic su Train.
  4. Fai clic sulla scheda Test Set e carica documenti di test compilati. Assicurati che tutti i field siano etichettati correttamente su ogni documento. Se la posizione di qualche field non corrisponde a nessuna di quelle presenti nei moduli vuoti di esempio caricati, aggiungi un modulo vuoto di esempio per quella variante di documento.
  5. Nel riquadro Actions, testa la tua skill. Al termine dell’operazione, esamina i risultati. Se non sei soddisfatto dei risultati, modifica l’etichettatura e addestra nuovamente l’attività.
  6. Pubblica la tua skill nello Skill Catalog per renderla disponibile all’uso.
Fixed Form Tabs Schede visualizzate nello Skill Designer per una skill che elabora documenti strutturati Durante l’elaborazione dei tuoi documenti, potresti scoprire che è più appropriato trattarli come semi-strutturati piuttosto che come documenti strutturati. In questo caso:
  1. Fai clic sull’icona a destra del nome della skill nello Skill Designer.
  2. Disattiva l’interruttore Fixed-form documents.
Nota: Tutti i field etichettati vengono mantenuti.
  1. Addestra nuovamente la tua skill.
Se modifichi la tua skill in Advanced Designer e combini l’attività Forms con altre attività, l’interruttore Fixed-form documents è disabilitato in Vantage e non puoi più modificare la skill al di fuori di Advanced Designer.

Lavorare con tabelle e gruppi ripetuti

Quando si elaborano documenti strutturati, Vantage può gestire tabelle e gruppi ripetuti se il numero massimo di righe della tabella o di istanze del gruppo è noto in anticipo e i bordi della tabella o del gruppo sono fissi. È necessario etichettare tutte le righe che potrebbero presentarsi in tutte le varianti del modulo.
Nota: Nei risultati dell’elaborazione vengono visualizzate solo le righe contenenti dati. Le righe vuote vengono ignorate.
Se il numero di righe o di istanze in un gruppo non è noto in anticipo, è necessario utilizzare un’altra tecnologia di Vantage; vedere Elaborazione di documenti strutturati.
Suggerimento: Al momento è possibile gestire solo tabelle con valori di testo. Se la tabella contiene colonne con caselle di spunta o codici a barre, utilizzare invece un gruppo ripetuto.

Configurazione di una lingua di riconoscimento

Durante l’elaborazione di un documento, Vantage seleziona una lingua di elaborazione da un elenco di lingue specificate. Quando si configura una nuova skill, le seguenti quattro lingue sono selezionate per impostazione predefinita: inglese, francese, tedesco e spagnolo. L’elenco delle lingue di riconoscimento può essere modificato facendo clic sull’icon a destra del nome della skill nello Skill Designer. Le lingue visualizzate nella finestra di dialogo delle impostazioni sono ordinate in ordine alfabetico. Le lingue selezionate sono mostrate nella parte superiore dell’elenco. È necessario selezionare almeno una lingua. Per chiudere la finestra di dialogo delle impostazioni, fare clic su Save per mantenere le modifiche oppure su Cancel per scartarle.
Nota: Il numero di lingue selezionate può influire sulla velocità di elaborazione dei documenti. Se si è certi delle lingue che Vantage incontrerà nei documenti, si consiglia di limitare le lingue selezionate a quelle specifiche.
È possibile modificare l’elenco delle lingue di riconoscimento di una skill anche se la skill è già stata addestrata. Per applicare le modifiche, caricare nuovamente i documents e riaddestrare la skill.

Configurare la modalità Apprendimento online

L’Apprendimento online è disponibile per le Document skill e per le Skill di classificazione. Il servizio di Apprendimento online raccoglie i documenti in un set di training e poi addestra ulteriormente la skill utilizzando i documenti raccolti. Nelle Impostazioni della Document Skill sono disponibili le seguenti modalità di Apprendimento online:
  • Raccogli e apprendi. Opzione predefinita.
  • Solo raccolta. Se Skill Designer deve raccogliere documenti senza eseguire l’addestramento.
Per abilitare la raccolta dei documenti senza addestramento, fare clic sull’icona a destra del nome della skill in Skill Designer e selezionare la modalità Solo raccolta nella finestra di dialogo delle impostazioni. Questa modalità consente di rivedere i documenti aggiunti al set di training prima di riaddestrare la skill. Modalità Solo raccolta

Vedi anche