Vai al contenuto principale
Un contenitore di filtro delle ipotesi combina diverse attività di Deep Learning e un’attività di regole di estrazione. Gli output delle attività di Deep Learning vengono inviati all’attività di regole di estrazione, che definisce condizioni per selezionare i valori desiderati. Anche se un’attività di Deep Learning può raggiungere una qualità di estrazione dei field molto elevata, in alcuni casi potresti voler controllare l’output dell’attività di Deep Learning. Per farlo, puoi combinare una o più attività di Deep Learning con un’attività di regole di estrazione, che applicherà condizioni ai valori ottenuti dalla o dalle attività di Deep Learning. Il controllo dell’output è essenziale quando la rete neurale individua parole intere ma servono solo parti specifiche, o quando è necessario filtrare rumori acquisiti accidentalmente. Può anche essere utile per identificare parti di field più ampi, come gli indirizzi, che potrebbero essere trascurate dalla rete neurale. Inoltre, consente di scegliere l’ipotesi migliore per più occorrenze dello stesso valore. Ad esempio, quando il nome del Fornitore è stampato più volte su un documento, puoi selezionare il risultato di estrazione più accurato tra le diverse occorrenze.
Nota: Questa tecnologia è fornita in anteprima e verrà migliorata nelle versioni future.

Configurazione di un contenitore per il filtraggio delle ipotesi

  1. Fare clic sul blocco con l’attività Deep Learning e selezionare Filter Hypotheses. Verrà creato un nuovo contenitore per il filtraggio delle ipotesi e l’attività Deep Learning selezionata verrà inserita al suo interno.
  2. (Facoltativo) Trascinare altre attività Deep Learning nel contenitore per il filtraggio delle ipotesi. Questo consente di combinare e confrontare l’output di due o più attività Deep Learning. Due attività possono essere necessarie, ad esempio, quando si lavora contemporaneamente con campi di testo e tabelle.
  3. Aggiungere un’attività Extraction Rules al contenitore. È possibile creare una nuova attività facendo clic sul segnaposto oppure trascinare un’attività esistente nel contenitore.
  4. Configurare l’attività Extraction Rules. Per ciascuno dei valori trovati dalle attività Deep Learning, aggiungere un elemento di ricerca Deep Learning e configurarne le proprietà. È possibile aggiungere tutti gli output field di un’attività Deep Learning contemporaneamente. Un elemento di ricerca Deep Learning supporta tutte le proprietà che limitano l’area di ricerca e le condizioni per trovare l’elemento.
  5. Collegare l’input e l’output del contenitore per il filtraggio delle ipotesi ad altri blocchi nel workflow di elaborazione dei documenti. Gli output field del contenitore per il filtraggio delle ipotesi saranno gli stessi degli output field dell’attività Extraction Rules.
Nota: Se si decide di smettere di controllare l’output dell’attività Deep Learning, fare clic in un punto qualsiasi del contenitore e selezionare Don’t Filter Hypotheses. Il contenitore verrà rimosso, ma le attività non verranno eliminate e sarà comunque possibile utilizzarle nel workflow di elaborazione dei documenti modificato.

Esempi

Nota: Questi sono solo alcuni esempi che illustrano come utilizzare un container Hypothesis Filtering. Tuttavia, esistono molte altre situazioni in cui è possibile usare questa funzionalità per controllare l’output delle reti neurali e ottimizzare l’estrazione dei field. Solo tu puoi stabilire quali regolazioni siano necessarie per i documenti su cui stai lavorando, e ti invitiamo a provare questa tecnologia ogni volta che i risultati dell’attività di Deep Learning possono beneficiare di un’ulteriore messa a punto. Gli esempi seguenti utilizzano lo stesso skill di esempio, in cui gli output di due attività di Deep Learning vengono passati a un’attività di Extraction Rules.

Workflow della Skill

AD_HypothesisFiltering_Container
  • L’attività Deep Learning estrae field di testo.
  • L’attività Deep Learning 2 estrae una tabella.
  • Il contenitore Hypothesis Filtering seleziona e combina i relativi risultati.

Struttura degli elementi di ricerca nell’attività Extraction Rules

AD_HypothesisFiltering_SearchElementTree Ogni elemento di ricerca è associato al relativo field.

Esempio 1: Correggere un valore trovato da un’attività di Deep Learning

In questo esempio, un’attività di Deep Learning trova un valore per il numero del documento troppo lungo e viene creato un nuovo elemento di ricerca per correggerlo. Il valore per il numero del documento trovato dall’attività di Deep Learning include la parte dopo il trattino: AD_HypothesisFiltering_ValueTooLong
  1. Per correggere il valore Document_Number, viene creato un nuovo elemento di ricerca. Questo elemento di ricerca, denominato DocNumber_Corrected, deve trovarsi all’interno della regione dell’elemento di ricerca Document_Number e contenere un numero limitato di caratteri.
AD_HypothesisFiltering_CorrectedProperties
  1. L’area di ricerca del nuovo elemento viene limitata per corrispondere alla regione di Document_Number aggiungendo la seguente riga al codice dell’elemento:
RestrictSearchArea: 95.Region;
  1. L’elemento di ricerca corretto è associato al field che estrae il numero del documento:
AD_HypothesisFiltering_CorrectedMapping Di conseguenza, il numero del documento estratto non includerà la parte dopo il trattino: AD_HypothesisFiltering_ValueCorrected

Esempio 2: selezionare uno tra più valori ripetuti

In questo esempio, un’attività di Deep Learning viene addestrata a trovare tutte le occorrenze del numero documento, ma il risultato finale della Skill richiede un solo field del numero documento. Per ottenere questo risultato, l’impostazione Allow Multiple Items viene disabilitata per il field Document Number e vengono specificate condizioni per selezionare l’occorrenza corretta del numero documento.
Nota: Si consiglia di salvare il set di documenti etichettati in una cartella prima di procedere. Quando si disabilita l’impostazione Allow Multiple Items per un field, tutte le occorrenze aggiuntive di quel field verranno eliminate dall’etichettatura. Il modello addestrato nell’attività di Deep Learning continuerà a funzionare, ma se si desidera modificarlo e riaddestrarlo, sarà necessario caricare il set di documenti originale.
  1. L’impostazione Allow Multiple Items è disabilitata per il field Document Number (l’impostazione è accessibile facendo clic su Manage Fields).
AD_HypothesisFiltering_NoMultiples
  1. L’elemento di ricerca Document_Number con più occorrenze non può essere mappato al field Document Number. Pertanto, viene creato un nuovo elemento di ricerca Deep Learning dall’output del numero documento dell’attività di Deep Learning e mappato al field Document Number.
AD_HypothesisFiltering_MapNoMultiples
  1. Le molteplici occorrenze del numero documento trovate dall’attività di Deep Learning vengono utilizzate per costruire un albero di ipotesi, dal quale solo una verrà selezionata come valore dell’elemento di ricerca Document_Number.
AD_HypothesisFiltering_HypTree
  1. Per trovare una specifica occorrenza, vengono aggiunte determinate condizioni per l’elemento di ricerca Document_Number (in questo caso si desidera trovare l’occorrenza più in alto del numero documento).
AD_HypothesisFiltering_TopmostInstance

Esempio 3: Combinare l’output di due attività di Deep Learning

Un contenitore Hypothesis Filtering consente di combinare i risultati di due o più attività di Deep Learning per confrontarli tra loro o semplicemente per perfezionare tali risultati all’interno della stessa attività. In questo esempio, sono state necessarie due attività di Deep Learning perché un’unica attività di Deep Learning non può essere addestrata a estrarre sia field di testo sia tabelle. Viene aggiunta una condizione che specifica che l’elemento di ricerca Company_Address deve sempre trovarsi sopra l’elemento di ricerca Goods_Table. Di conseguenza, l’indirizzo corretto verrà trovato anche se altri indirizzi sono stampati in fondo alla Pagina. AD_HypothesisFiltering_AboveTable