Vai al contenuto principale
L’attività Regole di Estrazione opera sul testo riconosciuto dei documenti non strutturati. Le regole utilizzano entità denominate, parole chiave ed espressioni regolari per definire le condizioni dei field da estrarre.

Casi d’uso

Aggiungi questa attività al tuo flusso di elaborazione dei documenti nei seguenti casi:
  • Se hai estratto più oggetti dello stesso tipo tramite un’attività Named Entities (NER) e ora devi individuarne un’istanza specifica. Ad esempio, da un contratto di locazione possono essere estratte più entità Organization. Puoi utilizzare un’attività Extraction Rules per determinare il locatore e il conduttore.
  • Se non disponi di un numero sufficiente di documenti per utilizzare un’attività Deep Learning. In questo caso, puoi creare un’attività Extraction Rules ed estrarre gli oggetti necessari utilizzando parole chiave, espressioni regolari o altra logica aziendale.
  • Se devi estrarre un oggetto di tipo non standard. Ad esempio, potresti voler estrarre una combinazione di data e ora anziché solo la data.
  • Se devi raggruppare diversi field relativi allo stesso oggetto. Ad esempio, puoi usare un’attività Extraction Rules per raggruppare il nome, la data di nascita e l’indirizzo di ciascuna persona. Un’attività Named Entities (NER) può anche estrarre nomi e indirizzi, ma non consente di associare gli indirizzi ai rispettivi nomi.

Come funziona

Questa attività utilizza l’elaborazione del linguaggio naturale (NLP) per trovare elementi di ricerca nel testo. Gli elementi di ricerca sono entità denominate e parole o frasi che corrispondono a parole chiave o espressioni regolari. Insieme ai field estratti da altre attività, gli elementi di ricerca possono essere utilizzati come elementi costitutivi per regole di estrazione che specificano la posizione dei field rispetto ad altro testo. Le regole di estrazione possono essere create facilmente tramite l’interfaccia utente e ulteriormente personalizzate utilizzando un linguaggio dedicato. Gli elementi di ricerca possono essere associati ai field, in modo che il testo riconosciuto nell’area di un elemento di ricerca venga utilizzato per compilare il field associato. Per ulteriori informazioni, vedere Configurazione di un’attività Extraction Rules.