Vai al contenuto principale
Per la maggior parte degli elementi di ricerca dell’attività Extraction Rules, il riquadro Properties comprende due sezioni: What to search for e Where to search. Fanno eccezione:
  • Gli elementi Group e Repeating Group, che non hanno proprietà proprie.
  • Gli elementi di input field, che provengono da attività precedenti all’attività Extraction Rules e offrono solo l’opzione Get region from per passare da un input field a un altro.

Cosa cercare

La sezione Cosa cercare contiene proprietà specifiche per ogni elemento.

Persona, Organizzazione, Indirizzo, Località, Data, Durata, Denaro

Per tutti gli elementi di ricerca che individuano entità denominate, è possibile specificare le seguenti proprietà:
  • Entities: tipo di entità. Se si modifica il tipo, l’icon accanto all’elemento di ricerca verrà aggiornato automaticamente.
  • Instances: numero di occorrenze. È possibile estrarre solo la prima oppure tutte le occorrenze trovate.

Valore da Dizionario

Per una frase del dizionario, specificare:
  • Origine del testo: un file TXT con un elenco di parole o frasi da cercare, una variante per riga.
  • Usa morfologia: attivare questa opzione per cercare tutte le forme della parola.
  • Occorrenze: il numero di istanze. È possibile estrarre solo la prima oppure tutte le occorrenze rilevate.

Valore da espressione regolare

Per un’espressione regolare, specificare:
  • Espressione regolare: un’espressione regolare che definisce la ricerca. Il programma utilizza la sintassi delle espressioni regolari PCRE2.
  • Ricerca all’interno delle parole: attivare questa opzione per trovare le corrispondenze anche se non sono separate da spazi dal resto del testo.
  • Occorrenze: il numero di occorrenze. È possibile estrarre la prima occorrenza rilevata oppure tutte le occorrenze rilevate.

Testo

Per un elemento di ricerca testuale, fai clic sull’icona di modifica e inserisci un elenco di parole o frasi da cercare, oppure fai clic sull’immagine del documento per aggiungere parole riconosciute dal documento. A differenza dell’elemento di ricerca Valore da dizionario, le parole chiave sono elencate direttamente invece che in un file TXT e hai anche la possibilità di consentire alcuni errori di riconoscimento.
  • Origine del testo: elenco di parole o frasi da cercare, una variante per riga.
  • Usa morfologia: attiva questa opzione per cercare tutte le forme della parola.
  • Errori consentiti: la percentuale o il numero di caratteri diversi che consentirà comunque di trovare il testo. Utile in caso di errori di riconoscimento.
Nota: Questa opzione non sarà disponibile se attivi l’opzione Usa morfologia.
  • Occorrenze: numero di occorrenze. È possibile estrarre solo la prima o tutte le occorrenze rilevate.
La sezione Dove cercare è identica per tutti gli elementi. In questa sezione puoi restringere l’area in cui il programma cercherà l’elemento. Nelle impostazioni seguenti puoi utilizzare gli elementi di ricerca posizionati sopra l’elemento corrente nell’elenco:
  • Cerca in: l’elemento di ricerca si trova nell’intero documento oppure all’interno di un altro elemento di ricerca.
Esempio: Cerca il nome dell’organizzazione nel preambolo del documento.
  • Dopo: l’elemento di ricerca si trova dopo un altro elemento di ricerca nel testo riconosciuto.
    • Cerca nella stessa frase: attiva questa opzione per trovare l’elemento all’interno della stessa frase.
Esempio: Cerca il ruolo dell’organizzazione dopo il suo nome nella stessa frase.
  • Prima: l’elemento di ricerca si trova prima di un altro elemento di ricerca nel testo riconosciuto.
    • Cerca nella stessa frase: attiva questa opzione per trovare l’elemento all’interno della stessa frase.
Ad esempio, se stai cercando la data di nascita di una persona, puoi prima creare un elemento di ricerca ausiliario con la parola chiave “nato”, quindi specificare che l’entità Date si trova da qualche parte dopo questa parola chiave nella stessa frase. Puoi aggiungere più elementi Dopo e Prima, perfezionando ulteriormente la ricerca.