Vai al contenuto principale
Per la maggior parte degli elementi di ricerca dell’attività Extraction Rules, il riquadro Properties presenta due sezioni: Cosa cercare e Dove cercare. Fanno eccezione:
  • Gli elementi Group e Repeating Group, che non hanno proprietà proprie.
  • Gli elementi di input field, che provengono da attività precedenti all’attività Extraction Rules e offrono soltanto l’opzione Get region from per passare da un input field a un altro.

Cosa cercare

La sezione Cosa cercare contiene proprietà specifiche per ogni elemento.

Persona, Organizzazione, Indirizzo, Località, Data, Durata, Denaro

Per tutti gli elementi di ricerca che individuano entità denominate, è possibile specificare le seguenti proprietà:
  • Entities: tipo di entità. Se si modifica il tipo, l’icon accanto all’elemento di ricerca verrà aggiornato automaticamente.
  • Instances: numero di occorrenze. È possibile estrarre solo la prima oppure tutte le occorrenze trovate.

Valore da Dizionario

Per una frase del dizionario, specificare:
  • Origine del testo: un file TXT con un elenco di parole o frasi da cercare, una variante per riga.
  • Usa morfologia: attivare questa opzione per cercare tutte le forme della parola.
  • Occorrenze: il numero di istanze. È possibile estrarre solo la prima oppure tutte le occorrenze rilevate.

Valore da espressione regolare

Per un’espressione regolare, specificare:
  • Espressione regolare: un’espressione regolare che definisce la ricerca. Il programma utilizza la sintassi delle espressioni regolari PCRE2.
  • Ricerca all’interno delle parole: attivare questa opzione per trovare le corrispondenze anche se non sono separate da spazi dal resto del testo.
  • Occorrenze: il numero di occorrenze. È possibile estrarre la prima occorrenza rilevata oppure tutte le occorrenze rilevate.

Testo

Per un elemento di ricerca testo, fai clic sull’icona di modifica e inserisci un elenco di parole o frasi da trovare, oppure fai clic sull’immagine del documento per aggiungere parole riconosciute dal documento. A differenza dell’elemento di ricerca Valore da dizionario, le parole chiave sono elencate direttamente invece che in un file TXT, e hai anche la possibilità di consentire alcuni errori di riconoscimento.
  • Origine del testo: un elenco di parole o frasi da trovare, una variante per riga.
  • Usa morfologia: attiva questa opzione per cercare tutte le forme della parola.
  • Errori consentiti: la percentuale o il numero di caratteri differenti che consentiranno comunque di trovare il testo. Può essere utile in caso di errori di riconoscimento.
Nota: Questa opzione non sarà disponibile se attivi l’opzione Usa morfologia.
  • Occorrenze: il numero di occorrenze. È possibile estrarre solo la prima oppure tutte quelle rilevate.
La sezione Dove cercare è identica per tutti gli elementi. In questa sezione puoi restringere l’area in cui il programma cercherà l’elemento di ricerca. Nelle impostazioni seguenti puoi utilizzare gli elementi di ricerca posizionati sopra l’elemento corrente nell’elenco:
  • Cerca in: l’elemento di ricerca si trova nell’intero documento oppure all’interno di un altro elemento di ricerca.
Esempio: Cerca il nome dell’organizzazione nel preambolo del documento.
  • Dopo: l’elemento di ricerca si trova dopo un altro elemento di ricerca nel testo riconosciuto.
    • Cerca nella stessa frase: attiva questa opzione per trovare l’elemento all’interno della stessa frase.
Esempio: Cerca il ruolo dell’organizzazione dopo il suo nome all’interno della stessa frase.
  • Prima: l’elemento di ricerca si trova prima di un altro elemento di ricerca nel testo riconosciuto.
    • Cerca nella stessa frase: attiva questa opzione per trovare l’elemento all’interno della stessa frase.
Ad esempio, se stai cercando la data di nascita di una persona, puoi prima creare un elemento di ricerca ausiliario con la parola chiave “nato”, quindi specificare che l’entità Date si trova da qualche parte dopo questa parola chiave all’interno della stessa frase. Puoi aggiungere più elementi Dopo e Prima, affinando ulteriormente la ricerca.