Vai al contenuto principale
Un elemento di ricerca consente di impostare le condizioni relative al tipo e alle proprietà dell’oggetto che desideri estrarre. Poiché le attività di NLP operano su testo non strutturato, le condizioni di ricerca indicano la posizione degli oggetti rispetto ad altro testo, anziché la loro relazione geometrica. È inoltre possibile utilizzare elementi di ricerca ausiliari per restringere il campo, specificando che l’oggetto desiderato può trovarsi all’interno, prima o dopo tali elementi ausiliari.

Creazione di un elemento di ricerca

  • Puoi creare rapidamente un elemento di ricerca facendo clic su uno degli oggetti evidenziati nell’immagine. Il nuovo elemento di ricerca sarà dello stesso tipo dell’oggetto su cui fai clic. Usa il pulsante Mostra oggetti dell’immagine sulla barra degli strumenti per selezionare gli oggetti da evidenziare.

Evidenziazione degli oggetti

È possibile evidenziare i seguenti tipi di oggetti:
  • Persona
  • Organizzazione
  • Indirizzo
  • Località
  • Data
  • Durata
  • Valuta
  • Parole riconosciute
Nota: Tutti questi oggetti vengono evidenziati per impostazione predefinita, ad eccezione delle parole riconosciute.
  • È anche possibile creare un nuovo elemento di ricerca utilizzando il menu:
  1. Vai alla scheda Elementi di ricerca a destra della finestra del documento.
  2. Fai clic su Crea elemento.
  3. Seleziona il tipo di elemento desiderato nell’elenco che si apre.
Una volta creato l’elemento, è necessario configurarene le proprietà nel riquadro Proprietà (vedi Proprietà dell’elemento per ulteriori informazioni).
Nota: Le proprietà specificate possono anche essere visualizzate e modificate in formato codice (vedi Sintassi del codice per l’attività Extraction Rules per NLP per ulteriori informazioni).

Tipi di elementi di ricerca

Quando si crea un elemento di ricerca, è necessario specificarne il tipo, che dipende dall’oggetto che si desidera trovare. I tipi di elementi di ricerca disponibili sono descritti brevemente di seguito.

Persona

Nomi di persone, ad esempio: John Doe, Jane Smith.

Organizzazione

Nomi di organizzazioni, ad esempio ABBYY, Acme Corp.

Indirizzo

Indirizzi, ad esempio: 123 Main Str., Anytown AB 45678.

Località

Nomi di località, ad esempio: Anytown, Corporate Place.

Data

Date in diversi formati, ad esempio: 14 novembre 2009, 11/14/2009.

Durata

Intervalli temporali, ad esempio: dodici (12) mesi, 4 giorni.

Denaro

Importi in denaro, ad esempio: $2670.00, 199 dollari e 99 centesimi. Nota: Gli elementi Person, Organization, Address, Location, Date, Duration e Money corrispondono alle entità denominate che è possibile configurare nell’attività Named Entities (NER) e vengono estratti utilizzando la stessa tecnologia.

Valore da dizionario

Una parola o una frase proveniente da un dizionario. Il dizionario deve essere un file TXT semplice con un elenco di varianti di testo da cercare, una per riga.

Valore da espressione regolare

Un valore che corrisponde a un’espressione regolare da te specificata.

Testo

Una parola chiave o una frase, con l’opzione di cercare tutte le forme delle parole o di consentire alcuni errori di riconoscimento.

Gruppo

Una raccolta di elementi di ricerca annidati. Gli elementi che compongono un gruppo possono essere sia elementi semplici sia elementi di tipo gruppo. Un elemento di tipo gruppo non ha proprietà proprie. I dati verranno estratti in base alle impostazioni dei relativi elementi di ricerca annidati. Gli elementi di tipo gruppo possono essere utilizzati per imporre una gerarchia logica degli elementi, facilitando il debug e la navigazione. Ad esempio, raggruppare il nome, l’indirizzo e la data di nascita di una persona consente di estrarre i dati relativi a ciascuna persona in modo coerente.

Gruppo ripetuto

Questo elemento è progettato per individuare gruppi ripetuti di elementi. I gruppi ripetuti sono pensati per i casi in cui un’entità può avere più istanze, ciascuna con le proprie proprietà, ma non si sa in anticipo quante istanze ci saranno. Le proprietà di ogni istanza sono specificate negli elementi annidati del gruppo ripetuto. Ad esempio, se stai elaborando dei curriculum, potresti creare un gruppo ripetuto “Education” con i seguenti elementi annidati: “School_name”, “Degree”, “Start_date” e “Graduation_date”. D’altra parte, se i dati che cerchi riguardano entità diverse con ruoli differenti, un gruppo ripetuto non è la scelta giusta. Ad esempio, se in un contratto ci sono solo due parti, ad esempio acquirente e venditore, crea un gruppo “Party1_Buyer” e un gruppo “Party2_Seller” invece di un unico gruppo ripetuto “Party”.

Field di input

Questo elemento consente di utilizzare un field estratto da un’altra attività come elemento costitutivo per le regole. Ad esempio, se un’attività di Extraction Rules è preceduta da un’attività di Segmentation, potresti voler utilizzare alcuni segmenti per restringere la ricerca.

Modifica del tipo, del nome e della posizione di un elemento nell’elenco

Per modificare il tipo di un elemento:
  • Fare clic con il pulsante destro del mouse su un elemento e selezionare Converti elemento in nel menu di scelta rapida.
  • Selezionare un elemento nell’elenco e fare clic su un oggetto evidenziato nell’immagine. In questo modo è possibile convertire l’elemento di ricerca selezionato nel tipo dell’oggetto evidenziato. Se si fa clic su una parola riconosciuta evidenziata, è possibile convertire l’elemento di ricerca in Testo e, allo stesso tempo, aggiungere la parola selezionata all’elenco delle parole chiave per questo elemento di ricerca.
  • Per gli elementi di ricerca che corrispondono a entità denominate, utilizzare la proprietà Entità per modificare il tipo dell’entità denominata.
Nota: La modifica del tipo di un elemento non trasforma gli elementi non di gruppo in elementi di gruppo e viceversa.
Per modificare il nome di un elemento:
  • Fare clic con il pulsante destro del mouse su un elemento, selezionare Rinomina nel menu di scelta rapida e immettere un nuovo nome.
  • Selezionare un elemento, fare clic sul suo nome (o premere F2) e immettere un nuovo nome.
Il nome di un elemento può contenere lettere inglesi, numeri e trattini bassi. Tuttavia, non può iniziare con un numero. Spazi, simboli speciali (.,:- \ /) e nomi riservati non sono consentiti. Per spostare gli elementi nell’elenco:
  • Trascinare gli elementi verso l’alto o verso il basso per modificarne la posizione nell’elenco.
  • Trascinare gli elementi su un elemento di gruppo per inserirli all’interno del gruppo.
Nota: Gli elementi vengono cercati dall’alto verso il basso. Ciò significa che gli elementi utilizzati nelle condizioni di ricerca di un altro elemento devono precedere tale elemento nell’elenco degli elementi.