Vai al contenuto principale
Definisci le aree di ricerca degli elementi specificando le regioni sulle immagini del documento in cui il programma deve cercare gli oggetti, utilizzando coordinate assolute o relazioni rispetto a elementi di ancoraggio. Un’area di ricerca è una regione dell’immagine in cui il programma deve cercare oggetti corrispondenti a un elemento specifico. Viene determinata in base alle condizioni specificate nella sezione Dove cercare del riquadro Proprietà. Nei documenti semistrutturati, alcuni oggetti possono trovarsi in posizioni diverse su documenti differenti e, di conseguenza, il programma non sempre riuscirà a trovarli utilizzando aree di ricerca assolute. In questo caso, le aree di ricerca possono essere definite rispetto a elementi con posizioni permanenti o rispetto ai field già individuati. Esistono anche casi in cui un elemento può essere rilevato senza definire un’area di ricerca (ad es. un elemento Static Text che contiene sempre una parola univoca per il documento può essere rilevato basandosi solo su quella parola) oppure limitando l’area di ricerca alla prima o all’ultima Pagina di un documento.

Specificare un’area di ricerca

Per specificare un’area di ricerca per un elemento:
  1. Crea e configura i cosiddetti elementi di ancoraggio. Qualsiasi elemento già rilevato può essere utilizzato come elemento di ancoraggio, a condizione che tu possa definire delle relazioni tra esso e l’elemento che desideri che il programma rilevi. Confronta gli elementi con l’immagine usando il comando Match e assicurati che vengano rilevati correttamente.
  2. Crea un elemento corrispondente all’oggetto immagine che desideri rilevare e specificane le proprietà nella sezione What to search for.
  3. Specifica l’area di ricerca nella sezione Where to search. a. Nell’elenco a discesa Search on, seleziona Whole Document se devi cercare in tutto il documento, oppure First Page o Last Page se devi limitare la ricerca alla prima o all’ultima pagina. Specificando l’area di ricerca in questo modo, non sono necessari elementi di ancoraggio. b. Se necessario, specifica le relazioni esistenti tra l’elemento da rilevare e altri elementi oppure disegna direttamente sull’immagine un’area di ricerca. Puoi definire i confini dell’area di ricerca in relazione ad altri elementi, escludere determinati elementi dall’area di ricerca o specificare quale elemento o bordo della pagina è più vicino all’elemento da rilevare.
  4. Fai clic su Match per assicurarti che l’elemento venga rilevato correttamente in tutti i documenti.

Specificare un’area di ricerca sull’immagine del documento

Nella maggior parte dei casi specificherai un’area di ricerca in relazione alla posizione di altri elementi di ricerca usati come ancore. Puoi usare un elemento come ancora solo se è stato effettivamente trovato nell’immagine, quindi per prima cosa configura e individua gli elementi che verranno usati come ancore. Fai clic sul pulsante Disegna sull’immagine e disegna un’area di ricerca sull’immagine. L’area di ricerca dovrebbe essere vicina alle regioni delle ancore o intersecarle. Nella sezione Dove cercare, per l’area di ricerca che hai disegnato verranno visualizzate le proprietà A destra di, Sotto, A sinistra di e Sopra, oltre alle coordinate per specificare le distanze di queste proprietà in relazione all’area di ricerca e agli elementi ancora. Queste proprietà sono sincronizzate con l’area di ricerca sull’immagine. Puoi modificare l’area di ricerca in qualsiasi momento, sia intervenendo direttamente sull’immagine sia cambiando le proprietà di relazione nel riquadro Proprietà. Quando selezioni una relazione nel riquadro Proprietà, il semipiano definito da quella relazione viene evidenziato sull’immagine del documento. Quindi, regola le relazioni per le ancore e per l’area di ricerca utilizzando la barra degli strumenti dell’ancora, accessibile facendo clic sulla regione di un elemento: AD_ExtractionRules_SearchArea_Tools
  • Le frecce direzionali consentono di abilitare o disabilitare le relazioni di ricerca dell’oggetto rispetto all’elemento nella direzione corrispondente.
  • Lo strumento di eliminazione delle relazioni rimuove tutte le relazioni impostate per l’elemento selezionato.
  • Lo strumento di prossimità specifica che, tra tutte le ipotesi dell’elemento, va considerata quella più vicina all’elemento selezionato se tutte le altre condizioni sono soddisfatte allo stesso modo. Quando vengono formulate le ipotesi, verrà scelto l’oggetto più vicino all’elemento selezionato. Se si utilizza questo strumento, la proprietà Più vicino a appare nel riquadro Proprietà. Questa proprietà può essere impostata per una sola ancora.
  • Lo strumento di esclusione esclude l’elemento selezionato dall’area di ricerca. Si usa quando un elemento all’interno dell’area di ricerca potrebbe essere scambiato per l’oggetto ricercato. Ad esempio, se stai cercando un elemento Character String con un determinato set di caratteri, un altro elemento Character String con lo stesso o un set di caratteri simile potrebbe essere selezionato per errore. Per evitarlo, escludi il secondo elemento dall’area di ricerca usando lo strumento di esclusione. Quando utilizzi questo strumento, la proprietà Escludi appare nel riquadro Proprietà.
Quando hai terminato di configurare l’area di ricerca, fai clic sul pulsante Disegna sull’immagine per uscire dalla modalità Disegna area di ricerca.

Specificare un’area di ricerca nel riquadro Proprietà

Queste relazioni sono equivalenti a quelle configurate mediante la barra degli strumenti dell’elemento di ancoraggio descritta sopra. È possibile modificare ciascuna relazione separatamente. Se si attiva la modalità Disegna area di ricerca, l’area di ricerca e il semipiano definito dalla relazione selezionata verranno visualizzati sull’immagine del documento. L’area di ricerca sarà sincronizzata con le proprietà della relazione.

A destra di, Sotto, A sinistra di, Sopra, Escludi

Nella sezione Dove cercare, fai clic su Aggiungi e seleziona il tipo di relazione che desideri configurare. Nella finestra di dialogo che si apre, seleziona un elemento di ancoraggio. Puoi selezionare qualsiasi elemento attivo sopra l’elemento corrente. Puoi aggiungere più relazioni per ciascuno di questi tipi. Puoi modificare l’area di ricerca cambiando l’offset per le relazioni A destra di, Sotto, A sinistra di e Sopra. Un valore di offset positivo significa che il limite verrà spostato nella stessa direzione indicata dalla relazione. Un valore di offset negativo sposta il limite nella direzione opposta a quella indicata dalla relazione. Ad esempio, un offset negativo per la relazione A destra di sposterà il limite a sinistra. Puoi anche selezionare il bordo dell’elemento da cui calcolare l’area di ricerca. Per impostazione predefinita, il bordo è selezionato in modo da non includere l’elemento di ancoraggio nell’area di ricerca (sopra il bordo superiore, sotto il bordo inferiore, ecc.). È inoltre possibile calcolare l’area di ricerca a partire dal bordo opposto dell’elemento di ancoraggio (sopra il bordo inferiore, sotto il bordo superiore, ecc.) o dal suo centro. Per regolare questa impostazione, fai clic sull’icona del bordo visualizzata per la relazione corrispondente.

Esempio

Supponiamo che tu debba trovare una specifica sequenza di caratteri che, in alcuni documenti, si trovi al di sopra di un testo statico predefinito e, in altri, sia allineata a quel testo statico. Impostare il valore di Sopra su 0 farà sì che l’area di ricerca non consideri gli elementi allineati al testo statico, il che significa che il tuo elemento non rientrerà nell’area di ricerca in alcune immagini: Esempio 1 Esempio 1b Tuttavia, impostando il valore di Sopra su -50 oppure facendo clic sull’icona del bordo e selezionando Confine inferiore della regione, verranno incluse sia l’area allineata al testo statico sia l’area al di sopra di esso, garantendo che il tuo elemento rientri nell’area di ricerca in tutte le immagini: Esempio 2 Esempio 2b

Più vicino a

Quando si imposta questa relazione nel riquadro Properties, è possibile selezionare come ancoraggio un elemento di ricerca oppure uno dei bordi della Pagina. Questa è l’unica relazione che si può impostare per il primo elemento nell’albero. È possibile aggiungere una sola relazione di questo tipo. Non è possibile aggiungere questa relazione per gli elementi Group e Repeating Group, ma è possibile aggiungerla per gli elementi figli di un gruppo o di un gruppo ripetuto.

Utilizzare un elemento Gruppo ripetuto come elemento di ancoraggio

Quando selezioni un elemento di ancoraggio per una relazione, noterai che gli elementi Gruppo ripetuto e i relativi elementi figlio sono sempre disattivati. Tuttavia, puoi utilizzare questi elementi come elementi di ancoraggio. Per configurare una relazione con un elemento Gruppo ripetuto, fai clic sull’icona del menu a discesa di modifica a destra del nome dell’elemento e seleziona l’istanza che fungerà da elemento di ancoraggio. Puoi specificare l’ultima istanza trovata, tutte le istanze completate oppure un’istanza con un numero specifico.

Modifica ed eliminazione delle relazioni

Puoi cambiare l’elemento di ancoraggio di una relazione esistente facendo doppio clic sulla relazione nel riquadro Properties. Le impostazioni di offset e di limite verranno mantenute. Le relazioni esistenti possono essere eliminate sia dal riquadro dell’elemento di ancoraggio sia con il pulsante Elimina accanto alla proprietà corrispondente nel riquadro Properties. Per eliminare un’area di ricerca, fai clic sull’icona Elimina relazioni nell’area di ricerca. In alternativa, seleziona Whole Document, First Page o Last Page nella proprietà Search on.