Vai al contenuto principale
Un’area di ricerca è una regione dell’immagine in cui il programma deve cercare oggetti corrispondenti a un elemento specifico. Viene determinata in base alle condizioni specificate nella sezione Dove cercare del riquadro Proprietà. Nei documenti semistrutturati, alcuni oggetti possono trovarsi in posizioni diverse su documenti differenti e, di conseguenza, il programma non sempre riuscirà a individuarli usando aree di ricerca assolute. In questi casi, le aree di ricerca possono essere definite rispetto a elementi con posizioni stabili oppure rispetto a field già individuati. Vi sono anche casi in cui un elemento può essere rilevato senza definire un’area di ricerca (ad es., un elemento Static Text che contiene sempre una parola univoca del documento può essere rilevato in base a quella sola parola) oppure limitando l’area di ricerca alla prima o all’ultima Pagina di un documento.

Specificare un’area di ricerca

Per specificare un’area di ricerca per un elemento:
  1. Crea e configura i cosiddetti elementi di ancoraggio. Qualsiasi elemento già rilevato può essere usato come elemento di ancoraggio, purché tu possa definire alcune relazioni tra questi e l’elemento che vuoi far rilevare al programma. Confronta gli elementi con l’immagine usando il comando Match e assicurati che vengano rilevati correttamente.
  2. Crea un elemento corrispondente all’oggetto nell’immagine che desideri rilevare e specificale le proprietà nella sezione What to search for.
  3. Specifica l’area di ricerca nella sezione Where to search. a. Nell’elenco a discesa Search on, seleziona Whole Document se devi cercare nell’intero documento, oppure First Page o Last Page se devi limitare la ricerca alla prima o all’ultima pagina. Quando specifichi l’area di ricerca in questo modo, non sono necessari elementi di ancoraggio. b. Se necessario, specifica le relazioni tra l’elemento da rilevare e altri elementi oppure disegna un’area di ricerca direttamente sull’immagine. Puoi definire i confini dell’area di ricerca in relazione ad altri elementi, escludere determinati elementi dall’area di ricerca o indicare quale elemento o bordo della pagina è più vicino all’elemento da rilevare.
  4. Fai clic su Match per assicurarti che l’elemento venga rilevato correttamente in tutti i documenti.

Specificare un’area di ricerca sull’immagine del documento

Nella maggior parte dei casi specificherai un’area di ricerca rispetto alla posizione di altri elementi di ricerca usati come ancoraggi. Puoi usare un elemento come ancoraggio solo se è stato trovato correttamente nell’immagine, quindi prima dovresti configurare e riconoscere gli elementi che verranno utilizzati come ancoraggi. Fai clic sul pulsante Disegna sull’immagine e disegna un’area di ricerca sull’immagine. L’area di ricerca dovrebbe essere vicina alle regioni degli elementi di ancoraggio o intersecarle. Nella sezione Dove cercare compariranno, per l’area di ricerca che hai disegnato, le proprietà A destra di, Sotto, A sinistra di e Sopra, oltre alle coordinate per specificare le distanze di tali proprietà in relazione all’area di ricerca e agli elementi di ancoraggio. Queste proprietà sono sincronizzate con l’area di ricerca sull’immagine. Puoi modificare l’area di ricerca in qualsiasi momento, sia intervenendo direttamente sull’immagine sia cambiando le proprietà di relazione nel riquadro Proprietà. Quando selezioni una relazione nel riquadro Proprietà, il semipiano definito da tale relazione viene evidenziato sull’immagine del documento. Quindi, regola le relazioni per gli elementi di ancoraggio e per l’area di ricerca utilizzando la barra degli strumenti dell’elemento di ancoraggio, accessibile facendo clic sulla relativa regione: AD_ExtractionRules_SearchArea_Tools
  • Gli strumenti con frecce direzionali consentono di abilitare o disabilitare le relazioni di ricerca dell’oggetto rispetto all’elemento nella direzione corrispondente.
  • Lo strumento Elimina relazioni rimuove tutte le relazioni impostate per l’elemento selezionato.
  • Lo strumento Più vicino specifica che, tra tutte le ipotesi dell’elemento, deve essere considerata quella più vicina all’elemento selezionato se tutte le altre condizioni sono soddisfatte allo stesso modo. Durante la formulazione delle ipotesi verrà scelto l’oggetto più vicino all’elemento selezionato. Se utilizzi questo strumento, nel riquadro Proprietà compare la proprietà Più vicino a. Questa proprietà può essere impostata per un solo elemento di ancoraggio.
  • Lo strumento Escludi esclude l’elemento selezionato dall’area di ricerca. È utile quando un elemento all’interno dell’area di ricerca potrebbe essere scambiato per l’oggetto cercato. Ad esempio, se stai cercando un elemento Character String con un determinato set di caratteri, un altro elemento Character String con lo stesso o un set di caratteri simile potrebbe essere scelto per errore. Per evitarlo, escludi il secondo elemento dall’area di ricerca usando lo strumento Escludi. Quando utilizzi questo strumento, nel riquadro Proprietà compare la proprietà Escludi.
Quando hai terminato di configurare l’area di ricerca, fai clic sul pulsante Disegna sull’immagine per uscire dalla modalità Disegna area di ricerca.

Specificare un’area di ricerca nel riquadro Proprietà

Queste relazioni sono equivalenti a quelle configurate mediante la barra degli strumenti dell’elemento di ancoraggio descritta sopra. È possibile modificare ciascuna relazione separatamente. Se si attiva la modalità Disegna area di ricerca, l’area di ricerca e il semipiano definito dalla relazione selezionata verranno visualizzati sull’immagine del documento. L’area di ricerca sarà sincronizzata con le proprietà della relazione.

A destra di, Sotto, A sinistra di, Sopra, Escludi

Nella sezione Dove cercare, fai clic su Aggiungi e seleziona il tipo di relazione che desideri configurare. Nella finestra di dialogo che si apre, seleziona un elemento di ancoraggio. Puoi selezionare qualsiasi elemento attivo sopra l’elemento corrente. Puoi aggiungere più relazioni per ciascuno di questi tipi. Puoi modificare l’area di ricerca cambiando l’offset per le relazioni A destra di, Sotto, A sinistra di e Sopra. Un valore di offset positivo significa che il limite verrà spostato nella stessa direzione indicata dalla relazione. Un valore di offset negativo sposta il limite nella direzione opposta a quella indicata dalla relazione. Ad esempio, un offset negativo per la relazione A destra di sposterà il limite a sinistra. Puoi anche selezionare il bordo dell’elemento da cui calcolare l’area di ricerca. Per impostazione predefinita, il bordo è selezionato in modo da non includere l’elemento di ancoraggio nell’area di ricerca (sopra il bordo superiore, sotto il bordo inferiore, ecc.). È inoltre possibile calcolare l’area di ricerca a partire dal bordo opposto dell’elemento di ancoraggio (sopra il bordo inferiore, sotto il bordo superiore, ecc.) o dal suo centro. Per regolare questa impostazione, fai clic sull’icona del bordo visualizzata per la relazione corrispondente.

Esempio

Supponiamo che tu debba trovare una specifica sequenza di caratteri che, in alcuni documenti, si trova sopra un testo statico predefinito e, in altri, è allineata a quel testo statico. Impostare Above a 0 fa sì che l’area di ricerca non consideri gli elementi allineati al testo statico, il che significa che il tuo elemento non rientrerà nell’area di ricerca in alcune immagini: Esempio 1 Esempio 1b Tuttavia, impostando Above a -50 oppure facendo clic sull’icona del limite e selezionando Bottom Boundary of Region, verranno incluse sia l’area allineata al testo statico sia l’area al di sopra, garantendo che il tuo elemento rientri nell’area di ricerca in tutte le immagini: Esempio 2 Esempio 2b

Più vicino a

Quando si imposta questa relazione nel riquadro Properties, è possibile selezionare come ancoraggio un elemento di ricerca oppure uno dei bordi della Pagina. Questa è l’unica relazione che si può impostare per il primo elemento nell’albero. È possibile aggiungere una sola relazione di questo tipo. Non è possibile aggiungere questa relazione per gli elementi Group e Repeating Group, ma è possibile aggiungerla per gli elementi figli di un gruppo o di un gruppo ripetuto.

Utilizzare un elemento Gruppo ripetuto come elemento di ancoraggio

Quando selezioni un elemento di ancoraggio per una relazione, noterai che gli elementi Gruppo ripetuto e i relativi elementi figlio sono sempre disattivati. Tuttavia, puoi utilizzare questi elementi come elementi di ancoraggio. Per configurare una relazione con un elemento Gruppo ripetuto, fai clic sull’icona del menu a discesa di modifica a destra del nome dell’elemento e seleziona l’istanza che fungerà da elemento di ancoraggio. Puoi specificare l’ultima istanza trovata, tutte le istanze completate oppure un’istanza con un numero specifico.

Modifica ed eliminazione delle relazioni

Puoi cambiare l’elemento di ancoraggio di una relazione esistente facendo doppio clic sulla relazione nel riquadro Properties. Le impostazioni di offset e di limite verranno mantenute. Le relazioni esistenti possono essere eliminate sia dal riquadro dell’elemento di ancoraggio sia con il pulsante Elimina accanto alla proprietà corrispondente nel riquadro Properties. Per eliminare un’area di ricerca, fai clic sull’icona Elimina relazioni nell’area di ricerca. In alternativa, seleziona Whole Document, First Page o Last Page nella proprietà Search on.