Pular para o conteúdo principal
Uma área de pesquisa é uma região da imagem onde o programa deve procurar objetos correspondentes a um elemento específico. Ela é calculada com base nas condições especificadas na seção Onde pesquisar do painel Propriedades. Em documentos semiestruturados, alguns objetos podem aparecer em locais diferentes em documentos distintos e, portanto, o programa nem sempre conseguirá encontrá-los usando áreas de pesquisa absolutas. Nesse caso, as áreas de pesquisa podem ser definidas em relação a elementos com localizações fixas ou a campos que já foram encontrados. Também há situações em que um elemento pode ser detectado sem definir uma área de pesquisa (por exemplo, um elemento Static Text que sempre contenha uma palavra exclusiva do documento pode ser detectado com base apenas nessa palavra) ou limitando a área de pesquisa à primeira ou à última página de um documento.

Especificando uma Área de Pesquisa

Para especificar uma área de pesquisa para um elemento:
  1. Crie e configure os chamados elementos âncora. Qualquer elemento que já tenha sido detectado pode ser usado como elemento âncora, desde que seja possível definir relações entre ele e o elemento que você deseja que o programa detecte. Faça a correspondência dos elementos com a imagem usando o comando Match e verifique se foram detectados corretamente.
  2. Crie um elemento correspondente ao objeto da imagem que você deseja detectar e especifique suas propriedades na seção What to search for.
  3. Especifique a área de pesquisa na seção Where to search. a. Na lista suspensa Search on, selecione Whole Document se precisar pesquisar o documento inteiro, ou First Page ou Last Page se precisar restringir a pesquisa à primeira ou à última página. Ao especificar a área de pesquisa dessa maneira, não são necessários elementos âncora. b. Se necessário, especifique as relações existentes entre o elemento a ser detectado e outros elementos, ou desenhe uma área de pesquisa diretamente na imagem. Você pode definir os limites da área de pesquisa em relação a outros elementos, excluir determinados elementos da área de pesquisa ou indicar qual elemento ou borda da página está mais próximo do elemento a ser detectado.
  4. Clique em Match para verificar se o seu elemento pode ser detectado corretamente em todos os documentos.

Especificando uma área de pesquisa na imagem do documento

Na maioria dos casos, você especificará uma área de pesquisa em relação à localização de outros elementos de pesquisa usados como âncoras. Você só pode usar um elemento como âncora se ele tiver sido encontrado na imagem com sucesso; portanto, primeiro configure e faça a correspondência dos elementos que serão usados como âncoras. Clique no botão Desenhar na imagem e desenhe uma área de pesquisa na sua imagem. A área de pesquisa deve ficar próxima ou cruzar as regiões dos elementos âncora. Na seção Onde pesquisar, as propriedades À direita de, Abaixo de, À esquerda de e Acima de serão exibidas para a área de pesquisa desenhada, bem como coordenadas para especificar as distâncias dessas propriedades em relação à área de pesquisa e aos elementos âncora. Essas propriedades são sincronizadas com a área de pesquisa na imagem. Você pode modificar a área de pesquisa a qualquer momento, seja editando-a na imagem, seja alterando as propriedades de relação no painel Propriedades. Ao selecionar uma relação no painel Propriedades, o semiplano definido por essa relação é destacado na imagem do documento. Em seguida, ajuste as relações dos elementos âncora e da área de pesquisa usando a barra de ferramentas do elemento âncora, acessível ao clicar na região de um elemento: AD_ExtractionRules_SearchArea_Tools
  • As setas direcionais podem ser usadas para ativar e desativar as relações de pesquisa de objetos em relação ao elemento na direção correspondente.
  • A ferramenta de exclusão de relações remove todas as relações definidas para o elemento selecionado.
  • A ferramenta de proximidade especifica que, entre todas as hipóteses de elementos, deve ser considerada aquela mais próxima do elemento selecionado, caso todas as demais condições sejam atendidas de forma equivalente. Quando as hipóteses são formuladas, o objeto mais próximo do elemento selecionado será escolhido. Se essa ferramenta for usada, a propriedade Mais próximo de aparecerá no painel Propriedades. Essa propriedade pode ser definida para apenas um elemento âncora.
  • A ferramenta de exclusão exclui o elemento selecionado da área de pesquisa. Ela é usada quando um elemento dentro da área de pesquisa pode ser confundido com o objeto que está sendo procurado. Por exemplo, se você estiver procurando um elemento Character String com um determinado conjunto de caracteres, outro elemento Character String com o mesmo ou semelhante conjunto de caracteres pode ser escolhido por engano. Para evitar isso, exclua o segundo elemento da área de pesquisa usando a ferramenta de exclusão. Ao usar essa ferramenta, a propriedade Excluir aparece no painel Propriedades.
Quando terminar de configurar a área de pesquisa, clique no botão Desenhar na imagem para sair do modo Desenhar área de pesquisa.

Especificando uma Área de Pesquisa no Painel de Propriedades

Essas relações são equivalentes às configuradas usando a barra de ferramentas do elemento de âncora descrita acima. Você pode editar cada relação separadamente. Se você ativar o modo Desenhar Área de Pesquisa, a área de pesquisa e o semiplano definido pela relação selecionada serão exibidos na imagem do documento. A área de pesquisa será sincronizada com as propriedades da relação.

À direita de, Abaixo de, À esquerda de, Acima de, Excluir

Na seção Onde buscar, clique em Adicionar e selecione o tipo de relação que deseja configurar. Na caixa de diálogo que se abre, selecione um elemento âncora. Você pode selecionar qualquer elemento ativo acima do elemento atual. Você pode adicionar várias relações de cada um desses tipos. Você pode modificar a área de busca alterando o deslocamento para as relações À direita de, Abaixo de, À esquerda de e Acima de. Um valor de deslocamento positivo significa que o limite será movido na mesma direção especificada na relação. Um valor de deslocamento negativo move o limite na direção oposta à especificada na relação. Por exemplo, um deslocamento negativo para a relação À direita de moverá o limite para a esquerda. Você também pode selecionar o limite do elemento a partir do qual a área de busca será calculada. Por padrão, o limite é definido de modo a não incluir o elemento âncora na área de busca (acima do limite superior, abaixo do limite inferior, etc.). Você também pode calcular a área de busca a partir do limite oposto do elemento âncora (acima do limite inferior, abaixo do limite superior, etc.) ou a partir do centro. Para ajustar essa configuração, clique no ícone de limite exibido para a relação correspondente.

Exemplo

Suponha que você precise encontrar uma determinada sequência de caracteres que fique acima de um texto estático predefinido em alguns documentos e no mesmo nível desse texto estático em outros. Definir o valor de Above como 0 fará com que a área de pesquisa não considere elementos no mesmo nível do texto estático, o que significa que seu elemento não estará na área de pesquisa em algumas imagens: Exemplo 1 Exemplo 1b No entanto, definir o valor de Above como -50 ou clicar no ícone de limite e selecionar Bottom Boundary of Region incluirá tanto a área no mesmo nível do texto estático quanto a área acima dele, o que garante que seu elemento estará dentro da área de pesquisa em todas as imagens: Exemplo 2 Exemplo 2b

Mais próximo de

Ao definir essa relação no painel Properties, você pode selecionar um elemento de pesquisa ou uma das bordas da Página como âncora. Essa é a única relação que pode ser definida para o primeiro elemento na árvore. Você pode adicionar apenas uma relação desse tipo. Não é possível adicionar essa relação para elementos Group e Repeating Group, mas é possível adicioná-la a elementos filho de um grupo ou de um grupo repetido.

Usando um elemento de Grupo Repetido como elemento âncora

Ao selecionar um elemento âncora para uma relação, você verá que os elementos de Grupo Repetido e seus elementos filhos aparecem sempre esmaecidos. No entanto, é possível usar esses elementos como âncoras. Para configurar uma relação com um elemento de Grupo Repetido, clique no ícone de menu de edição à direita do nome do elemento e selecione a instância que servirá como âncora. Você pode especificar a última instância encontrada, todas as instâncias concluídas ou uma instância por um determinado número.

Editando e Excluindo Relações

Você pode alterar o elemento âncora de qualquer relação existente dando um clique duplo na relação no painel Properties. As configurações de deslocamento e de limite serão preservadas. Relações existentes podem ser excluídas tanto pelo painel do elemento âncora quanto pelo botão de exclusão ao lado da propriedade correspondente no painel Properties. Para excluir uma área de pesquisa, clique no ícone de excluir relações na própria área de pesquisa. Como alternativa, selecione Whole Document, First Page ou Last Page na propriedade Search on.