Pular para o conteúdo principal
Um elemento de pesquisa permite definir condições para o tipo e as propriedades de um objeto que você deseja extrair. Como as atividades de PLN trabalham com texto não estruturado, as condições de pesquisa especificam a posição dos objetos em relação a outros trechos de texto, e não sua relação geométrica. Você também pode usar elementos de pesquisa auxiliares para restringir a pesquisa, especificando que o objeto desejado pode ser encontrado dentro, antes ou depois desses elementos auxiliares.

Criando um elemento de pesquisa

  • Você pode criar rapidamente um elemento de pesquisa clicando em um dos objetos destacados na imagem. O novo elemento de pesquisa será do mesmo tipo do objeto em que você clicar. Use o botão Show Image Objects na barra de ferramentas para selecionar quais objetos devem ser destacados.

Realçando objetos

Os seguintes tipos de objetos podem ser realçados:
  • Pessoa
  • Organização
  • Endereço
  • Local
  • Data
  • Duração
  • Valor monetário
  • Palavras reconhecidas
Observação: Todos esses objetos serão realçados por padrão, com exceção das palavras reconhecidas.
  • Você também pode criar um novo elemento de pesquisa usando o menu:
  1. Vá até a guia Search Elements à direita da janela do documento.
  2. Clique em Create Element.
  3. Selecione o tipo de elemento desejado na lista que for aberta.
Depois que o elemento for criado, você precisa configurar suas propriedades no painel Properties (consulte Propriedades do elemento para mais informações).
Observação: As propriedades especificadas também podem ser visualizadas e editadas no formato de código (consulte Sintaxe de código para a atividade Extraction Rules para NLP para mais informações).

Tipos de elementos de pesquisa

Ao criar um elemento de pesquisa, é necessário especificar seu tipo, que dependerá do objeto que você deseja encontrar. Os tipos de elementos de pesquisa disponíveis são descritos brevemente abaixo.

Pessoa

Nomes de pessoas, por exemplo, John Doe, Jane Smith.

Organização

Nomes de organizações, por exemplo, ABBYY e Acme Corp.

Endereço

Exemplos de endereços: 123 Main Str., Anytown AB 45678.

Localização

Nomes de localidades, por exemplo: Anytown, Corporate Place.

Data

Datas em diferentes formatos, por exemplo: 14 de novembro de 2009, 11/14/2009.

Duração

Períodos, por exemplo: doze (12) meses, 4 dias.

Dinheiro

Montantes de dinheiro, por exemplo: US$ 2.670,00, 199 dólares e 99 centavos. Observação: Os elementos Person, Organization, Address, Location, Date, Duration e Money correspondem às entidades nomeadas que você pode configurar na atividade Named Entities (NER) e são extraídos com a mesma tecnologia.

Valor do dicionário

Uma palavra ou frase de um dicionário. O dicionário deve ser um arquivo TXT simples com uma lista de variantes de texto para pesquisa, uma por linha.

Valor de expressão regular

Um valor que corresponde a uma expressão regular especificada por você.

Texto

Uma palavra-chave ou frase, com opção de buscar todas as flexões ou permitir alguns erros de reconhecimento.

Grupo

Uma coleção de elementos de pesquisa aninhados. Os elementos que compõem um grupo podem ser tanto elementos simples quanto elementos de grupo. Um elemento de grupo não possui propriedades próprias. Os dados serão extraídos com base nas configurações de seus elementos de pesquisa aninhados. Elementos de grupo podem ser usados para impor uma hierarquia lógica de elementos, facilitando a depuração e a navegação. Por exemplo, agrupar o nome, o endereço e a data de nascimento de uma pessoa permitirá extrair os dados de cada pessoa de maneira consistente.

Grupo repetido

Este elemento foi projetado para localizar grupos repetidos de elementos. Grupos repetidos são usados em casos em que uma entidade pode ter várias instâncias, cada uma com suas próprias propriedades, mas você não sabe quantas instâncias haverá. As propriedades de cada instância são especificadas nos elementos aninhados do grupo repetido. Por exemplo, se você estiver processando currículos, talvez queira criar um grupo repetido “Education” com os seguintes elementos aninhados: “School_name”, “Degree”, “Start_date” e “Graduation_date”. Por outro lado, se os dados que você procura se relacionam a entidades diferentes com papéis distintos, um grupo repetido não será a opção adequada. Por exemplo, se você tiver apenas duas partes em um contrato, como comprador e vendedor, crie um grupo “Party1_Buyer” e um grupo “Party2_Seller” em vez de um único grupo repetido “Party”.

Campo de entrada

Este elemento permite usar um campo extraído por outra atividade como base para as regras. Por exemplo, se uma atividade de Extraction Rules vier antes de uma atividade de Segmentation, você pode querer usar alguns dos segmentos para restringir a pesquisa.

Alterando o tipo, o nome e a posição de um elemento na lista

Para alterar o tipo de um elemento:
  • Clique com o botão direito no elemento e selecione Converter elemento em no menu de contexto.
  • Selecione um elemento na lista e clique em um objeto realçado na imagem. Isso permite converter o elemento de pesquisa selecionado para o tipo do objeto realçado. Se você clicar em uma palavra reconhecida realçada, poderá converter o elemento de pesquisa em Text e, ao mesmo tempo, adicionar a palavra selecionada à lista de palavras‑chave desse elemento de pesquisa.
  • Para elementos de pesquisa que correspondem a entidades nomeadas, use a propriedade Entities para alterar o tipo da entidade nomeada.
Observação: Alterar o tipo de um elemento não converterá elementos não agrupados em elementos de grupo e vice‑versa.
Para alterar o nome de um elemento:
  • Clique com o botão direito no elemento, selecione Renomear no menu de contexto e insira um novo nome.
  • Selecione um elemento, clique no nome (ou pressione F2) e insira um novo nome.
O nome de um elemento pode conter letras em inglês, números e sublinhados. No entanto, o nome de um elemento não pode começar com um número. Espaços, símbolos especiais (.,:- \ /) e nomes reservados não são permitidos. Para mover elementos na lista:
  • Arraste os elementos para cima ou para baixo para alterar sua posição na lista.
  • Arraste os elementos para um elemento de grupo para colocá‑los dentro do grupo.
Observação: Os elementos são pesquisados de cima para baixo. Isso significa que os elementos usados nas condições de pesquisa de outro elemento devem preceder esse elemento na lista de elementos.