Pular para o conteúdo principal
Para a maioria dos elementos de pesquisa da atividade Extraction Rules, o painel Properties tem duas seções: What to search for e Where to search. As exceções são:
  • Elementos Group e Repeating Group, que não têm propriedades próprias.
  • Elementos de campo de entrada, que são obtidos de outras atividades anteriores à atividade Extraction Rules e oferecem apenas a opção Get region from para alternar de um campo de entrada para outro.

O que procurar

A seção O que procurar contém propriedades específicas de cada elemento.

Pessoa, Organização, Endereço, Localização, Data, Duração, Dinheiro

Para todos os elementos de pesquisa que procuram entidades nomeadas, você pode especificar as seguintes propriedades:
  • Entidades: tipo de entidade. Se você alterar o tipo, o icon do elemento de pesquisa será atualizado automaticamente.
  • Instâncias: número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências encontradas.

Valor do Dicionário

Para uma expressão do dicionário, especifique:
  • Fonte do texto: um arquivo TXT com uma lista de palavras ou expressões a serem encontradas, uma por linha.
  • Usar morfologia: ative esta opção para buscar todas as flexões/formas da palavra.
  • Instâncias: a quantidade de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.

Valor de expressão regular

Para uma expressão regular, especifique:
  • Expressão regular: a expressão regular que define a busca. O programa usa a sintaxe de expressões regulares PCRE2.
  • Pesquisar por partes de palavras: ative esta opção para encontrar correspondências mesmo quando não estiverem separadas por espaços do restante do texto.
  • Instâncias: o número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.

Texto

Para um elemento de pesquisa de texto, clique no ícone de edição e insira uma lista de palavras ou frases a serem localizadas, ou clique na imagem do documento para adicionar palavras reconhecidas do documento. Diferentemente do elemento de pesquisa Valor do Dicionário, as palavras-chave são listadas diretamente, em vez de em um arquivo TXT, e você também pode permitir alguns erros de reconhecimento.
  • Fonte de texto: uma lista de palavras ou frases a serem localizadas, uma variante por linha.
  • Usar morfologia: ative esta opção para procurar todas as formas da palavra.
  • Erros permitidos: a porcentagem ou o número de caracteres diferentes que ainda permitirá que o texto seja encontrado. Pode ser útil em caso de erros de reconhecimento.
Observação: Esta opção não estará disponível se você ativar a opção Usar morfologia.
  • Ocorrências: o número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.
A seção Onde pesquisar é idêntica para todos os elementos. Nesta seção, você pode restringir a área onde o programa procurará o elemento de pesquisa. Nas configurações a seguir, você pode usar os elementos de pesquisa localizados acima do elemento atual na lista:
  • Pesquisar em: o elemento de pesquisa está localizado no Documento inteiro ou dentro de outro elemento de pesquisa.
Exemplo: Procure o nome da organização no preâmbulo do documento.
  • Depois: o elemento de pesquisa está localizado após outro elemento de pesquisa no texto reconhecido.
    • Pesquisar na mesma frase: ative esta opção para localizar o elemento dentro da mesma frase.
Exemplo: Procure a função da organização após o nome dela na mesma frase.
  • Antes: o elemento de pesquisa está localizado antes de outro elemento de pesquisa no texto reconhecido.
    • Pesquisar na mesma frase: ative esta opção para localizar o elemento dentro da mesma frase.
Por exemplo, se você estiver procurando a data de nascimento de alguém, primeiro crie um elemento de pesquisa auxiliar com a palavra-chave “born” e, em seguida, especifique que a entidade Date está localizada em algum ponto após essa palavra-chave na mesma frase. Você pode adicionar vários elementos Depois e Antes, refinando ainda mais a sua pesquisa.