Pular para o conteúdo principalPara a maioria dos elementos de pesquisa da atividade Extraction Rules, o painel Propriedades tem duas seções: O que pesquisar e Onde pesquisar. As exceções são:
- Os elementos Group e Repeating Group, que não têm propriedades próprias.
- Elementos de campo de entrada, que são provenientes de outras atividades anteriores à atividade Extraction Rules e oferecem apenas a opção Obter região de para alternar de um campo de entrada para outro.
A seção O que procurar contém propriedades específicas de cada elemento.
Pessoa, Organização, Endereço, Localização, Data, Duração, Dinheiro
Para todos os elementos de pesquisa que procuram entidades nomeadas, você pode especificar as seguintes propriedades:
- Entidades: tipo de entidade. Se você alterar o tipo, o icon do elemento de pesquisa será atualizado automaticamente.
- Instâncias: número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências encontradas.
Para uma expressão do dicionário, especifique:
- Fonte do texto: um arquivo TXT com uma lista de palavras ou expressões a serem encontradas, uma por linha.
- Usar morfologia: ative esta opção para buscar todas as flexões/formas da palavra.
- Instâncias: a quantidade de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.
Valor de expressão regular
Para uma expressão regular, especifique:
- Expressão regular: a expressão regular que define a busca. O programa usa a sintaxe de expressões regulares PCRE2.
- Pesquisar por partes de palavras: ative esta opção para encontrar correspondências mesmo quando não estiverem separadas por espaços do restante do texto.
- Instâncias: o número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.
Para um elemento de pesquisa de texto, clique no ícone de edição e insira uma lista de palavras ou frases a serem encontradas, ou clique na imagem do documento para adicionar palavras reconhecidas do documento.
Diferentemente do elemento de pesquisa Value from Dictionary, as palavras-chave são listadas diretamente em vez de em um arquivo TXT, e você também tem a opção de permitir alguns erros de reconhecimento.
- Fonte do texto: uma lista de palavras ou frases a serem encontradas, uma variante por linha.
- Usar morfologia: ative esta opção para procurar todas as formas da palavra.
- Erros permitidos: a porcentagem ou o número de caracteres diferentes que ainda permite que o texto seja encontrado. Pode ser útil em caso de erros de reconhecimento.
Observação: esta opção não estará disponível se você ativar a opção Usar morfologia.
- Ocorrências: o número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.
A seção Onde procurar é idêntica para todos os elementos. Nesta seção, você pode restringir a área onde o programa buscará o elemento de pesquisa. Nas configurações a seguir, você pode usar os elementos de pesquisa posicionados acima do elemento atual na lista:
- Pesquisar em: o elemento de pesquisa está situado no Documento inteiro ou dentro de outro elemento de pesquisa.
Exemplo: Procure o nome da organização no preâmbulo do documento.
- Depois: o elemento de pesquisa está localizado após outro elemento de pesquisa no texto reconhecido.
- Pesquisar na mesma frase: ative esta opção para encontrar o elemento dentro da mesma frase.
Exemplo: Procure o papel da organização após seu nome, na mesma frase.
- Antes: o elemento de pesquisa está localizado antes de outro elemento de pesquisa no texto reconhecido.
- Pesquisar na mesma frase: ative esta opção para encontrar o elemento dentro da mesma frase.
Por exemplo, se você estiver procurando a data de nascimento de alguém, primeiro crie um elemento de pesquisa auxiliar com a palavra-chave “nascido” e depois especifique que a entidade Data está localizada em algum ponto após essa palavra-chave, na mesma frase.
Você pode adicionar vários elementos Depois e Antes, refinando ainda mais a sua pesquisa.