Configurar as propriedades dos elementos de pesquisa na atividade Extraction Rules para NLP.
Para a maioria dos elementos de pesquisa da atividade Extraction Rules, o painel Propriedades tem duas seções: O que pesquisar e Onde pesquisar. As exceções são:
Os elementos Group e Repeating Group, que não têm propriedades próprias.
Elementos de campo de entrada, que são provenientes de outras atividades anteriores à atividade Extraction Rules e oferecem apenas a opção Obter região de para alternar de um campo de entrada para outro.
Expressão regular: a expressão regular que define a busca. O programa usa a sintaxe de expressões regulares PCRE2.
Pesquisar por partes de palavras: ative esta opção para encontrar correspondências mesmo quando não estiverem separadas por espaços do restante do texto.
Instâncias: o número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.
Para um elemento de pesquisa de texto, clique no ícone de edição e insira uma lista de palavras ou frases a serem encontradas, ou clique na imagem do documento para adicionar palavras reconhecidas do documento.Diferentemente do elemento de pesquisa Value from Dictionary, as palavras-chave são listadas diretamente em vez de em um arquivo TXT, e você também tem a opção de permitir alguns erros de reconhecimento.
Fonte do texto: uma lista de palavras ou frases a serem encontradas, uma variante por linha.
Usar morfologia: ative esta opção para procurar todas as formas da palavra.
Erros permitidos: a porcentagem ou o número de caracteres diferentes que ainda permite que o texto seja encontrado. Pode ser útil em caso de erros de reconhecimento.
Observação: esta opção não estará disponível se você ativar a opção Usar morfologia.
Ocorrências: o número de ocorrências. É possível extrair apenas a primeira ou todas as ocorrências detectadas.
A seção Onde procurar é idêntica para todos os elementos. Nesta seção, você pode restringir a área onde o programa buscará o elemento de pesquisa. Nas configurações a seguir, você pode usar os elementos de pesquisa posicionados acima do elemento atual na lista:
Pesquisar em: o elemento de pesquisa está situado no Documento inteiro ou dentro de outro elemento de pesquisa.
Exemplo: Procure o nome da organização no preâmbulo do documento.
Depois: o elemento de pesquisa está localizado após outro elemento de pesquisa no texto reconhecido.
Pesquisar na mesma frase: ative esta opção para encontrar o elemento dentro da mesma frase.
Exemplo: Procure o papel da organização após seu nome, na mesma frase.
Antes: o elemento de pesquisa está localizado antes de outro elemento de pesquisa no texto reconhecido.
Pesquisar na mesma frase: ative esta opção para encontrar o elemento dentro da mesma frase.
Por exemplo, se você estiver procurando a data de nascimento de alguém, primeiro crie um elemento de pesquisa auxiliar com a palavra-chave “nascido” e depois especifique que a entidade Data está localizada em algum ponto após essa palavra-chave, na mesma frase.Você pode adicionar vários elementos Depois e Antes, refinando ainda mais a sua pesquisa.