Pular para o conteúdo principal
A atividade Extraction Rules trabalha com o texto reconhecido de documentos não estruturados. As regras usam entidades nomeadas, palavras-chave e expressões regulares para definir condições para os campos que você precisa extrair.

Casos de uso

Adicione esta atividade ao seu fluxo de processamento de documentos nos seguintes casos:
  • Se você extraiu vários objetos do mesmo tipo com a ajuda de uma atividade de Named Entities (NER) e agora precisa encontrar uma instância específica. Por exemplo, várias entidades Organization podem ser extraídas de um contrato de locação. Você pode usar uma atividade Extraction Rules para determinar o locador e o locatário.
  • Se você não tem documentos suficientes para usar uma atividade de Deep Learning. Nesse caso, você pode criar uma atividade Extraction Rules e extrair os objetos necessários usando palavras-chave, expressões regulares ou outra lógica de negócios.
  • Se você precisa extrair um objeto de um tipo não padronizado. Por exemplo, você pode querer extrair uma combinação de data e hora em vez de apenas a data.
  • Se você precisa agrupar vários campos relacionados ao mesmo objeto. Por exemplo, você pode usar uma atividade Extraction Rules para agrupar o nome, a data de nascimento e o endereço de cada pessoa. Uma atividade de Named Entities (NER) também pode extrair nomes e endereços, mas não permitirá associar os endereços aos respectivos nomes.

Como funciona

Esta atividade usa Processamento de Linguagem Natural (NLP) para encontrar elementos de pesquisa no texto. Elementos de pesquisa são entidades nomeadas e palavras ou frases que correspondem a palavras-chave ou expressões regulares. Junto com os campos extraídos por outras atividades, os elementos de pesquisa podem ser usados como blocos de construção para regras de extração, que especificam a posição dos campos em relação a outro texto. As regras de extração podem ser facilmente criadas pela interface do usuário e posteriormente personalizadas usando uma linguagem específica. Elementos de pesquisa podem ser mapeados para campos, de modo que o texto reconhecido na região de um elemento de pesquisa seja usado para preencher o campo ao qual ele foi mapeado. Para mais informações, consulte Configuração de uma atividade Extraction Rules.