Pular para o conteúdo principal
A atividade de Entidades Nomeadas (NER) foi projetada para usar Processamento de Linguagem Natural (NLP) para extrair entidades nomeadas de documentos não estruturados, como contratos, cartas, pedidos, comunicados de imprensa e outros documentos sem uma estrutura específica que possa ser descrita por regras. Para processar esses documentos usando uma atividade de Entidades Nomeadas (NER), você precisa mapear as entidades nomeadas aos campos da skill nos quais os valores das entidades serão extraídos. Em seguida, essa atividade analisará o documento e extrairá as entidades nomeadas em seus respectivos campos. Você também pode configurar a extração de entidades nomeadas para campos extraídos por outras atividades. Suponha que você saiba que os nomes de organizações e os endereços que precisa extrair estão localizados no primeiro parágrafo de cada contrato. Você pode extrair o primeiro parágrafo usando uma atividade de Segmentação e, em seguida, extrair nomes de empresas e endereços desse parágrafo usando uma atividade de Entidades Nomeadas (NER). Essa abordagem é mais confiável do que extrair entidades nomeadas do documento inteiro, pois você pode controlar a área específica de onde essas entidades são extraídas.
Observação: A atividade oferece suporte apenas a campos do tipo Text que têm o tipo de dados definido como Text, Date ou Money.

Configurando uma atividade de Named Entities (NER)

Para configurar uma atividade de Named Entities (NER):
  1. Na guia Activities, adicione uma atividade de Named Entities (NER) ao fluxo de processamento de documentos.
  2. No painel Activity Properties, use a lista suspensa Source para selecionar a origem que a atividade usará para extrair entidades nomeadas — o documento inteiro ou um único campo extraído por outra atividade.
  3. Em Output field, selecione os campos nos quais as entidades nomeadas serão extraídas.
Observação: Os campos de saída devem estar no mesmo nível de aninhamento do campo de origem ou um nível abaixo.
  1. Clique em Create Mapping. Na caixa de diálogo que será aberta, selecione quais entidades nomeadas serão extraídas para cada campo na lista Entity to extract. Clique em Save. Você pode editar o mapeamento a qualquer momento clicando em Edit Mapping.
  2. Clique em Test Skill para testar sua Skill e analisar os resultados da extração de entidades nomeadas na guia Results.

Entidades nomeadas compatíveis

Entity nameDescriptionExampleSupported data typesSupported languages
PersonNomes de pessoasJohn Doe, Jane SmithTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
LocationNomes de localidadesAnytown, Corporate PlaceTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
OrganizationNomes de organizaçõesABBYY, Acme Corp.TextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
AddressEndereços123 Main Str., Anytown AB 45678, 950 Acacia Avenue 50, Anytown, AB 12345, USATextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
MoneyValores monetários$2670.00, 199 dollars 99 centsText, Amount of moneyEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DateDatasNovember 14, 2009, 11/14/2009Text, DateEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch
DurationPeríodosTwelve (12) months, 4 daysTextEnglish, Russian, German, French, Spanish, Japanese, Italian, Portuguese (Standard), Dutch