Pular para o conteúdo principal
Documentos de algumas empresas podem ter estruturas particularmente complexas. Para extrair corretamente os dados desses documentos, é necessário configurar atividades de extração específicas para cada empresa. Isso pode ser feito em um único Skill de Documento usando a atividade Classificar por Empresa. Essa atividade classifica documentos por empresa usando catálogos de dados.

Usando catálogos de dados

Um catálogo de dados é um conjunto de dados que contém informações específicas. Por exemplo, pode conter informações relacionadas a empresas, como razão social, endereços, números de contas bancárias etc. Catálogos de dados podem ser usados para buscar quaisquer empresas no documento, como Fornecedores, Consignatários, bancos, transportadoras etc. Um catálogo de dados pode ser preenchido com dados de um arquivo CSV com estrutura idêntica à do catálogo de dados. Para obter mais informações sobre o uso de catálogos de dados, consulte a seção Usando catálogos de dados no Guia do Skill Designer. Quando documentos são processados usando uma atividade Classify By Company, dados específicos da empresa são pesquisados no catálogo de dados conectado. O resultado é um identificador único da empresa, que é registrado no campo correspondente no skill. Esse identificador da empresa é então usado para configurar um algoritmo de processamento de documentos específico da empresa. O identificador da empresa é o único campo necessário para que uma atividade Classify By Company funcione; no entanto, você pode preencher mais campos usando informações sobre a empresa armazenadas no catálogo de dados para evitar configurar atividades adicionais de extração para esses campos. Para isso, é necessário mapear as colunas do catálogo de dados para os campos apropriados no skill. Uma atividade Classify By Company usa catálogos de dados do tipo Document Issuer Companies, disponíveis no servidor do Vantage ao qual você está conectado. Em alguns casos, você pode querer pesquisar no documento um par de empresas relacionadas (por exemplo, um fornecedor e um comprador de mercadorias). Para isso, adicione um segundo catálogo de dados opcional do tipo Document Receiver Companies. Se precisar encontrar duas empresas não relacionadas, você pode usar essa opção ou adicionar duas atividades Classify By Company.

Buscando um Par de Empresas

Cada unidade de negócios da sua empresa pode ter seu próprio banco de dados de fornecedores. Se um fornecedor trabalha com várias unidades de negócios, ele terá vários registros com IDs diferentes. Nesse caso, você precisará encontrar o registro exato do fornecedor que corresponde à unidade de negócios. Para isso, preencha a coluna Company Correlation ID no catálogo de dados Document Issuer Companies. A busca procurará pares de empresas em que o correlation ID do emissor do documento corresponda ao ID do recebedor do documento. Se alguns correlation IDs estiverem ausentes, os pares com correlation IDs correspondentes terão prioridade. Ao buscar pares de empresas, hipóteses são geradas com base na correlação entre um fornecedor e uma unidade de negócios. A atividade Classify By Company seleciona cinco registros de empresas recebedoras de documentos que mais confiavelmente correspondem aos valores de campo na imagem do documento. Em seguida, para cada registro, a atividade seleciona cinco registros de empresas emissoras de documentos em que o Company Correlation ID seja idêntico ao Receiver Company ID. Se o catálogo de dados não contiver registros em que o Company Correlation ID seja idêntico ao Receiver Company ID, registros com Company Correlation ID vazio são selecionados em seu lugar.
Importante! Para encontrar pares válidos, você deve preencher os Company Correlation IDs corretos para todos os registros.
Como resultado, o melhor par emissor–recebedor é selecionado. Para obter mais informações sobre a detecção de empresas, consulte How company detection works. Se as suas empresas emissoras de documentos puderem trabalhar com qualquer recebedor de documentos, você não precisa preencher a coluna Company Correlation ID no seu catálogo de dados Document Issuer Companies, e a busca considerará todos os possíveis pares de empresas.

Tipos de catálogo de dados

Catálogo de Dados de Empresas Emissoras do Documento

NameDescription
Issuer Company IDObtido pela detecção do emissor do documento. Identifica o emissor do documento em um sistema externo de informações.

Observação: Este é o identificador exclusivo do registro no catálogo de dados se todas as unidades de negócio da empresa usarem o mesmo banco de dados de clientes. Caso contrário, o registro no catálogo de dados é identificado exclusivamente por uma combinação de Issuer Company ID e Company Correlation ID.
Company Correlation IDIdentificador da unidade de negócio da empresa.

Observação: Se as unidades de negócio da empresa usarem bancos de dados de clientes diferentes, esta coluna do catálogo de dados deve ser preenchida, pois a chave exclusiva do registro no catálogo de dados será uma combinação de Issuer Company ID e Company Correlation ID. Para mais informações, veja Procurando um par de empresas.
Tax IDEstas colunas podem ser usadas em uma pesquisa por identificador exclusivo da empresa.
National Tax IDEstas colunas podem ser usadas em uma pesquisa por identificador exclusivo da empresa.
IBANEstas colunas podem ser usadas em uma pesquisa por identificador exclusivo da empresa.
NameEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
Postal CodeEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
StreetEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
CityEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
State or ProvinceEstas colunas não são usadas no processo de detecção de empresas. Elas só podem ser usadas para preencher os campos do documento.
CountryEstas colunas não são usadas no processo de detecção de empresas. Elas só podem ser usadas para preencher os campos do documento.
Bank AccountEstas colunas não são usadas no processo de detecção de empresas. Elas só podem ser usadas para preencher os campos do documento.
Bank CodeEstas colunas não são usadas no processo de detecção de empresas. Elas só podem ser usadas para preencher os campos do documento.

Catálogo de dados de empresas destinatárias do documento

NomeDescrição
Receiver Company IDObtido ao detectar a empresa destinatária do documento. Identifica o destinatário do documento em um sistema de informações externo. Chave exclusiva no catálogo de dados.
ID de ImpostoEsta coluna pode ser usada em uma pesquisa por identificador único de empresa.
NomeEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
CEPEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
RuaEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
CidadeEstas colunas podem ser usadas em uma pesquisa por nome e endereço da empresa.
Estado ou ProvínciaEstas colunas não são usadas no processo de detecção de empresas. Elas só podem ser usadas para preencher os campos do documento.
PaísEstas colunas não são usadas no processo de detecção de empresas. Elas só podem ser usadas para preencher os campos do documento.