Pular para o conteúdo principal

Visão geral

ABBYY Vantage possibilita o processamento automático de documentos com recursos inteligentes de extração. Este guia se concentra no fluxo de trabalho baseado em SFTP, que permite enviar documentos para uma pasta compartilhada e recuperar automaticamente os resultados processados. O que você vai fazer:
  • Criar e configurar uma Skill de Processo
  • Configurar o acesso SFTP para entrada e saída
  • Enviar documentos por linha de comando
  • Baixar os resultados de extração
Tempo para concluir: 15–20 minutos

Etapa 1: Criar uma Skill de Processo

Uma Skill de Processo é a base do seu fluxo de trabalho de processamento de documentos no Vantage.
  1. Acesse a seção Documents no ABBYY Vantage.
  2. Clique em Skill Designer na barra lateral esquerda.
  3. Selecione Skill de Processo entre os tipos de skill.
Selecionando Skill de Processo
  1. Na caixa de diálogo Create Process skill, insira:
    • Skill Name: Um nome descritivo para o seu processo (por exemplo, “Teste de Skill de Processo 1”)
    • Description: Descrição opcional do que essa skill faz
    • Technology Core Version: 3.0 (recomendado)
Nomeando a Skill de Processo
  1. Clique em Create

Etapa 2: Configurar o workflow da Skill de Processo

Depois de criar sua skill, você configurará o fluxo de processamento de documentos.
  1. No Skill Designer, você verá o painel Select Process Skill à direita
  2. Escolha Simple Document skill workflow para processar um único tipo de documento
Selecting Simple Workflow Isso cria um workflow pré-configurado com:
  • Conector Input: Onde os documentos entram no sistema
  • Skill de OCR (Optical Character Recognition): Reconhecimento óptico de caracteres
  • Skill de Extract: Extração de dados
  • Conector Output: Onde os resultados são entregues
O workflow aparecerá no canvas central exibindo: Input → OCR → Extract → Output

Etapa 3: Configurar a entrada via SFTP

Configure a atividade Input para aceitar documentos via SFTP.
  1. Clique na atividade Input no fluxo de trabalho.
  2. No painel Actions à direita, marque Select additional source.
  3. Selecione a opção Shared folder.
  4. Clique em Settings para configurar.
Configurando a atividade Input

Configurar as definições de entrada

Na caixa de diálogo Input Settings: Shared Folder: Input Settings Dialog Configurações da pasta:
  • Folder name: Input (padrão)
  • Import method: Single file
Credenciais para importação (exibidas para sua utilização):
  • Folder link: .../Input
  • Exceptions folder link: .../Input-exception
  • Username: Um UUID gerado (por exemplo, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Exibida com opção de mostrar/ocultar
Observação: Copie essas credenciais, pois você precisará delas para se conectar via SFTP. Arquivos que não puderem ser importados serão movidos para a pasta de exceções. O Vantage verifica se há arquivos a cada 20 segundos após a publicação da Skill.
  1. Clique em Save.

Etapa 4: Configurar Output via SFTP

Configure a atividade Output para entregar os resultados via SFTP.
  1. Clique na atividade Output no fluxo de trabalho.
  2. No painel Actions, marque Select additional destination.
  3. Selecione o botão de rádio Shared folder.
  4. Clique em Settings para configurar.
Configuring Output Activity

Configurar as opções de saída

Na caixa de diálogo Output Settings: Shared Folder: Output Settings Dialog Informações:
  • Folder name: Output (padrão)
  • Folder: .../Output
  • Username: Um UUID gerado automaticamente (por exemplo, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: A senha é exibida, com opção de mostrar/ocultar
Dados exportados:
  • Fields (JSON): Formato de exportação padrão
Observação: Os resultados são organizados em subpastas nomeadas com base no arquivo de origem e no ID da transação (por exemplo, invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). Os arquivos são removidos automaticamente de acordo com a política de retenção de dados.
  1. Clique em Save.

Etapa 5: Configurar Skills de Extração

Defina quais tipos de documento a atividade Extract deve reconhecer e processar.
  1. Clique na atividade Extract no fluxo de trabalho.
  2. No painel Actions, você verá Document Skills.
Configurando Skills de Extração As Skills de Documento disponíveis incluem:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Selecione os tipos de documento relevantes para o seu caso de uso.
  2. Clique em Add Skill se precisar de tipos de documento adicionais.
  3. Use Edit Mapping para personalizar a extração de campos, se necessário.

Etapa 6: Publicar e obter o ID da sua Skill

Antes de usar o SFTP, você precisa publicar a Skill e localizar o respectivo ID.
  1. Clique no botão Publish no canto superior direito do Skill Designer.
  2. Depois de publicada, anote o Skill ID na URL do navegador.
Obtendo o Skill ID a partir da URL O formato da URL é:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Por exemplo: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Aviso: Mantenha o ID da sua Skill em mãos – você vai precisar dele para acessar as pastas corretas de entrada e saída no SFTP.

Etapa 7: Conectar ao SFTP

Agora você está pronto para se conectar via SFTP usando as credenciais das configurações de Entrada/Saída.

Detalhes da conexão

Em suas configurações de Input/Output, você tem:
  • Server: 172.172.228.138
  • Port: 2022
  • Username: Seu UUID gerado
  • Password: Sua senha gerada
  • Base Path: /{skill-id}/

Conectar via Terminal

Abra o terminal e conecte-se usando:
sftp -P 2022 {username}@172.172.228.138
Exemplo:
sftp -P 2022 [email protected]
Observação: Use -P maiúsculo para o número da porta no SFTP (-p minúsculo é usado para outra finalidade). Quando solicitado, digite sua senha.

Etapa 8: Navegar pela estrutura de pastas do SFTP

Depois de conectado, você verá o prompt do SFTP: sftp>

Exibir Skills Disponíveis

Liste todas as Skills de Processo disponíveis:
sftp> ls
Acessando pastas de Skills Você verá pastas para cada skill (identificadas pelos respectivos IDs de skill), além de:
  • Catalogs - Catálogos de Skill de Documento
  • Catalogs-exception - Importações de catálogos com falha
  • skills-import - Diretório de importação de skills
Use o ID do Skill da Etapa 6:
sftp> cd {your-skill-id}
sftp> ls
Você deverá ver três pastas:
  • Input - Onde você envia documentos para processamento
  • Input-exception - Importações com falha são movidas para cá
  • Output - Onde os resultados processados são exibidos

Etapa 9: Enviar documentos para processamento

Acesse a pasta Input e envie seus documentos.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

Carregar um único arquivo

Carregue um arquivo informando o caminho completo:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
Ou, primeiro, altere o diretório local:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Upload e download de arquivos

Carregar vários arquivos

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Observação: Os arquivos enviados para o Input são automaticamente excluídos após o processamento bem-sucedido (geralmente em até 20 segundos). Se você não encontrar o seu arquivo depois de fazer o upload, isso significa que o Vantage já o colocou em processamento!

Verificar envio

Verifique se os arquivos ainda estão na pasta Input:
sftp> ls
Se a pasta estiver vazia ou se o seu arquivo não estiver lá, o processamento já foi iniciado.

Etapa 10: Verificar o status do processamento

Monitorar a pasta de exceções de entrada

Se um arquivo falhar na importação, ele aparecerá aqui:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Uma pasta vazia indica que todos os arquivos foram importados com sucesso.

Aguarde o processamento

O tempo de processamento varia dependendo de:
  • Complexidade do documento
  • Skills de extração configuradas
  • Carga atual do sistema
Normalmente, faturas simples são processadas em 30–60 segundos.

Etapa 11: Baixar resultados processados

Quando o processamento for concluído, os resultados aparecerão na pasta Output.
sftp> cd ..
sftp> cd Output
sftp> ls

Compreendendo a estrutura dos resultados

Os resultados são organizados em subpastas com o seguinte padrão de nomenclatura:
{original-filename}-{transaction-id}
Exemplo:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Exibir o conteúdo da pasta de resultados

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Conteúdo típico:
  • Invoice_US.json - Dados extraídos em formato JSON
  • Invoice_US.csv - Dados extraídos em formato CSV (se configurado)
  • Arquivos adicionais, dependendo das configurações de saída

Fazer download dos resultados

Defina o diretório local para download:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Baixar um único arquivo:
sftp> get Invoice_US.json
Baixe todos os arquivos da pasta:
sftp> mget *
Baixar toda a pasta de resultados de forma recursiva:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Entendendo a saída JSON

A saída padrão é um arquivo JSON que contém:
  • Estrutura do documento - Layout e organização
  • Valores de campos extraídos - Dados obtidos do documento
  • Níveis de confiança - Confiabilidade de cada extração
  • Erros de regra - Quaisquer problemas de validação
  • Metadados de campos - Informações adicionais sobre cada campo
Estrutura de exemplo:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Para obter a documentação detalhada do esquema JSON, consulte a documentação da ABBYY Vantage API.

Comandos SFTP úteis

ComandoDescriçãoExemplo
lsListar arquivos remotosls
llsListar arquivos locaislls
pwdMostrar diretório remotopwd
lpwdMostrar diretório locallpwd
cd folderAlterar diretório remotocd Output
lcd folderAlterar diretório locallcd ~/Downloads
put fileEnviar um único arquivoput invoice.pdf
mput filesEnviar vários arquivosmput *.jpg
get fileBaixar um único arquivoget result.json
mget filesBaixar vários arquivosmget *
get -r folderBaixar pasta de forma recursivaget -r results/
exitDesconectarexit

Solução de problemas

Problemas de conexão

Problema: erros de “Connection refused” ou de tempo limite (timeout) Soluções:
  • Verifique se você está conectado à VPN da empresa
  • Confira o número da porta (deve ser 2022 com a opção -P em maiúsculo)
  • Confirme se seu nome de usuário e senha estão corretos
  • Teste a conectividade básica da rede: ping 172.172.228.138

Problemas de carregamento

Problema: Arquivos não estão sendo processados Soluções:
  • Verifique a pasta Input-exception em busca de importações com falha
  • Verifique se o formato do arquivo é suportado (PDF, JPG, PNG, TIFF, etc.)
  • Certifique-se de que o Skill de Processo está publicado
  • Verifique os limites de tamanho de arquivo (varia conforme a configuração)

Nenhum arquivo de saída

Problema: A pasta de saída fica vazia após o envio dos arquivos Soluções:
  • Aguarde mais tempo – o processamento pode levar de 30 a 60 segundos ou mais
  • Verifique se o Output está configurado com o destino “Shared folder”
  • Verifique os logs da transação na interface web do Vantage
  • Confirme se a atividade Extract tem as skills de documento apropriadas configuradas

Erros de permissão

Problema: “Permissão negada” ao enviar/baixar Soluções:
  • Verifique se você está usando as credenciais corretas para Input e Output
  • As credenciais de Input permitem: upload e exclusão
  • As credenciais de Output permitem: visualização, download, renomear e exclusão
  • Verifique se a skill está publicada e ativa

Práticas recomendadas

Segurança

  • Nunca compartilhe credenciais de SFTP em texto aberto
  • Use canais seguros para transmitir senhas
  • Altere as credenciais periodicamente
  • Limite o acesso SFTP apenas ao pessoal necessário

Gerenciamento de arquivos

  • Use nomes de arquivo descritivos que incluam datas ou IDs
  • Processe arquivos em lotes fora do horário de pico, se possível
  • Baixe e arquive os resultados o quanto antes
  • Limpe regularmente as pastas de resultados antigos

Monitoramento

  • Verifique regularmente a pasta Input-exception para identificar falhas de importação
  • Monitore os tempos de processamento para identificar gargalos
  • Revise os níveis de confiança da extração nos resultados
  • Configure alertas para falhas críticas (se disponível)

Otimização do fluxo de trabalho

  • Agrupe tipos de documentos semelhantes
  • Configure Skills de Documento apropriadas para o seu caso de uso
  • Teste com documentos de exemplo antes do uso em produção
  • Documente seu fluxo de trabalho SFTP para referência da equipe

Próximas etapas

Agora que você tem um pipeline de processamento de documentos baseado em SFTP em funcionamento:
  1. Teste com vários documentos - Carregue diferentes tipos de arquivo e variações de documentos
  2. Verifique a precisão da extração - Analise os resultados em JSON e as pontuações de confiança
  3. Personalize a extração - Use Edit Mapping para ajustar com precisão a extração de campos
  4. Automatize os uploads - Crie scripts para automatizar o envio de arquivos
  5. Integre com sistemas - Conecte seus aplicativos por meio da API REST do Vantage
  6. Expanda seu fluxo de trabalho - Adicione mais Skills de Documento ou crie Skills de Processo adicionais
Para configurações avançadas, integração via API ou fluxos de trabalho personalizados, consulte a documentação do ABBYY Vantage.

Recursos adicionais

  • REST API Documentation: Para upload de arquivos via API e recuperação de resultados
  • Skill Catalog: Navegue por Skills de Documento predefinidas
  • Suporte: Entre em contato com o suporte da ABBYY para obter assistência técnica

Resumo

Você concluiu com sucesso:
  • ✅ Criou uma Skill de Processo no ABBYY Vantage
  • ✅ Configurou o acesso SFTP para entrada e saída
  • ✅ Configurou Skills de extração de documentos
  • ✅ Conectou-se via linha de comando do SFTP
  • ✅ Enviou documentos para processamento
  • ✅ Baixou os resultados de extração
Seu pipeline de processamento de documentos agora está operacional e pronto para uso em produção!