Pular para o conteúdo principal

Visão geral

ABBYY Vantage permite o processamento automático de documentos com recursos inteligentes de extração. Este guia se concentra no fluxo de trabalho baseado em SFTP, que permite enviar documentos para uma pasta compartilhada e recuperar automaticamente os resultados processados. O que você vai fazer:
  • Criar e configurar uma Skill de Processo
  • Configurar o acesso SFTP para entrada e saída
  • Enviar documentos via linha de comando
  • Fazer download dos resultados da extração
Tempo para concluir: 15–20 minutos

Etapa 1: Criar uma Skill de Processo

Uma Skill de Processo é a base do seu fluxo de trabalho de processamento de documentos no Vantage.
  1. Acesse a seção Documents no ABBYY Vantage.
  2. Clique em Skill Designer na barra lateral esquerda.
  3. Selecione Process Skill na lista de tipos de skill.
Selecionando Skill de Processo
  1. Na caixa de diálogo Create Process skill, digite:
    • Skill Name: Um nome descritivo para o seu processo (por exemplo, “Process Skill Test 1”)
    • Description: Uma descrição opcional do que esta skill faz
    • Technology Core Version: 3.0 (recomendado)
Nomeando a Skill de Processo
  1. Clique em Create

Etapa 2: Configurar o fluxo de trabalho da Skill de Processo

Depois de criar sua skill, você configurará o fluxo de processamento de documentos.
  1. No Skill Designer, você verá o painel Select Process Skill à direita
  2. Escolha Simple Document skill workflow para processar um único tipo de documento
Selecting Simple Workflow Isso cria um fluxo de trabalho pré-configurado com:
  • Conector de Input: onde os documentos entram no sistema
  • Skill de OCR (Optical Character Recognition): reconhecimento óptico de caracteres
  • Skill de Extract: extração de dados
  • Conector de Output: onde os resultados são entregues
O fluxo de trabalho aparecerá na área central mostrando: Input → OCR → Extract → Output

Etapa 3: Configurar a entrada via SFTP

Configurar a atividade Input para aceitar documentos via SFTP.
  1. Clique na atividade Input no fluxo de trabalho.
  2. No painel Actions à direita, marque a opção Select additional source.
  3. Selecione a opção Shared folder.
  4. Clique em Settings para configurar.
Configurando a atividade Input

Configurar as configurações de entrada

Na caixa de diálogo Input Settings: Shared Folder: Input Settings Dialog Configurações da pasta:
  • Folder name: Input (padrão)
  • Import method: Single file
Credenciais para importação (exibidas para sua referência):
  • Folder link: .../Input
  • Exceptions folder link: .../Input-exception
  • Username: Um UUID gerado (por exemplo, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Exibida com opção de mostrar/ocultar
Observação: Copie essas credenciais — você vai precisar delas para se conectar via SFTP. Arquivos que não puderem ser importados serão movidos para a pasta de exceções. O Vantage verifica se há arquivos a cada 20 segundos após a publicação da Skill.
  1. Clique em Save.

Etapa 4: Configurar saída via SFTP

Configure a atividade Output para enviar os resultados via SFTP.
  1. Clique na atividade Output no fluxo de trabalho.
  2. No painel Actions, marque Select additional destination.
  3. Selecione o botão de opção Shared folder.
  4. Clique em Settings para configurar.
Configuring Output Activity

Configurar Output Settings

Na caixa de diálogo Output Settings: Shared Folder: Output Settings Dialog Informações:
  • Folder name: Output (padrão)
  • Folder: .../Output
  • Username: Um UUID gerado (por exemplo, 685df03c-9e22-41cb-a96f-4c408ab52735)
  • Password: Exibida com a opção de mostrar/ocultar
Dados exportados:
  • Fields (JSON): Formato de exportação padrão
Observação: Os resultados são organizados em subpastas nomeadas de acordo com o arquivo de origem e o ID da transação (por exemplo, invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82). Os arquivos são removidos automaticamente de acordo com a política de retenção de dados.
  1. Clique em Save.

Etapa 5: Configurar Skills de Extração

Defina quais tipos de documento devem ser reconhecidos e processados pela atividade Extract.
  1. Clique na atividade Extract no fluxo de trabalho.
  2. No painel Actions, você verá Skills de Documento.
Configurando Skills de Extração As Skills de Documento disponíveis incluem:
  • Invoice
  • Invoice AU-NZ
  • Invoice CA
  • Invoice ES
  • Invoice UA
  • Invoice US
  1. Selecione os tipos de documento relevantes para o seu caso de uso.
  2. Clique em Add Skill se precisar de tipos de documento adicionais.
  3. Use Edit Mapping para personalizar a extração de campos, se necessário.

Etapa 6: Publicar e obter o ID da sua Skill

Antes de usar SFTP, você precisa publicar a Skill e localizar o respectivo ID.
  1. Clique no botão Publish no canto superior direito do Skill Designer.
  2. Depois de publicada, anote o Skill ID na URL do navegador.
Obtendo o Skill ID a partir da URL O formato da URL é:
https://vantage-preview.abbyy.com/skill-editor/Processing/{skill-id}
Por exemplo: fc7116ea-ab6c-40fa-b10d-1aef61aaaa2c Aviso: Mantenha o ID da Skill à mão – você precisará dele para acessar as pastas corretas de Input e Output no SFTP.

Etapa 7: Conectar ao SFTP

Agora você está pronto para se conectar ao SFTP usando as credenciais definidas nas suas configurações de entrada/saída.

Detalhes da conexão

Nas suas configurações de Entrada/Saída, você tem:
  • Servidor: 172.172.228.138
  • Porta: 2022
  • Nome de usuário: Seu UUID gerado
  • Senha: Sua senha gerada
  • Caminho base: /{skill-id}/

Conecte-se pelo Terminal

Abra o terminal e conecte-se usando:
sftp -P 2022 {username}@172.172.228.138
Exemplo:
sftp -P 2022 [email protected]
Observação: Use -P maiúsculo para indicar o número da porta no SFTP (o -p minúsculo é usado para outra finalidade). Quando for solicitado, digite sua senha.

Etapa 8: Navegar na estrutura de pastas do SFTP

Depois de estabelecida a conexão, você verá o prompt do SFTP: sftp>

Ver Skills disponíveis

Liste todas as Skills de Processo disponíveis:
sftp> ls
Acessando pastas de Skill Você verá pastas para cada skill (identificadas pelos respectivos IDs de skill), além de:
  • Catalogs - Catálogos de Skill de Documento
  • Catalogs-exception - Importações de catálogo com falha
  • skills-import - Diretório de importação de Skills
Use o ID do skill da Etapa 6:
sftp> cd {your-skill-id}
sftp> ls
Você verá três pastas:
  • Input - Onde você carrega documentos para processamento
  • Input-exception - Importações com falha são movidas para cá
  • Output - Onde aparecem os resultados do processamento

Etapa 9: Carregar documentos para processamento

Acesse a pasta Input e carregue seus documentos.
sftp> cd Input
sftp> pwd
Remote working directory: /{skill-id}/Input

Carregar um único arquivo

Carregue um arquivo especificando o caminho completo:
sftp> put ~/Documents/Sample\ Files/Demo\ Docs/invoice_1.jpg
Ou primeiro altere o diretório local:
sftp> lcd ~/Documents/Sample\ Files/Demo\ Docs
sftp> lls
sftp> put invoice_1.jpg
Upload e download de arquivos

Carregar vários arquivos

sftp> mput *.jpg
sftp> mput invoice_*.pdf
Observação: Os arquivos enviados para Input são automaticamente excluídos após o processamento bem-sucedido (geralmente em até 20 segundos). Se você não visualizar o seu arquivo após o envio, isso significa que o Vantage já o recebeu para processamento!

Verificar o envio

Verifique se os arquivos ainda estão na pasta Input:
sftp> ls
Se a pasta estiver vazia ou seu arquivo não estiver lá, o processamento já foi iniciado.

Etapa 10: Verificar o status do processamento

Monitorar a pasta Input-exception

Se um arquivo não for importado com sucesso, ele aparecerá aqui:
sftp> cd ..
sftp> cd Input-exception
sftp> ls
Uma pasta vazia indica que todos os arquivos foram importados com sucesso.

Aguarde o processamento

O tempo de processamento varia dependendo de:
  • Complexidade do documento
  • Skills de extração configurados
  • Carga atual do sistema
Normalmente, faturas simples são processadas em 30 a 60 segundos.

Etapa 11: Baixar resultados processados

Depois que o processamento for concluído, os resultados aparecerão na pasta Output.
sftp> cd ..
sftp> cd Output
sftp> ls

Entendendo a estrutura de saída

Os resultados são organizados em subpastas com o seguinte padrão de nomenclatura:
{original-filename}-{transaction-id}
Exemplo:
invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Ver o conteúdo de uma pasta de resultados

sftp> cd invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82
sftp> ls
Conteúdo típico:
  • Invoice_US.json - Dados extraídos em formato JSON
  • Invoice_US.csv - Dados extraídos em formato CSV (se configurado)
  • Arquivos adicionais dependendo das configurações de saída

Baixar os resultados

Defina seu diretório local de download:
sftp> lcd ~/Downloads
sftp> lpwd
Local working directory: /Users/yourname/Downloads
Fazer download de um único arquivo:
sftp> get Invoice_US.json
Baixar todos os arquivos da pasta:
sftp> mget *
Faça o download de toda a pasta de resultados de forma recursiva:
sftp> cd ..
sftp> get -r invoice_1.jpg-4ac2a31b-d1b6-4231-99b2-39f00bc5df82

Entendendo a saída em JSON

A saída padrão é um arquivo JSON contendo:
  • Estrutura do documento - Disposição e organização
  • Valores de campos extraídos - Dados extraídos do documento
  • Pontuações de confiança - Confiabilidade de cada extração
  • Erros de regra - Quaisquer problemas de validação
  • Metadados de Field - Informações adicionais sobre cada campo
Exemplo de estrutura:
{
  "Document": {
    "DocumentType": "Invoice US",
    "Fields": [
      {
        "Name": "InvoiceNumber",
        "Value": "INV-12345",
        "Confidence": 0.98
      },
      {
        "Name": "Total",
        "Value": "1250.00",
        "Confidence": 0.95
      }
    ]
  }
}
Para obter a documentação detalhada do esquema JSON, consulte a documentação da ABBYY Vantage API.

Comandos SFTP úteis

ComandoDescriçãoExemplo
lsListar arquivos remotosls
llsListar arquivos locaislls
pwdMostrar diretório remotopwd
lpwdMostrar diretório locallpwd
cd folderAlterar diretório remotocd Output
lcd folderAlterar diretório locallcd ~/Downloads
put fileEnviar um único arquivoput invoice.pdf
mput filesEnviar vários arquivosmput *.jpg
get fileBaixar um único arquivoget result.json
mget filesBaixar vários arquivosmget *
get -r folderBaixar pasta recursivamenteget -r results/
exitDesconectarexit

Resolução de problemas

Problemas de conexão

Problema: erros de “Connection refused” ou de timeout Soluções:
  • Verifique se você está conectado à VPN da empresa
  • Confira o número da porta (deve ser 2022 com -P maiúsculo)
  • Confirme se seu nome de usuário e senha estão corretos
  • Teste a conectividade básica da rede: ping 172.172.228.138

Problemas no envio

Problema: Arquivos não estão sendo processados Soluções:
  • Verifique a pasta Input-exception em busca de importações com falha
  • Confirme se o formato do arquivo é suportado (PDF, JPG, PNG, TIFF, etc.)
  • Certifique-se de que a Skill de Processo está publicada
  • Verifique os limites de tamanho de arquivo (variam conforme a configuração)

Nenhum arquivo de saída

Problema: A pasta de saída está vazia após o upload Soluções:
  • Aguarde mais tempo – o processamento pode levar de 30 a 60 segundos ou mais
  • Verifique se a saída está configurada com o destino “Shared folder”
  • Verifique os logs da transação na interface web do Vantage
  • Confirme que a atividade Extract está com as Skills de Documento apropriadas configuradas

Erros de permissão

Problema: mensagem “Permission denied” ao fazer upload/download Soluções:
  • Verifique se você está usando as credenciais corretas para Input e Output
  • Credenciais de Input permitem: upload, excluir
  • Credenciais de Output permitem: visualizar, download, renomear, excluir
  • Verifique se o skill está publicado e ativo

Boas práticas

Segurança

  • Nunca compartilhe credenciais de SFTP em texto simples
  • Use canais seguros para transmitir senhas
  • Altere as credenciais periodicamente
  • Restrinja o acesso ao SFTP apenas às pessoas que precisam dele

Gerenciamento de arquivos

  • Use nomes de arquivo descritivos que incluam datas ou IDs
  • Processe arquivos em lotes fora dos horários de pico, se possível
  • Baixe e arquive os resultados o mais rápido possível
  • Remova regularmente as pastas de resultados antigos

Monitoramento

  • Verifique regularmente a pasta Input-exception em busca de importações malsucedidas
  • Monitore os tempos de processamento para identificar gargalos
  • Analise os níveis de confiança da extração nos resultados
  • Configure alertas para falhas críticas (se disponível)

Otimização do fluxo de trabalho

  • Agrupe tipos de documentos semelhantes
  • Configure as Skills de Documento apropriadas para o seu caso de uso
  • Teste com documentos de exemplo antes do uso em produção
  • Documente seu fluxo de trabalho SFTP para referência da equipe

Próximas etapas

Agora que você tem um pipeline de processamento de documentos baseado em SFTP em funcionamento:
  1. Teste com vários documentos - Carregue diferentes tipos de arquivos e variações de documentos
  2. Revise a precisão da extração - Verifique os resultados em JSON e as pontuações de confiança
  3. Personalize a extração - Use Edit Mapping para ajustar com precisão a extração de campos
  4. Automatize os uploads - Crie scripts para automatizar o envio de arquivos
  5. Integre com sistemas - Conecte seus aplicativos por meio da API REST do Vantage
  6. Escalone seu fluxo de trabalho - Adicione mais Skills de Documento ou crie Skills de Processo adicionais
Para configurações avançadas, integração com API ou fluxos de trabalho personalizados, consulte a documentação do ABBYY Vantage.

Recursos adicionais

  • REST API Documentation: Para envio programático de arquivos e recuperação de resultados
  • Skill Catalog: Navegue pelas skills de documento pré-configuradas
  • Support: Entre em contato com o suporte da ABBYY para obter assistência técnica

Resumo

Você concluiu com sucesso:
  • ✅ Criou uma Skill de Processo no ABBYY Vantage
  • ✅ Configurou o acesso SFTP para entrada e saída
  • ✅ Configurou skills de extração de documentos
  • ✅ Conectou-se via linha de comando SFTP
  • ✅ Enviou documentos para processamento
  • ✅ Baixou os resultados de extração
Seu pipeline de processamento de documentos agora está operacional e pronto para uso em produção!