Como Extrair Dados Usando Atividades Baseadas em Prompt no Advanced Designer

Visão geral

A extração baseada em prompt permite usar instruções em linguagem natural para extrair dados estruturados de documentos usando LLMs. Em vez de treinar modelos tradicionais de machine learning, você descreve quais dados deseja extrair e como eles devem ser formatados, e o LLM realiza a extração com base em suas instruções. O que você fará:

Criar uma atividade de extração baseada em prompt
Configurar uma conexão com um LLM
Escrever prompts de extração eficazes
Definir o formato e a estrutura de saída
Aplicar nível de rigor e regras de validação
Testar e aprimorar sua extração

Tempo para concluir: 20–30 minutos Casos de uso:

Extração de informações de Fornecedor a partir de faturas
Captura de dados de documentos em nível de cabeçalho
Processamento de documentos semiestruturados
Documentos com layouts variáveis

Pré-requisitos

Antes de começar, certifique-se de que você tenha:

Acesso ao ABBYY Vantage Advanced Designer
Uma conexão LLM configurada (consulte Como configurar conexões LLM)
Uma Skill de Documento com documentos de exemplo carregados
Conhecimento básico da estrutura do JSON
Definições de campos para os dados que você deseja extrair

Observação: Este guia se concentra na extração em nível de cabeçalho. As funcionalidades de extração de tabelas podem variar.

Entendendo a extração baseada em prompts

O que é Extração Baseada em Prompt?

A extração baseada em prompt usa LLMs para entender e extrair dados de documentos com base em instruções em linguagem natural. Você define:

Role: O papel que o LLM deve desempenhar (por exemplo, “modelo de extração de dados”)
Instructions: Como extrair e formatar os dados
Output Structure: O formato JSON exato para os resultados
Rules: Diretrizes para lidar com dados ambíguos ou ausentes

Benefícios

Nenhum dado de treinamento é necessário: Funciona apenas com engenharia de prompts
Flexível: Fácil de adicionar ou modificar campos
Lida com variações: LLMs conseguem entender diferentes formatos de documento
Configuração rápida: Mais rápido do que treinar modelos tradicionais de aprendizado de máquina
Linguagem natural: Escreva instruções em inglês simples

Limitações

Custo: Cada extração usa chamadas à API de LLM
Velocidade: Mais lenta que a extração tradicional para documentos simples
Consistência: Os resultados podem variar ligeiramente entre diferentes execuções
Limites de contexto: Documentos muito longos podem exigir tratamento especial

Etapa 1: Adicionar uma Atividade Baseada em Prompt

Crie uma nova atividade de extração baseada em prompt na sua Skill de Documento.

Abra sua Skill de Documento no ABBYY Vantage Advanced Designer
No painel esquerdo, localize EXTRACT FROM TEXT (NLP)
Encontre e clique em Prompt-based

Selecionando atividade baseada em prompt

A atividade aparece no canvas do seu fluxo de trabalho
Conecte-a entre as atividades de entrada e saída

Observação: As atividades baseadas em prompt são encontradas em “EXTRACT FROM TEXT (NLP)” no painel Activities, junto com outros métodos de extração, como Named Entities (NER) e Deep Learning.

Etapa 2: Configurar a conexão de LLM

Selecione qual conexão de LLM será usada pela atividade.

Selecione a atividade baseada em prompt no seu fluxo de trabalho
No painel Activity Properties à direita, localize LLM Connection
Clique no menu suspenso

Selecione, na lista, a conexão de LLM que você configurou
- Exemplo: Nick-ChatGPT, Microsoft Foundry, Production GPT-4
Verifique se a conexão está selecionada

Observação: Se você não vir nenhuma conexão listada, será necessário configurar primeiro uma conexão de LLM em Configuration → Connections.

Etapa 3: Definir campos de saída

Configure os campos que você deseja extrair antes de escrever o prompt.

No painel Activity Properties, localize a seção Output
Você verá uma lista hierárquica de grupos de campos e campos
Neste exemplo, estamos extraindo informações do Fornecedor:
- Fornecedor
  - Name
  - Address
  - TaxID
  - Número da conta
  - Sort Code
  - IBAN
  - BIC_SWIFT
- Unidade de negócio
  - Name
  - Address
  - Data da fatura
  - Número da fatura
- Totais
  - Montante líquido

Clique no botão Activity Editor para começar a configurar o prompt

Observação: Defina todos os campos antes de escrever o prompt. Os nomes dos campos serão referenciados na estrutura do prompt.

Etapa 4: Definir a Função

Defina qual função o LLM deve exercer ao processar documentos.

No Activity Editor, você verá a interface Prompt Text
Comece pela seção ROLE:

FUNÇÃO

Você é um modelo de extração de dados. Extraia apenas os campos relacionados ao fornecedor especificados de um documento. Extraia o texto do valor exatamente como está (não o rótulo). Não infira nem reformate nenhum dado. Omita qualquer campo que não esteja claramente presente.

Instruções principais para o papel:

Seja específico: “data extraction model” informa ao LLM seu propósito
Defina o escopo: “vendor-related fields” limita o que extrair
Defina expectativas: “value text verbatim” evita reformatar
Trate dados ausentes: “Omit any field that is not clearly present”

Melhores práticas:

Mantenha o papel claro e conciso
Use declarações no imperativo (“Extract”, “Do not infer”)
Seja explícito sobre o que NÃO fazer
Defina como lidar com casos de borda

Etapa 5: Definir o Formato de Saída

Especifique a estrutura JSON exata para os resultados da extração.

Abaixo da seção ROLE, adicione o título OUTPUT FORMAT
Defina a estrutura JSON:

OUTPUT FORMAT

Return one valid JSON object using this exact structure:

{
  "Fields": [
    { "FieldName": Vendor.Name, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Address, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.TaxID, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Account Number, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Sort Code, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.IBAN, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.BIC_SWIFT, "Text": "...", "Line": <FirstLineIndex> }
  ]
}

Componentes da estrutura:

FieldName: Deve corresponder exatamente às definições dos seus campos (por exemplo, Vendor.Name)
Text: O valor extraído como uma string
Line: Índice de linha baseado em zero em que o valor aparece no documento

Observações importantes:

Use exatamente os nomes de campo da sua configuração de Output
Inclua todos os campos, mesmo que alguns estejam vazios
A estrutura deve ser um JSON válido
Os números de linha ajudam na verificação e na solução de problemas

Etapa 6: Adicionar regras de extração específicas para cada Field

Forneça instruções detalhadas para extrair cada campo. Abaixo de OUTPUT FORMAT, adicione regras específicas para cada tipo de campo:

VENDOR NAME
1) Recognize names like "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extract the complete company name including legal suffixes (Ltd, Inc, GmbH, etc.).
3) Vendor name typically appears near the top of the document.

VENDOR ADDRESS
1) Extract the complete address including street, city, postal code.
2) For multiline addresses, represent each new line using "\n".
3) Vendor-side only; exclude customer/buyer addresses.

NÚMERO DA CONTA
1) Reconheça "Account Number", "Account No", "Acct #".
2) Extraia o formato numérico exatamente como impresso (por exemplo, "12-34-56" ou "500 105 17").
3) Somente contas do fornecedor (por exemplo, seções "Beneficiary" ou "Vendor Payment").
4) Ignore IBAN — ele possui seu próprio campo.

SORT CODE
1) Recognize "Sort Code", "Sort No.", "BLZ", "Bankleitzahl".
2) Extract the numeric format exactly as printed (e.g., "12-34-56" or "500 105 17").
3) Vendor-side data only; ignore payer/buyer codes.

IBAN
1) Recognize "IBAN", "International Bank Account Number".
2) Extract the full IBAN exactly as printed (include spaces).
3) Vendor-side only, typically under "Bankverbindung", "Coordonnées bancaires", "Payment Details", or "Beneficiary Bank".

BIC_SWIFT
1) Recognize "BIC", "SWIFT", or "BIC/SWIFT".
2) Extract the complete identifier (usually 8 or 11 uppercase letters/numbers).
3) Vendor-side only, near the IBAN or bank name.
4) Exclude customer/payer data.

Estrutura das regras:

Padrões de reconhecimento: liste rótulos alternativos para cada campo
Especificações de formato: descreva o formato exato a ser extraído
Dicas de localização: onde normalmente encontrar os dados
Exclusões: o que NÃO deve ser extraído

Práticas recomendadas:

Numere suas regras para maior clareza
Forneça diversas variações de rótulo
Especifique a origem dos dados (lado do fornecedor vs. lado do cliente)
Inclua exemplos de formato entre parênteses
Seja explícito sobre campos relacionados (por exemplo, “Ignore o IBAN — ele tem seu próprio campo”)

Etapa 7: Aplicar Regras de Rigor

Adicione regras de validação para garantir a qualidade e a consistência dos dados. Ao final do seu prompt, adicione uma seção STRICTNESS:

STRICTNESS
- Never generate or infer values.
- Omit ambiguous or missing fields.
- If none of the vendor fields are found, return:
  {
    "Fields": []
  }

Regras adicionais de rigor (opcional):

REGRAS GERAIS
- Extraia exatamente um valor por campo.
- Ignore qualquer campo que não possa ser localizado com segurança — omita-o da saída.
- "FieldName" deve corresponder exatamente aos nomes acima.
- "Text" deve ser copiado literalmente do documento — sem normalização ou inferência.
- Para valores de múltiplas linhas (por exemplo, endereços), represente cada nova linha usando a sequência de escape "\n" (uma barra invertida seguida pela letra n).
- Não insira tags HTML como <br> no texto de saída.
- "Line" é o índice baseado em zero da primeira linha que contém o valor extraído; inclua-o apenas se verificável.

Por que o Rigor é Importante:

Evita alucinações: LLMs podem gerar dados plausíveis, porém incorretos
Garante consistência: Regras claras reduzem a variação entre execuções
Lida com dados ausentes: Define o que fazer quando campos não são encontrados
Mantém a integridade dos dados: Extração literal preserva a formatação original

Princípios-Chave de Rigor:

Nunca gerar dados que não estejam no documento
Omitir extrações incertas em vez de adivinhar
Retornar uma estrutura vazia se nenhum campo for encontrado
Usar exatamente os mesmos nomes de campos
Preservar a formatação original do texto

Etapa 8: Selecionar formato do documento

Escolha qual representação do documento enviar para o LLM.

No Activity Editor, localize a lista suspensa Prompt
Você verá opções de como o documento será fornecido ao LLM

Formatos disponíveis:

PDF: Arquivo PDF original
- Use para: Documentos em que o layout é crítico
- Considerações: Arquivo de tamanho maior; alguns LLMs têm suporte limitado a PDF
Plain Text: Extração de texto sem formatação
- Use para: Documentos simples, somente texto
- Considerações: Perde toda a formatação e as informações de layout
Annotated Text ⭐ (Recomendado)
- Use para: A maioria dos tipos de documento
- Considerações: Preserva a estrutura, embora seja baseado em texto
- Benefícios: Melhor equilíbrio entre estrutura e desempenho
Formatted Text: Texto com formatação básica preservada
- Use para: Documentos em que alguma formatação é importante
- Considerações: Meio-termo entre Plain e Annotated

Selecione Annotated Text para obter os melhores resultados

Observação: Com base em testes, constatou-se que Annotated Text oferece os resultados mais consistentes e confiáveis para tarefas de extração. Ele preserva a estrutura do documento enquanto é processado de forma eficiente pelos LLMs.

Etapa 9: Teste sua extração

Execute a atividade em documentos de exemplo para verificar os resultados.

Executar a Activity

Feche o Activity Editor
Navegue até a guia All Documents
Selecione um documento de teste
Clique no botão Test Activity ou Run

Aguarde o LLM processar o documento
- Tempo de processamento: normalmente de 5 a 30 segundos, dependendo da complexidade do documento
- Você verá um indicador de carregamento enquanto aguarda a resposta da API

Revisar resultados

Quando o processamento for concluído:

A interface muda para a Predictive view
Revise o painel Output, que exibe os campos extraídos
Clique em cada campo para ver:
- Valor extraído
- Confiança (se disponível)
- Região destacada na imagem do documento

O que verificar:

✅ Todos os campos esperados estão preenchidos
✅ Os valores correspondem exatamente ao documento
✅ Não há dados alucinados ou inferidos
✅ Tratamento adequado de campos multilinha
✅ Campos ausentes são omitidos (não são preenchidos com dados incorretos)

Padrões comuns de resultados

Extração bem-sucedida:

{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 },
    { "FieldName": "Vendor.Address", "Text": "123 Business Street\nLondon SW1A 1AA", "Line": 5 },
    { "FieldName": "Vendor.IBAN", "Text": "GB29 NWBK 6016 1331 9268 19", "Line": 15 }
  ]
}

Extração parcial (com alguns campos faltando):

{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 }
  ]
}

Nenhum Field encontrado:

{
  "Fields": []
}

Etapa 10: Aprimore seu prompt

Baseie-se nos resultados dos testes para aprimorar seu prompt.

Problemas Comuns e Soluções

Problema: o LLM extrai o campo incorreto

Solução: Adicione indicações de localização mais específicas
Exemplo: “Apenas do lado do Fornecedor; exclua os endereços do cliente/comprador”

Problema: a formatação é alterada

Solução: Reforce a extração literal
Exemplo: “Extraia o formato numérico exatamente como impresso (por exemplo, ‘12-34-56’)”

Problema: o LLM inventa dados

Solução: Reforce as regras de rigor
Exemplo: “Nunca gere ou infira valores. Omita se não estiver presente.”

Problema: campos multilinha são concatenados

Solução: Especifique as sequências de escape
Exemplo: “Para valores multilinha, use \n para quebras de linha”

Problema: nomes de campo incorretos na saída

Solução: Verifique se os nomes de campo correspondem exatamente
Exemplo: Use Vendor.Account Number e não AccountNumber

Processo iterativo de melhoria

Teste com vários documentos: Não otimize para um único exemplo
Documente os padrões: Anote quais regras funcionam e quais precisam de refinamento
Adicione exemplos específicos: Inclua exemplos de formatos entre parênteses
Refine o nível de rigor: Ajuste com base em padrões de extração excessiva ou insuficiente
Teste casos-limite: Experimente documentos com campos ausentes e layouts incomuns

Antes:

VENDOR NAME
1) Extract the vendor name from the document.

Depois:

NOME DO FORNECEDOR
1) Reconheça nomes como "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extraia o nome completo da empresa, incluindo sufixos legais (Ltd, Inc, GmbH, etc.).
3) O nome do fornecedor normalmente aparece próximo ao topo do documento.
4) Exclua nomes de clientes/compradores - foque na entidade que emite a nota fiscal.

Compreendendo o processo de extração

Como funciona a extração baseada em prompts

Conversão do documento: Seu documento é convertido para o formato selecionado (Annotated Text recomendado)
Montagem do prompt: Seu papel, o formato de saída, as regras de campo e as regras de estrita observância são combinados
Chamada de API: O prompt e o documento são enviados para o LLM por meio da sua conexão
Processamento pelo LLM: O LLM lê o documento e extrai os dados de acordo com suas instruções
Resposta JSON: O LLM retorna dados estruturados no formato JSON especificado
Mapeamento de campos: O Vantage mapeia a resposta JSON para os campos de saída que você definiu
Verificação: Números de linha e escores de confiança (se fornecidos) ajudam a verificar a precisão

Uso de tokens e custos

Fatores que afetam o custo:

Tamanho do documento: Documentos mais longos usam mais tokens
Complexidade do prompt: Prompts detalhados aumentam a contagem de tokens
Escolha do formato: Annotated Text é geralmente mais eficiente do que PDF
Número de campos: Mais campos = prompts mais longos

Dicas de otimização:

Use uma linguagem clara e concisa nos prompts
Não duplique instruções
Remova exemplos desnecessários
Considere agrupar campos para dados relacionados

Melhores práticas

Criação de prompts

Faça:

✅ Use instruções claras, no imperativo (“Extract”, “Recognize”, “Omit”)
✅ Forneça várias opções de rótulo para cada campo
✅ Inclua exemplos de formato entre parênteses
✅ Especifique o que NÃO deve ser extraído (exclusões)
✅ Numere suas regras para facilitar a referência
✅ Use uma terminologia consistente em todo o texto

Não faça:

❌ Usar instruções vagas (“get the name”)
❌ Presumir que o LLM conhece convenções específicas do domínio
❌ Escrever frases excessivamente longas e complexas
❌ Entrar em contradição em seções diferentes
❌ Ignorar regras de rigor (strictness)

Definições de campos

Instruções eficazes para campos:

Comece com padrões de reconhecimento (rótulos alternativos)
Especifique o formato exato a ser preservado
Forneça indicações de localização (posicionamento típico)
Defina a responsabilidade sobre os dados (fornecedor vs. cliente)
Inclua o tratamento de valores em várias linhas
Faça referência a campos relacionados para evitar confusão

Exemplo:

IBAN
1) Reconheça "IBAN", "International Bank Account Number".
2) Extraia o IBAN completo exatamente como impresso (inclua espaços).
3) Apenas do lado do Fornecedor, normalmente em "Bankverbindung", "Detalhes de Pagamento".
4) NÃO confunda com Número da Conta — o IBAN é mais longo e alfanumérico.

Estratégia de testes

Comece com documentos simples: Teste primeiro a extração básica
Amplie para variações: Experimente diferentes layouts e formatos
Teste casos limite: Campos ausentes, posições incomuns, múltiplas correspondências
Registre as falhas: Mantenha exemplos de onde a extração falha
Itere de forma sistemática: Altere um elemento de cada vez

Otimização de desempenho

Para velocidade:

Mantenha os prompts concisos
Use o formato Annotated Text
Minimize o número de campos por atividade
Considere dividir documentos complexos

Para precisão:

Forneça regras abrangentes para campos
Inclua exemplos de formato
Adicione regras de validação mais rígidas
Teste com amostras de documentos diversos

Para custo:

Otimize o comprimento do prompt
Use formatos de documento eficientes
Armazene em cache os resultados quando apropriado
Monitore o uso de tokens no painel do provedor de LLM

Solução de problemas

Problemas de Extração

Problema: Campos estão vazios apesar de haver dados Soluções:

Verifique se a grafia do nome do campo corresponde exatamente
Verifique se os dados estão no formato de documento selecionado
Adicione mais variações de rótulos aos padrões de reconhecimento
Reduza o rigor temporariamente para ver se o LLM encontra os dados
Verifique se a qualidade do documento afeta a extração de OCR/texto

Problema: O LLM extrai dados do cliente em vez de dados do fornecedor Soluções:

Reforce as especificações do lado do fornecedor
Adicione exclusões explícitas para dados de cliente/comprador
Forneça dicas de localização (por exemplo, “topo do documento”, “seção do emissor”)
Inclua exemplos de extração correta vs. incorreta

Problema: Valores multilinha são concatenados ou ficam malformados Soluções:

Especifique explicitamente o formato da sequência de escape (\n)
Forneça exemplos de saída multilinha correta
Verifique se o formato do documento preserva as quebras de linha
Adicione a instrução: “Preserve as quebras de linha originais usando \n”

Problema: O LLM reformata ou normaliza os dados Soluções:

Enfatize “verbatim” e “exatamente como impresso”
Adicione uma regra rígida: “Sem normalização ou inferência”
Forneça exemplos específicos mostrando a preservação da formatação
Inclua exemplos negativos: “Não ‘12-34-56’, mantenha como ‘12 34 56‘“

Problemas de desempenho

Problema: A extração está muito lenta Soluções:

Altere para o formato Annotated Text se estiver usando PDF
Simplifique o prompt sem perder instruções essenciais
Reduza a resolução do documento se as imagens forem muito grandes
Verifique o status do provedor de LLM e os limites de requisições
Considere usar um modelo mais rápido para documentos simples

Problema: Resultados inconsistentes entre execuções Soluções:

Torne as regras de validação mais rígidas
Torne as instruções mais específicas e sem ambiguidades
Adicione mais exemplos de formato
Reduza a complexidade do prompt que possa levar a diferentes interpretações
Teste com configurações de temperature mais altas (se disponível na integração)

Problema: Custos de API elevados Soluções:

Otimize o tamanho do prompt
Use Annotated Text em vez de PDF
Processe documentos em lotes fora do horário de pico
Considere usar modelos menores/mais baratos para documentos simples
Monitore e configure alertas de orçamento no painel do provedor de LLM

Técnicas avançadas

Extração condicional

Você pode instruir o LLM a extrair determinados campos apenas se determinadas condições forem satisfeitas:

NÚMERO DA CONTA (CONDICIONAL)
1) Extrair somente se o documento contiver detalhes de pagamento bancário.
2) Se "Método de pagamento: Cheque" ou similar aparecer, omitir este campo.
3) Reconhecer "Account Number", "Account No", "Acct #".

Suporte multilíngue

A extração baseada em prompts funciona bem com documentos multilíngues:

NOME DO FORNECEDOR (MULTILÍNGUE)
1) Reconhecer em inglês: "Vendor Name", "Supplier", "Seller"
2) Reconhecer em alemão: "Verkäufer", "Lieferant", "Anbieter"
3) Reconhecer em francês: "Fournisseur", "Vendeur"
4) Extrair o nome completo da empresa independentemente do idioma.

Regras de validação

Adicione lógica de validação aos prompts:

IBAN (COM VALIDAÇÃO)
1) Extraia o IBAN completo exatamente como está impresso.
2) Verifique se ele começa com um código de país de 2 letras.
3) Se o formato não corresponder ao padrão IBAN, omita o campo.
4) Não invente dígitos de verificação nem códigos de país.

Relações entre campos

Especifique como os campos se relacionam:

ACCOUNT NUMBER vs IBAN
- Account Number: Usually shorter, numeric, domestic format
- IBAN: Alphanumeric, starts with country code (e.g., "GB29 NWBK...")
- If both are present, extract both to separate fields
- If only one is present, extract to the appropriate field
- Do not duplicate the same value in both fields

Limitações e considerações

Capacidades atuais

Com suporte:

✅ Extração de campo em nível de cabeçalho
✅ Valores de linha única e multilinha
✅ Vários campos por documento
✅ Lógica de extração condicional
✅ Documentos em vários idiomas
✅ Layouts de documentos variáveis

Com suporte limitado ou sem suporte:

⚠️ Extração de tabelas (varia conforme a implementação)
⚠️ Estruturas complexas aninhadas
⚠️ Documentos muito grandes (limites de tokens)
⚠️ Processamento em tempo real (latência da API)
⚠️ Garantia de resultados determinísticos

Quando usar a extração baseada em prompt

Melhor para:

Documentos com layouts variáveis
Documentos semiestruturados
Prototipagem e testes rápidos
Pequenos a médios volumes de documentos
Quando não há dados de treinamento disponíveis
Processamento de documentos em vários idiomas

Considere alternativas para:

Produção em grande volume (ML tradicional pode ser mais rápido)
Formulários altamente estruturados (extração baseada em templates)
Aplicações sensíveis a custos (métodos tradicionais podem ser mais baratos)
Aplicações com requisitos críticos de latência (APIs de LLMs têm atraso de rede)
Requisitos de processamento offline (os métodos tradicionais não exigem conexão à internet)

Integração com Skills de Documento

Usando Dados Extraídos

Quando a extração for concluída, os dados dos campos ficam disponíveis em todo o seu Skill de Documento:

Atividades de Validação: Aplicar regras de negócio aos valores extraídos
Atividades de Script: Processar ou transformar dados extraídos
Atividades de Exportação: Enviar dados para sistemas externos
Interface de Revisão: Verificação manual dos campos extraídos

Combinar com outras atividades

A extração baseada em prompts pode ser usada em conjunto com outras atividades:

Workflow Example:
Classification (identify document type)
OCR (extract text)
Prompt-based extraction (extract structured data)
Validation rules (verify data quality)
Script (format for export)
Output (deliver results)

Mapeamento de campos

Os campos JSON extraídos são mapeados automaticamente para os campos de saída que você definiu:

"FieldName": "Vendor.Name" → É mapeado para o campo de saída Vendor.Name
A hierarquia de campos é preservada na estrutura de saída
Os números de linha ajudam na verificação e solução de problemas

Resumo

Você concluiu com sucesso:

✅ Criou uma atividade de extração baseada em prompt
✅ Configurou uma conexão com um LLM
✅ Escreveu um prompt de extração abrangente com papel, formato e regras
✅ Selecionou o formato de documento ideal (Annotated Text)
✅ Aplicou regras de rigor para garantir a qualidade dos dados
✅ Testou a extração e revisou os resultados
✅ Aprendeu práticas recomendadas para engenharia de prompts

Principais conclusões:

A extração baseada em prompt usa instruções em linguagem natural
O formato Annotated Text oferece os melhores resultados
Prompts claros e específicos produzem extrações consistentes
Regras de rigor evitam alucinações e mantêm a qualidade dos dados
Testes e refinamentos iterativos melhoram a precisão

Sua atividade de extração baseada em prompt agora está pronta para o processamento de documentos!

Próximas etapas

Teste com documentos variados: Valide em diferentes layouts e variações
Refine seus prompts: Melhore continuamente com base nos resultados
Monitore os custos: Acompanhe o uso de tokens no painel do seu provedor de LLM
Otimize o desempenho: Ajuste seus prompts para obter mais velocidade e precisão
Explore a extração de tabelas: Experimente extrair itens (se houver suporte)
Integre com fluxos de trabalho: Combine com outras atividades para um processamento completo

Recursos adicionais

Documentação do ABBYY Vantage Advanced Designer: https://docs.abbyy.com
Guia de configuração de conexões com LLM: Como configurar conexões com LLM
Boas práticas de engenharia de prompts (Prompt Engineering): Consulte a documentação do provedor de LLM que você utiliza
Suporte: Entre em contato com o suporte da ABBYY para obter assistência técnica

Perguntas frequentes

P: Qual é a diferença entre extração baseada em prompt e extração tradicional? R: A extração baseada em prompt usa instruções em linguagem natural de um LLM sem dados de treinamento. Os métodos tradicionais exigem exemplos de treinamento, mas são mais rápidos e mais econômicos em grande escala. P: Posso extrair tabelas com atividades baseadas em prompt? R: A extração em nível de cabeçalho é bem suportada. Os recursos de extração de tabelas podem variar e exigir estruturas de prompt específicas. P: Por que usar Annotated Text em vez de PDF? R: Annotated Text oferece o melhor equilíbrio entre preservação da estrutura e eficiência de processamento. Esse formato se mostrou o mais confiável nos testes. P: Como reduzo os custos de API? R: Otimize o tamanho do prompt, use o formato Annotated Text, processe de forma eficiente e monitore o uso de tokens no painel do provedor de LLM. P: O que acontece se minha conexão com o LLM falhar? R: Verifique o status da conexão em Configuration → Connections. Teste a conexão, verifique as credenciais e confirme se sua cota de API não foi excedida. P: Posso usar várias conexões de LLM em uma única Skill? R: Sim, atividades diferentes podem usar conexões diferentes. Isso permite que você use modelos distintos para diferentes tarefas de extração. P: Como faço para lidar com documentos em vários idiomas? R: Adicione variações de rótulos multilíngues às suas regras de campo. Em geral, LLMs lidam bem com conteúdo multilíngue. P: Qual é o tamanho máximo do documento? R: Isso depende dos limites de tokens do seu provedor de LLM. Documentos muito longos podem precisar ser divididos ou processados em seções.

Sobre

Início rápido

​Visão geral

​Pré-requisitos

​Entendendo a extração baseada em prompts

​O que é Extração Baseada em Prompt?

​Benefícios

​Limitações

​Etapa 1: Adicionar uma Atividade Baseada em Prompt

​Etapa 2: Configurar a conexão de LLM

​Etapa 3: Definir campos de saída

​Etapa 4: Definir a Função

​Etapa 5: Definir o Formato de Saída

​Etapa 6: Adicionar regras de extração específicas para cada Field

​Etapa 7: Aplicar Regras de Rigor

​Etapa 8: Selecionar formato do documento

​Etapa 9: Teste sua extração

​Executar a Activity

​Revisar resultados

​Padrões comuns de resultados

​Etapa 10: Aprimore seu prompt

​Problemas Comuns e Soluções

​Processo iterativo de melhoria

​Exemplos de melhorias

​Compreendendo o processo de extração

​Como funciona a extração baseada em prompts

​Uso de tokens e custos

​Melhores práticas

​Criação de prompts

​Definições de campos

​Estratégia de testes

​Otimização de desempenho

​Solução de problemas

​Problemas de Extração

​Problemas de desempenho

​Técnicas avançadas

​Extração condicional

​Suporte multilíngue

​Regras de validação

​Relações entre campos

​Limitações e considerações

​Capacidades atuais

​Quando usar a extração baseada em prompt

​Integração com Skills de Documento

​Usando Dados Extraídos

​Combinar com outras atividades

​Mapeamento de campos

​Resumo

​Próximas etapas

​Recursos adicionais

​Perguntas frequentes