Saltar al contenido principal

Descripción general

La extracción basada en prompts te permite usar instrucciones en lenguaje natural para extraer datos estructurados de documentos utilizando LLM. En lugar de entrenar modelos tradicionales de aprendizaje automático, describes qué datos quieres extraer y cómo deben estar formateados, y el LLM se encarga de la extracción según tus instrucciones. Lo que lograrás:
  • Crear una actividad de extracción basada en prompts
  • Configurar una conexión con un LLM
  • Redactar prompts de extracción eficaces
  • Definir el formato y la estructura de salida
  • Aplicar nivel de rigurosidad y Reglas de Validación
  • Probar y perfeccionar tu extracción
Tiempo estimado para completar: 20-30 minutos Casos de uso:
  • Extracción de información del proveedor a partir de facturas
  • Captura de datos del documento a nivel de encabezado
  • Procesamiento de documentos semiestructurados
  • Documentos con diseños variables

Requisitos previos

Antes de comenzar, asegúrate de tener:
  1. Acceso a ABBYY Vantage Advanced Designer
  2. Una conexión LLM configurada (consulta Cómo configurar conexiones LLM)
  3. Un Skill de documento con documentos de muestra cargados
  4. Comprensión básica de la estructura JSON
  5. Definiciones de campos para los datos que quieres extraer
Nota: Esta guía se centra en la extracción a nivel de encabezado. Las capacidades de extracción de tablas pueden variar.

Comprender la extracción basada en prompts

¿Qué es la extracción basada en prompts?

La extracción basada en prompts utiliza LLM para comprender y extraer datos de documentos a partir de instrucciones en lenguaje natural. Usted define:
  • Rol: Qué papel debe asumir el LLM (por ejemplo, «modelo de extracción de datos»)
  • Instrucciones: Cómo extraer y dar formato a los datos
  • Estructura de salida: El formato JSON exacto de los resultados
  • Reglas: Directrices para manejar datos ambiguos o faltantes

Ventajas

  • No se requieren datos de entrenamiento: Funciona únicamente mediante ingeniería de prompts
  • Flexible: Fácil de añadir o modificar campos
  • Soporta variaciones: Los LLM pueden comprender diferentes formatos de documentos
  • Configuración rápida: Más rápido que entrenar modelos de ML tradicionales
  • Lenguaje natural: Permite escribir instrucciones en inglés sencillo

Limitaciones

  • Costo: Cada extracción realiza llamadas a la API de LLM
  • Velocidad: Más lenta que la extracción tradicional para documentos simples
  • Consistencia: Los resultados pueden variar ligeramente entre ejecuciones
  • Límites de contexto: Es posible que los documentos muy largos requieran un tratamiento especial

Paso 1: Agregar una actividad basada en prompts

Cree una nueva actividad de extracción basada en prompts en su Skill de documento.
  1. Abra su Skill de documento en ABBYY Vantage Advanced Designer
  2. En el panel izquierdo, localice EXTRACT FROM TEXT (NLP)
  3. Busque y haga clic en Prompt-based
Selección de actividad basada en prompts
  1. La actividad aparece en el lienzo de su flujo de trabajo
  2. Conéctela entre sus actividades de entrada y salida
Nota: Las actividades basadas en prompts se encuentran en “EXTRACT FROM TEXT (NLP)” en el panel de Activities, junto con otros métodos de extracción como Named Entities (NER) y Deep Learning.

Paso 2: Configurar la conexión LLM

Seleccione qué conexión LLM debe utilizar la actividad.
  1. Seleccione la actividad basada en prompts en su flujo de trabajo
  2. En el panel Activity Properties a la derecha, busque LLM Connection
  3. Haga clic en el menú desplegable
Configuring LLM Connection
  1. Seleccione su conexión LLM configurada de la lista
    • Ejemplo: Nick-ChatGPT, Microsoft Foundry, Production GPT-4
  2. Verifique que la conexión esté seleccionada
Nota: Si no ve ninguna conexión en la lista, primero debe configurar una conexión LLM desde Configuration → Connections.

Paso 3: Definir campos de salida

Configure los campos que desea extraer antes de redactar su prompt.
  1. En el panel Activity Properties, busque la sección Output
  2. Verá una lista jerárquica de grupos de campos y campos individuales
  3. En este ejemplo, estamos extrayendo información del proveedor:
    • Proveedor
      • Name
      • Address
      • TaxID
      • Número de cuenta
      • Sort Code
      • IBAN
      • BIC_SWIFT
    • Business Unit
      • Name
      • Address
      • Fecha de la factura
      • Número de factura
    • Totals
      • Monto neto
Estructura de salida de campos
  1. Haga clic en el botón Activity Editor para comenzar a configurar el prompt
Nota: Defina todos los campos antes de redactar su prompt. Los nombres de los campos se utilizarán como referencia en la estructura del prompt.

Paso 4: Redactar la definición del rol

Defina qué función debe desempeñar el LLM al procesar documentos.
  1. En el Activity Editor, verá la interfaz Prompt Text
  2. Comience con la sección ROLE:
ROL

Eres un modelo de extracción de datos. Extrae únicamente los campos relacionados 
con el proveedor especificados de un documento. Extrae el texto del valor tal cual 
(no la etiqueta). No infiera ni reformatee ningún dato. Omite cualquier campo que no 
esté claramente presente.
Editor de texto del prompt Instrucciones clave sobre el rol:
  • Sea específico: “data extraction model” indica al LLM cuál es su propósito
  • Defina el alcance: “vendor-related fields” limita qué se debe extraer
  • Establezca expectativas: “value text verbatim” evita el reformateo
  • Gestione la ausencia de datos: “Omit any field that is not clearly present”
Mejores prácticas:
  • Mantenga el rol claro y conciso
  • Use enunciados imperativos (“Extract”, “Do not infer”)
  • Sea explícito sobre lo que NO se debe hacer
  • Defina cómo manejar los casos límite

Paso 5: Definir el formato de salida

Especifique la estructura JSON precisa para los resultados de la extracción.
  1. Debajo de la sección ROLE, agregue el encabezado OUTPUT FORMAT
  2. Defina la estructura JSON:
OUTPUT FORMAT

Return one valid JSON object using this exact structure:

{
  "Fields": [
    { "FieldName": Vendor.Name, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Address, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.TaxID, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Account Number, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Sort Code, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.IBAN, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.BIC_SWIFT, "Text": "...", "Line": <FirstLineIndex> }
  ]
}
JSON Output Format Componentes de la estructura:
  • FieldName: Debe coincidir exactamente con las definiciones de campos (por ejemplo, Vendor.Name)
  • Text: El valor extraído como una cadena
  • Line: Índice de línea con base 0 donde el valor aparece en el documento
Notas importantes:
  • Usar los nombres de campo exactos de la configuración de Output
  • Incluir todos los campos, incluso si algunos pueden estar vacíos
  • La estructura debe ser JSON válido
  • Los números de línea ayudan con la verificación y el diagnóstico de problemas

Paso 6: Agregar reglas de extracción específicas por Field

Proporcione instrucciones detalladas para extraer cada campo. Debajo de OUTPUT FORMAT, agregue reglas específicas para cada tipo de campo:
VENDOR NAME
1) Recognize names like "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extract the complete company name including legal suffixes (Ltd, Inc, GmbH, etc.).
3) Vendor name typically appears near the top of the document.

VENDOR ADDRESS
1) Extract the complete address including street, city, postal code.
2) For multiline addresses, represent each new line using "\n".
3) Vendor-side only; exclude customer/buyer addresses.

NÚMERO DE CUENTA
1) Reconozca "Account Number", "Account No", "Acct #", "Número de Cuenta", "Nº de Cuenta".
2) Extraiga el formato numérico exactamente como aparece impreso (p. ej., "12-34-56" o "500 105 17").
3) Solo cuentas del proveedor (p. ej., secciones "Beneficiary" o "Vendor Payment").
4) Ignore IBAN: tiene su propio campo.

SORT CODE
1) Recognize "Sort Code", "Sort No.", "BLZ", "Bankleitzahl".
2) Extract the numeric format exactly as printed (e.g., "12-34-56" or "500 105 17").
3) Vendor-side data only; ignore payer/buyer codes.

IBAN
1) Recognize "IBAN", "International Bank Account Number".
2) Extract the full IBAN exactly as printed (include spaces).
3) Vendor-side only, typically under "Bankverbindung", "Coordonnées bancaires", "Payment Details", or "Beneficiary Bank".

BIC_SWIFT
1) Recognize "BIC", "SWIFT", or "BIC/SWIFT".
2) Extract the complete identifier (usually 8 or 11 uppercase letters/numbers).
3) Vendor-side only, near the IBAN or bank name.
4) Exclude customer/payer data.
Extraction Rules Estructura de las reglas:
  • Patrones de reconocimiento: Enumera etiquetas alternativas para cada campo
  • Especificaciones de formato: Describe el formato exacto que se debe extraer
  • Indicaciones de ubicación: Dónde se suele encontrar el dato
  • Exclusiones: Qué NO se debe extraer
Buenas prácticas:
  • Numera tus reglas para mayor claridad
  • Proporciona distintas variantes de etiqueta
  • Especifica la propiedad de los datos (del lado del proveedor vs. del lado del cliente)
  • Incluye ejemplos de formato entre paréntesis
  • Sé explícito sobre los campos relacionados (por ejemplo, “Ignora el IBAN: tiene su propio campo”)

Paso 7: Aplicar reglas de estrictitud

Agregue Reglas de Validación para garantizar la calidad y la consistencia de los datos. Al final de su prompt, agregue una sección STRICTNESS:
STRICTNESS
- Never generate or infer values.
- Omit ambiguous or missing fields.
- If none of the vendor fields are found, return:
  {
    "Fields": []
  }
Reglas de rigor Reglas adicionales de rigor (opcional):
REGLAS GENERALES
- Extraiga exactamente un valor por campo.
- Omita cualquier campo que no pueda ubicarse con certeza — exclúyalo de la salida.
- "FieldName" debe coincidir exactamente con los nombres indicados arriba.
- "Text" debe copiarse textualmente del documento — sin normalización ni inferencia.
- Para valores de varias líneas (por ejemplo, direcciones), represente cada línea nueva usando la secuencia de escape "\n" (una barra invertida seguida de la letra n).
- No inserte etiquetas HTML como <br> en el texto de salida.
- "Line" es el índice basado en 0 de la primera línea que contiene el valor extraído; inclúyalo solo si es verificable.
Por qué es importante el rigor:
  • Evita alucinaciones: Los LLM pueden generar datos plausibles pero incorrectos
  • Garantiza la consistencia: Reglas claras reducen la variación entre ejecuciones
  • Gestiona datos faltantes: Define qué hacer cuando no se encuentran campos
  • Mantiene la integridad de los datos: La extracción literal preserva el formato original
Principios clave de rigor:
  • Nunca generar datos que no estén en el documento
  • Omitir extracciones inciertas en lugar de adivinar
  • Devolver una estructura vacía si no se encuentran campos
  • Hacer que los nombres de los campos coincidan exactamente
  • Conservar el formato original del texto

Paso 8: Seleccionar el formato de documento

Elija qué representación del documento enviar al LLM.
  1. En el Activity Editor, busque la lista desplegable Prompt
  2. Verá opciones sobre cómo se proporciona el documento al LLM
Opciones de formato de documento Formatos disponibles:
  • PDF: Archivo PDF original
    • Úselo para: Documentos en los que el diseño es fundamental
    • Consideraciones: Tamaño de archivo mayor; algunos LLM tienen compatibilidad limitada con PDF
  • Texto sin formato: Extracción de texto sin formato
    • Úselo para: Documentos sencillos solo de texto
    • Consideraciones: Se pierde todo el formato y la información de diseño
  • Texto anotado ⭐ (recomendado)
    • Úselo para: La mayoría de los tipos de documentos
    • Consideraciones: Conserva la estructura aunque se base en texto
    • Ventajas: Mejor equilibrio entre estructura y rendimiento
  • Texto con formato: Texto con formato básico conservado
    • Úselo para: Documentos en los que parte del formato es importante
    • Consideraciones: Punto intermedio entre texto sin formato y texto anotado
  1. Seleccione Texto anotado para obtener los mejores resultados
Nota: Según las pruebas realizadas, se ha comprobado que Texto anotado ofrece los resultados más uniformes y fiables para las tareas de extracción. Conserva la estructura del documento y, al mismo tiempo, se procesa de forma eficiente mediante LLM.

Paso 9: Pruebe la extracción

Ejecute la actividad con documentos de ejemplo para verificar los resultados.

Ejecutar la Activity

  1. Cierre el Activity Editor
  2. Vaya a la pestaña All Documents
  3. Seleccione un documento de prueba
  4. Haga clic en Test Activity o en el botón Run
Testing Activity
  1. Espere a que el LLM termine de procesar el documento
    • Tiempo de procesamiento: por lo general de 5 a 30 segundos, según la complejidad del documento
    • Verá un indicador de carga mientras espera la respuesta de la API

Revisión de resultados

Una vez que finalice el procesamiento:
  1. La interfaz cambia a Predictive view
  2. Revisa el panel de Output que muestra los campos extraídos
  3. Haz clic en cada campo para ver:
    • Valor extraído
    • Nivel de confianza (si se proporciona)
    • Región resaltada en la imagen del documento
Revisión de resultados Qué verificar:
  • ✅ Todos los campos esperados están completados
  • ✅ Los valores coinciden exactamente con el documento
  • ✅ No hay datos inventados o inferidos
  • ✅ Correcto manejo de campos multilínea
  • ✅ Los campos que faltan se omiten (no se completan con datos incorrectos)

Patrones de resultados habituales

Extracción satisfactoria:
{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 },
    { "FieldName": "Vendor.Address", "Text": "123 Business Street\nLondon SW1A 1AA", "Line": 5 },
    { "FieldName": "Vendor.IBAN", "Text": "GB29 NWBK 6016 1331 9268 19", "Line": 15 }
  ]
}
Extracción parcial (faltan algunos campos):
{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 }
  ]
}
No se encontraron Fields:
{
  "Fields": []
}

Paso 10: Perfecciona tu prompt

Itera tu prompt en función de los resultados de las pruebas.

Problemas comunes y soluciones

Problema: el LLM extrae el campo incorrecto
  • Solución: Agrega indicaciones de ubicación más específicas
  • Ejemplo: “Solo en la parte del Proveedor; excluye las direcciones del cliente/comprador”
Problema: el formato se modifica
  • Solución: Destaca que la extracción debe ser literal
  • Ejemplo: “Extrae el formato numérico exactamente como está impreso (p. ej., ‘12-34-56’)”
Problema: el LLM inventa datos
  • Solución: Refuerza las reglas de estrictitud
  • Ejemplo: “Nunca generes ni infieras valores. Omite si no están presentes.”
Problema: los campos multilínea se concatenan
  • Solución: Especifica las secuencias de escape
  • Ejemplo: “Para valores multilínea, usa \n para los saltos de línea”
Problema: nombres de campos incorrectos en la salida
  • Solución: Verifica que los nombres de campos coincidan exactamente
  • Ejemplo: Usa Vendor.Account Number y no AccountNumber

Proceso de mejora iterativa

  1. Pruebe con múltiples documentos: No optimice pensando solo en un único ejemplo
  2. Documente los patrones: Tome nota de qué reglas funcionan y cuáles necesitan refinamiento
  3. Agregue ejemplos específicos: Incluya ejemplos de formato entre paréntesis
  4. Refine el grado de estrictitud: Ajústelo según los patrones de sobreextracción o subextracción
  5. Pruebe casos límite: Use documentos con campos ausentes y diseños poco habituales

Ejemplos de mejoras

Antes:
VENDOR NAME
1) Extract the vendor name from the document.
Después:
NOMBRE DEL PROVEEDOR
1) Reconocer nombres como "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extraer el nombre completo de la empresa, incluyendo sufijos legales (Ltd, Inc, GmbH, etc.).
3) El nombre del proveedor suele aparecer cerca de la parte superior del documento.
4) Excluir nombres de clientes/compradores; centrarse en la entidad que emite la factura.

Descripción del proceso de extracción

Cómo funciona la extracción basada en prompts

  1. Conversión del documento: Su documento se convierte al formato seleccionado (se recomienda Annotated Text)
  2. Construcción del prompt: Se combinan su rol, el formato de salida, las reglas de campos y las reglas de rigor
  3. Llamada a la API: El prompt y el documento se envían al LLM a través de su conexión
  4. Procesamiento del LLM: El LLM lee el documento y extrae los datos según sus instrucciones
  5. Respuesta JSON: El LLM devuelve datos estructurados en el formato JSON especificado
  6. Asignación de campos: Vantage asigna la respuesta JSON a sus campos de salida definidos
  7. Verificación: Los números de línea y las puntuaciones de confianza (si se proporcionan) ayudan a verificar la exactitud

Uso de tokens y costos

Factores que afectan el costo:
  • Longitud del documento: Los documentos más largos usan más tokens
  • Complejidad del prompt: Los prompts más detallados aumentan la cantidad de tokens
  • Elección de formato: Annotated Text suele ser más eficiente que PDF
  • Número de campos: Más campos = prompts más largos
Recomendaciones de optimización:
  • Usa un lenguaje conciso pero claro en los prompts
  • No repitas las instrucciones
  • Elimina ejemplos innecesarios
  • Considera agrupar campos para datos relacionados

Mejores prácticas

Redacción de prompts

Haz:
  • ✅ Usar enunciados claros en modo imperativo (“Extraer”, “Reconocer”, “Omitir”)
  • ✅ Proporcionar múltiples variantes de etiqueta para cada campo
  • ✅ Incluir ejemplos de formato entre paréntesis
  • ✅ Especificar qué NO se debe extraer (exclusiones)
  • ✅ Numerar las reglas para facilitar su referencia
  • ✅ Usar terminología consistente en todo el prompt
No hagas:
  • ❌ Usar instrucciones vagas (“obtener el nombre”)
  • ❌ Suponer que el LLM conoce las convenciones específicas del dominio
  • ❌ Escribir oraciones demasiado largas y complejas
  • ❌ Contradecirte en diferentes secciones
  • ❌ Omitir las reglas sobre el nivel de estrictitud

Definiciones de campos

Instrucciones eficaces para campos:
  • Comience con patrones de reconocimiento (etiquetas alternativas)
  • Especifique el formato exacto que se debe conservar
  • Proporcione indicaciones de ubicación (posición típica)
  • Defina la propiedad de los datos (Proveedor vs. cliente)
  • Incluya el tratamiento de valores de varias líneas
  • Haga referencia a campos relacionados para evitar confusiones
Ejemplo:
IBAN
1) Reconocer "IBAN", "International Bank Account Number".
2) Extraer el IBAN completo exactamente como aparece impreso (incluir espacios).
3) Solo del lado del Proveedor, normalmente bajo "Bankverbindung", "Detalles de pago".
4) NO confundir con Número de cuenta: el IBAN es más largo y alfanumérico.

Estrategia de pruebas

  1. Comience con documentos simples: Pruebe primero la extracción básica
  2. Amplíe a variaciones: Pruebe con diferentes diseños y formatos
  3. Pruebe casos límite: Campos faltantes, posiciones inusuales, múltiples coincidencias
  4. Documente los errores: Conserve ejemplos de dónde falla la extracción
  5. Itére de forma sistemática: Cambie una sola cosa a la vez

Optimización del rendimiento

Para mejorar la velocidad:
  • Mantén los prompts concisos
  • Usa el formato Annotated Text
  • Reduce al mínimo el número de campos por actividad
  • Considera dividir los documentos complejos
Para mejorar la precisión:
  • Define reglas completas para cada campo
  • Incluye ejemplos de formato
  • Añade reglas de validación estrictas
  • Prueba con muestras de documentos variadas
Para reducir costes:
  • Optimiza la longitud del prompt
  • Usa formatos de documento eficientes
  • Almacena en caché los resultados cuando sea adecuado
  • Supervisa el consumo de tokens desde el panel de control del proveedor de LLM

Resolución de problemas

Problemas de extracción

Problema: Los campos están vacíos a pesar de que los datos están presentes Soluciones:
  • Compruebe que el nombre del campo esté escrito exactamente igual
  • Verifique que los datos estén en el formato de documento seleccionado
  • Añada más variantes de etiquetas a los patrones de reconocimiento
  • Reduzca temporalmente el nivel de estrictitud para comprobar si el LLM lo encuentra
  • Compruebe si la calidad del documento afecta a la extracción mediante Reconocimiento óptico de caracteres (OCR) o text
Problema: El LLM extrae datos del cliente en lugar de datos del proveedor Soluciones:
  • Refuerce las especificaciones para los datos del proveedor
  • Agregue exclusiones explícitas para los datos del cliente/comprador
  • Proporcione indicaciones de ubicación (por ejemplo, “parte superior del documento”, “sección del emisor”)
  • Incluya ejemplos de extracción correcta frente a incorrecta
Problema: Los valores de varias líneas se concatenan o quedan mal formados Soluciones:
  • Especifique explícitamente el formato de la secuencia de escape (\n)
  • Proporcione ejemplos de salida multilínea correcta
  • Verifique que el formato del documento conserve los saltos de línea
  • Agregue la instrucción: “Conserve los saltos de línea originales usando \n
Problema: El LLM reformatea o normaliza los datos Soluciones:
  • Haga hincapié en “verbatim” y “exactamente como impreso”
  • Agregue una regla estricta: “Sin normalización ni inferencias”
  • Proporcione ejemplos específicos que muestren la preservación del formato
  • Incluya ejemplos negativos: “No ‘12-34-56’, mantener como ‘12 34 56‘“

Problemas de rendimiento

Problema: La extracción es demasiado lenta Soluciones:
  • Cambie al formato Annotated Text si está utilizando PDF
  • Simplifique el prompt sin perder instrucciones críticas
  • Reduzca la resolución del documento si las imágenes son muy grandes
  • Verifique el estado del proveedor de LLM y los límites de uso
  • Considere usar un modelo más rápido para documentos simples
Problema: Resultados inconsistentes entre ejecuciones Soluciones:
  • Refuerce las reglas de estrictitud
  • Haga que las instrucciones sean más específicas e inequívocas
  • Agregue más ejemplos de formato
  • Reduzca la complejidad del prompt que pueda dar lugar a interpretaciones
  • Pruebe con ajustes de temperatura más altos (si están disponibles en la conexión)
Problema: Costos de API elevados Soluciones:
  • Optimice la longitud del prompt
  • Use Annotated Text en lugar de PDF
  • Procese documentos por lotes fuera de las horas pico
  • Considere usar modelos más pequeños o más económicos para documentos simples
  • Supervise y configure alertas de presupuesto en el panel del proveedor de LLM

Técnicas avanzadas

Extracción condicional

Puede indicar al LLM que extraiga campos específicos solo si se cumplen determinadas condiciones:
NÚMERO DE CUENTA (CONDICIONAL)
1) Extraer únicamente si el documento contiene detalles de pago bancario.
2) Si aparece "Forma de pago: Cheque" o similar, omitir este campo.
3) Reconocer "Account Number", "Account No", "Acct #".

Compatibilidad con varios idiomas

La extracción basada en prompts funciona bien con documentos en varios idiomas:
VENDOR NAME (MULTI-LANGUAGE)
1) Recognize in English: "Vendor Name", "Supplier", "Seller"
2) Recognize in German: "Verkäufer", "Lieferant", "Anbieter"
3) Recognize in French: "Fournisseur", "Vendeur"
4) Extract the complete company name regardless of language.

Reglas de Validación

Agregue lógica de validación a sus prompts:
IBAN (CON VALIDACIÓN)
1) Extraiga el IBAN completo exactamente como aparece impreso.
2) Verifique que comience con un código de país de 2 letras.
3) Si el formato no coincide con el patrón de IBAN, omita el campo.
4) No invente dígitos de verificación ni códigos de país.

Relaciones entre campos

Especifique cómo se relacionan los campos:
ACCOUNT NUMBER vs IBAN
- Account Number: Usually shorter, numeric, domestic format
- IBAN: Alphanumeric, starts with country code (e.g., "GB29 NWBK...")
- If both are present, extract both to separate fields
- If only one is present, extract to the appropriate field
- Do not duplicate the same value in both fields

Limitaciones y consideraciones

Capacidades actuales

Funciones disponibles:
  • ✅ Extracción de campos a nivel de encabezado
  • ✅ Valores de una y varias líneas
  • ✅ Varios campos por documento
  • ✅ Lógica de extracción condicional
  • ✅ Documentos en varios idiomas
  • ✅ Diseños de documento variables
Limitadas o no disponibles:
  • ⚠️ Extracción de tablas (varía según la implementación)
  • ⚠️ Estructuras complejas anidadas
  • ⚠️ Documentos muy grandes (límite de tokens)
  • ⚠️ Procesamiento en tiempo real (latencia de la API)
  • ⚠️ Garantía de resultados deterministas

Cuándo usar la extracción basada en prompts

Ideal para:
  • Documentos con diseños variables
  • Documentos semiestructurados
  • Prototipado y pruebas rápidas
  • Volúmenes de documentos de pequeños a medianos
  • Cuando no se dispone de datos de entrenamiento
  • Procesamiento de documentos en varios idiomas
Considere alternativas para:
  • Producción de alto volumen (el ML tradicional puede ser más rápido)
  • Formularios altamente estructurados (extracción basada en plantillas)
  • Aplicaciones sensibles al costo (los métodos tradicionales pueden ser más económicos)
  • Aplicaciones con requisitos estrictos de latencia (las API de LLM tienen retraso de red)
  • Requisitos de procesamiento sin conexión (los métodos tradicionales no necesitan internet)

Integración con Skills de documento

Uso de los datos extraídos

Una vez completada la extracción, los datos de los campos están disponibles en toda la Skill de documento:
  1. Actividades de validación: aplicar reglas de negocio a los valores extraídos
  2. Actividades de script: procesar o transformar los datos extraídos
  3. Actividades de exportación: enviar datos a sistemas externos
  4. Interfaz de revisión: verificación manual de los campos extraídos

Combinación con otras actividades

La extracción basada en prompts puede utilizarse junto con otras actividades:
Workflow Example:
1. Classification (identify document type)
2. OCR (extract text)
3. Prompt-based extraction (extract structured data)
4. Validation rules (verify data quality)
5. Script (format for export)
6. Output (deliver results)

Asignación de campos

Los campos JSON extraídos se asignan automáticamente a sus campos de salida definidos:
  • "FieldName": "Vendor.Name" → Se asigna al campo de salida Vendor.Name
  • La jerarquía de campos se conserva en la estructura de salida
  • Los números de línea ayudan con la verificación y la solución de problemas

Resumen

Has realizado correctamente lo siguiente:
  • ✅ Crear una actividad de extracción basada en prompts
  • ✅ Configurar una conexión LLM
  • ✅ Redactar un prompt de extracción completo con rol, formato y reglas
  • ✅ Seleccionar el formato de documento óptimo (Annotated Text)
  • ✅ Aplicar reglas estrictas para la calidad de los datos
  • ✅ Probar la extracción y revisar los resultados
  • ✅ Aprender las prácticas recomendadas para la ingeniería de prompts
Puntos clave:
  • La extracción basada en prompts utiliza instrucciones en lenguaje natural
  • El formato Annotated Text ofrece los mejores resultados
  • Prompts claros y específicos producen una extracción consistente
  • Las reglas estrictas evitan alucinaciones y mantienen la calidad de los datos
  • Las pruebas iterativas y su posterior perfeccionamiento mejoran la precisión
¡Tu actividad de extracción basada en prompts ya está lista para el procesamiento de documentos!

Próximos pasos

  1. Pruebe con documentos diversos: Valide distintos diseños y variaciones
  2. Refine sus prompts: Mejórelos de forma continua en función de los resultados
  3. Supervise los costos: Haga un seguimiento del uso de tokens en el panel de control de su proveedor de LLM
  4. Optimice el rendimiento: Ajuste los prompts para mejorar la velocidad y la precisión
  5. Explore la extracción de tablas: Experimente con la extracción de Partidas (si está disponible)
  6. Intégrelo en sus flujos de trabajo: Combínelo con otras actividades para lograr un procesamiento completo

Recursos adicionales

  • Documentación de ABBYY Vantage Advanced Designer: https://docs.abbyy.com
  • Guía de configuración de conexiones LLM: Cómo configurar conexiones LLM
  • Mejores prácticas de ingeniería de prompts: Consulte la documentación de su proveedor de LLM
  • Soporte: Póngase en contacto con el soporte técnico de ABBYY para obtener asistencia

Preguntas frecuentes

P: ¿Cuál es la diferencia entre la extracción basada en prompts y la extracción tradicional? R: La extracción basada en prompts utiliza instrucciones en lenguaje natural para LLM sin necesidad de datos de entrenamiento. Los métodos tradicionales requieren ejemplos de entrenamiento, pero son más rápidos y rentables a gran escala. P: ¿Puedo extraer tablas con actividades basadas en prompts? R: La extracción a nivel de encabezado está bien soportada. Las capacidades de extracción de tablas pueden variar y requerir estructuras de prompt específicas. P: ¿Por qué usar Annotated Text en lugar de PDF? R: Annotated Text ofrece el mejor equilibrio entre preservación de la estructura y eficiencia de procesamiento. Las pruebas han demostrado que es la opción más fiable. P: ¿Cómo reduzco los costos de la API? R: Optimice la longitud del prompt, use el formato Annotated Text, procese de forma eficiente y supervise el uso de tokens desde el panel de control de su proveedor de LLM. P: ¿Qué pasa si falla mi conexión LLM? R: Verifique el estado de su conexión en Configuration → Connections. Pruebe la conexión, confirme las credenciales y asegúrese de que no se haya superado su cuota de API. P: ¿Puedo usar múltiples conexiones LLM en una sola Habilidad? R: Sí, diferentes actividades pueden usar conexiones distintas. Esto le permite usar distintos modelos para diferentes tareas de extracción. P: ¿Cómo gestiono documentos en varios idiomas? R: Añada variaciones de etiquetas en varios idiomas a sus reglas de campo. Los LLM generalmente manejan bien el contenido multilingüe. P: ¿Cuál es el tamaño máximo de documento? R: Depende de los límites de tokens de su proveedor de LLM. Es posible que los documentos muy largos deban dividirse o procesarse por secciones.