Saltar al contenido principal

Descripción general

La extracción basada en prompts permite usar instrucciones en lenguaje natural para extraer datos estructurados de documentos con LLM. En lugar de entrenar modelos tradicionales de aprendizaje automático, usted describe qué datos desea extraer y cómo deben estar formateados, y el LLM se encarga de la extracción según sus instrucciones. Lo que va a lograr:
  • Crear una actividad de extracción basada en prompts
  • Configurar una conexión con un LLM
  • Redactar prompts de extracción eficaces
  • Definir el formato y la estructura de salida
  • Definir el nivel de rigor y las Reglas de Validación
  • Probar y perfeccionar su extracción
Tiempo para completar: 20-30 minutos Casos de uso:
  • Extracción de información del Proveedor a partir de facturas
  • Captura de datos de documentos a nivel de encabezado
  • Procesamiento de documentos semiestructurados
  • Documentos con diseños variables

Requisitos previos

Antes de comenzar, asegúrate de tener:
  1. Acceso a ABBYY Vantage Advanced Designer
  2. Una conexión LLM configurada (consulta Cómo configurar conexiones LLM)
  3. Una Skill de documento con documentos de ejemplo cargados
  4. Conocimientos básicos de la estructura JSON
  5. Definiciones de campos para los datos que deseas extraer
Nota: Esta guía se centra en la extracción a nivel de encabezado. Las capacidades de extracción de tablas pueden variar.

Comprender la extracción basada en prompts

¿Qué es la extracción basada en prompts?

La extracción basada en prompts utiliza LLMs para comprender y extraer datos de documentos a partir de instrucciones en lenguaje natural. Usted define:
  • Rol: Cómo debe actuar el LLM (por ejemplo, “modelo de extracción de datos”)
  • Instrucciones: Cómo extraer y formatear los datos
  • Estructura de salida: El formato JSON exacto de los resultados
  • Reglas: Directrices para manejar datos ambiguos o ausentes

Beneficios

  • No se requieren datos de entrenamiento: Funciona únicamente con ingeniería de prompts
  • Flexible: Es fácil agregar o modificar campos
  • Maneja variaciones: Los LLM pueden comprender diferentes formatos de documentos
  • Configuración rápida: Más rápido que entrenar modelos tradicionales de aprendizaje automático (ML)
  • Lenguaje natural: Escribe las instrucciones en inglés sencillo

Limitaciones

  • Coste: Cada extracción utiliza llamadas a la API de LLM
  • Velocidad: Más lenta que la extracción tradicional para documentos simples
  • Consistencia: Los resultados pueden variar ligeramente entre distintas ejecuciones
  • Límites de contexto: Los documentos muy largos pueden requerir un tratamiento especial

Paso 1: Agregar una actividad basada en prompts

Cree una nueva actividad de extracción basada en prompts en su Skill de documento.
  1. Abra su Skill de documento en ABBYY Vantage Advanced Designer
  2. En el panel izquierdo, localice EXTRACT FROM TEXT (NLP)
  3. Busque y haga clic en Prompt-based
Seleccionar la actividad basada en prompts
  1. La actividad aparecerá en el lienzo de su flujo de trabajo
  2. Conéctela entre las actividades de entrada y salida
Nota: Las actividades basadas en prompts se encuentran en “EXTRACT FROM TEXT (NLP)” en el panel Activities, junto con otros métodos de extracción como Named Entities (NER) y Deep Learning.

Paso 2: Configurar la conexión LLM

Seleccione qué conexión LLM debe usar la actividad.
  1. Seleccione la actividad basada en prompt en su flujo de trabajo
  2. En el panel Activity Properties a la derecha, localice LLM Connection
  3. Haga clic en el menú desplegable
Configuring LLM Connection
  1. Seleccione de la lista la conexión LLM que haya configurado
    • Ejemplo: Nick-ChatGPT, Microsoft Foundry, Production GPT-4
  2. Compruebe que la conexión esté seleccionada
Nota: Si no ve ninguna conexión en la lista, primero debe configurar una conexión LLM en Configuration → Connections.

Paso 3: Definir los campos de salida

Configure los campos que quiere extraer antes de redactar su prompt.
  1. En el panel Activity Properties, busque la sección Output
  2. Verá una lista jerárquica de grupos de campos y campos
  3. En este ejemplo, extraeremos información del proveedor:
    • Proveedor
      • Nombre
      • Dirección
      • TaxID
      • Número de cuenta
      • Sort Code
      • IBAN
      • BIC_SWIFT
    • Unidad de negocio
      • Nombre
      • Dirección
      • Fecha de la factura
      • Número de factura
    • Totales
      • Monto neto
Estructura de salida de campos
  1. Haga clic en el botón Activity Editor para empezar a configurar el prompt
Nota: Defina todos los campos antes de redactar su prompt. Se hará referencia a los nombres de los campos en la estructura de su prompt.

Paso 4: Escribir la definición del rol

Defina el rol que debe desempeñar el LLM al procesar documentos.
  1. En el Activity Editor, verá la interfaz Prompt Text
  2. Comience con la sección ROLE:
ROL

Eres un modelo de extracción de datos. Extrae únicamente los campos relacionados 
con el proveedor especificados de un documento. Extrae el texto del valor tal cual 
(no la etiqueta). No infiera ni reformatee ningún dato. Omite cualquier campo que no 
esté claramente presente.
Editor de texto de instrucciones Instrucciones clave para el rol:
  • Sea específico: “data extraction model” indica al LLM cuál es su propósito
  • Defina el alcance: “vendor-related fields” limita qué se debe extraer
  • Establezca expectativas: “value text verbatim” evita cambiar el formato
  • Gestione los datos faltantes: “Omit any field that is not clearly present”
Mejores prácticas:
  • Mantenga la definición del rol clara y concisa
  • Use enunciados imperativos (“Extract”, “Do not infer”)
  • Sea explícito sobre lo que NO se debe hacer
  • Defina cómo manejar los casos límite

Paso 5: Definir el formato de salida

Especifique la estructura JSON exacta de los resultados de la extracción.
  1. Debajo de la sección ROLE, agregue el encabezado OUTPUT FORMAT
  2. Defina la estructura JSON:
OUTPUT FORMAT

Return one valid JSON object using this exact structure:

{
  "Fields": [
    { "FieldName": Vendor.Name, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Address, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.TaxID, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Account Number, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Sort Code, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.IBAN, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.BIC_SWIFT, "Text": "...", "Line": <FirstLineIndex> }
  ]
}
Formato de salida JSON Componentes de la estructura:
  • FieldName: Debe coincidir exactamente con sus definiciones de campos (por ejemplo, Vendor.Name)
  • Text: El valor extraído como una cadena
  • Line: Índice de línea con base 0 donde aparece el valor en el documento
Notas importantes:
  • Use los nombres de campos exactos de su configuración de Output
  • Incluya todos los campos incluso si algunos pueden estar vacíos
  • La estructura debe ser JSON válido
  • Los números de línea ayudan con la verificación y la resolución de problemas

Paso 6: Añadir reglas de extracción específicas para cada Field

Proporcione instrucciones detalladas para la extracción de cada campo. Debajo de OUTPUT FORMAT, añada reglas específicas para cada tipo de campo:
VENDOR NAME
1) Recognize names like "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extract the complete company name including legal suffixes (Ltd, Inc, GmbH, etc.).
3) Vendor name typically appears near the top of the document.

VENDOR ADDRESS
1) Extract the complete address including street, city, postal code.
2) For multiline addresses, represent each new line using "\n".
3) Vendor-side only; exclude customer/buyer addresses.

NÚMERO DE CUENTA
1) Reconozca "Account Number", "Account No", "Acct #", "Número de Cuenta", "Nº de Cuenta".
2) Extraiga el formato numérico exactamente como aparece impreso (p. ej., "12-34-56" o "500 105 17").
3) Solo cuentas del proveedor (p. ej., secciones "Beneficiary" o "Vendor Payment").
4) Ignore IBAN: tiene su propio campo.

SORT CODE
1) Recognize "Sort Code", "Sort No.", "BLZ", "Bankleitzahl".
2) Extract the numeric format exactly as printed (e.g., "12-34-56" or "500 105 17").
3) Vendor-side data only; ignore payer/buyer codes.

IBAN
1) Recognize "IBAN", "International Bank Account Number".
2) Extract the full IBAN exactly as printed (include spaces).
3) Vendor-side only, typically under "Bankverbindung", "Coordonnées bancaires", "Payment Details", or "Beneficiary Bank".

BIC_SWIFT
1) Recognize "BIC", "SWIFT", or "BIC/SWIFT".
2) Extract the complete identifier (usually 8 or 11 uppercase letters/numbers).
3) Vendor-side only, near the IBAN or bank name.
4) Exclude customer/payer data.
Extraction Rules Estructura de las reglas:
  • Patrones de reconocimiento: Enumera etiquetas alternativas para cada campo
  • Especificaciones de formato: Describe el formato exacto que se debe extraer
  • Indicaciones de ubicación: Dónde se suelen encontrar los datos
  • Exclusiones: Qué NO se debe extraer
Mejores prácticas:
  • Numera tus reglas para mayor claridad
  • Proporciona múltiples variaciones de etiquetas
  • Especifica la procedencia de los datos (lado del proveedor vs. lado del cliente)
  • Incluye ejemplos de formato entre paréntesis
  • Sé explícito sobre los campos relacionados (por ejemplo, “Ignora el IBAN — tiene su propio campo”)

Paso 7: Aplicar reglas de STRICTNESS

Agregue Reglas de Validación para garantizar la calidad y la consistencia de los datos. Al final de su prompt, agregue una sección STRICTNESS:
STRICTNESS
- Never generate or infer values.
- Omit ambiguous or missing fields.
- If none of the vendor fields are found, return:
  {
    "Fields": []
  }
Reglas de rigor Reglas de rigor adicionales (opcional):
REGLAS GENERALES
- Extraiga exactamente un valor por campo.
- Omita cualquier campo que no pueda ubicarse con certeza — exclúyalo de la salida.
- "FieldName" debe coincidir exactamente con los nombres indicados arriba.
- "Text" debe copiarse textualmente del documento — sin normalización ni inferencia.
- Para valores de varias líneas (por ejemplo, direcciones), represente cada línea nueva usando la secuencia de escape "\n" (una barra invertida seguida de la letra n).
- No inserte etiquetas HTML como <br> en el texto de salida.
- "Line" es el índice basado en 0 de la primera línea que contiene el valor extraído; inclúyalo solo si es verificable.
Por qué es importante Strictness (nivel de rigor):
  • Evita alucinaciones: los LLM pueden generar datos plausibles pero incorrectos
  • Garantiza la coherencia: las reglas claras reducen la variabilidad entre ejecuciones
  • Gestiona datos faltantes: define qué hacer cuando no se encuentran campos
  • Mantiene la integridad de los datos: la extracción literal preserva el formato original
Principios clave de Strictness:
  • Nunca generar datos que no estén en el documento
  • Omitir extracciones dudosas en lugar de adivinar
  • Devolver una estructura vacía si no se encuentran campos
  • Hacer coincidir exactamente los nombres de los campos
  • Conservar el formato original del texto

Paso 8: Seleccionar el formato del documento

Elija qué representación de documento enviar al LLM.
  1. En el Activity Editor, localice la lista desplegable Prompt
  2. Verá opciones sobre cómo se proporciona el documento al LLM
Opciones de formato de documento Formatos disponibles:
  • PDF: Archivo PDF original
    • Úselo para: Documentos donde el diseño es fundamental
    • Consideraciones: Tamaño de archivo mayor; algunos LLM tienen compatibilidad limitada con PDF
  • Plain Text: Extracción de texto sin formato
    • Úselo para: Documentos sencillos solo de texto
    • Consideraciones: Se pierde toda la información de formato y diseño
  • Annotated Text ⭐ (Recomendado)
    • Úselo para: La mayoría de los tipos de documentos
    • Consideraciones: Conserva la estructura aun siendo basado en texto
    • Ventajas: Mejor equilibrio entre estructura y rendimiento
  • Formatted Text: Texto con formato básico conservado
    • Úselo para: Documentos donde parte del formato es importante
    • Consideraciones: Punto intermedio entre Plain Text y Annotated Text
  1. Seleccione Annotated Text para obtener los mejores resultados
Nota: A través de las pruebas, se ha comprobado que Annotated Text proporciona los resultados más coherentes y fiables para las tareas de extracción. Conserva la estructura del documento y, al mismo tiempo, puede ser procesado de forma eficiente por los LLM.

Paso 9: Pruebe su extracción

Ejecute la actividad con documentos de muestra para verificar los resultados.

Ejecutar la actividad

  1. Cierre el Activity Editor
  2. Vaya a la pestaña All Documents
  3. Seleccione un documento de prueba
  4. Haga clic en el botón Test Activity o Run
Testing Activity
  1. Espere a que el LLM procese el documento
    • Tiempo de procesamiento: normalmente entre 5 y 30 segundos, según la complejidad del documento
    • Verá un indicador de carga mientras espera la respuesta de la API

Revisar los resultados

Una vez que el procesamiento se complete:
  1. La interfaz cambia a la vista predictiva
  2. Revise el panel de Output que muestra los campos extraídos
  3. Haga clic en cada campo para ver:
    • Valor extraído
    • Nivel de confianza (si se proporciona)
    • Región resaltada en la imagen del documento
Reviewing Results Qué verificar:
  • ✅ Todos los campos esperados están completos
  • ✅ Los valores coinciden exactamente con el documento
  • ✅ No hay datos inventados ni inferidos
  • ✅ Manejo correcto de campos de varias líneas
  • ✅ Los campos faltantes se omiten (no se rellenan con datos incorrectos)

Patrones de resultados habituales

Extracción correcta:
{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 },
    { "FieldName": "Vendor.Address", "Text": "123 Business Street\nLondon SW1A 1AA", "Line": 5 },
    { "FieldName": "Vendor.IBAN", "Text": "GB29 NWBK 6016 1331 9268 19", "Line": 15 }
  ]
}
Extracción parcial (faltan algunos campos):
{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 }
  ]
}
No se encontraron Fields:
{
  "Fields": []
}

Paso 10: Refine su prompt

Itere sobre su prompt según los resultados de las pruebas.

Problemas comunes y soluciones

Problema: el LLM extrae el campo incorrecto
  • Solución: Añadir indicaciones de ubicación más específicas
  • Ejemplo: “Solo información del Proveedor; excluir direcciones del cliente/comprador”
Problema: se cambia el formato
  • Solución: Enfatizar la extracción literal
  • Ejemplo: “Extrae el formato numérico exactamente como está impreso (p. ej., ‘12-34-56’)”
Problema: el LLM inventa datos
  • Solución: Hacer más estrictas las reglas
  • Ejemplo: “Nunca generes ni infieras valores. Omite si no está presente.”
Problema: los campos multilínea se concatenan
  • Solución: Especificar secuencias de escape
  • Ejemplo: “Para valores multilínea, usa \n para los saltos de línea”
Problema: nombres de campo incorrectos en la salida
  • Solución: Verificar que los nombres de campo coincidan exactamente
  • Ejemplo: Usa Vendor.Account Number y no AccountNumber

Proceso de mejora iterativo

  1. Prueba con varios documentos: No lo optimices para un único ejemplo
  2. Documenta los patrones: Registra qué reglas funcionan y cuáles necesitan ajustes
  3. Añade ejemplos concretos: Incluye ejemplos de formatos entre paréntesis
  4. Ajusta el nivel de rigor: Modifícalo según los patrones de sobreextracción o subextracción
  5. Prueba casos límite: Usa documentos con campos faltantes y diseños inusuales

Ejemplos de mejoras

Antes:
VENDOR NAME
1) Extract the vendor name from the document.
Después:
NOMBRE DEL PROVEEDOR
1) Reconocer nombres como "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extraer el nombre completo de la empresa, incluyendo sufijos legales (Ltd, Inc, GmbH, etc.).
3) El nombre del proveedor suele aparecer cerca de la parte superior del documento.
4) Excluir nombres de clientes/compradores; centrarse en la entidad que emite la factura.

Descripción del proceso de extracción

Cómo funciona la extracción basada en prompts

  1. Conversión del documento: Tu documento se convierte al formato seleccionado (se recomienda Annotated Text)
  2. Ensamblado del prompt: Se combinan tu rol, el formato de salida, las reglas de campo y las reglas de estrictitud
  3. Llamada a la API: El prompt y el documento se envían al LLM a través de tu conexión
  4. Procesamiento del LLM: El LLM lee el documento y extrae datos de acuerdo con tus instrucciones
  5. Respuesta JSON: El LLM devuelve datos estructurados en el formato JSON especificado
  6. Asignación de campos: Vantage asigna la respuesta JSON a tus campos de salida definidos
  7. Verificación: Los números de línea y los niveles de confianza (si se proporcionan) ayudan a verificar la precisión

Uso de tokens y costos

Factores que influyen en el costo:
  • Longitud del documento: Los documentos más largos consumen más tokens
  • Complejidad del prompt: Los prompts detallados incrementan la cantidad de tokens
  • Elección de formato: Annotated Text suele ser más eficiente que PDF
  • Cantidad de campos: Más campos = prompts más largos
Consejos de optimización:
  • Usa un lenguaje conciso pero claro en los prompts
  • No dupliques instrucciones
  • Elimina ejemplos innecesarios
  • Considera agrupar campos para datos relacionados

Mejores prácticas

Redacción de prompts

Haz:
  • ✅ Usa enunciados claros e imperativos (“Extract”, “Recognize”, “Omit”)
  • ✅ Proporciona varias alternativas de etiqueta para cada campo
  • ✅ Incluye ejemplos de formato entre paréntesis
  • ✅ Especifica qué NO se debe extraer (exclusiones)
  • ✅ Numera tus reglas para que sea fácil consultarlas
  • ✅ Usa una terminología coherente en todo el documento
No hagas:
  • ❌ No uses instrucciones vagas (“get the name”)
  • ❌ No supongas que el LLM conoce convenciones específicas del dominio
  • ❌ No escribas oraciones excesivamente largas y complejas
  • ❌ No te contradigas en diferentes secciones
  • ❌ No omitas las reglas de rigor

Definiciones de campos

Instrucciones eficaces para la definición de campos:
  • Comience con patrones de reconocimiento (etiquetas alternativas)
  • Especifique el formato exacto que se debe conservar
  • Proporcione indicaciones de ubicación (ubicación habitual)
  • Defina la propiedad de los datos (proveedor vs. cliente)
  • Incluya el tratamiento de valores en varias líneas
  • Haga referencia a campos relacionados para evitar confusiones
Ejemplo:
IBAN
1) Reconocer "IBAN", "International Bank Account Number".
2) Extraer el IBAN completo exactamente como aparece impreso (incluir espacios).
3) Solo del lado del Proveedor, normalmente bajo "Bankverbindung", "Detalles de pago".
4) NO confundir con Número de cuenta: el IBAN es más largo y alfanumérico.

Estrategia de pruebas

  1. Comience con documentos simples: Pruebe primero la extracción básica
  2. Amplíe a más variaciones: Pruebe diferentes diseños y formatos
  3. Pruebe casos límite: Campos faltantes, posiciones inusuales, múltiples coincidencias
  4. Documente los fallos: Guarde ejemplos de los casos en que falla la extracción
  5. Itere de forma sistemática: Cambie una sola cosa a la vez

Optimización del rendimiento

Para la velocidad:
  • Mantén los prompts concisos
  • Usa el formato Annotated Text
  • Minimiza el número de campos por actividad
  • Considera dividir los documentos complejos
Para la precisión:
  • Proporciona reglas de campos completas
  • Incluye ejemplos de formato
  • Agrega reglas de validación estrictas
  • Prueba con muestras de documentos diversas
Para el costo:
  • Optimiza la longitud del prompt
  • Usa formatos de documento eficientes
  • Guarda en caché los resultados cuando sea apropiado
  • Supervisa el uso de tokens mediante el panel de control del proveedor de LLM

Solución de problemas

Problemas de extracción

Problema: Los campos están vacíos aunque los datos estén presentes Soluciones:
  • Compruebe que la ortografía del nombre del campo coincida exactamente
  • Verifique que los datos estén en el formato de documento seleccionado
  • Agregue más variaciones de etiquetas a los patrones de reconocimiento
  • Reduzca el nivel de rigor temporalmente para ver si el LLM los encuentra
  • Compruebe si la calidad del documento afecta a la extracción de texto mediante OCR
Problema: El LLM extrae datos del cliente en lugar de datos del proveedor Soluciones:
  • Refuerce las especificaciones del lado del proveedor
  • Agregue exclusiones explícitas para datos de cliente/comprador
  • Proporcione indicios de ubicación (p. ej., “parte superior del documento”, “sección del emisor”)
  • Incluya ejemplos de extracción correcta frente a incorrecta
Problema: Los valores multilínea se concatenan o se alteran Soluciones:
  • Especifique explícitamente el formato de la secuencia de escape (\n)
  • Proporcione ejemplos de salida multilínea correcta
  • Verifique que el formato del documento preserve los saltos de línea
  • Agregue la instrucción: “Conserve los saltos de línea originales usando \n
Problema: El LLM reformatea o normaliza los datos Soluciones:
  • Haga hincapié en “literal” y “exactamente como está impreso”
  • Agregue una regla de rigor: “Sin normalización ni inferencia”
  • Proporcione ejemplos específicos que muestren la preservación del formato
  • Incluya ejemplos negativos: “No ‘12-34-56’, conservar como ‘12 34 56‘“

Problemas de rendimiento

Problema: La extracción es demasiado lenta Soluciones:
  • Cambia al formato Annotated Text si trabajas con PDF
  • Simplifica el prompt sin perder instrucciones críticas
  • Reduce la resolución del documento si las imágenes son muy grandes
  • Verifica el estado del servicio del proveedor de LLM y los límites de tasa de uso
  • Considera usar un modelo más rápido para documentos sencillos
Problema: Resultados inconsistentes entre ejecuciones Soluciones:
  • Refuerza las reglas de rigurosidad
  • Haz las instrucciones más específicas e inequívocas
  • Añade más ejemplos de formato
  • Reduce la complejidad del prompt que pueda dar lugar a interpretaciones
  • Prueba con valores de temperatura más altos (si están disponibles en la conexión)
Problema: Costes elevados de API Soluciones:
  • Optimiza la longitud del prompt
  • Usa Annotated Text en lugar de PDF
  • Procesa documentos en lotes durante periodos de baja demanda
  • Considera usar modelos más pequeños o más económicos para documentos sencillos
  • Supervisa y configura alertas de presupuesto en el panel del proveedor de LLM

Técnicas avanzadas

Extracción condicional

Puedes configurar el LLM para que extraiga determinados campos solo cuando se cumplan ciertas condiciones:
NÚMERO DE CUENTA (CONDICIONAL)
1) Extraer únicamente si el documento contiene detalles de pago bancario.
2) Si aparece "Forma de pago: Cheque" o similar, omitir este campo.
3) Reconocer "Account Number", "Account No", "Acct #".

Compatibilidad multilingüe

La extracción basada en prompts funciona bien con documentos en varios idiomas:
VENDOR NAME (MULTI-LANGUAGE)
1) Recognize in English: "Vendor Name", "Supplier", "Seller"
2) Recognize in German: "Verkäufer", "Lieferant", "Anbieter"
3) Recognize in French: "Fournisseur", "Vendeur"
4) Extract the complete company name regardless of language.

Reglas de Validación

Añada lógica de validación a sus prompts:
IBAN (CON VALIDACIÓN)
1) Extraiga el IBAN completo exactamente como aparece impreso.
2) Verifique que comience con un código de país de 2 letras.
3) Si el formato no coincide con el patrón de IBAN, omita el campo.
4) No invente dígitos de verificación ni códigos de país.

Relaciones entre campos

Especifique cómo se relacionan los campos:
ACCOUNT NUMBER vs IBAN
- Account Number: Usually shorter, numeric, domestic format
- IBAN: Alphanumeric, starts with country code (e.g., "GB29 NWBK...")
- If both are present, extract both to separate fields
- If only one is present, extract to the appropriate field
- Do not duplicate the same value in both fields

Limitaciones y aspectos a considerar

Capacidades actuales

Funciones disponibles:
  • ✅ Extracción de campos a nivel de encabezado
  • ✅ Valores de una o varias líneas
  • ✅ Múltiples campos por documento
  • ✅ Lógica de extracción condicional
  • ✅ Documentos multilingües
  • ✅ Diseños de documentos variables
Con soporte limitado o no disponible:
  • ⚠️ Extracción de tablas (varía según la implementación)
  • ⚠️ Estructuras complejas anidadas
  • ⚠️ Documentos muy grandes (límites de tokens)
  • ⚠️ Procesamiento en tiempo real (latencia de la API)
  • ⚠️ Garantía de resultados deterministas

Cuándo utilizar la extracción basada en prompts

Ideal para:
  • Documentos con diseños variables
  • Documentos semiestructurados
  • Prototipado y pruebas rápidas
  • Volúmenes de documentos de pequeños a medianos
  • Cuando no se dispone de datos de entrenamiento
  • Procesamiento de documentos en varios idiomas
Considere alternativas para:
  • Producción de alto volumen (el ML tradicional puede ser más rápido)
  • Formularios altamente estructurados (extracción basada en plantillas)
  • Aplicaciones sensibles al costo (los métodos tradicionales pueden ser más económicos)
  • Aplicaciones con requisitos estrictos de latencia (las API de LLM tienen latencia de red)
  • Requisitos de procesamiento sin conexión (no se necesita internet con métodos tradicionales)

Integración con Skills de documento

Uso de los datos extraídos

Una vez completada la extracción, los datos de los campos están disponibles en toda tu Skill de documento:
  1. Actividades de validación: Aplicar reglas de negocio a los valores extraídos
  2. Actividades de script: Procesar o transformar los datos extraídos
  3. Actividades de exportación: Enviar datos a sistemas externos
  4. Interfaz de revisión: Verificación manual de los campos extraídos

Uso en combinación con otras actividades

La extracción basada en prompts puede utilizarse junto con otras actividades:
Workflow Example:
1. Classification (identify document type)
2. OCR (extract text)
3. Prompt-based extraction (extract structured data)
4. Validation rules (verify data quality)
5. Script (format for export)
6. Output (deliver results)

Asignación de campos

Los campos JSON extraídos se asignan automáticamente a los campos de salida que haya definido:
  • "FieldName": "Vendor.Name" → se asigna al campo de salida Vendor.Name
  • La jerarquía de campos se conserva en la estructura de salida
  • Los números de línea ayudan con la verificación y la resolución de problemas

Resumen

Has completado satisfactoriamente lo siguiente:
  • ✅ Creado una actividad de extracción basada en prompts
  • ✅ Configurado una conexión con un LLM
  • ✅ Redactado un prompt de extracción completo con rol, formato y reglas
  • ✅ Seleccionado el formato de documento óptimo (Annotated Text)
  • ✅ Aplicado reglas de estrictitud para la calidad de los datos
  • ✅ Probado la extracción y revisado los resultados
  • ✅ Aprendido buenas prácticas de ingeniería de prompts
Puntos clave:
  • La extracción basada en prompts utiliza instrucciones en lenguaje natural
  • El formato Annotated Text proporciona los mejores resultados
  • Prompts claros y específicos proporcionan una extracción coherente
  • Las reglas de estrictitud evitan alucinaciones y mantienen la calidad de los datos
  • Las pruebas iterativas y el perfeccionamiento mejoran la precisión
¡Tu actividad de extracción basada en prompts ya está lista para procesar documentos!

Próximos pasos

  1. Pruebe con documentos diversos: Valide con distintos diseños y variaciones
  2. Refine sus prompts: Mejórelos continuamente en función de los resultados
  3. Supervise los costos: Haga un seguimiento del uso de tokens en el panel de control de su proveedor de LLM
  4. Optimice el rendimiento: Ajuste finamente los prompts para mejorar la velocidad y la precisión
  5. Explore la extracción de tablas: Experimente con la extracción de Partidas (si está disponible)
  6. Integre con flujos de trabajo: Combínelo con otras actividades para lograr un procesamiento completo

Recursos adicionales

  • Documentación de ABBYY Vantage Advanced Designer: https://docs.abbyy.com
  • Guía de configuración de conexiones LLM: Cómo configurar conexiones LLM
  • Mejores prácticas de ingeniería de prompts: Consulte la documentación de su proveedor de LLM
  • Soporte: Póngase en contacto con el soporte de ABBYY para obtener asistencia técnica

Preguntas frecuentes

P: ¿Cuál es la diferencia entre la extracción basada en prompts y la extracción tradicional?
R: La extracción basada en prompts utiliza instrucciones en lenguaje natural para LLM sin necesidad de datos de entrenamiento. Los métodos tradicionales requieren ejemplos de entrenamiento, pero son más rápidos y rentables a gran escala.
P: ¿Puedo extraer tablas con actividades basadas en prompts?
R: La extracción a nivel de encabezado está plenamente soportada. Las capacidades de extracción de tablas pueden variar y requerir estructuras de prompt específicas.
P: ¿Por qué usar Annotated Text en lugar de PDF?
R: Annotated Text ofrece el mejor equilibrio entre conservación de la estructura y eficiencia de procesamiento. Las pruebas han demostrado que es la opción más fiable.
P: ¿Cómo reduzco los costes de la API?
R: Optimice la longitud del prompt, use el formato Annotated Text, procese de forma eficiente y supervise el uso de tokens mediante el panel de control de su proveedor de LLM.
P: ¿Qué ocurre si falla mi conexión de LLM?
R: Compruebe el estado de la conexión en Configuration → Connections. Pruebe la conexión, verifique las credenciales y asegúrese de que no se haya superado su cuota de API.
P: ¿Puedo usar múltiples conexiones de LLM en una sola Habilidad?
R: Sí, diferentes actividades pueden usar conexiones distintas. Esto le permite usar distintos modelos para diferentes tareas de extracción.
P: ¿Cómo gestiono documentos en varios idiomas?
R: Añada variaciones de etiquetas en varios idiomas a sus reglas de campo. Los LLM generalmente gestionan bien el contenido multilingüe.
P: ¿Cuál es el tamaño máximo de documento?
R: Depende de los límites de tokens de su proveedor de LLM. Es posible que los documentos muy extensos deban dividirse o procesarse por secciones.