Cómo extraer datos mediante actividades basadas en prompts en Advanced Designer

Descripción general

La extracción basada en prompts permite usar instrucciones en lenguaje natural para extraer datos estructurados de documentos con LLM. En lugar de entrenar modelos tradicionales de aprendizaje automático, usted describe qué datos desea extraer y cómo deben estar formateados, y el LLM se encarga de la extracción según sus instrucciones. Lo que va a lograr:

Crear una actividad de extracción basada en prompts
Configurar una conexión con un LLM
Redactar prompts de extracción eficaces
Definir el formato y la estructura de salida
Definir el nivel de rigor y las Reglas de Validación
Probar y perfeccionar su extracción

Tiempo para completar: 20-30 minutos Casos de uso:

Extracción de información del Proveedor a partir de facturas
Captura de datos de documentos a nivel de encabezado
Procesamiento de documentos semiestructurados
Documentos con diseños variables

Requisitos previos

Antes de comenzar, asegúrate de tener:

Acceso a ABBYY Vantage Advanced Designer
Una conexión LLM configurada (consulta Cómo configurar conexiones LLM)
Una Skill de documento con documentos de ejemplo cargados
Conocimientos básicos de la estructura JSON
Definiciones de campos para los datos que deseas extraer

Nota: Esta guía se centra en la extracción a nivel de encabezado. Las capacidades de extracción de tablas pueden variar.

Comprender la extracción basada en prompts

¿Qué es la extracción basada en prompts?

La extracción basada en prompts utiliza LLMs para comprender y extraer datos de documentos a partir de instrucciones en lenguaje natural. Usted define:

Rol: Cómo debe actuar el LLM (por ejemplo, “modelo de extracción de datos”)
Instrucciones: Cómo extraer y formatear los datos
Estructura de salida: El formato JSON exacto de los resultados
Reglas: Directrices para manejar datos ambiguos o ausentes

Beneficios

No se requieren datos de entrenamiento: Funciona únicamente con ingeniería de prompts
Flexible: Es fácil agregar o modificar campos
Maneja variaciones: Los LLM pueden comprender diferentes formatos de documentos
Configuración rápida: Más rápido que entrenar modelos tradicionales de aprendizaje automático (ML)
Lenguaje natural: Escribe las instrucciones en inglés sencillo

Limitaciones

Coste: Cada extracción utiliza llamadas a la API de LLM
Velocidad: Más lenta que la extracción tradicional para documentos simples
Consistencia: Los resultados pueden variar ligeramente entre distintas ejecuciones
Límites de contexto: Los documentos muy largos pueden requerir un tratamiento especial

Paso 1: Agregar una actividad basada en prompts

Cree una nueva actividad de extracción basada en prompts en su Skill de documento.

Abra su Skill de documento en ABBYY Vantage Advanced Designer
En el panel izquierdo, localice EXTRACT FROM TEXT (NLP)
Busque y haga clic en Prompt-based

Seleccionar la actividad basada en prompts

La actividad aparecerá en el lienzo de su flujo de trabajo
Conéctela entre las actividades de entrada y salida

Nota: Las actividades basadas en prompts se encuentran en “EXTRACT FROM TEXT (NLP)” en el panel Activities, junto con otros métodos de extracción como Named Entities (NER) y Deep Learning.

Paso 2: Configurar la conexión LLM

Seleccione qué conexión LLM debe usar la actividad.

Seleccione la actividad basada en prompt en su flujo de trabajo
En el panel Activity Properties a la derecha, localice LLM Connection
Haga clic en el menú desplegable

Seleccione de la lista la conexión LLM que haya configurado
- Ejemplo: Nick-ChatGPT, Microsoft Foundry, Production GPT-4
Compruebe que la conexión esté seleccionada

Nota: Si no ve ninguna conexión en la lista, primero debe configurar una conexión LLM en Configuration → Connections.

Paso 3: Definir los campos de salida

Configure los campos que quiere extraer antes de redactar su prompt.

En el panel Activity Properties, busque la sección Output
Verá una lista jerárquica de grupos de campos y campos
En este ejemplo, extraeremos información del proveedor:
- Proveedor
  - Nombre
  - Dirección
  - TaxID
  - Número de cuenta
  - Sort Code
  - IBAN
  - BIC_SWIFT
- Unidad de negocio
  - Nombre
  - Dirección
  - Fecha de la factura
  - Número de factura
- Totales
  - Monto neto

Haga clic en el botón Activity Editor para empezar a configurar el prompt

Nota: Defina todos los campos antes de redactar su prompt. Se hará referencia a los nombres de los campos en la estructura de su prompt.

Paso 4: Escribir la definición del rol

Defina el rol que debe desempeñar el LLM al procesar documentos.

En el Activity Editor, verá la interfaz Prompt Text
Comience con la sección ROLE:

ROL

Eres un modelo de extracción de datos. Extrae únicamente los campos relacionados 
con el proveedor especificados de un documento. Extrae el texto del valor tal cual 
(no la etiqueta). No infiera ni reformatee ningún dato. Omite cualquier campo que no 
esté claramente presente.

Instrucciones clave para el rol:

Sea específico: “data extraction model” indica al LLM cuál es su propósito
Defina el alcance: “vendor-related fields” limita qué se debe extraer
Establezca expectativas: “value text verbatim” evita cambiar el formato
Gestione los datos faltantes: “Omit any field that is not clearly present”

Mejores prácticas:

Mantenga la definición del rol clara y concisa
Use enunciados imperativos (“Extract”, “Do not infer”)
Sea explícito sobre lo que NO se debe hacer
Defina cómo manejar los casos límite

Paso 5: Definir el formato de salida

Especifique la estructura JSON exacta de los resultados de la extracción.

Debajo de la sección ROLE, agregue el encabezado OUTPUT FORMAT
Defina la estructura JSON:

OUTPUT FORMAT

Return one valid JSON object using this exact structure:

{
  "Fields": [
    { "FieldName": Vendor.Name, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Address, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.TaxID, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Account Number, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Sort Code, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.IBAN, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.BIC_SWIFT, "Text": "...", "Line": <FirstLineIndex> }
  ]
}

Componentes de la estructura:

FieldName: Debe coincidir exactamente con sus definiciones de campos (por ejemplo, Vendor.Name)
Text: El valor extraído como una cadena
Line: Índice de línea con base 0 donde aparece el valor en el documento

Notas importantes:

Use los nombres de campos exactos de su configuración de Output
Incluya todos los campos incluso si algunos pueden estar vacíos
La estructura debe ser JSON válido
Los números de línea ayudan con la verificación y la resolución de problemas

Paso 6: Añadir reglas de extracción específicas para cada Field

Proporcione instrucciones detalladas para la extracción de cada campo. Debajo de OUTPUT FORMAT, añada reglas específicas para cada tipo de campo:

VENDOR NAME
1) Recognize names like "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extract the complete company name including legal suffixes (Ltd, Inc, GmbH, etc.).
3) Vendor name typically appears near the top of the document.

VENDOR ADDRESS
1) Extract the complete address including street, city, postal code.
2) For multiline addresses, represent each new line using "\n".
3) Vendor-side only; exclude customer/buyer addresses.

NÚMERO DE CUENTA
1) Reconozca "Account Number", "Account No", "Acct #", "Número de Cuenta", "Nº de Cuenta".
2) Extraiga el formato numérico exactamente como aparece impreso (p. ej., "12-34-56" o "500 105 17").
3) Solo cuentas del proveedor (p. ej., secciones "Beneficiary" o "Vendor Payment").
4) Ignore IBAN: tiene su propio campo.

SORT CODE
1) Recognize "Sort Code", "Sort No.", "BLZ", "Bankleitzahl".
2) Extract the numeric format exactly as printed (e.g., "12-34-56" or "500 105 17").
3) Vendor-side data only; ignore payer/buyer codes.

IBAN
1) Recognize "IBAN", "International Bank Account Number".
2) Extract the full IBAN exactly as printed (include spaces).
3) Vendor-side only, typically under "Bankverbindung", "Coordonnées bancaires", "Payment Details", or "Beneficiary Bank".

BIC_SWIFT
1) Recognize "BIC", "SWIFT", or "BIC/SWIFT".
2) Extract the complete identifier (usually 8 or 11 uppercase letters/numbers).
3) Vendor-side only, near the IBAN or bank name.
4) Exclude customer/payer data.

Estructura de las reglas:

Patrones de reconocimiento: Enumera etiquetas alternativas para cada campo
Especificaciones de formato: Describe el formato exacto que se debe extraer
Indicaciones de ubicación: Dónde se suelen encontrar los datos
Exclusiones: Qué NO se debe extraer

Mejores prácticas:

Numera tus reglas para mayor claridad
Proporciona múltiples variaciones de etiquetas
Especifica la procedencia de los datos (lado del proveedor vs. lado del cliente)
Incluye ejemplos de formato entre paréntesis
Sé explícito sobre los campos relacionados (por ejemplo, “Ignora el IBAN — tiene su propio campo”)

Paso 7: Aplicar reglas de STRICTNESS

Agregue Reglas de Validación para garantizar la calidad y la consistencia de los datos. Al final de su prompt, agregue una sección STRICTNESS:

STRICTNESS
- Never generate or infer values.
- Omit ambiguous or missing fields.
- If none of the vendor fields are found, return:
  {
    "Fields": []
  }

Reglas de rigor adicionales (opcional):

REGLAS GENERALES
- Extraiga exactamente un valor por campo.
- Omita cualquier campo que no pueda ubicarse con certeza — exclúyalo de la salida.
- "FieldName" debe coincidir exactamente con los nombres indicados arriba.
- "Text" debe copiarse textualmente del documento — sin normalización ni inferencia.
- Para valores de varias líneas (por ejemplo, direcciones), represente cada línea nueva usando la secuencia de escape "\n" (una barra invertida seguida de la letra n).
- No inserte etiquetas HTML como <br> en el texto de salida.
- "Line" es el índice basado en 0 de la primera línea que contiene el valor extraído; inclúyalo solo si es verificable.

Por qué es importante Strictness (nivel de rigor):

Evita alucinaciones: los LLM pueden generar datos plausibles pero incorrectos
Garantiza la coherencia: las reglas claras reducen la variabilidad entre ejecuciones
Gestiona datos faltantes: define qué hacer cuando no se encuentran campos
Mantiene la integridad de los datos: la extracción literal preserva el formato original

Principios clave de Strictness:

Nunca generar datos que no estén en el documento
Omitir extracciones dudosas en lugar de adivinar
Devolver una estructura vacía si no se encuentran campos
Hacer coincidir exactamente los nombres de los campos
Conservar el formato original del texto

Paso 8: Seleccionar el formato del documento

Elija qué representación de documento enviar al LLM.

En el Activity Editor, localice la lista desplegable Prompt
Verá opciones sobre cómo se proporciona el documento al LLM

Formatos disponibles:

PDF: Archivo PDF original
- Úselo para: Documentos donde el diseño es fundamental
- Consideraciones: Tamaño de archivo mayor; algunos LLM tienen compatibilidad limitada con PDF
Plain Text: Extracción de texto sin formato
- Úselo para: Documentos sencillos solo de texto
- Consideraciones: Se pierde toda la información de formato y diseño
Annotated Text ⭐ (Recomendado)
- Úselo para: La mayoría de los tipos de documentos
- Consideraciones: Conserva la estructura aun siendo basado en texto
- Ventajas: Mejor equilibrio entre estructura y rendimiento
Formatted Text: Texto con formato básico conservado
- Úselo para: Documentos donde parte del formato es importante
- Consideraciones: Punto intermedio entre Plain Text y Annotated Text

Seleccione Annotated Text para obtener los mejores resultados

Nota: A través de las pruebas, se ha comprobado que Annotated Text proporciona los resultados más coherentes y fiables para las tareas de extracción. Conserva la estructura del documento y, al mismo tiempo, puede ser procesado de forma eficiente por los LLM.

Paso 9: Pruebe su extracción

Ejecute la actividad con documentos de muestra para verificar los resultados.

Ejecutar la actividad

Cierre el Activity Editor
Vaya a la pestaña All Documents
Seleccione un documento de prueba
Haga clic en el botón Test Activity o Run

Espere a que el LLM procese el documento
- Tiempo de procesamiento: normalmente entre 5 y 30 segundos, según la complejidad del documento
- Verá un indicador de carga mientras espera la respuesta de la API

Revisar los resultados

Una vez que el procesamiento se complete:

La interfaz cambia a la vista predictiva
Revise el panel de Output que muestra los campos extraídos
Haga clic en cada campo para ver:
- Valor extraído
- Nivel de confianza (si se proporciona)
- Región resaltada en la imagen del documento

Qué verificar:

✅ Todos los campos esperados están completos
✅ Los valores coinciden exactamente con el documento
✅ No hay datos inventados ni inferidos
✅ Manejo correcto de campos de varias líneas
✅ Los campos faltantes se omiten (no se rellenan con datos incorrectos)

Patrones de resultados habituales

Extracción correcta:

{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 },
    { "FieldName": "Vendor.Address", "Text": "123 Business Street\nLondon SW1A 1AA", "Line": 5 },
    { "FieldName": "Vendor.IBAN", "Text": "GB29 NWBK 6016 1331 9268 19", "Line": 15 }
  ]
}

Extracción parcial (faltan algunos campos):

{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 }
  ]
}

No se encontraron Fields:

{
  "Fields": []
}

Paso 10: Refine su prompt

Itere sobre su prompt según los resultados de las pruebas.

Problemas comunes y soluciones

Problema: el LLM extrae el campo incorrecto

Solución: Añadir indicaciones de ubicación más específicas
Ejemplo: “Solo información del Proveedor; excluir direcciones del cliente/comprador”

Problema: se cambia el formato

Solución: Enfatizar la extracción literal
Ejemplo: “Extrae el formato numérico exactamente como está impreso (p. ej., ‘12-34-56’)”

Problema: el LLM inventa datos

Solución: Hacer más estrictas las reglas
Ejemplo: “Nunca generes ni infieras valores. Omite si no está presente.”

Problema: los campos multilínea se concatenan

Solución: Especificar secuencias de escape
Ejemplo: “Para valores multilínea, usa \n para los saltos de línea”

Problema: nombres de campo incorrectos en la salida

Solución: Verificar que los nombres de campo coincidan exactamente
Ejemplo: Usa Vendor.Account Number y no AccountNumber

Proceso de mejora iterativo

Prueba con varios documentos: No lo optimices para un único ejemplo
Documenta los patrones: Registra qué reglas funcionan y cuáles necesitan ajustes
Añade ejemplos concretos: Incluye ejemplos de formatos entre paréntesis
Ajusta el nivel de rigor: Modifícalo según los patrones de sobreextracción o subextracción
Prueba casos límite: Usa documentos con campos faltantes y diseños inusuales

Antes:

VENDOR NAME
1) Extract the vendor name from the document.

Después:

NOMBRE DEL PROVEEDOR
1) Reconocer nombres como "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extraer el nombre completo de la empresa, incluyendo sufijos legales (Ltd, Inc, GmbH, etc.).
3) El nombre del proveedor suele aparecer cerca de la parte superior del documento.
4) Excluir nombres de clientes/compradores; centrarse en la entidad que emite la factura.

Descripción del proceso de extracción

Cómo funciona la extracción basada en prompts

Conversión del documento: Tu documento se convierte al formato seleccionado (se recomienda Annotated Text)
Ensamblado del prompt: Se combinan tu rol, el formato de salida, las reglas de campo y las reglas de estrictitud
Llamada a la API: El prompt y el documento se envían al LLM a través de tu conexión
Procesamiento del LLM: El LLM lee el documento y extrae datos de acuerdo con tus instrucciones
Respuesta JSON: El LLM devuelve datos estructurados en el formato JSON especificado
Asignación de campos: Vantage asigna la respuesta JSON a tus campos de salida definidos
Verificación: Los números de línea y los niveles de confianza (si se proporcionan) ayudan a verificar la precisión

Uso de tokens y costos

Factores que influyen en el costo:

Longitud del documento: Los documentos más largos consumen más tokens
Complejidad del prompt: Los prompts detallados incrementan la cantidad de tokens
Elección de formato: Annotated Text suele ser más eficiente que PDF
Cantidad de campos: Más campos = prompts más largos

Consejos de optimización:

Usa un lenguaje conciso pero claro en los prompts
No dupliques instrucciones
Elimina ejemplos innecesarios
Considera agrupar campos para datos relacionados

Mejores prácticas

Redacción de prompts

Haz:

✅ Usa enunciados claros e imperativos (“Extract”, “Recognize”, “Omit”)
✅ Proporciona varias alternativas de etiqueta para cada campo
✅ Incluye ejemplos de formato entre paréntesis
✅ Especifica qué NO se debe extraer (exclusiones)
✅ Numera tus reglas para que sea fácil consultarlas
✅ Usa una terminología coherente en todo el documento

No hagas:

❌ No uses instrucciones vagas (“get the name”)
❌ No supongas que el LLM conoce convenciones específicas del dominio
❌ No escribas oraciones excesivamente largas y complejas
❌ No te contradigas en diferentes secciones
❌ No omitas las reglas de rigor

Definiciones de campos

Instrucciones eficaces para la definición de campos:

Comience con patrones de reconocimiento (etiquetas alternativas)
Especifique el formato exacto que se debe conservar
Proporcione indicaciones de ubicación (ubicación habitual)
Defina la propiedad de los datos (proveedor vs. cliente)
Incluya el tratamiento de valores en varias líneas
Haga referencia a campos relacionados para evitar confusiones

Ejemplo:

IBAN
1) Reconocer "IBAN", "International Bank Account Number".
2) Extraer el IBAN completo exactamente como aparece impreso (incluir espacios).
3) Solo del lado del Proveedor, normalmente bajo "Bankverbindung", "Detalles de pago".
4) NO confundir con Número de cuenta: el IBAN es más largo y alfanumérico.

Estrategia de pruebas

Comience con documentos simples: Pruebe primero la extracción básica
Amplíe a más variaciones: Pruebe diferentes diseños y formatos
Pruebe casos límite: Campos faltantes, posiciones inusuales, múltiples coincidencias
Documente los fallos: Guarde ejemplos de los casos en que falla la extracción
Itere de forma sistemática: Cambie una sola cosa a la vez

Optimización del rendimiento

Para la velocidad:

Mantén los prompts concisos
Usa el formato Annotated Text
Minimiza el número de campos por actividad
Considera dividir los documentos complejos

Para la precisión:

Proporciona reglas de campos completas
Incluye ejemplos de formato
Agrega reglas de validación estrictas
Prueba con muestras de documentos diversas

Para el costo:

Optimiza la longitud del prompt
Usa formatos de documento eficientes
Guarda en caché los resultados cuando sea apropiado
Supervisa el uso de tokens mediante el panel de control del proveedor de LLM

Solución de problemas

Problemas de extracción

Problema: Los campos están vacíos aunque los datos estén presentes Soluciones:

Compruebe que la ortografía del nombre del campo coincida exactamente
Verifique que los datos estén en el formato de documento seleccionado
Agregue más variaciones de etiquetas a los patrones de reconocimiento
Reduzca el nivel de rigor temporalmente para ver si el LLM los encuentra
Compruebe si la calidad del documento afecta a la extracción de texto mediante OCR

Problema: El LLM extrae datos del cliente en lugar de datos del proveedor Soluciones:

Refuerce las especificaciones del lado del proveedor
Agregue exclusiones explícitas para datos de cliente/comprador
Proporcione indicios de ubicación (p. ej., “parte superior del documento”, “sección del emisor”)
Incluya ejemplos de extracción correcta frente a incorrecta

Problema: Los valores multilínea se concatenan o se alteran Soluciones:

Especifique explícitamente el formato de la secuencia de escape (\n)
Proporcione ejemplos de salida multilínea correcta
Verifique que el formato del documento preserve los saltos de línea
Agregue la instrucción: “Conserve los saltos de línea originales usando \n”

Problema: El LLM reformatea o normaliza los datos Soluciones:

Haga hincapié en “literal” y “exactamente como está impreso”
Agregue una regla de rigor: “Sin normalización ni inferencia”
Proporcione ejemplos específicos que muestren la preservación del formato
Incluya ejemplos negativos: “No ‘12-34-56’, conservar como ‘12 34 56‘“

Problemas de rendimiento

Problema: La extracción es demasiado lenta Soluciones:

Cambia al formato Annotated Text si trabajas con PDF
Simplifica el prompt sin perder instrucciones críticas
Reduce la resolución del documento si las imágenes son muy grandes
Verifica el estado del servicio del proveedor de LLM y los límites de tasa de uso
Considera usar un modelo más rápido para documentos sencillos

Problema: Resultados inconsistentes entre ejecuciones Soluciones:

Refuerza las reglas de rigurosidad
Haz las instrucciones más específicas e inequívocas
Añade más ejemplos de formato
Reduce la complejidad del prompt que pueda dar lugar a interpretaciones
Prueba con valores de temperatura más altos (si están disponibles en la conexión)

Problema: Costes elevados de API Soluciones:

Optimiza la longitud del prompt
Usa Annotated Text en lugar de PDF
Procesa documentos en lotes durante periodos de baja demanda
Considera usar modelos más pequeños o más económicos para documentos sencillos
Supervisa y configura alertas de presupuesto en el panel del proveedor de LLM

Técnicas avanzadas

Extracción condicional

Puedes configurar el LLM para que extraiga determinados campos solo cuando se cumplan ciertas condiciones:

NÚMERO DE CUENTA (CONDICIONAL)
1) Extraer únicamente si el documento contiene detalles de pago bancario.
2) Si aparece "Forma de pago: Cheque" o similar, omitir este campo.
3) Reconocer "Account Number", "Account No", "Acct #".

Compatibilidad multilingüe

La extracción basada en prompts funciona bien con documentos en varios idiomas:

VENDOR NAME (MULTI-LANGUAGE)
1) Recognize in English: "Vendor Name", "Supplier", "Seller"
2) Recognize in German: "Verkäufer", "Lieferant", "Anbieter"
3) Recognize in French: "Fournisseur", "Vendeur"
4) Extract the complete company name regardless of language.

Reglas de Validación

Añada lógica de validación a sus prompts:

IBAN (CON VALIDACIÓN)
1) Extraiga el IBAN completo exactamente como aparece impreso.
2) Verifique que comience con un código de país de 2 letras.
3) Si el formato no coincide con el patrón de IBAN, omita el campo.
4) No invente dígitos de verificación ni códigos de país.

Relaciones entre campos

Especifique cómo se relacionan los campos:

ACCOUNT NUMBER vs IBAN
- Account Number: Usually shorter, numeric, domestic format
- IBAN: Alphanumeric, starts with country code (e.g., "GB29 NWBK...")
- If both are present, extract both to separate fields
- If only one is present, extract to the appropriate field
- Do not duplicate the same value in both fields

Limitaciones y aspectos a considerar

Capacidades actuales

Funciones disponibles:

✅ Extracción de campos a nivel de encabezado
✅ Valores de una o varias líneas
✅ Múltiples campos por documento
✅ Lógica de extracción condicional
✅ Documentos multilingües
✅ Diseños de documentos variables

Con soporte limitado o no disponible:

⚠️ Extracción de tablas (varía según la implementación)
⚠️ Estructuras complejas anidadas
⚠️ Documentos muy grandes (límites de tokens)
⚠️ Procesamiento en tiempo real (latencia de la API)
⚠️ Garantía de resultados deterministas

Cuándo utilizar la extracción basada en prompts

Ideal para:

Documentos con diseños variables
Documentos semiestructurados
Prototipado y pruebas rápidas
Volúmenes de documentos de pequeños a medianos
Cuando no se dispone de datos de entrenamiento
Procesamiento de documentos en varios idiomas

Considere alternativas para:

Producción de alto volumen (el ML tradicional puede ser más rápido)
Formularios altamente estructurados (extracción basada en plantillas)
Aplicaciones sensibles al costo (los métodos tradicionales pueden ser más económicos)
Aplicaciones con requisitos estrictos de latencia (las API de LLM tienen latencia de red)
Requisitos de procesamiento sin conexión (no se necesita internet con métodos tradicionales)

Integración con Skills de documento

Uso de los datos extraídos

Una vez completada la extracción, los datos de los campos están disponibles en toda tu Skill de documento:

Actividades de validación: Aplicar reglas de negocio a los valores extraídos
Actividades de script: Procesar o transformar los datos extraídos
Actividades de exportación: Enviar datos a sistemas externos
Interfaz de revisión: Verificación manual de los campos extraídos

Uso en combinación con otras actividades

La extracción basada en prompts puede utilizarse junto con otras actividades:

Workflow Example:
Classification (identify document type)
OCR (extract text)
Prompt-based extraction (extract structured data)
Validation rules (verify data quality)
Script (format for export)
Output (deliver results)

Asignación de campos

Los campos JSON extraídos se asignan automáticamente a los campos de salida que haya definido:

"FieldName": "Vendor.Name" → se asigna al campo de salida Vendor.Name
La jerarquía de campos se conserva en la estructura de salida
Los números de línea ayudan con la verificación y la resolución de problemas

Resumen

Has completado satisfactoriamente lo siguiente:

✅ Creado una actividad de extracción basada en prompts
✅ Configurado una conexión con un LLM
✅ Redactado un prompt de extracción completo con rol, formato y reglas
✅ Seleccionado el formato de documento óptimo (Annotated Text)
✅ Aplicado reglas de estrictitud para la calidad de los datos
✅ Probado la extracción y revisado los resultados
✅ Aprendido buenas prácticas de ingeniería de prompts

Puntos clave:

La extracción basada en prompts utiliza instrucciones en lenguaje natural
El formato Annotated Text proporciona los mejores resultados
Prompts claros y específicos proporcionan una extracción coherente
Las reglas de estrictitud evitan alucinaciones y mantienen la calidad de los datos
Las pruebas iterativas y el perfeccionamiento mejoran la precisión

¡Tu actividad de extracción basada en prompts ya está lista para procesar documentos!

Próximos pasos

Pruebe con documentos diversos: Valide con distintos diseños y variaciones
Refine sus prompts: Mejórelos continuamente en función de los resultados
Supervise los costos: Haga un seguimiento del uso de tokens en el panel de control de su proveedor de LLM
Optimice el rendimiento: Ajuste finamente los prompts para mejorar la velocidad y la precisión
Explore la extracción de tablas: Experimente con la extracción de Partidas (si está disponible)
Integre con flujos de trabajo: Combínelo con otras actividades para lograr un procesamiento completo

Recursos adicionales

Documentación de ABBYY Vantage Advanced Designer: https://docs.abbyy.com
Guía de configuración de conexiones LLM: Cómo configurar conexiones LLM
Mejores prácticas de ingeniería de prompts: Consulte la documentación de su proveedor de LLM
Soporte: Póngase en contacto con el soporte de ABBYY para obtener asistencia técnica

Preguntas frecuentes

P: ¿Cuál es la diferencia entre la extracción basada en prompts y la extracción tradicional?
R: La extracción basada en prompts utiliza instrucciones en lenguaje natural para LLM sin necesidad de datos de entrenamiento. Los métodos tradicionales requieren ejemplos de entrenamiento, pero son más rápidos y rentables a gran escala. P: ¿Puedo extraer tablas con actividades basadas en prompts?
R: La extracción a nivel de encabezado está plenamente soportada. Las capacidades de extracción de tablas pueden variar y requerir estructuras de prompt específicas. P: ¿Por qué usar Annotated Text en lugar de PDF?
R: Annotated Text ofrece el mejor equilibrio entre conservación de la estructura y eficiencia de procesamiento. Las pruebas han demostrado que es la opción más fiable. P: ¿Cómo reduzco los costes de la API?
R: Optimice la longitud del prompt, use el formato Annotated Text, procese de forma eficiente y supervise el uso de tokens mediante el panel de control de su proveedor de LLM. P: ¿Qué ocurre si falla mi conexión de LLM?
R: Compruebe el estado de la conexión en Configuration → Connections. Pruebe la conexión, verifique las credenciales y asegúrese de que no se haya superado su cuota de API. P: ¿Puedo usar múltiples conexiones de LLM en una sola Habilidad?
R: Sí, diferentes actividades pueden usar conexiones distintas. Esto le permite usar distintos modelos para diferentes tareas de extracción. P: ¿Cómo gestiono documentos en varios idiomas?
R: Añada variaciones de etiquetas en varios idiomas a sus reglas de campo. Los LLM generalmente gestionan bien el contenido multilingüe. P: ¿Cuál es el tamaño máximo de documento?
R: Depende de los límites de tokens de su proveedor de LLM. Es posible que los documentos muy extensos deban dividirse o procesarse por secciones.

Acerca de

Guía de inicio rápido

​Descripción general

​Requisitos previos

​Comprender la extracción basada en prompts

​¿Qué es la extracción basada en prompts?

​Beneficios

​Limitaciones

​Paso 1: Agregar una actividad basada en prompts

​Paso 2: Configurar la conexión LLM

​Paso 3: Definir los campos de salida

​Paso 4: Escribir la definición del rol

​Paso 5: Definir el formato de salida

​Paso 6: Añadir reglas de extracción específicas para cada Field

​Paso 7: Aplicar reglas de STRICTNESS

​Paso 8: Seleccionar el formato del documento

​Paso 9: Pruebe su extracción

​Ejecutar la actividad

​Revisar los resultados

​Patrones de resultados habituales

​Paso 10: Refine su prompt

​Problemas comunes y soluciones

​Proceso de mejora iterativo

​Ejemplos de mejoras

​Descripción del proceso de extracción

​Cómo funciona la extracción basada en prompts

​Uso de tokens y costos

​Mejores prácticas

​Redacción de prompts

​Definiciones de campos

​Estrategia de pruebas

​Optimización del rendimiento

​Solución de problemas

​Problemas de extracción

​Problemas de rendimiento

​Técnicas avanzadas

​Extracción condicional

​Compatibilidad multilingüe

​Reglas de Validación

​Relaciones entre campos

​Limitaciones y aspectos a considerar

​Capacidades actuales

​Cuándo utilizar la extracción basada en prompts

​Integración con Skills de documento

​Uso de los datos extraídos

​Uso en combinación con otras actividades

​Asignación de campos

​Resumen

​Próximos pasos

​Recursos adicionales

​Preguntas frecuentes