Extraer datos con actividades basadas en prompts

Descripción general

La extracción basada en prompts te permite usar instrucciones en lenguaje natural para extraer datos estructurados de documentos utilizando LLM. En lugar de entrenar modelos tradicionales de aprendizaje automático, describes qué datos quieres extraer y cómo deben estar formateados, y el LLM se encarga de la extracción según tus instrucciones. Lo que lograrás:

Crear una actividad de extracción basada en prompts.
Configurar una conexión con un LLM.
Redactar prompts de extracción eficaces.
Definir el formato y la estructura de salida.
Aplicar nivel de rigurosidad y Reglas de Validación.
Probar y perfeccionar tu extracción.

Tiempo estimado para completar: 20-30 minutos Casos de uso:

Extracción de información del proveedor a partir de facturas
Captura de datos del documento a nivel de encabezado
Procesamiento de documentos semiestructurados
Documentos con diseños variables

Requisitos previos

Antes de comenzar, asegúrate de tener:

Acceso a ABBYY Vantage Advanced Designer.
Una conexión LLM configurada. Consulte Configurar conexiones LLM.
Un Skill de documento con documentos de muestra cargados.
Comprensión básica de la estructura JSON.
Definiciones de campos para los datos que quieres extraer.

Esta guía se centra en la extracción a nivel de encabezado. Las capacidades de extracción de tablas pueden variar.

Comprender la extracción basada en prompts

¿Qué es la extracción basada en prompts?

La extracción basada en prompts utiliza LLM para comprender y extraer datos de documentos a partir de instrucciones en lenguaje natural. Usted define:

Rol: Qué papel debe asumir el LLM (por ejemplo, «modelo de extracción de datos»).
Instrucciones: Cómo extraer y dar formato a los datos.
Estructura de salida: El formato JSON exacto de los resultados.
Reglas: Directrices para manejar datos ambiguos o faltantes.

Ventajas

No se requieren datos de entrenamiento: Funciona únicamente mediante ingeniería de prompts.
Flexible: Fácil de añadir o modificar campos.
Soporta variaciones: Los LLM pueden comprender diferentes formatos de documentos.
Configuración rápida: Más rápido que entrenar modelos de ML tradicionales.
Lenguaje natural: Permite escribir instrucciones en inglés sencillo.

Limitaciones

Costo: Cada extracción realiza llamadas a la API de LLM.
Velocidad: Más lenta que la extracción tradicional para documentos simples.
Consistencia: Los resultados pueden variar ligeramente entre ejecuciones.
Límites de contexto: Es posible que los documentos muy largos requieran un tratamiento especial.

Paso 1: Agregar una actividad basada en prompts

Cree una nueva actividad de extracción basada en prompts en su Skill de documento.

Abra su Skill de documento en ABBYY Vantage Advanced Designer.
En el panel izquierdo, localice EXTRACT FROM TEXT (NLP).
Busque y haga clic en Prompt-based.

Selección de actividad basada en prompts

La actividad aparece en el lienzo de su flujo de trabajo.
Conéctela entre sus actividades de entrada y salida.

Las actividades basadas en prompts se encuentran en “EXTRACT FROM TEXT (NLP)” en el panel de Activities, junto con otros métodos de extracción como Named Entities (NER) y Deep Learning.

Paso 2: Configurar la conexión LLM

Seleccione qué conexión LLM debe utilizar la actividad.

Seleccione la actividad basada en prompts en su flujo de trabajo.
En el panel Activity Properties a la derecha, busque LLM Connection.
Haga clic en el menú desplegable.

Seleccione su conexión LLM configurada de la lista.
- Ejemplo: Nick-ChatGPT, Microsoft Foundry, Production GPT-4
Verifique que la conexión esté seleccionada.

Si no ve ninguna conexión en la lista, primero debe configurar una conexión LLM desde Configuration → Connections.

Cuando publique la skill, la conexión que seleccione aquí se convierte en la predeterminada para esa skill en el portal web de Vantage. En Skill Catalog → [your skill] → Parameters, la conexión aparece precargada. Los administradores del tenant pueden cambiarla por una conexión diferente (por ejemplo, para que una skill de producción apunte a un endpoint de LLM distinto según el entorno) sin volver a publicar la skill; consulte Document skill parameters.

Paso 3: Definir campos de salida

Configure los campos que desea extraer antes de redactar su prompt.

En el panel Activity Properties, busque la sección Output.
Verá una lista jerárquica de grupos de campos y campos individuales.
En este ejemplo, estamos extrayendo información del proveedor:
- Proveedor
  - Name
  - Address
  - TaxID
  - Número de cuenta
  - Sort Code
  - IBAN
  - BIC_SWIFT
- Business Unit
  - Name
  - Address
  - Fecha de la factura
  - Número de factura
- Totals
  - Monto neto

Haga clic en el botón Activity Editor para comenzar a configurar el prompt.

Defina todos los campos antes de redactar su prompt. Los nombres de los campos se utilizarán como referencia en la estructura del prompt.

Paso 4: Redactar la definición del rol

Defina qué función debe desempeñar el LLM al procesar documentos.

En el Activity Editor, verá la interfaz Prompt Text
Comience con la sección ROLE:

ROL

Eres un modelo de extracción de datos. Extrae únicamente los campos relacionados 
con el proveedor especificados de un documento. Extrae el texto del valor tal cual 
(no la etiqueta). No infiera ni reformatee ningún dato. Omite cualquier campo que no 
esté claramente presente.

Instrucciones clave sobre el rol:

Sea específico: “data extraction model” indica al LLM cuál es su propósito.
Defina el alcance: “vendor-related fields” limita qué se debe extraer.
Establezca expectativas: “value text verbatim” evita el reformateo.
Gestione la ausencia de datos: “Omit any field that is not clearly present”.

Mejores prácticas:

Mantenga el rol claro y conciso.
Use enunciados imperativos (“Extract”, “Do not infer”).
Sea explícito sobre lo que NO se debe hacer.
Defina cómo manejar los casos límite.

Paso 5: Definir el formato de salida

Especifique la estructura JSON precisa para los resultados de la extracción.

Debajo de la sección ROLE, agregue el encabezado OUTPUT FORMAT.
Defina la estructura JSON:

OUTPUT FORMAT

Return one valid JSON object using this exact structure:

{
  "Fields": [
    { "FieldName": Vendor.Name, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Address, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.TaxID, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Account Number, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.Sort Code, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.IBAN, "Text": "...", "Line": <FirstLineIndex> },
    { "FieldName": Vendor.BIC_SWIFT, "Text": "...", "Line": <FirstLineIndex> }
  ]
}

Componentes de la estructura:

FieldName: Debe coincidir exactamente con las definiciones de campos (por ejemplo, Vendor.Name).
Text: El valor extraído como una cadena.
Line: Índice de línea con base 0 donde el valor aparece en el documento.

Notas importantes:

Usar los nombres de campo exactos de la configuración de Output.
Incluir todos los campos, incluso si algunos pueden estar vacíos.
La estructura debe ser JSON válido.
Los números de línea ayudan con la verificación y el diagnóstico de problemas.

Paso 6: Agregar reglas de extracción específicas por Field

Proporcione instrucciones detalladas para extraer cada campo. Debajo de OUTPUT FORMAT, agregue reglas específicas para cada tipo de campo:

NOMBRE DEL PROVEEDOR
1) Reconozca nombres como "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extraiga el nombre completo de la empresa incluyendo sufijos legales (Ltd, Inc, GmbH, etc.).
3) El nombre del proveedor generalmente aparece cerca de la parte superior del documento.

DIRECCIÓN DEL PROVEEDOR
1) Extraiga la dirección completa incluyendo calle, ciudad, código postal.
2) Para direcciones de varias líneas, represente cada nueva línea usando "\n".
3) Solo del lado del proveedor; excluya direcciones de cliente/comprador.

NÚMERO DE CUENTA
1) Reconozca "Account Number", "Account No", "Acct #".
2) Extraiga el formato numérico exactamente como aparece impreso (p. ej., "12-34-56" o "500 105 17").
3) Solo cuentas del proveedor (p. ej., secciones "Beneficiary" o "Vendor Payment").
4) Ignore IBAN: tiene su propio campo.

CÓDIGO DE CLASIFICACIÓN
1) Reconozca "Sort Code", "Sort No.", "BLZ", "Bankleitzahl".
2) Extraiga el formato numérico exactamente como aparece impreso (p. ej., "12-34-56" o "500 105 17").
3) Solo datos del lado del proveedor; ignore códigos de pagador/comprador.

IBAN
1) Reconozca "IBAN", "International Bank Account Number".
2) Extraiga el IBAN completo exactamente como aparece impreso (incluya espacios).
3) Solo del lado del proveedor, generalmente bajo "Bankverbindung", "Coordonnées bancaires", "Payment Details" o "Beneficiary Bank".

BIC_SWIFT
1) Reconozca "BIC", "SWIFT" o "BIC/SWIFT".
2) Extraiga el identificador completo (generalmente 8 u 11 letras/números en mayúsculas).
3) Solo del lado del proveedor, cerca del IBAN o nombre del banco.
4) Excluya datos de cliente/pagador.

Estructura de las reglas:

Patrones de reconocimiento: Enumera etiquetas alternativas para cada campo.
Especificaciones de formato: Describe el formato exacto que se debe extraer.
Indicaciones de ubicación: Dónde se suele encontrar el dato.
Exclusiones: Qué NO se debe extraer.

Buenas prácticas:

Numera tus reglas para mayor claridad.
Proporciona distintas variantes de etiqueta.
Especifica la propiedad de los datos (del lado del proveedor vs. del lado del cliente).
Incluye ejemplos de formato entre paréntesis.
Sé explícito sobre los campos relacionados (por ejemplo, “Ignora el IBAN: tiene su propio campo”).

Paso 7: Aplicar reglas de estrictitud

Agregue Reglas de Validación para garantizar la calidad y la consistencia de los datos. Al final de su prompt, agregue una sección STRICTNESS:

STRICTNESS
- Never generate or infer values.
- Omit ambiguous or missing fields.
- If none of the vendor fields are found, return:
  {
    "Fields": []
  }

Reglas adicionales de estrictitud (opcional):

REGLAS GENERALES
- Extraiga exactamente un valor por campo.
- Omita cualquier campo que no pueda ubicarse con certeza — exclúyalo de la salida.
- "FieldName" debe coincidir exactamente con los nombres indicados arriba.
- "Text" debe copiarse textualmente del documento — sin normalización ni inferencia.
- Para valores de varias líneas (por ejemplo, direcciones), represente cada línea nueva usando la secuencia de escape "\n" (una barra invertida seguida de la letra n).
- No inserte etiquetas HTML como <br> en el texto de salida.
- "Line" es el índice basado en 0 de la primera línea que contiene el valor extraído; inclúyalo solo si es verificable.

Por qué es importante la estrictitud:

Evita alucinaciones: Los LLM pueden generar datos plausibles pero incorrectos.
Garantiza la consistencia: Reglas claras reducen la variación entre ejecuciones.
Gestiona datos faltantes: Define qué hacer cuando no se encuentran campos.
Mantiene la integridad de los datos: La extracción literal preserva el formato original.

Principios clave de estrictitud:

Nunca generar datos que no estén en el documento.
Omitir extracciones inciertas en lugar de adivinar.
Devolver una estructura vacía si no se encuentran campos.
Hacer que los nombres de los campos coincidan exactamente.
Conservar el formato original del texto.

Paso 8: Seleccionar el formato de documento

Elija qué representación del documento enviar al LLM.

En el Activity Editor, busque la lista desplegable Prompt.
Verá opciones sobre cómo se proporciona el documento al LLM.

Formatos disponibles:

PDF: Archivo PDF original
- Úselo para: Documentos en los que el diseño es fundamental
- Consideraciones: Tamaño de archivo mayor; algunos LLM tienen compatibilidad limitada con PDF
En desuso: El formato de documento PDF está en desuso y solo está disponible en conexiones OpenAI preexistentes. Este formato ya no es compatible con ninguna conexión nueva de ningún proveedor. Use Annotated Text en su lugar.
Texto sin formato: Extracción de texto sin formato
- Úselo para: Documentos sencillos solo de texto
- Consideraciones: Se pierde todo el formato y la información de diseño
Annotated Text ⭐ (recomendado)
- Úselo para: La mayoría de los tipos de documentos
- Consideraciones: Conserva la estructura aunque se base en texto
- Ventajas: Mejor equilibrio entre estructura y rendimiento
Texto con formato: Texto con formato básico conservado
- Úselo para: Documentos en los que parte del formato es importante
- Consideraciones: Punto intermedio entre texto sin formato y Annotated Text

Seleccione Annotated Text para obtener los mejores resultados

Según las pruebas realizadas, se ha comprobado que Annotated Text ofrece los resultados más uniformes y fiables para las tareas de extracción. Conserva la estructura del documento y, al mismo tiempo, se procesa de forma eficiente mediante LLM.

Paso 9: Pruebe la extracción

Ejecute la actividad con documentos de ejemplo para verificar los resultados.

Ejecutar la actividad

Cierre el editor de actividad.
Vaya a la pestaña All Documents.
Seleccione un documento de prueba.
Haga clic en Test Activity o en el botón Run.

Espere a que el LLM termine de procesar el documento.
- Tiempo de procesamiento: por lo general de 5 a 30 segundos, según la complejidad del documento.
- Verá un indicador de carga mientras espera la respuesta de la API.

Revisión de resultados

Una vez que finalice el procesamiento:

La interfaz cambia a Predictive view.
Revisa el panel de Output que muestra los campos extraídos.
Haz clic en cada campo para ver:
- Valor extraído
- Nivel de confianza (si se proporciona)
- Región resaltada en la imagen del documento

Qué verificar:

✅ Todos los campos esperados están completados
✅ Los valores coinciden exactamente con el documento
✅ No hay datos inventados o inferidos
✅ Correcto manejo de campos multilínea
✅ Los campos que faltan se omiten (no se completan con datos incorrectos)

Patrones de resultados habituales

Extracción satisfactoria:

{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 },
    { "FieldName": "Vendor.Address", "Text": "123 Business Street\nLondon SW1A 1AA", "Line": 5 },
    { "FieldName": "Vendor.IBAN", "Text": "GB29 NWBK 6016 1331 9268 19", "Line": 15 }
  ]
}

Extracción parcial (faltan algunos campos):

{
  "Fields": [
    { "FieldName": "Vendor.Name", "Text": "ABC Corporation Ltd", "Line": 3 }
  ]
}

No se encontraron Fields:

{
  "Fields": []
}

Paso 10: Perfecciona tu prompt

Itera tu prompt en función de los resultados de las pruebas.

Problemas comunes y soluciones

Problema: el LLM extrae el campo incorrecto

Solución: Proporciona indicaciones de ubicación más específicas.
Ejemplo: “Solo del lado del Proveedor; excluye las direcciones del cliente/comprador”

Problema: se cambia el formato

Solución: Haz hincapié en la extracción literal.
Ejemplo: “Extrae el formato numérico exactamente como está impreso (p. ej., ‘12-34-56’)”

Problema: el LLM inventa datos

Solución: Refuerza las reglas de estrictez.
Ejemplo: “Nunca generes ni infieras valores. Omite si no está presente.”

Problema: los campos multilínea se concatenan

Solución: Especifica secuencias de escape.
Ejemplo: “Para valores multilínea, utiliza \n para los saltos de línea”

Problema: nombres de campo incorrectos en la salida

Solución: Verifica que los nombres de campo coincidan exactamente.
Ejemplo: Usa Vendor.Account Number y no AccountNumber

Proceso de mejora iterativa

Pruebe con múltiples documentos: No optimice pensando solo en un único ejemplo.
Documente los patrones: Tome nota de qué reglas funcionan y cuáles necesitan refinamiento.
Agregue ejemplos específicos: Incluya ejemplos de formato entre paréntesis.
Refine el grado de estrictitud: Ajústelo según los patrones de sobreextracción o subextracción.
Pruebe casos límite: Use documentos con campos ausentes y diseños poco habituales.

Antes:

VENDOR NAME
1) Extract the vendor name from the document.

Después:

NOMBRE DEL PROVEEDOR
1) Reconocer nombres como "ABC Corporation", "XYZ Ltd", "Acme Inc.".
2) Extraer el nombre completo de la empresa, incluyendo sufijos legales (Ltd, Inc, GmbH, etc.).
3) El nombre del proveedor suele aparecer cerca de la parte superior del documento.
4) Excluir nombres de clientes/compradores; centrarse en la entidad que emite la factura.

Descripción del proceso de extracción

Cómo funciona la extracción basada en prompts

Conversión del documento: Su documento se convierte al formato seleccionado (se recomienda Annotated Text).
Construcción del prompt: Se combinan su rol, el formato de salida, las reglas de campos y las reglas de rigor.
Llamada a la API: El prompt y el documento se envían al LLM a través de su conexión.
Procesamiento del LLM: El LLM lee el documento y extrae los datos según sus instrucciones.
Respuesta JSON: El LLM devuelve datos estructurados en el formato JSON especificado.
Asignación de campos: Vantage asigna la respuesta JSON a sus campos de salida definidos.
Verificación: Los números de línea y las puntuaciones de confianza (si se proporcionan) ayudan a verificar la exactitud.

Uso de tokens y costos

Factores que afectan el costo:

Longitud del documento: Los documentos más largos usan más tokens.
Complejidad del prompt: Los prompts más detallados aumentan la cantidad de tokens.
Elección de formato: Annotated Text suele ser más eficiente que PDF.
Número de campos: Más campos = prompts más largos.

Recomendaciones de optimización:

Usa un lenguaje conciso pero claro en los prompts.
No repitas las instrucciones.
Elimina ejemplos innecesarios.
Considera agrupar campos para datos relacionados.

Mejores prácticas

Redacción de prompts

Hacer:

✅ Usa instrucciones claras en modo imperativo (“Extract”, “Recognize”, “Omit”).
✅ Proporciona varias alternativas de etiqueta para cada campo.
✅ Incluye ejemplos de formato entre paréntesis.
✅ Especifica qué NO se debe extraer (exclusiones).
✅ Numera tus reglas para facilitar la referencia.
✅ Utiliza una terminología coherente en todo el texto.

No hacer:

❌ No uses instrucciones vagas (“get the name”).
❌ No supongas que el LLM conoce las convenciones específicas del dominio.
❌ No escribas oraciones demasiado largas y complejas.
❌ No te contradigas en diferentes secciones.
❌ No omitas las reglas sobre el grado de rigor.

Definiciones de campos

Instrucciones eficaces para campos:

Comience con patrones de reconocimiento (etiquetas alternativas)
Especifique el formato exacto que se debe conservar
Proporcione indicaciones de ubicación (posición típica)
Defina la propiedad de los datos (Proveedor vs. cliente)
Incluya el tratamiento de valores de varias líneas
Haga referencia a campos relacionados para evitar confusiones

Ejemplo:

IBAN
1) Reconocer "IBAN", "International Bank Account Number".
2) Extraer el IBAN completo exactamente como aparece impreso (incluir espacios).
3) Solo del lado del Proveedor, normalmente bajo "Bankverbindung", "Detalles de pago".
4) NO confundir con Número de cuenta: el IBAN es más largo y alfanumérico.

Estrategia de pruebas

Comience con documentos simples: Pruebe primero la extracción básica.
Amplíe a variaciones: Pruebe con diferentes diseños y formatos.
Pruebe casos límite: Campos faltantes, posiciones inusuales, múltiples coincidencias.
Documente los errores: Conserve ejemplos de dónde falla la extracción.
Itére de forma sistemática: Cambie una sola cosa a la vez.

Optimización del rendimiento

Para mayor velocidad:

Mantenga los prompts concisos.
Use el formato Annotated Text.
Minimice el número de campos por actividad.
Considere dividir los documentos complejos.

Para mayor precisión:

Proporcione reglas de campos completas.
Incluya ejemplos de formato.
Agregue reglas de validación estrictas.
Pruebe con muestras de documentos variadas.

Para reducir el coste:

Optimice la longitud del prompt.
Use formatos de documento eficientes.
Almacene en caché los resultados cuando sea apropiado.
Supervise el uso de tokens mediante el panel del proveedor de LLM.

Resolución de problemas

Problemas de extracción

Problema: Los campos están vacíos a pesar de que los datos están presentes. Soluciones:

Comprueba que el nombre del campo esté escrito exactamente igual.
Verifica que los datos estén en el formato de documento seleccionado.
Añade más variaciones de etiquetas a los patrones de reconocimiento.
Reduce temporalmente el nivel de estrictitud para ver si el LLM lo encuentra.
Comprueba si la calidad del documento afecta al Reconocimiento óptico de caracteres (OCR) o a la extracción de texto.

Problema: El LLM extrae datos del cliente en lugar de datos del Proveedor. Soluciones:

Refuerza las especificaciones para los datos del Proveedor.
Añade exclusiones explícitas para los datos del cliente/comprador.
Proporciona indicaciones de ubicación (p. ej., “parte superior del documento”, “sección del emisor”).
Incluye ejemplos de extracción correcta frente a incorrecta.

Problema: Los valores multilínea se concatenan o se forman de manera incorrecta. Soluciones:

Especifica explícitamente el formato de la secuencia de escape (\n).
Proporciona ejemplos de salida multilínea correcta.
Verifica que el formato del documento preserve los saltos de línea.
Añade la instrucción: “Preservar los saltos de línea originales usando \n”.

Problema: El LLM reestructura o normaliza los datos. Soluciones:

Destaca “literal” y “exactamente como está impreso”.
Añade una regla de estrictitud: “Sin normalización ni inferencias”.
Proporciona ejemplos específicos que muestren la preservación del formato.
Incluye ejemplos negativos: “No ‘12-34-56’, mantener como ‘12 34 56’”.

Problemas de rendimiento

Problema: La extracción es demasiado lenta. Soluciones:

Cambie al formato Annotated Text si usa PDF.
Simplifique el prompt sin perder instrucciones críticas.
Reduzca la resolución del documento si las imágenes son muy grandes.
Verifique el estado y los límites de tasa del proveedor de LLM.
Considere usar un modelo más rápido para documentos simples.

Problema: Resultados inconsistentes entre ejecuciones. Soluciones:

Refuerce las reglas estrictas.
Haga que las instrucciones sean más específicas e inequívocas.
Agregue más ejemplos de formato.
Reduzca la complejidad del prompt que pueda dar lugar a interpretaciones.
Pruebe con valores de temperatura más altos (si están disponibles en la conexión).

Problema: Costos elevados de API. Soluciones:

Optimice la longitud del prompt.
Use Annotated Text en lugar de PDF.
Procese documentos por lotes durante horas de baja demanda.
Considere usar modelos más pequeños o más económicos para documentos simples.
Supervise y configure alertas de presupuesto en el panel del proveedor de LLM.

Técnicas avanzadas

Extracción condicional

Puede indicar al LLM que extraiga campos específicos solo si se cumplen determinadas condiciones:

NÚMERO DE CUENTA (CONDICIONAL)
1) Extraer únicamente si el documento contiene detalles de pago bancario.
2) Si aparece "Forma de pago: Cheque" o similar, omitir este campo.
3) Reconocer "Account Number", "Account No", "Acct #".

Compatibilidad con varios idiomas

La extracción basada en prompts funciona bien con documentos en varios idiomas:

VENDOR NAME (MULTI-LANGUAGE)
1) Recognize in English: "Vendor Name", "Supplier", "Seller"
2) Recognize in German: "Verkäufer", "Lieferant", "Anbieter"
3) Recognize in French: "Fournisseur", "Vendeur"
4) Extract the complete company name regardless of language.

Reglas de Validación

Agregue lógica de validación a sus prompts:

IBAN (CON VALIDACIÓN)
1) Extraiga el IBAN completo exactamente como aparece impreso.
2) Verifique que comience con un código de país de 2 letras.
3) Si el formato no coincide con el patrón de IBAN, omita el campo.
4) No invente dígitos de verificación ni códigos de país.

Relaciones entre campos

Especifique cómo se relacionan los campos:

ACCOUNT NUMBER vs IBAN
- Account Number: Usually shorter, numeric, domestic format.
- IBAN: Alphanumeric, starts with country code (e.g., "GB29 NWBK...").
- If both are present, extract both to separate fields.
- If only one is present, extract to the appropriate field.
- Do not duplicate the same value in both fields.

Limitaciones y consideraciones

Capacidades actuales

Funciones disponibles:

✅ Extracción de campos a nivel de encabezado
✅ Valores de una y varias líneas
✅ Varios campos por documento
✅ Lógica de extracción condicional
✅ Documentos en varios idiomas
✅ Diseños de documento variables

Limitadas o no disponibles:

⚠️ Extracción de tablas (varía según la implementación)
⚠️ Estructuras complejas anidadas
⚠️ Documentos muy grandes (límite de tokens)
⚠️ Procesamiento en tiempo real (latencia de la API)
⚠️ Garantía de resultados deterministas

Cuándo usar la extracción basada en prompts

Ideal para:

Documentos con diseños variables
Documentos semiestructurados
Prototipado y pruebas rápidas
Volúmenes de documentos de pequeños a medianos
Cuando no se dispone de datos de entrenamiento
Procesamiento de documentos en varios idiomas

Considere alternativas para:

Producción de alto volumen (el ML tradicional puede ser más rápido)
Formularios altamente estructurados (extracción basada en plantillas)
Aplicaciones sensibles al costo (los métodos tradicionales pueden ser más económicos)
Aplicaciones con requisitos estrictos de latencia (las API de LLM tienen retraso de red)
Requisitos de procesamiento sin conexión (los métodos tradicionales no necesitan internet)

Integración con Skills de documento

Uso de los datos extraídos

Una vez completada la extracción, los datos de los campos están disponibles en toda la Skill de documento:

Actividades de validación: aplicar reglas de negocio a los valores extraídos.
Actividades de script: procesar o transformar los datos extraídos.
Actividades de exportación: enviar datos a sistemas externos.
Interfaz de revisión: verificación manual de los campos extraídos.

Combinación con otras actividades

La extracción basada en prompts puede utilizarse junto con otras actividades:

Workflow Example:
Classification (identify document type)
OCR (extract text)
Prompt-based extraction (extract structured data)
Validation rules (verify data quality)
Script (format for export)
Output (deliver results)

Asignación de campos

Los campos JSON extraídos se asignan automáticamente a sus campos de salida definidos:

"FieldName": "Vendor.Name" → Se asigna al campo de salida Vendor.Name.
La jerarquía de campos se conserva en la estructura de salida.
Los números de línea ayudan con la verificación y la solución de problemas.

Resumen

Has logrado:

✅ Crear una actividad de extracción basada en prompts.
✅ Configurar una conexión con un LLM.
✅ Redactar un prompt de extracción completo con rol, formato y reglas.
✅ Seleccionar el formato de documento óptimo (Annotated Text).
✅ Aplicar reglas de estrictitud para la calidad de los datos.
✅ Probar la extracción y revisar los resultados.
✅ Aprender prácticas recomendadas de ingeniería de prompts.

Puntos clave:

La extracción basada en prompts utiliza instrucciones en lenguaje natural.
El formato Annotated Text ofrece los mejores resultados.
Prompts claros y específicos producen una extracción consistente.
Las reglas de estrictitud evitan alucinaciones y mantienen la calidad de los datos.
Las pruebas y el perfeccionamiento iterativos mejoran la precisión.

¡Tu actividad de extracción basada en prompts ya está lista para el procesamiento de documentos!

Próximos pasos

Pruebe con documentos diversos: Valide distintos diseños y variaciones.
Refine sus prompts: Mejórelos de forma continua en función de los resultados.
Supervise los costos: Haga un seguimiento del uso de tokens en el panel de control de su proveedor de LLM.
Optimice el rendimiento: Ajuste los prompts para mejorar la velocidad y la precisión.
Explore la extracción de tablas: Experimente con la extracción de Partidas (si está disponible).
Intégrelo en sus flujos de trabajo: Combínelo con otras actividades para lograr un procesamiento completo.

Recursos adicionales

Documentación de ABBYY Vantage Advanced Designer: https://docs.abbyy.com
Guía de configuración de conexiones LLM: Configurar conexiones LLM.
Mejores prácticas de ingeniería de prompts: Consulte la documentación de su proveedor de LLM.
Soporte: Póngase en contacto con el soporte técnico de ABBYY para obtener asistencia.

Preguntas frecuentes

P: ¿Cuál es la diferencia entre la extracción basada en prompts y la extracción tradicional? R: La extracción basada en prompts utiliza instrucciones en lenguaje natural para LLM sin necesidad de datos de entrenamiento. Los métodos tradicionales requieren ejemplos de entrenamiento, pero son más rápidos y rentables a gran escala. P: ¿Puedo extraer tablas con actividades basadas en prompts? R: La extracción a nivel de encabezado está bien soportada. Las capacidades de extracción de tablas pueden variar y requerir estructuras de prompt específicas. P: ¿Por qué usar Annotated Text en lugar de PDF? R: Annotated Text ofrece el mejor equilibrio entre preservación de la estructura y eficiencia de procesamiento. Las pruebas han demostrado que es la opción más fiable. P: ¿Cómo reduzco los costos de la API? R: Optimice la longitud del prompt, use el formato Annotated Text, procese de forma eficiente y supervise el uso de tokens desde el panel de control de su proveedor de LLM. P: ¿Qué pasa si falla mi conexión LLM? R: Verifique el estado de su conexión en Configuration → Connections. Pruebe la conexión, confirme las credenciales y asegúrese de que no se haya superado su cuota de API. P: ¿Puedo usar múltiples conexiones LLM en una sola Habilidad? R: Sí, diferentes actividades pueden usar conexiones distintas. Esto le permite usar distintos modelos para diferentes tareas de extracción. P: ¿Cómo gestiono documentos en varios idiomas? R: Añada variaciones de etiquetas en varios idiomas a sus reglas de campo. Los LLM generalmente manejan bien el contenido multilingüe. P: ¿Cuál es el tamaño máximo de documento? R: Depende de los límites de tokens de su proveedor de LLM. Es posible que los documentos muy largos deban dividirse o procesarse por secciones.

​Descripción general

​Requisitos previos

​Comprender la extracción basada en prompts

​¿Qué es la extracción basada en prompts?

​Ventajas

​Limitaciones

​Paso 1: Agregar una actividad basada en prompts

​Paso 2: Configurar la conexión LLM

​Paso 3: Definir campos de salida

​Paso 4: Redactar la definición del rol

​Paso 5: Definir el formato de salida

​Paso 6: Agregar reglas de extracción específicas por Field

​Paso 7: Aplicar reglas de estrictitud

​Paso 8: Seleccionar el formato de documento

​Paso 9: Pruebe la extracción

​Ejecutar la actividad

​Revisión de resultados

​Patrones de resultados habituales

​Paso 10: Perfecciona tu prompt

​Problemas comunes y soluciones

​Proceso de mejora iterativa

​Ejemplos de mejoras

​Descripción del proceso de extracción

​Cómo funciona la extracción basada en prompts

​Uso de tokens y costos

​Mejores prácticas

​Redacción de prompts

​Definiciones de campos

​Estrategia de pruebas

​Optimización del rendimiento

​Resolución de problemas

​Problemas de extracción

​Problemas de rendimiento

​Técnicas avanzadas

​Extracción condicional

​Compatibilidad con varios idiomas

​Reglas de Validación

​Relaciones entre campos

​Limitaciones y consideraciones

​Capacidades actuales

​Cuándo usar la extracción basada en prompts

​Integración con Skills de documento

​Uso de los datos extraídos

​Combinación con otras actividades

​Asignación de campos

​Resumen

​Próximos pasos

​Recursos adicionales

​Preguntas frecuentes

Descripción general

Requisitos previos

Comprender la extracción basada en prompts

¿Qué es la extracción basada en prompts?

Ventajas

Limitaciones

Paso 1: Agregar una actividad basada en prompts

Paso 2: Configurar la conexión LLM

Paso 3: Definir campos de salida

Paso 4: Redactar la definición del rol

Paso 5: Definir el formato de salida

Paso 6: Agregar reglas de extracción específicas por Field

Paso 7: Aplicar reglas de estrictitud

Paso 8: Seleccionar el formato de documento

Paso 9: Pruebe la extracción

Ejecutar la actividad

Revisión de resultados

Patrones de resultados habituales

Paso 10: Perfecciona tu prompt

Problemas comunes y soluciones

Proceso de mejora iterativa

Ejemplos de mejoras

Descripción del proceso de extracción

Cómo funciona la extracción basada en prompts

Uso de tokens y costos

Mejores prácticas

Redacción de prompts

Definiciones de campos

Estrategia de pruebas

Optimización del rendimiento

Resolución de problemas

Problemas de extracción

Problemas de rendimiento

Técnicas avanzadas

Extracción condicional

Compatibilidad con varios idiomas

Reglas de Validación

Relaciones entre campos

Limitaciones y consideraciones

Capacidades actuales

Cuándo usar la extracción basada en prompts

Integración con Skills de documento

Uso de los datos extraídos

Combinación con otras actividades

Asignación de campos

Resumen

Próximos pasos

Recursos adicionales

Preguntas frecuentes