La actividad Reglas de extracción te permite definir reglas para detectar campos en documentos semiestructurados y comprobar cómo funcionan en documentos reales. Suele aplicarse cuando la ubicación de un campo puede variar de un documento a otro, lo que complica la extracción de datos, y cuando puedes proporcionar información adicional para detectar esos campos: por ejemplo, la posición de los campos en relación con otros objetos del documento o expresiones regulares que definan las condiciones de búsqueda de un objeto. Por ejemplo, puedes indicar que el campo Número de factura puede ubicarse a la derecha de la imagen o directamente debajo de las palabras “Order number”, “Order #”, u otras palabras clave similares. También recomendamos añadir una actividad de Fast Learning al flujo de procesamiento y habilitar el aprendizaje en línea para recopilar documentos en tiempo de ejecución, lo que reconstruirá automáticamente la Habilidad más adelante mediante aprendizaje automático.”Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
Casos de uso
- Cuando su conjunto de documentos no está lo suficientemente estandarizado como para usar una actividad de Fast Learning para extraer datos, no tiene suficientes documentos para entrenar una actividad de Deep Learning y los documentos tienen una estructura conocida que puede formalizarse.
- Cuando desea un mayor control sobre la IA, analizando los resultados de predicción de las actividades de Deep Learning y de Fast Learning antes de transferir esos valores a los campos del documento. Por ejemplo, si espera extraer un número ubicado cerca de alguna palabra clave, puede filtrar las hipótesis que no parecen ser un número y aquellas que no están ubicadas cerca de la palabra clave. En general, si se requiere posprocesamiento con reglas, esto suele indicar que el conjunto de entrenamiento para las actividades de Deep Learning y de Fast Learning debe ampliarse, porque las tecnologías de aprendizaje automático pueden “captar” y aprender el tipo de datos de un campo, su ubicación típica y su contexto.
- Cuando tiene un archivo FlexiLayout de ABBYY FlexiLayout Studio que desea reutilizar. Para obtener más información, consulte Importing FlexiLayouts from ABBYY FlexiLayout Studio.
- Cuando sus documentos contienen estructuras complejas (p. ej., tablas anidadas, que son estructuras repetitivas dentro de otras tablas) que no pueden extraerse mediante otras actividades dirigidas a documentos semiestructurados.
