Variantes de tipo de documento
- Para cientos de variantes, las skills entrenadas mediante Online Learning en Vantage podrán extraer datos casi a la perfección.
- Para miles de variantes, las skills entrenadas mediante la actividad Deep Learning podrán extraer datos con una precisión de aproximadamente un 80% a un 90%, según la complejidad de los tipos de documento.
- Para las variantes más importantes de un tipo de documento, las skills entrenadas mediante las actividades Fast Learning y/o Extraction Rules garantizarán una extracción precisa de datos de documentos complejos.
- Para documentos estructurados, que siempre tienen el mismo tipo de información exactamente en las mismas ubicaciones, recomendamos usar hasta 10 variantes. Si un formulario fijo tiene muchas variantes, recomendamos tratarlas todas como tipos de documento diferentes.
- Al entrenar una skill, utilice un conjunto de documentos representativo que contenga al menos 2-3 documentos de cada variante. Si hay muchas variantes y el conjunto no contiene al menos un documento de cada variante, puede usar la actividad Deep Learning. Esta entiende patrones de imagen, la estructura espacial de los documentos, el contenido de los campos y las etiquetas circundantes, y puede procesar variantes que no se usaron para el entrenamiento.
- Al probar una skill, utilice una distribución de documentos similar a la del flujo real de documentos en producción: el porcentaje de documentos de una variante específica en el conjunto de entrenamiento debe ser representativo de la frecuencia con la que la variante aparece en su flujo de documentos. Esto garantizará que la estimación de precisión sea válida. Para ello, pruebe las skills usando una muestra aleatoria de documentos del flujo real de documentos en producción.
- Es mejor contar con una muestra de alguna variante que no contar con ninguna muestra.
