Revise la precisión de la clasificación por clase en la pestaña Result y corrija los problemas habituales del conjunto de entrenamiento que provocan clasificaciones erróneas.
Use this file to discover all available pages before exploring further.
Después de entrenar una Skill de clasificación, abra la pestaña Result en el Skill Designer de clasificación para ver con qué precisión el clasificador asigna etiquetas a cada clase y diagnosticar errores en el conjunto de entrenamiento. Las estadísticas se actualizan automáticamente cada vez que se entrena el clasificador. Si la precisión es baja, vaya a Errores de clasificación para consultar las causas más comunes y cómo corregirlas.
La tabla de resultados contiene todas las clases de usuario no vacías (excepto Sin clase). Las clases se ordenan primero por precisión (de menor a mayor), después por número de documentos y, por último, alfabéticamente por nombre. Aparece una barra de desplazamiento si no caben todas las filas en la pantalla.Al hacer clic en una fila, se abre la clase correspondiente en la pestaña Documentos. Si cambia el nombre de una clase en la pestaña Documentos, el nombre se actualiza automáticamente en la pestaña Result. Si elimina una clase después del entrenamiento, su nombre aparece en gris en la pestaña Result; la fila solo se elimina la próxima vez que se entrena el clasificador.
No existe un umbral de precisión fijo para un Skill de clasificación: el objetivo adecuado depende de su tolerancia a los documentos mal clasificados en las etapas posteriores y de cuánta revisión manual sea aceptable. Como guía práctica, procure lograr una alta precisión por clase (no solo en términos generales), siga iterando sobre las causas siguientes mientras la brecha continúe reduciéndose y deténgase cuando una clase cumpla su requisito de negocio o claramente se haya estancado a pesar de contar con datos de entrenamiento equilibrados y limpios. Si una clase se estanca muy por debajo de las demás, trátela como indistinguible y fusiónela con la clase más cercana.Una vez que la skill esté en producción, siga supervisando la Precisión del clasificador de documentos a lo largo del tiempo en el Panel de análisis y considere el Aprendizaje en línea para una mejora continua.
La mayoría de los casos de clasificación incorrecta se deben a errores en el conjunto de entrenamiento, por ejemplo, clases de referencia mal asignadas o un número insuficiente de documentos para una clase determinada.
Datos de entrenamiento insuficientes o desequilibrados
La baja calidad del clasificador puede deberse a lo siguiente:
Un número insuficiente de documentos cargados
Una distribución considerablemente desigual de documentos entre clases
Un número insuficiente de muestras de las variantes de documento más comunes para la clase dada
Mejore la calidad del clasificador añadiendo los documentos que faltan al conjunto de entrenamiento. Procure tener entre 100 y 1.000 documentos por clase e incluya documentos de ejemplo de las variantes de documento más comunes de cada clase en una proporción aproximada de uno a uno.Después de añadir los nuevos documentos al conjunto de entrenamiento, asigne una clase a cada uno y vuelva a entrenar el clasificador.
Si dos clases se confunden sistemáticamente porque no presentan diferencias significativas en la forma, el diseño o el texto, combínalas en una sola clase. Separa los documentos más adelante en el flujo mediante los valores de los campos extraídos si esa distinción sigue siendo importante.
Es probable que una clase para facturas de menos de 10,000yotraparafacturasdemaˊsde10,000 se confundan, ya que la única diferencia entre ellas es el monto total adeudado. Combínalas en una sola clase de Factura y ramifica según el monto más adelante en el flujo, después de extraer el total.