Saltar al contenido principal
Mientras se entrena un clasificador, se recopilan estadísticas sobre los resultados de la clasificación. Analizar estas estadísticas ayuda a entender cómo mejorar la calidad de un clasificador. Las estadísticas de clasificación se encuentran en la pestaña Result del Skill Designer de clasificación y se actualizan automáticamente cada vez que se entrena el clasificador. Pestañas de análisis del Skill de clasificación Esta pestaña contiene la siguiente información:
  • Precisión general de la clasificación. El porcentaje de documentos clasificados correctamente en relación con el número total de documentos del conjunto.
  • Precisión de la clasificación por clase. El porcentaje de documentos que se clasificaron correctamente para una clase determinada.
  • La cantidad de documentos correctamente clasificados e incorrectamente clasificados de cada clase.
  • La fecha y hora en que el clasificador se entrenó por última vez.
La tabla de resultados contiene todas las clases de usuario no vacías (excluyendo No class). Las clases en la tabla se ordenan primero por la precisión del clasificador (de peor a mejor), luego por la cantidad de documentos en la clase y, por último, alfabéticamente por nombre. Si no se pueden mostrar todas las filas de la tabla en la pantalla a la vez, se mostrará una barra de desplazamiento. Al hacer clic en una fila de la tabla de resultados, se dirige al usuario a la clase correspondiente en la pestaña Documents. Modificar el nombre de una clase en la pestaña Documents también lo actualiza en la pestaña Result. Si elimina una clase después de entrenar el clasificador correspondiente, el nombre de esta clase aparecerá atenuado en la pestaña Result. La fila que contiene esta clase se elimina de la tabla de resultados solo cuando se vuelve a entrenar el clasificador.

Errores de clasificación

La mayoría de los casos de clasificación incorrecta se deben a errores cometidos al crear el conjunto de entrenamiento (por ejemplo, clases de referencia mal asignadas o un número insuficiente de páginas específicas en un conjunto de documentos).

Clases de referencia asignadas incorrectamente

Para corregir este tipo de error, asigne la clase correcta a ese documento del conjunto de entrenamiento y vuelva a entrenar el clasificador de la siguiente manera:
  1. Vaya a la pestaña Documentos haciendo clic en Review Prediction in Document Set en el panel Actions. Como alternativa, haga clic en la fila con la clase correspondiente en la tabla de resultados.
  2. Seleccione un documento al que se le haya asignado incorrectamente una clase de referencia.
  3. Haga clic en el nombre de la clase correcta en el panel Actions.
  4. Repita los pasos 2 y 3 para cada documento al que se le haya asignado incorrectamente una clase de referencia.
  5. Haga clic en el botón Train en el panel Actions.

Número insuficiente de páginas en el conjunto de documentos

La baja calidad del clasificador puede deberse a lo siguiente:
  • Un número insuficiente de documentos cargados
  • Una distribución considerablemente desigual de documentos entre clases
  • Un número insuficiente de muestras de las variantes de documento más comunes para la clase dada
En este caso, la calidad del clasificador puede mejorarse añadiendo los documentos que faltan al conjunto de entrenamiento. Recomendamos cargar entre 100 y 1000 documentos por clase. También sugerimos que su conjunto de documentos incluya documentos de muestra de las variantes de documento más comunes de cada clase, en una proporción aproximadamente de uno a uno. Después de añadir los nuevos documentos al conjunto de entrenamiento, asigne una clase a cada uno y vuelva a entrenar el clasificador.

Clases confundidas

Los errores de clasificación también pueden deberse a clases que no difieren de forma significativa entre sí en cuanto a sus parámetros. En este caso, revise el número de clases y, si es necesario, unifique las clases confundidas en una sola. Por ejemplo, una clase para facturas de menos de 10.000 USD y una clase para facturas de más de 10.000 USD pueden confundirse si su única diferencia significativa es el Total adeudado. En este caso, estas clases deben unificarse en una sola clase para la Skill de clasificación, y las facturas solo deberían separarse en una etapa posterior si fuera necesario (por ejemplo, cuando el Total adeudado ya se haya extraído de la factura).

Consulta también