Saltar al contenido principal
Cuando finaliza el entrenamiento, se muestran las estadísticas de clasificación. Puede usar estas estadísticas para mejorar el clasificador. Para abrir la ventana de estadísticas de clasificación, haga una de las siguientes acciones:
  • Seleccione Classification Training → View Statistics en el menú principal, o
  • Haga clic en el botón Statistics de la Toolbar.
La siguiente información está disponible:
  • F-measure, Recall,yPrecision – Cuanto más altos sean estos valores, más precisos serán los resultados de la clasificación. (Para más Details sobre cómo se calcula la F-measure, consulte Glossary, Classifier F-measure).
    • El número de páginas con clases de referencia
    • Resultados de la clasificación de páginas:
      • True Positive – El número de páginas a las que se asignó la clase de referencia.
      • False Positive – El número de páginas a las que se asignó una clase distinta de la clase de referencia.
      • False Negative – El número de páginas con una clase de referencia a las que no se asignó ninguna clase.
      • True Negative – El número de páginas sin clases de referencia a las que no se asignó ninguna clase.
Use la lista desplegable de la esquina superior izquierda de la ventana Classification Statistics para elegir si desea mostrar las estadísticas de las páginas For Testing, de las páginas Para entrenamiento o de ambas. La información detallada sobre la relación entre las clases de referencia y las clases de resultado, así como la información sobre los resultados del entrenamiento del clasificador, se presenta de tres maneras diferentes:
  1. Confusion Matrix. La matriz de confusión es una representación visual de los documentos que un clasificador confunde con más frecuencia. Los valores de las celdas de la matriz representan la relación entre las clases de referencia y las clases de resultado. Las celdas verdes muestran el número de páginas a las que se asignó correctamente una clase. Las celdas rojas muestran el número de páginas con clases confundidas: clases que el clasificador asignó incorrectamente a páginas con una clase de referencia.
  • La opción Confused only oculta las clases en las que las clases de resultado de todas las páginas coincidieron con su clase de referencia.
  • Los botones Pages y Percent permiten al usuario alternar entre datos numéricos y porcentuales sobre el número de páginas con clases identificadas correctamente y clases confundidas (el porcentaje se calcula usando la proporción de páginas con una clase asignada correctamente respecto del total de páginas con la misma clase de referencia).
  • La escala de la matriz se puede administrar de la siguiente manera:
    • - muestra la matriz con una escala fija;
    • - muestra la matriz completa;
    • - acercar;
    • - alejar.
  1. Statistics by Class. Una tabla que contiene estadísticas de las páginas cuya clase de resultado no coincide con la clase de referencia. Permite al usuario identificar las clases que provocan más errores en un clasificador determinado. Puede ordenar por número de páginas confundidas, así como por la proporción de páginas confundidas respecto del número total de páginas de esa clase de referencia.
  2. Clases confusas. Esta tab contiene una lista de todas las clases que un clasificador asignó incorrectamente. Con estos datos, puede determinar qué clases se confunden con más frecuencia entre sí.
Al hacer doble clic en una celda de la matriz o en una fila de la tabla de datos, se abrirán las páginas de las clases seleccionadas. La fila de búsqueda de clases de referencia y de resultado está disponible en todas las tabs. También puede ordenar cualquier tabla de datos para averiguar qué clases son las más problemáticas. Para su comodidad, puede exportar las estadísticas a un archivo de texto haciendo clic en Export Statistics… en el cuadro de diálogo Classification Statistics. En el cuadro de diálogo que se abre, especifique un nombre y una ubicación para el archivo exportado y elija si desea guardarlo como archivo CSV o TXT. También puede elegir qué estadísticas exportar (seleccione una o más opciones):
  • Estadísticas resumidas de los principales parámetros de clasificación: F-measure, Recall, Precision y resultados de clasificación desglosados por página.
  • Principales parámetros de clasificación desglosados por clase.
  • Clases confusas: número y porcentaje de páginas de cada clase confusa.
  • Todas las clases: número y porcentaje de páginas de cada clase.
Las estadísticas solo se exportarán para las páginas con el estado de documento seleccionado en el cuadro de diálogo Classification Statistics.
Debe volver a inicializar el entrenamiento del clasificador si se ha realizado alguna de las siguientes acciones:
  • Se agregaron o eliminaron documentos con el estado Para entrenamiento asignado;
  • Se asignó o quitó el estado Para entrenamiento a un documento;
  • Se agregaron, eliminaron o fusionaron clases;
  • Se asignó una clase de referencia distinta a un documento;
  • Se modificó un perfil de clasificación y/o la prioridad de precisión-recall.