Saltar al contenido principal
Este objeto proporciona acceso a los parámetros utilizados al validar un modelo de clasificación. Dispone de dos estrategias:
  1. Utilizar el algoritmo de validación proporcionado por ABBYY FineReader Engine. Este emplea la estrategia de validación cruzada k-fold:
    En cada iteración, los datos categorizados proporcionados en el objeto TrainingData se dividen aleatoriamente en FoldsCount partes iguales. Cada una de las partes se utiliza a su vez para la validación: se entrena un modelo con todas las partes excepto esa, y luego se evalúa con la parte restante.
    El proceso se repite RepeatCount veces. De los FoldsCount * RepeatCount modelos resultantes, el que muestra la mejor puntuación F-measure es devuelto por la propiedad ITrainingResult::Model, y sus puntuaciones pueden obtenerse a través de la propiedad ITrainingResult::ValidationResult.
    El número de objetos en el conjunto de entrenamiento en cada paso de entrenamiento será igual a <número total de objetos> * (FoldsCount - 1) / FoldsCount. Tenga en cuenta que este número debe ser de al menos 4 para el clasificador de texto y de al menos 8 para el clasificador combinado. Asegúrese de que su muestra de entrenamiento contenga suficientes objetos.
  2. Desactivar la validación estableciendo ShouldPerformValidation en FALSE, entrenar el modelo con el conjunto de datos de entrenamiento completo y, a continuación, evaluar el rendimiento del modelo de forma independiente utilizando el método IModel::Classify sobre otra muestra de datos conocida.

Propiedades

NombreTipoDescripción
AveragingMethodAveragingMethodEnumEl método para calcular los valores promedio de exactitud, precisión, exhaustividad y F-measure de clasificadores con más de 2 categorías. Esta propiedad es AM_Macro de forma predeterminada.
FoldsCountintEl número de particiones utilizadas en el algoritmo de validación cruzada de k particiones. El valor predeterminado de esta propiedad es 3.
RepeatCountintEl número de iteraciones utilizadas en el algoritmo. El valor predeterminado de esta propiedad es 1.
ShouldPerformValidationVARIANT_BOOLEspecifica si se debe validar el modelo entrenado. Esta propiedad es FALSE de forma predeterminada.
ValidationParams Diagrama de objetos

Ejemplos

Este objeto se utiliza en la herramienta de demostración Clasificación de Windows y en el ejemplo de código Clasificación para Linux y macOS.

Consulte también

Clasificación de documentos