- Utilizar el algoritmo de validación proporcionado por ABBYY FineReader Engine. Este emplea la estrategia de validación cruzada k-fold:
En cada iteración, los datos categorizados proporcionados en el objeto TrainingData se dividen aleatoriamente en FoldsCount partes iguales. Cada una de las partes se utiliza a su vez para la validación: se entrena un modelo con todas las partes excepto esa, y luego se evalúa con la parte restante.
El proceso se repite RepeatCount veces. De los FoldsCount * RepeatCount modelos resultantes, el que muestra la mejor puntuación F-measure es devuelto por la propiedad ITrainingResult::Model, y sus puntuaciones pueden obtenerse a través de la propiedad ITrainingResult::ValidationResult.
El número de objetos en el conjunto de entrenamiento en cada paso de entrenamiento será igual a <número total de objetos> * (FoldsCount - 1) / FoldsCount. Tenga en cuenta que este número debe ser de al menos 4 para el clasificador de texto y de al menos 8 para el clasificador combinado. Asegúrese de que su muestra de entrenamiento contenga suficientes objetos. - Desactivar la validación estableciendo ShouldPerformValidation en FALSE, entrenar el modelo con el conjunto de datos de entrenamiento completo y, a continuación, evaluar el rendimiento del modelo de forma independiente utilizando el método IModel::Classify sobre otra muestra de datos conocida.
Propiedades
| Nombre | Tipo | Descripción |
|---|---|---|
| AveragingMethod | AveragingMethodEnum | El método para calcular los valores promedio de exactitud, precisión, exhaustividad y F-measure de clasificadores con más de 2 categorías. Esta propiedad es AM_Macro de forma predeterminada. |
| FoldsCount | int | El número de particiones utilizadas en el algoritmo de validación cruzada de k particiones. El valor predeterminado de esta propiedad es 3. |
| RepeatCount | int | El número de iteraciones utilizadas en el algoritmo. El valor predeterminado de esta propiedad es 1. |
| ShouldPerformValidation | VARIANT_BOOL | Especifica si se debe validar el modelo entrenado. Esta propiedad es FALSE de forma predeterminada. |
Diagrama de objetos
