- Verwenden Sie den von ABBYY FineReader Engine bereitgestellten Validierungsalgorithmus. Er nutzt die k-fache Kreuzvalidierungsstrategie:
Bei jeder Iteration werden die im Objekt TrainingData bereitgestellten kategorisierten Daten zufällig in FoldsCount gleich große Teile aufgeteilt. Jeder dieser Teile wird dann nacheinander zur Validierung verwendet: Ein Modell wird mit allen Teilen außer diesem trainiert und anschließend mit dem verbleibenden Teil geprüft.
Der Prozess wird RepeatCount-mal wiederholt. Von den dabei entstehenden FoldsCount * RepeatCount Modellen wird dasjenige mit dem besten F-Measure-Score über die Eigenschaft ITrainingResult::Model zurückgegeben; die zugehörigen Score können über die Eigenschaft ITrainingResult::ValidationResult abgerufen werden.
Die Anzahl der Objekte im Trainingssatz bei jedem Trainingsschritt entspricht <Gesamtzahl der Objekte> * (FoldsCount - 1) / FoldsCount. Beachten Sie, dass diese Zahl für einen Textklassifikator mindestens 4 und für einen kombinierten Klassifikator mindestens 8 betragen sollte. Stellen Sie sicher, dass Ihre Trainingsstichprobe genügend Objekte enthält. - Deaktivieren Sie die Validierung, indem Sie ShouldPerformValidation auf FALSE setzen, trainieren Sie das Modell mit dem gesamten Datensatz und testen Sie die Leistung des Modells dann selbst, indem Sie die Methode IModel::Classify mit einer anderen bekannten Datenstichprobe verwenden.
Eigenschaften
| Name | Typ | Beschreibung |
|---|---|---|
| AveragingMethod | AveragingMethodEnum | Die Methode zur Berechnung der durchschnittlichen Scores für Genauigkeit, Präzision, Recall und F-Measure bei Klassifikatoren mit mehr als 2 Kategorien. Der Standardwert dieser Eigenschaft ist AM_Macro. |
| FoldsCount | int | Die Anzahl der Folds, die im Algorithmus der k-fachen Kreuzvalidierung verwendet werden. Der Standardwert dieser Eigenschaft ist 3. |
| RepeatCount | int | Die Anzahl der im Algorithmus verwendeten Iterationen. Der Standardwert dieser Eigenschaft ist 1. |
| ShouldPerformValidation | VARIANT_BOOL | Gibt an, ob das trainierte Modell validiert werden soll. Der Standardwert dieser Eigenschaft ist FALSE. |
Objektdiagramm
