Zum Hauptinhalt springen
Dieses Objekt bietet Zugriff auf die Parameter, die bei der Validierung eines Klassifizierungsmodells verwendet werden. Dabei stehen Ihnen zwei Strategien zur Verfügung:
  1. Verwenden Sie den von ABBYY FineReader Engine bereitgestellten Validierungsalgorithmus. Er nutzt die k-fache Kreuzvalidierungsstrategie:
    Bei jeder Iteration werden die im Objekt TrainingData bereitgestellten kategorisierten Daten zufällig in FoldsCount gleich große Teile aufgeteilt. Jeder dieser Teile wird dann nacheinander zur Validierung verwendet: Ein Modell wird mit allen Teilen außer diesem trainiert und anschließend mit dem verbleibenden Teil geprüft.
    Der Prozess wird RepeatCount-mal wiederholt. Von den dabei entstehenden FoldsCount * RepeatCount Modellen wird dasjenige mit dem besten F-Measure-Score über die Eigenschaft ITrainingResult::Model zurückgegeben; die zugehörigen Score können über die Eigenschaft ITrainingResult::ValidationResult abgerufen werden.
    Die Anzahl der Objekte im Trainingssatz bei jedem Trainingsschritt entspricht <Gesamtzahl der Objekte> * (FoldsCount - 1) / FoldsCount. Beachten Sie, dass diese Zahl für einen Textklassifikator mindestens 4 und für einen kombinierten Klassifikator mindestens 8 betragen sollte. Stellen Sie sicher, dass Ihre Trainingsstichprobe genügend Objekte enthält.
  2. Deaktivieren Sie die Validierung, indem Sie ShouldPerformValidation auf FALSE setzen, trainieren Sie das Modell mit dem gesamten Datensatz und testen Sie die Leistung des Modells dann selbst, indem Sie die Methode IModel::Classify mit einer anderen bekannten Datenstichprobe verwenden.

Eigenschaften

NameTypBeschreibung
AveragingMethodAveragingMethodEnumDie Methode zur Berechnung der durchschnittlichen Scores für Genauigkeit, Präzision, Recall und F-Measure bei Klassifikatoren mit mehr als 2 Kategorien. Der Standardwert dieser Eigenschaft ist AM_Macro.
FoldsCountintDie Anzahl der Folds, die im Algorithmus der k-fachen Kreuzvalidierung verwendet werden. Der Standardwert dieser Eigenschaft ist 3.
RepeatCountintDie Anzahl der im Algorithmus verwendeten Iterationen. Der Standardwert dieser Eigenschaft ist 1.
ShouldPerformValidationVARIANT_BOOLGibt an, ob das trainierte Modell validiert werden soll. Der Standardwert dieser Eigenschaft ist FALSE.
ValidationParams Objektdiagramm

Beispiele

Dieses Objekt wird im Demo-Tool Classification für Windows und im Codebeispiel Classification für Linux und macOS verwendet.

Siehe auch

Dokumentklassifizierung