- Utilizzare l’algoritmo di convalida fornito da ABBYY FineReader Engine. Usa la strategia di convalida incrociata k-fold:
A ogni iterazione, i dati categorizzati forniti nell’oggetto TrainingData vengono suddivisi casualmente in FoldsCount parti uguali. Ciascuna parte, a turno, viene utilizzata per la convalida: un modello viene addestrato su tutte le parti tranne quella in esame e poi verificato sull’ultima parte.
Il processo viene ripetuto RepeatCount volte. Tra i FoldsCount * RepeatCount modelli risultanti, quello con il punteggio F-measure migliore viene restituito dalla proprietà ITrainingResult::Model, mentre i relativi punteggi possono essere ottenuti tramite la proprietà ITrainingResult::ValidationResult.
Il numero di oggetti nel set di addestramento a ogni fase di addestramento sarà pari a <numero totale di oggetti> * (FoldsCount - 1) / FoldsCount. Tieni presente che questo numero deve essere almeno 4 per il classificatore di testo e almeno 8 per il classificatore combinato. Assicurati che il campione di addestramento contenga un numero sufficiente di oggetti. - Disattivare la convalida impostando ShouldPerformValidation su FALSE, addestrare il modello sull’intero set di dati di addestramento e quindi testarne le prestazioni autonomamente usando il metodo IModel::Classify su un altro campione di dati noto.
Proprietà
| Nome | Tipo | Descrizione |
|---|---|---|
| AveragingMethod | AveragingMethodEnum | Il metodo per calcolare i punteggi medi di accuratezza, precisione, recall e F-measure per i classificatori con più di 2 categorie. Per impostazione predefinita, questa proprietà è AM_Macro. |
| FoldsCount | int | Il numero di fold utilizzati nell’algoritmo di convalida incrociata k-fold. Il valore predefinito di questa proprietà è 3. |
| RepeatCount | int | Il numero di iterazioni utilizzate nell’algoritmo. Il valore predefinito di questa proprietà è 1. |
| ShouldPerformValidation | VARIANT_BOOL | Specifica se il modello addestrato deve essere convalidato. Per impostazione predefinita, questa proprietà è FALSE. |
Diagramma degli oggetti
