Zum Hauptinhalt springen
Wenn ein Klassifikator aus irgendeinem Grund für einen Batch von Dokumenten unzureichende Ergebnisse liefert, versuchen Sie Folgendes:
  • Prüfen Sie, ob Sie den Präzision-Recall-Schieberegler korrekt eingestellt haben;
  • Erhöhen Sie die Anzahl der Dokumente. Je größer Ihre Auswahl an Dokumenten ist, desto mehr unterschiedliche Dokumente derselben Klasse kann der Klassifikator erkennen;
  • Erstellen Sie zusätzliche Regeln, um die Klassen besser voneinander zu unterscheiden.
Gehen Sie wie folgt vor, um die Klassifizierungsqualität zu verbessern:
  • Prüfen Sie, ob Sie die gewünschten Werte für Präzision und Recall korrekt festgelegt haben;
  • Fügen Sie dem Trainingsdatensatz weitere relevante Dokumente hinzu. Dadurch lassen sich die Klassenattribute präziser bestimmen und der Klassifizierungsalgorithmus optimieren, was wiederum die Qualität des trainierten Klassifikators verbessert;
  • Überprüfen Sie die falsch klassifizierten Dokumente in den gelben Zellen der Tabelle im Tab Konfusionsmatrix (mit Rechtsklick können Sie sie anzeigen). Wenn anhand der Bedeutung des Textes und der ausgewählten Attribute offensichtlich ist, dass die Referenzklasse falsch zugewiesen wurde, weisen Sie stattdessen die richtige zu. Wenn sich die Referenzklasse des Dokuments nicht eindeutig bestimmen lässt, entfernen Sie es aus dem Trainings-Batch;
  • Möglicherweise enthält der Trainings-Batch thematisch ähnliche Klassen, die selbst für menschliche Experten schwer zu unterscheiden sind. Fassen Sie ähnliche Klassen zu einer Klasse zusammen;
  • Erstellen Sie zusätzliche Regeln, um die Unterscheidung zwischen den Klassen zu erleichtern.