Zum Hauptinhalt springen
Um einen Klassifikator zu trainieren, benötigen Sie einen Trainingsdatensatz, der Dokumente enthält, denen bereits eine Referenzklasse zugewiesen wurde.

Erstellen eines Trainingssatzes

  1. Öffnen Sie im Classification Skill Designer die Registerkarte Documents.
  2. Erstellen Sie die entsprechenden Klassen über den Befehl Create Class im Bereich Actions oder durch Klicken auf Create class oberhalb der Klassenliste im linken Bereich des Bildschirms.
    Hinweis: Um eine vorhandene Klasse umzubenennen, klicken Sie auf das Symbol neben dem Klassennamen und wählen Sie Rename class.
  3. Wählen Sie eine Klasse aus der Klassenliste im linken Bereich des Bildschirms und laden Sie Dokumente dafür hoch, indem Sie entweder Upload documents in der Mitte des Classification Skill-Bildschirms, die Schaltfläche Upload in der Symbolleiste oder Upload Documents im Bereich Actions anklicken. Während des Hochladens wird oben im Skill Designer rechts neben den Lesezeichen ein Fortschrittsindikator angezeigt. Der Tooltip des Indikators enthält Informationen über die Anzahl der Dokumente, die noch hochgeladen und verarbeitet werden müssen.
    Hinweis: Dokumente, die in die Gruppe No class hochgeladen wurden, werden nicht für das Training und Testen des Klassifizierers verwendet.
Für jede Klasse wird die Anzahl der zugehörigen Dokumente angezeigt. Wenn Ihr Dokumentensatz sehr wenige Klassen enthält oder wenn sich die Klassen deutlich voneinander unterscheiden, genügt eine geringe Anzahl von Dokumenten pro Klasse. Wenn es hingegen sehr viele Klassen gibt oder die Unterschiede zwischen den Klassen nicht groß genug sind, empfehlen wir, zwischen 10 und 100 Dokumente pro Klasse hochzuladen, da eine geringere Anzahl in diesem Fall zu Klassifizierungsfehlern führen kann. In jedem Fall empfehlen wir nicht, mehr als 1.000 Dokumente pro Klasse hochzuladen. Um die Klassifizierungsgenauigkeit zu maximieren, fügen Sie Beispieldokumente für die gängigsten Varianten jeder Klasse hinzu (etwa ein Dokument pro Variante). Standardmäßig werden alle hochgeladenen Dokumente als Liste angezeigt. Dies erleichtert die Navigation, wenn die Dateien aussagekräftige Namen haben. Sie können auch zur Miniaturansicht wechseln, was vorzuziehen sein kann, wenn die Dokumente sich visuell unterscheiden. Um zwischen diesen beiden Ansichtsmodi zu wechseln, verwenden Sie die folgenden Schaltflächen in der Symbolleiste:
  • Listenansicht
  • Miniaturansicht
Wenn mehr als 50 Dokumente hochgeladen werden, werden sie auf mehrere Seiten verteilt. In beiden Ansichten können Sie ein Dokumentvorschaufenster öffnen, indem Sie auf die Schaltfläche links neben dem Dokumentnamen klicken. Die Standardbreite dieses Fensters beträgt 35 % der Breite des Browserfensters. Bei Bedarf können Sie die Breite des Vorschaufensters durch Ziehen des linken Rands auf bis zu 80 % der Browserfensterbreite erhöhen. Benutzerdefinierte Breiten bleiben erhalten, bis der Browsercache gelöscht wird. Bei Bedarf können Sie die Ausrichtung der Dokumentseiten in jeder Klasse manuell ändern, indem Sie in der Symbolleiste auf Rotate klicken. Dadurch werden die Seiten um 90° gegen den Uhrzeigersinn gedreht. Alternativ können Sie eine der folgenden Optionen aus der Dropdown-Liste auswählen: Rotate Left, Rotate Right oder Rotate 180°. Sie können auch das Dokumentvorschaufenster verwenden, um die Seitenausrichtung eines bestimmten Dokuments zu ändern, indem Sie auf die Schaltfläche klicken und eine passende Drehoption wählen. Wenn eine Datei aus irgendeinem Grund nicht hochgeladen wurde (z. B. weil das Dateiformat nicht unterstützt wird), wird ihr Name rot angezeigt.

Ändern der einem Dokument zugewiesenen Klasse

Sie können die Referenzklasse, die einem hochgeladenen Dokument zugewiesen ist, wie folgt ändern:
  1. Markieren Sie ein oder mehrere Dokumente, denen eine neue Klasse zugewiesen werden soll, indem Sie das Kontrollkästchen links neben ihren Namen aktivieren.
  2. Wählen Sie in der Liste im Bereich Aktionen die passende Klasse für das bzw. die Dokumente aus und klicken Sie auf Zuweisen. Wenn die richtige Klasse nicht in der Liste angezeigt wird, geben Sie im Feld Nach Klasse suchen im Bereich Aktionen einen neuen Namen ein und klicken Sie auf Erstellen.

Entfernen von Dokumenten aus einem Set

Sie können Dokumente auf eine der folgenden Arten aus einem Set entfernen:
  • Markieren Sie ein oder mehrere zu entfernende Dokumente, indem Sie das Kontrollkästchen links neben ihren Namen aktivieren. Sie können alle Dokumente einer bestimmten Klasse markieren, indem Sie das Kontrollkästchen links neben dem Namen dieser Klasse oberhalb der Dokumentenliste aktivieren (wenn die Dokumente der Klasse über mehrere Seiten angezeigt werden, werden nur die auf der aktuellen Seite angezeigten Dokumente markiert). Klicken Sie auf das Symbol neben einem der markierten Dokumente und anschließend auf Löschen. Bestätigen Sie Ihre Auswahl im daraufhin angezeigten Dialogfeld. Dadurch werden die markierten Dokumente gelöscht.
    Hinweis: Auch wenn ein Dokument nicht markiert ist, können Sie es löschen, indem Sie auf das Symbol neben seinem Namen klicken.
  • Klicken Sie auf das Symbol neben einem Klassennamen in der Klassenliste und anschließend auf Alle Dokumente löschen. Bestätigen Sie Ihre Auswahl im daraufhin angezeigten Dialogfeld. Dadurch werden alle Dokumente der ausgewählten Klasse gelöscht. Alternativ können Sie auf Klasse mit allen Dokumenten löschen klicken; dadurch werden sowohl die Klasse selbst als auch alle darin enthaltenen Dokumente gelöscht.

Einen Klassifikator trainieren

Um einen Klassifikator mit einem speziell vorbereiteten Trainingssatz zu trainieren, klicken Sie im Bereich Actions auf Train. Die Schaltfläche Train ist nur aktiv, wenn der Trainingssatz mindestens zwei verschiedene nicht leere Klassen enthält. Nach Abschluss des Trainings wird neben der Schaltfläche Train das Completed-icon angezeigt. Außerdem ändert sich die Darstellung der Klassenliste auf der Registerkarte Documents. Zusätzlich zur Anzahl der hochgeladenen Dokumente je Klasse wird auch die Anzahl der Dokumente angezeigt, bei denen die vorhergesagte Klasse von der Referenzklasse abweicht. Classification Skill Training Documents Amount Sie können das Training des Klassifikators beenden, indem Sie unter der Schaltfläche Train im Bereich Actions auf Cancel klicken.

Siehe auch

Analyse der Klassifikationsergebnisse