Varianten von Dokumenttypen
- Bei Hunderten von Varianten können Skills, die mit Online Learning in Vantage trainiert wurden, Daten nahezu fehlerfrei extrahieren.
- Bei Tausenden von Varianten können Skills, die mit der Deep-Learning-Aktivität trainiert wurden, Daten mit einer Genauigkeit von etwa 80 bis 90 % extrahieren, abhängig von der Komplexität der Dokumenttypen.
- Für die wichtigsten Varianten eines Dokumenttyps stellen Skills, die mit den Aktivitäten Fast Learning und/oder Extraction Rules trainiert wurden, eine präzise Extraktion von Daten aus komplexen Dokumenten sicher.
- Für strukturierte Dokumente, die immer denselben Informationstyp an exakt denselben Positionen enthalten, empfehlen wir die Verwendung von bis zu 10 Varianten. Wenn ein Formular mit fester Struktur viele Varianten hat, empfehlen wir, diese alle als unterschiedliche Dokumenttypen zu behandeln.
- Verwenden Sie beim Trainieren eines Skills eine repräsentative Dokumentenmenge, die mindestens 2–3 Dokumente jeder Variante enthält. Wenn es viele Varianten gibt und die Menge nicht mindestens ein Dokument jeder Variante enthält, können Sie die Deep-Learning-Aktivität verwenden. Sie erkennt Bildmuster, die räumliche Struktur von Dokumenten, Feldinhalte und umliegende Beschriftungen und kann Varianten verarbeiten, die nicht für das Training verwendet wurden.
- Verwenden Sie beim Testen eines Skills eine Dokumentenverteilung, die dem tatsächlichen Dokumentenfluss in der Produktion ähnelt: Der Prozentsatz der Dokumente einer bestimmten Variante im Trainingssatz sollte repräsentativ dafür sein, wie häufig die Variante in Ihrem Dokumentenfluss vorkommt. Dadurch wird sichergestellt, dass die Genauigkeitsschätzung gültig ist. Zu diesem Zweck testen Sie Skills anhand einer Zufallsstichprobe von Dokumenten aus dem tatsächlichen Dokumentenfluss in der Produktion.
- Eine Stichprobe für eine Variante ist besser als gar keine Stichprobe.
