Hinweis: Diese Aktivität kann keine komplexen Strukturen extrahieren (zum Beispiel verschachtelte Tabellen, also wiederholende Strukturen innerhalb anderer Tabellen) und keine Felder eines anderen Typs als Text. Um solche Strukturen zu extrahieren, verwenden Sie die Extraction Rules-Aktivität.
Anwendungsfälle
- Ihr Skill dazu verwendet wird, mehrere Varianten eines bestimmten Dokumenttyps zu verarbeiten.
- Sie vorhaben, Dokumentvarianten zu verarbeiten, für die Ihr Skill noch nicht trainiert wurde. Beispielsweise verfügen Sie möglicherweise über einen Document-Skill mit einer Fast Learning-Aktivität, der darauf trainiert wurde, Felder aus Kreditverträgen (mit unterschiedlichen Feldstrukturen) zu extrahieren, die von mehreren verschiedenen Banken stammen. Wenn Sie sich entscheiden, diesen bestehenden Skill zu verwenden, um Kreditverträge einer neuen, dem Skill noch unbekannten Bank zu verarbeiten, kann die Extraktionsqualität unzureichend sein. Um die Extraktionsqualität zu verbessern, können Sie statt einer Fast Learning-Aktivität eine Deep Learning-Aktivität verwenden.
Funktionsweise
Trainingsanforderungen
- Für Dokumente mit hoher Variabilität: Es werden mindestens 200–300 Beispieldokumente benötigt (2–3 Beispieldokumente pro Variante).
- Für Dokumente mit geringer Variabilität: Es werden mindestens 10 Beispieldokumente benötigt (2–3 Beispieldokumente pro Variante).
