- Strukturierte Dokumente enthalten eine Reihe klar definierter Datenfelder, deren Gestaltung, Anzahl und Anordnung sich von einem Dokument zum anderen nicht ändern. Beispiele für strukturierte Dokumente sind Formulare, Fragebögen und Anträge.
- Semistrukturierte Dokumente enthalten eine Reihe von Datenfeldern, deren Gestaltung, Anzahl und Anordnung von einem Dokument zum anderen erheblich variieren können. Sie werden manchmal auch als „flexible Dokumente“ bezeichnet. Ein Beispiel für semistrukturierte Dokumente sind Rechnungen, bei denen die Anzahl der Einträge und die Formatierung häufig vom ausstellenden Unternehmen abhängen.
- Unstrukturierte Dokumente enthalten Informationen, die in keiner Weise strukturiert sind. Sie enthalten außerdem keine expliziten Datenfelder. Beispiele für unstrukturierte Dokumente sind Verträge, Briefe und Bestellungen.
- Installieren Sie das NLP-Modul.
- Erstellen Sie eine Dokumentdefinition.
- Erstellen und trainieren Sie ein NLP-Modell.
- Alternativ können Sie ein vorhandenes NLP-Modell in Ihre Dokumentdefinition laden.
