| Das Ergebnis dieses Szenarios ist eine bearbeitbare Version eines Dokuments. In diesem Szenario werden Dokumentbilder erkannt, wobei die ursprüngliche Formatierung vollständig erhalten bleibt, und die Daten in einem bearbeitbaren Dateiformat gespeichert. So erhalten Sie bearbeitbare Versionen Ihrer Dokumente, die sich einfach auf Fehler prüfen und bearbeiten lassen. SeeDokumentkonvertierungfür weitere Informationen. |
| In diesem Verarbeitungsszenario werden Papierdokumente in nicht bearbeitbare digitale Kopien umgewandelt, die sämtliche Dokumentinformationen in einem durchsuchbaren Format enthalten. Dadurch lassen sich digitale Dokumentkopien in einem elektronischen Archiv per Volltextsuche leicht finden, Textabschnitte kopieren sowie Dokumente per E-Mail versenden oder ausdrucken. SeeDokumentarchivierungfür weitere Informationen. |
| Dieses Szenario wird verwendet, um alle möglichen Daten aus einem Dokument zu extrahieren und strukturiert zu speichern. Das Ergebnis ist eine JSON-Datei, die die Dokumentstruktur abbildet. Sie speichert alle Dokumentobjekte: gedruckten und handschriftlichen Text, Tabellen, Barcodes, Häkchen und Bilder mit ihrer Position und ihren Attributen. Dieses Format ist optimal für die weitere Verarbeitung, die Speicherung in einer Datenbank oder die Integration in eine andere Anwendung. SeeDatenextraktionfür weitere Informationen. |
| Dieses Szenario ermöglicht die Extraktion des Fließtexts eines Dokuments sowie von Texten auf Logos, Siegeln und anderen Elementen außerhalb des Fließtexts. Die natürliche Reihenfolge des Textes, “wie ein Mensch ihn lesen würde”, bleibt erhalten. Anschließend können Sie die Dokumente an Ihre eigenen Engines für die Verarbeitung natürlicher Sprache (NLP) übergeben, damit sie beispielsweise schnell zusammengefasst, auf sensible Informationen durchsucht oder einer Sentiment-Analyse unterzogen werden. SeeTextextraktionfür weitere Informationen. |
| Bei der Felderkennung werden kurze Textfragmente erkannt, um Daten aus bestimmten Feldern zu erfassen. Die Erkennungsqualität ist in diesem Szenario entscheidend. Dieses Szenario kann auch als Teil komplexerer Szenarien verwendet werden, in denen aussagekräftige Daten aus Dokumenten extrahiert werden sollen (zum Beispiel, um Daten aus Papierdokumenten in Informationssysteme und Datenbanken zu übernehmen oder Dokumente in Dokumentenmanagementsystemen automatisch zu klassifizieren und zu indexieren). In diesem Szenario erkennt das System entweder mehrere Textzeilen in nur einigen Feldern oder den gesamten Text in einem kleinen Bild. Das System berechnet für jedes erkannte Zeichen einen Zuverlässigkeitswert. Diese Werte können dann bei der Überprüfung der Erkennungsergebnisse verwendet werden. Zusätzlich kann das System mehrere Erkennungsvarianten für Wörter und Zeichen im Text speichern, die anschließend in Abstimmungsalgorithmen genutzt werden können, um die Erkennungsqualität zu verbessern. SeeFelderkennungfür weitere Informationen. |
| In diesem Szenario wird ABBYY FineReader Engine zum Lesen von Barcodes verwendet. Barcodes werden beispielsweise für die automatische Dokumententrennung, für die Verarbeitung von Dokumenten durch ein Dokumentenmanagementsystem oder für die Indexierung und Klassifizierung von Dokumenten benötigt. Dieses Szenario kann als Teil anderer Szenarien verwendet werden. So können beispielsweise mit Hochgeschwindigkeits-Produktionsscannern gescannte Dokumente mithilfe von Barcodes getrennt werden, oder für die Langzeitarchivierung vorbereitete Dokumente können anhand ihrer Barcodewerte in archivierende Dokumentenmanagementsysteme übernommen werden. Beim Extrahieren von Barcodes aus Texten kann das System alle Barcodes oder nur Barcodes eines bestimmten Typs mit einem bestimmten Wert erkennen. Das System kann den Wert eines Barcodes ermitteln und seine Prüfsumme berechnen. Erkannte Barcodewerte können in für die Weiterverarbeitung besonders geeigneten Formaten gespeichert werden, zum Beispiel in TXT. SeeBarcodeerkennungfür weitere Informationen. |
| Visitenkarten enthalten geschäftliche Informationen über ein Unternehmen oder eine Person. Visitenkarten können Namen, Unternehmensnamen, Telefonnummern, Faxnummern, E-Mail-Adressen, Website-Adressen und ähnliche Informationen enthalten. Möglicherweise müssen Sie diese Informationen von Papier-Visitenkarten erfassen und in einem elektronischen Format speichern. Das kann ein elektronisches Adressbuch auf einem Mobiltelefon, in einem E-Mail-Client oder in einem anderen Datenspeichersystem sein. Beispielsweise werden Visitenkarten häufig per E-Mail oder über ein Netzwerk im vCard-Format weitergegeben. SeeVisitenkartenerkennungfür weitere Informationen. |
| Die offiziellen Reise- oder Ausweisdokumente vieler Länder enthalten eine maschinenlesbare Zone (MRZ), die eine genauere Verarbeitung der Dokumentdaten ermöglicht. Dieses Szenario wird verwendet, um Daten aus einer maschinenlesbaren Zone auf Ausweisdokumenten beim Kunden-Onboarding oder in Verifizierungsprozessen zu extrahieren. Das System erkennt die MRZ im Dokumentbild und extrahiert die darin enthaltenen Daten. Die extrahierten Daten umfassen mehrere Felder mit persönlichen Angaben zum Dokument und zu seinem Inhaber (Dokumenttyp und Ablaufdatum, Vor- und Nachname des Dokumentinhabers usw.). Sie können die Felder durchsuchen, die Daten überprüfen und sie zur weiteren Verarbeitung in einer externen Datei speichern. SeeErfassung der maschinenlesbaren Zonefür weitere Informationen. |
| Nur unter Windows. In diesem Szenario wird ABBYY FineReader Engine auf einem “Scancomputer” verwendet, der Bilder scannt und als Dateien speichert. Dieses Szenario kann in einer vorgelagerten Phase der Dokumentverarbeitung als Teil anderer Szenarien verwendet werden, d. h. zum Erstellen elektronischer Versionen von Dokumenten für die weitere Verarbeitung. Anwendungsbeispiele sind das Scannen von Dokumenten zu Archivierungszwecken, das Erstellen bearbeitbarer Versionen von Dokumenten und das Extrahieren relevanter Daten aus Dokumenten. Papierdokumente werden gescannt, und die Bilder werden in einem elektronischen Format gespeichert. So entstehen hochwertige elektronische Versionen Ihrer gedruckten Dokumente. SeeScannenfür weitere Informationen. |
| Die Aufgabe der Dokumentklassifizierung besteht darin, ein Dokument einer der benutzerdefinierten Kategorien zuzuordnen. Möglicherweise arbeiten Sie mit einem Dokumentenbestand, der aus Dokumenten verschiedener Typen besteht, zum Beispiel Verträgen, Rechnungen und Belegen. Sie müssen den Typ jedes Dokuments identifizieren. So möchten Sie die Dokumente beispielsweise in verschiedene Ordner sortieren oder sie entsprechend ihrem Typ umbenennen. Dies kann mit einem vortrainierten System automatisch erfolgen. Der wesentliche Aspekt dieses Szenarios ist, dass Sie wissen, welche Dokumenttypen Sie verarbeiten werden. ABBYY FineReader Engine kann Dokumente anhand ihres Erscheinungsbilds oder ihres Inhalts klassifizieren. SeeDokumentklassifizierungfür weitere Informationen. |
| Bei der Arbeit mit Papierdokumenten müssen Sie Fehler und absichtlich vorgenommene Änderungen erkennen und korrigieren. Dieses Szenario wird verwendet, um besonders wichtige Dokumente wie Verträge und Bankunterlagen mit ihren Kopien zu vergleichen. Das Vergleichsergebnis enthält Informationen über Unterschiede beim Inhaltstyp (nur Text), bei der Art der Änderung (gelöscht, eingefügt oder geändert) sowie über deren Positionen im Original und in der Kopie. Sie können die Liste der erkannten Unterschiede oder den Bereich jeder Änderung abrufen und das Vergleichsergebnis zur weiteren Verarbeitung oder langfristigen Speicherung in einer externen Datei speichern. SeeDokumentenvergleichfür weitere Informationen. |











