Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

Ein Container zur Hypothesenfilterung kombiniert mehrere Deep‑Learning‑Aktivitäten mit einer Aktivität „Extraktionsregeln“. Die Ergebnisse der Deep‑Learning‑Aktivitäten werden an die Aktivität „Extraktionsregeln“ übergeben, die Bedingungen festlegt, um die gewünschten Werte auszuwählen. Auch wenn eine Deep‑Learning‑Aktivität eine sehr hohe Qualität bei der Feldextraktion erreichen kann, möchten Sie in manchen Fällen deren Ausgabe gezielt steuern. Dazu können Sie eine oder mehrere Deep‑Learning‑Aktivitäten mit einer Aktivität „Extraktionsregeln“ kombinieren, die Bedingungen auf die von den Deep‑Learning‑Aktivitäten gelieferten Werte anwendet. Die Steuerung der Ausgabe ist wichtig, wenn das neuronale Netz ganze Wörter findet, Sie jedoch nur bestimmte Teile benötigen, oder wenn versehentlich erfasste Störungen herausgefiltert werden müssen. Sie kann auch hilfreich sein, um Teile größerer Felder wie Adressen zu identifizieren, die vom neuronalen Netz übersehen werden könnten. Außerdem ermöglicht sie die Auswahl der besten Hypothese bei mehreren Vorkommen desselben Werts. Wenn beispielsweise ein Vendor‑Name mehrfach auf einem Dokument erscheint, können Sie aus den mehreren Vorkommen das genaueste Extraktionsergebnis auswählen.
Diese Technologie wird als Vorschau bereitgestellt und in zukünftigen Versionen weiter verbessert.

Einen Container zur Hypothesenfilterung einrichten

1

Container erstellen

Klicken Sie auf den Block mit der Deep Learning-Aktivität und wählen Sie Filter Hypotheses aus. Dadurch wird ein neuer Container zur Hypothesenfilterung erstellt, in den die ausgewählte Deep Learning-Aktivität eingefügt wird.
2

Weitere Deep Learning-Aktivitäten hinzufügen (optional)

Ziehen Sie weitere Deep Learning-Aktivitäten auf den Container zur Hypothesenfilterung. So können Sie die Ausgabe von zwei oder mehr Deep Learning-Aktivitäten kombinieren und vergleichen. Zwei Aktivitäten können beispielsweise erforderlich sein, wenn Sie gleichzeitig mit Textfeldern und Tabellen arbeiten.
3

Eine Aktivität „Extraktionsregeln“ hinzufügen

Fügen Sie dem Container eine Aktivität „Extraktionsregeln“ hinzu. Sie können entweder durch Klicken auf den Platzhalter eine neue Aktivität erstellen oder eine vorhandene Aktivität auf den Container ziehen.
4

Die Aktivität „Extraktionsregeln“ einrichten

Fügen Sie für jeden von den Deep Learning-Aktivitäten gefundenen Wert ein Deep Learning-Suchelement hinzu und legen Sie dessen Eigenschaften fest. Sie können alle Ausgabefelder einer Deep Learning-Aktivität gleichzeitig hinzufügen. Ein Deep Learning-Suchelement unterstützt alle Eigenschaften, die den Suchbereich und die Bedingungen zum Auffinden des Elements einschränken.
5

Den Container mit dem Workflow verbinden

Verbinden Sie Ein- und Ausgabe des Containers zur Hypothesenfilterung mit anderen Blöcken im Dokumentenverarbeitungs-Workflow. Die Ausgabefelder des Containers zur Hypothesenfilterung sind dieselben wie die Ausgabefelder der Aktivität „Extraktionsregeln“.
Wenn Sie die Ausgabe der Deep Learning-Aktivität nicht mehr steuern möchten, klicken Sie auf eine beliebige Stelle im Container und wählen Sie Don’t Filter Hypotheses aus. Der Container wird aufgelöst, die Aktivitäten selbst werden jedoch nicht gelöscht, und Sie können sie weiterhin im geänderten Dokumentenverarbeitungs-Workflow verwenden.

Beispiele

Dies sind nur einige Beispiele, die zeigen, wie ein Hypothesis-Filtering-Container verwendet werden kann. Es gibt jedoch viele weitere Situationen, in denen Sie diese Funktion nutzen können, um die Ausgabe neuronaler Netze zu steuern und die Felderextraktion zu verfeinern. Welche Anpassungen für die Dokumente erforderlich sind, mit denen Sie arbeiten, können nur Sie entscheiden. Wir empfehlen, diese Technologie in jedem Fall auszuprobieren, in dem die Ergebnisse der Deep-Learning-Aktivität von einer Feinabstimmung profitieren. Die folgenden Beispiele verwenden dasselbe Beispiel-Skill, bei dem die Ausgaben von zwei Deep-Learning-Aktivitäten an eine Extraction-Rules-Aktivität übergeben werden.

Skill-Workflow

Container zur Hypothesenfilterung mit zwei Deep-Learning-Aktivitäten, die eine Aktivität „Extraktionsregeln“ speisen
  • Die Aktivität „Deep Learning“ extrahiert Textfelder.
  • Die Aktivität „Deep Learning 2“ extrahiert eine Tabelle.
  • Der Container zur Hypothesenfilterung wählt ihre Ergebnisse aus und kombiniert sie.

Struktur der Suchelemente in der Aktivität „Extraktionsregeln“

Suchelemente-Baum in der Aktivität „Extraktionsregeln“, wobei jedes Suchelement dem entsprechenden Skill-Feld zugeordnet ist
Jedes Suchelement ist seinem jeweiligen Feld zugeordnet.

Beispiel 1: Einen von einer Deep-Learning-Aktivität gefundenen Wert korrigieren

In diesem Beispiel findet eine Deep-Learning-Aktivität einen Wert für die Dokumentnummer, der zu lang ist. Deshalb wird ein neues Suchelement erstellt, um den Wert zu korrigieren. Der von der Deep-Learning-Aktivität gefundene Wert für die Dokumentnummer enthält den Teil nach dem Bindestrich:
Von der Deep-Learning-Aktivität gefundener Wert für die Dokumentnummer, der unerwünschten Text nach einem Bindestrich enthält
  1. Um den Wert Document_Number zu korrigieren, wird ein neues Suchelement erstellt. Dieses Suchelement mit dem Namen DocNumber_Corrected sollte sich innerhalb der Region des Suchelements Document_Number befinden und eine begrenzte Anzahl von Zeichen enthalten.
Properties des Suchelements DocNumber_Corrected mit einer Begrenzung der Zeichenanzahl
  1. Der Suchbereich für das neue Element wird eingeschränkt, sodass er der Region von Document_Number entspricht. Dazu wird die folgende Zeile zum Code des Elements hinzugefügt:
RestrictSearchArea: Document_Number.Region;
  1. Das korrigierte Suchelement wird dem Feld zugeordnet, das die Dokumentnummer extrahiert:
Zuordnung mit dem korrigierten Suchelement, das dem Feld für die Dokumentnummer zugewiesen ist
Dadurch enthält die extrahierte Dokumentnummer nicht den Teil nach dem Bindestrich:
Dokumentnummer nach Anwendung des korrigierten Suchelements korrekt ohne den Teil nach dem Bindestrich extrahiert

Beispiel 2: Einen von mehreren wiederkehrenden Werten auswählen

In diesem Beispiel wird eine Deep-Learning-Aktivität darauf trainiert, alle Vorkommen der Dokumentnummer zu finden, das Ergebnis der Skill benötigt jedoch nur ein einziges Dokumentnummern-Feld. Um dies zu erreichen, wird die Einstellung Mehrere Elemente zulassen für das Feld Document Number deaktiviert und es werden Bedingungen festgelegt, um das richtige Vorkommen der Dokumentnummer auszuwählen. Wir empfehlen, zunächst den gelabelten Dokumentensatz zu speichern. Wenn Sie die Einstellung Mehrere Elemente zulassen für ein Feld deaktivieren, werden alle zusätzlichen Vorkommen dieses Felds aus der Labeling-Ansicht entfernt. Das in der Deep-Learning-Aktivität trainierte Modell funktioniert weiterhin; möchten Sie es jedoch ändern und neu trainieren, müssen Sie den ursprünglichen Dokumentensatz laden.
  1. Die Einstellung Mehrere Elemente zulassen ist für das Feld Document Number deaktiviert (die Einstellung kann über Manage Fields aufgerufen werden).
Dialogfeld „Manage Fields“ mit deaktivierter Option „Mehrere Elemente zulassen“ für das Feld Document Number
  1. Das Suchelement Document_Number mit mehreren Vorkommen kann dem Feld Document Number nicht zugeordnet werden. Daher wird ein neues Deep Learning-Suchelement aus der Ausgabe der Dokumentnummer der Deep-Learning-Aktivität erstellt und dem Feld Document Number zugeordnet.
Zuordnung des neuen Deep-Learning-Suchelements zum Feld Document Number nach dem Deaktivieren von „Mehrere Elemente zulassen“
  1. Die mehreren Vorkommen der Dokumentnummer, die von der Deep-Learning-Aktivität gefunden wurden, werden verwendet, um einen Hypothesenbaum zu erstellen, von dem nur eines als Wert des Suchelements Document_Number ausgewählt wird.
Hypothesenbaum für wiederkehrende Document_Number-Werte, der verwendet wird, um ein einzelnes Vorkommen auszuwählen
  1. Um ein bestimmtes Vorkommen zu finden, werden für das Suchelement Document_Number bestimmte Bedingungen hinzugefügt (in diesem Fall möchten wir das oberste Vorkommen der Dokumentnummer finden).
Suchelement-Bedingungen, die so konfiguriert sind, dass das oberste Vorkommen der Dokumentnummer ausgewählt wird

Beispiel 3: Ausgabe von zwei Deep-Learning-Aktivitäten kombinieren

Ein Container zur Hypothesenfilterung ermöglicht es, die Ergebnisse von zwei oder mehr Deep-Learning-Aktivitäten zu kombinieren, um sie miteinander abzugleichen oder diese Ergebnisse innerhalb derselben Aktivität weiter zu verfeinern. In diesem Beispiel waren zwei Deep-Learning-Aktivitäten erforderlich, da eine einzelne Deep-Learning-Aktivität nicht dafür trainiert werden kann, sowohl Textfelder als auch Tabellen zu extrahieren. Es wird eine Bedingung hinzugefügt, die festlegt, dass das Suchelement Company_Address stets oberhalb des Suchelements Goods_Table gefunden werden soll. Dadurch wird die richtige Adresse erkannt, selbst wenn andere Adressen am unteren Rand der Seite gedruckt sind.
Bedingung, die festlegt, dass Company_Address auf der Seite stets oberhalb von Goods_Table gefunden werden muss