Zum Hauptinhalt springen
Ein Hypothesenfilter-Container kombiniert mehrere Deep‑Learning‑Aktivitäten mit einer Aktivität für Extraktionsregeln. Die Ergebnisse der Deep‑Learning‑Aktivitäten werden an die Aktivität für Extraktionsregeln übergeben, die Bedingungen festlegt, um die gewünschten Werte auszuwählen. Auch wenn eine Deep‑Learning‑Aktivität eine sehr hohe Qualität bei der Feldextraktion erreichen kann, möchten Sie in manchen Fällen deren Ausgabe gezielt steuern. Dazu können Sie eine oder mehrere Deep‑Learning‑Aktivitäten mit einer Extraktionsregeln‑Aktivität kombinieren, die Bedingungen auf die von den Deep‑Learning‑Aktivitäten gelieferten Werte anwendet. Die Steuerung der Ausgabe ist wichtig, wenn das neuronale Netz ganze Wörter findet, Sie jedoch nur bestimmte Teile benötigen, oder wenn versehentlich erfasste Störungen herausgefiltert werden müssen. Sie kann auch hilfreich sein, um Teile größerer Felder wie Adressen zu identifizieren, die vom neuronalen Netz übersehen werden könnten. Außerdem ermöglicht sie die Auswahl der besten Hypothese bei mehreren Vorkommen desselben Werts. Wenn beispielsweise ein Vendor‑Name mehrfach auf einem Dokument erscheint, können Sie aus den mehreren Vorkommen das genaueste Extraktionsergebnis auswählen.
Hinweis: Diese Technologie wird als Vorschau bereitgestellt und in zukünftigen Versionen weiter verbessert.

Einrichten eines Containers zur Hypothesenfilterung

  1. Klicken Sie auf den Block mit der Deep-Learning-Aktivität und wählen Sie Hypothesen filtern. Dadurch wird ein neuer Container zur Hypothesenfilterung erstellt und die ausgewählte Deep-Learning-Aktivität darin platziert.
  2. (Optional) Ziehen Sie weitere Deep-Learning-Aktivitäten in den Container zur Hypothesenfilterung. So können Sie die Ausgabe von zwei oder mehr Deep-Learning-Aktivitäten kombinieren und vergleichen. Zwei Aktivitäten können beispielsweise erforderlich sein, wenn Sie gleichzeitig mit Textfeldern und Tabellen arbeiten.
  3. Fügen Sie dem Container eine Aktivität „Extraktionsregeln“ hinzu. Sie können entweder eine neue Aktivität erstellen, indem Sie auf den Platzhalter klicken, oder eine vorhandene Aktivität in den Container ziehen.
  4. Richten Sie die Aktivität „Extraktionsregeln“ ein. Fügen Sie für jeden von den Deep-Learning-Aktivitäten gefundenen Wert ein Deep-Learning-Suchelement hinzu und legen Sie dessen Eigenschaften fest. Sie können alle Ausgabefelder einer Deep-Learning-Aktivität in einem Schritt hinzufügen. Ein Deep-Learning-Suchelement unterstützt alle Eigenschaften, die den Suchbereich und die Bedingungen für das Auffinden des Elements einschränken.
  5. Verbinden Sie die Ein- und Ausgänge des Containers zur Hypothesenfilterung mit anderen Blöcken im Dokumentverarbeitungs-Workflow. Die Ausgabefelder des Containers zur Hypothesenfilterung entsprechen den Ausgabefeldern der Aktivität „Extraktionsregeln“.
Hinweis: Wenn Sie die Steuerung der Ausgabe der Deep-Learning-Aktivität beenden möchten, klicken Sie irgendwo in den Container und wählen Sie Hypothesen nicht filtern. Der Container wird aufgelöst, die Aktivitäten selbst werden jedoch nicht gelöscht, und Sie können sie weiterhin im geänderten Dokumentverarbeitungs-Workflow verwenden.

Beispiele

Hinweis: Dies sind nur einige Beispiele, die zeigen, wie ein Hypothesis-Filtering-Container verwendet werden kann. Es gibt jedoch viele weitere Situationen, in denen Sie diese Funktion nutzen können, um die Ausgabe neuronaler Netze zu steuern und die Felderextraktion zu verfeinern. Welche Anpassungen für die Dokumente erforderlich sind, mit denen Sie arbeiten, können nur Sie entscheiden. Wir empfehlen, diese Technologie in jedem Fall auszuprobieren, in dem die Ergebnisse der Deep-Learning-Aktivität von einer Feinabstimmung profitieren. Die folgenden Beispiele verwenden dasselbe Beispiel-Skill, bei dem die Ausgaben von zwei Deep-Learning-Aktivitäten an eine Extraction-Rules-Aktivität übergeben werden.

Skill-Workflow

AD_HypothesisFiltering_Container
  • Die Aktivität „Deep Learning“ extrahiert Textfelder.
  • Die Aktivität „Deep Learning 2“ extrahiert eine Tabelle.
  • Der Container „Hypothesis Filtering“ wählt ihre Ergebnisse aus und kombiniert sie.

Struktur der Suchelemente in der Aktivität „Extraktionsregeln“

AD_HypothesisFiltering_SearchElementTree Jedes Suchelement ist seinem jeweiligen Feld zugeordnet.

Beispiel 1: Korrektur eines von einer Deep-Learning-Aktivität gefundenen Werts

In diesem Beispiel findet eine Deep-Learning-Aktivität einen Wert für die Dokumentnummer, der zu lang ist, und es wird ein neues Suchelement erstellt, um den Wert zu korrigieren. Der von der Deep-Learning-Aktivität gefundene Wert für die Dokumentnummer enthält den Teil nach dem Bindestrich: AD_HypothesisFiltering_ValueTooLong
  1. Um den Document_Number-Wert zu korrigieren, wird ein neues Suchelement erstellt. Dieses Suchelement mit dem Namen DocNumber_Corrected sollte sich innerhalb der Region des Document_Number-Suchelements befinden und nur eine begrenzte Anzahl von Zeichen enthalten.
AD_HypothesisFiltering_CorrectedProperties
  1. Der Suchbereich für das neue Element wird eingeschränkt, sodass er der Document_Number-Region entspricht, indem die folgende Zeile zum Code des Elements hinzugefügt wird:
RestrictSearchArea: 95.Region;
  1. Das korrigierte Suchelement wird dem Feld zugeordnet, das die Dokumentnummer extrahiert:
AD_HypothesisFiltering_CorrectedMapping Dadurch enthält die extrahierte Dokumentnummer nicht den Teil nach dem Bindestrich: AD_HypothesisFiltering_ValueCorrected

Beispiel 2: Einen von mehreren wiederkehrenden Werten auswählen

In diesem Beispiel wird eine Deep-Learning-Aktivität darauf trainiert, alle Vorkommen der Dokumentnummer zu finden, das Ergebnis der Skill benötigt jedoch nur ein einziges Dokumentnummern-Feld. Um dies zu erreichen, wird die Einstellung Allow Multiple Items für das Feld Document Number deaktiviert und es werden Bedingungen festgelegt, um das richtige Vorkommen der Dokumentnummer auszuwählen.
Hinweis: Wir empfehlen, zunächst den gelabelten Dokumentensatz zu speichern. Wenn Sie die Einstellung Allow Multiple Items für ein Feld deaktivieren, werden alle zusätzlichen Vorkommen dieses Felds aus der Labeling-Ansicht entfernt. Das in der Deep-Learning-Aktivität trainierte Modell funktioniert weiterhin; möchten Sie es jedoch ändern und neu trainieren, müssen Sie den ursprünglichen Dokumentensatz laden.
  1. Die Einstellung Allow Multiple Items ist für das Feld Document Number deaktiviert (die Einstellung kann über Manage Fields aufgerufen werden).
AD_HypothesisFiltering_NoMultiples
  1. Das Suchelement 95 mit mehreren Vorkommen kann dem Feld Document Number nicht zugeordnet werden. Daher wird ein neues Deep Learning-Suchelement aus der Ausgabe der Dokumentnummer der Deep-Learning-Aktivität erstellt und dem Feld Document Number zugeordnet.
AD_HypothesisFiltering_MapNoMultiples
  1. Die mehreren Vorkommen der Dokumentnummer, die von der Deep-Learning-Aktivität gefunden wurden, werden verwendet, um einen Hypothesenbaum zu erstellen, von dem nur eines als Wert des Suchelements 95 ausgewählt wird.
AD_HypothesisFiltering_HypTree
  1. Um ein bestimmtes Vorkommen zu finden, werden für das Suchelement 95 bestimmte Bedingungen hinzugefügt (in diesem Fall möchten wir das oberste Vorkommen der Dokumentnummer finden).
AD_HypothesisFiltering_TopmostInstance

Beispiel 3: Ausgabe von zwei Deep-Learning-Aktivitäten kombinieren

Ein Hypothesis-Filtering-Container ermöglicht es, die Ergebnisse von zwei oder mehr Deep-Learning-Aktivitäten zu kombinieren, um sie miteinander abzugleichen oder diese Ergebnisse innerhalb derselben Aktivität weiter zu verfeinern. In diesem Beispiel waren zwei Deep-Learning-Aktivitäten erforderlich, da eine einzelne Deep-Learning-Aktivität nicht dafür trainiert werden kann, sowohl Textfelder als auch Tabellen zu extrahieren. Es wird eine Bedingung hinzugefügt, die festlegt, dass das Suchelement Company_Address stets oberhalb des Suchelements Goods_Table gefunden werden soll. Dadurch wird die richtige Adresse erkannt, selbst wenn andere Adressen am unteren Rand der Seite gedruckt sind. AD_HypothesisFiltering_AboveTable