メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt

Use this file to discover all available pages before exploring further.

この記事は、Vantage への移行を予定している FlexiCapture ユーザーを対象としています。Vantage では、FlexiLayouts を含む FlexiCapture プロジェクトの各種コンポーネントを再利用できます。さらに、既存のラベル付きドキュメントで容易に学習できる強力な最新の機械学習テクノロジーの利点も得られます。 まずは Vantage に用意されている組み込み Skill をご確認ください。多くの場合、それらは少なくともお使いの FlexiCapture プロジェクトと同等以上の性能を発揮します。Advanced Designer と Vantage が提供する学習効率により、FlexiLayout Studio で作成した FlexiLayouts を再利用する必要がなくなる可能性もあります。 Skill Catalog には 50 を超える組み込み Skill が用意されています。ほかにも、Vantage には請求書、購買注文書、レシート、商業インボイスの処理向けの Skill があり、ABBYY FlexiCapture for Invoices の代替として利用できます。

重要な概念

Vantage では、ドキュメントはトランザクション単位で処理されます。バッチとは異なり、トランザクションには種類が割り当てられません。トランザクションの処理フローと Optical Character Recognition (OCR) の設定は、そのトランザクションを処理する Skill によって定義されます。 通常は、Document Definitions を組み込みまたは手動で設定した Document skill に置き換え、Process skill を作成し、その処理フローを設定して、ドキュメントを適切な Document skill や他の処理ステージに振り分ける必要があります。

主要概念の対応

FlexiCapture の概念Vantage における同等概念
FlexiCapture projectVantage および Advanced Designer で作成された他の Skill (Optical Character Recognition (OCR)、Classification、Document、Document Splitter) を参照する Process skill
Batchトランザクション (部分的に同等)
Batch type, project propertiesProcess skill で構成されたドキュメント処理ワークフロー、Skill 設定およびアクティビティ設定
Classification batches分類スキルの Document セット
Training batchesDocument skill における Document セット (部分的に同等)
Test batchesAdvanced Designer の Document skill におけるテスト用 Document セット
Document DefinitionDocument skill
WorkflowProcess skill におけるドキュメント処理ワークフロー
Auto-learning for field extractionDocument skill 向けの Online learning
NLP modelsAdvanced Designer の Document skill における非構造化ドキュメント向けアクティビティ

Documents の取り込み

FlexiCapture 12 Scanning Stations は ABBYY Vantage Scanning Stations に完全に置き換えることができます。 Vantage では、shared folder と呼ばれる hot folder またはメールからの取り込みを、Process skill の Input activity で設定できます。ソース種別、ソースファイル名、メールに関する情報は、登録 Parameter に自動的に保存されます。 また、Vantage API を使用してドキュメントを取り込み、カスタム登録 Parameter を設定することもできます。あるいは、connectors を使用して、各種サードパーティアプリケーションからドキュメントを取り込むことも可能です。

ワークフローのセットアップ

バッチ処理ワークフローを再現するには、Process skill を構成します。Vantage では、Process skill のアクティビティは処理ステージに相当します。Document セットは、トランザクション内の documents の集合を指します。

ワークフロー段階の対応

FlexiCapture のワークフロー段階Vantage での対応機能
スキャンABBYY Vantage Scanning Station (Process skill のアクティビティには統合されていません)
再スキャン非対応
認識Optical Character Recognition (OCR)、Classify、Extract、Assemble アクティビティを組み合わせたワークフロー。Optical Character Recognition (OCR) アクティビティではすべてのドキュメントに対する事前認識オプションを設定し、Classify はドキュメントを Extract アクティビティにルーティングして、そこでデータが抽出されます。
ドキュメント組み立てチェックドキュメント集合の完全性検証は非対応です。ドキュメントを組み立てるには、Process skill の Assemble アクティビティを使用できます。
バッチ完全性チェックScanning Station は、ドキュメントが Vantage に送信される前に自動でバッチ完全性チェックを実行します。オペレーターは Scanning Station 上で手動チェックを実行することもできます。
データ検証、検証、エクスポート確認Process skill の 手動確認 アクティビティ。
エクスポートProcess skill の Output アクティビティまたは カスタム アクティビティ。
Processed、ExceptionsVantage によって自動的に割り当てられるトランザクションのステータス。Skill Monitor の Transactions セクションでトランザクションのステータスを確認できます。
ユーザータイプProcess skill の Condition アクティビティまたは カスタム アクティビティ。
Vantage のワークフローは、手動確認 アクティビティが含まれている場合にのみ、人間のオペレーターとの対話を必要とします。

PDF Processing Mode

FlexiCapture 12 では、PDF Processing Mode はバッチタイプレベルで設定され、埋め込みの PDF テキストレイヤーを FlexiCapture で使用するか、Optical Character Recognition (OCR) を実行するかを制御します。ABBYY Vantage では、PDF Processing Mode 設定で同等の制御が可能です。この設定は、Optical Character Recognition (OCR) Skill および Process skill 内の Optical Character Recognition (OCR) アクティビティで使用できます。 以下の表を使用して、既存の FlexiCapture の設定を Vantage の対応する設定に対応付けてください。
FlexiCapture 12Vantage注記
AutoDefault (推奨) — 部分一致FlexiCapture の Auto は、テキストレイヤーの品質に基づいて動的に選択します。Vantage の Default は固定の組み合わせ方式を使用するため、完全に同等ではありません。Auto に完全対応する機能は、今後の Vantage リリースで提供される予定です。
Prefer PDF text layer if availableUse Text Layer Only近い一致です。どちらも埋め込みテキストレイヤーを優先し、テキストレイヤーが存在しない場合は Optical Character Recognition (OCR) にフォールバックします。
Use OCR onlyUse OCR Only完全一致です。どちらも埋め込みテキストレイヤーを無視し、すべてのページで Optical Character Recognition (OCR) を実行します。

移行ガイダンス: 開始時の選択

どの Vantage モードを使用すべきか迷う場合は、以下のガイダンスを参考にしてください。一般的な FlexiCapture の設定と、Vantage で推奨される開始時の選択肢との対応を示しています。
  • FlexiCapture で Auto を使用していた場合: Default (推奨) から開始し、抽出結果を確認してください。精度が期待より低い場合は、Use Text Layer Only (PDF に信頼できるテキストレイヤーがある場合) または Use OCR Only (ない場合) に切り替えてください。
  • FlexiCapture で “Prefer PDF text layer if available” を使用していた場合: Vantage では Use Text Layer Only を使用してください。文書内のテキストレイヤーの品質が十分であることを確認するため、結果のサンプルを確認してください。
  • FlexiCapture で “Use OCR only” を使用していた場合: Vantage では Use OCR Only を使用してください。これは直接対応する設定です。
FlexiCapture の Auto モード、つまり Vantage が処理方法を選択する前にテキストレイヤーの品質を動的に評価する仕組みと完全に同等の機能は、今後の Vantage リリースで提供される予定です。それまでは、文書セットが混在している場合、Default (推奨) が現時点で最も近い選択肢です。
FlexiCapture ではこの設定はバッチタイプ レベルで一度だけ構成しますが、Vantage では Skill や Activity ごとに異なる PDF Processing Mode を設定できます。これにより、同じワークフロー内で異なる文書タイプを処理する場合でも、よりきめ細かな制御が可能になります。
各オプションの使い分けを含む PDF Processing Mode 設定の詳細については、PDF Processing Mode を参照してください。

ユーザーの役割

Vantage では、Process skill 内に複数の手動確認アクティビティを作成できます。Manual Review Operator は、特定の手動確認ステージへのアクセスが制限される場合があります。ユーザーを作成して権限を編集するには、Vantage の Users タブに移動します。

役割のマッピング

FlexiCapture の役割Vantage の役割
Scanning OperatorSkill User
Data Verification OperatorManual Review Operator (特定の Skill や手動確認ステージへのアクセスを制限可能)
Verification OperatorManual Review Operator (特定の Skill や手動確認ステージへのアクセスを制限可能)
Senior Verification OperatorProcessing Supervisor
Project Settings EditorSkill Designer
Monitoring OperatorProcessing Supervisor (手動確認にもアクセス可能)
AdministratorTenant Administrator
Web Capture OperatorSkill User + Manual Review Operator
Operators ManagerTenant Administrator (ユーザー権限を管理できる唯一の役割)

分類

分類モデルは、Vantage で直接再利用できません。 異なる種類のドキュメントを識別するには、Classification skill を作成します。その Skill に、FlexiCapture で分類モデルの学習に使用したドキュメントをアップロードし、同じクラスを作成して、Vantage で Skill を学習させます。さらに、この Skill を Process skill の Classify アクティビティで使用し、クラスを Extract アクティビティにマッピングできます。各 Extract アクティビティは Document skill を使用し、Document Definition セクションに相当します。 Vantage ではクラスタリングが常に有効なため、同じ種類のドキュメントでも異なるバリエーションが自動的に識別される場合があります。ただし、レイアウトが大きく異なる場合は、Advanced Designer で Document skill を作成し、そのワークフローに Classify アクティビティを追加して適切に学習させることを検討してください。Classify アクティビティの後に複数の Extraction Rules アクティビティを配置することで、ドキュメントのバリエーションに基づいて自動選択されるように、Extraction Rules アクティビティ (FlexiLayout のほぼ同等) を設定できます。 入力ページのストリーム内でドキュメントを分割するには、Process skill に Assemble アクティビティを追加します。Advanced Designer で Document Splitter skill を作成・構成する必要がある場合もあります。

Document Definitions

一般に、異なる種類の文書向けの Document Definitions は、適切な Document skill に置き換える必要があります。同一タイプの文書でもバリエーションが異なる場合は、それぞれを1つの Document skill 内の個別のactivitiesに置き換える必要があります。ある Document Definition に複数のセクションが含まれる場合は、各セクションを適切な Document skill に置き換えてください。 Optical Character Recognition (OCR) の設定と手書き文字認識は、Document skill の範囲で設定します。文書を異なる Document skill に振り分けるために Process skill を使用する場合は、OCR activity で共通の事前認識設定 (言語、手書き文字認識、バーコード) も設定できます。なお、手書き文字認識は Document skill の設定では既定で有効、OCR activity では既定で無効です。 PDFテキストレイヤーの処理: ABBYY FlexiCapture では、Document Definition の一部として、PDF のテキストレイヤーを使用するか OCR を使用するかという動作を設定できました。Vantage では、これに相当する PDF Processing Mode の設定は Document skills では設定しません。代わりに、OCR Skills と Process Skill の OCR Activity で設定します。詳細は、PDF Processing Mode を参照してください。
Vantage のデータ抽出テクノロジーは、FlexiCapture と比べて大幅に変更・改善されています。Vantage で利用可能な Extraction Rules およびその他のアクティビティの動作は、FlexiCapture の同等機能とは異なるため、場合によっては結果が異なることがあります。Document Definitions を Document skill に置き換えた後は、抽出結果に問題がないことを必ず確認してください。
FlexiCapture プロジェクトに該当するケースを展開してください:
フォーム向けのDocument DefinitionsはVantageで直接再利用できません。組み込みのSkillが要件に合わない場合は、FlexiCaptureからラベル付きdocumentsの該当バッチをエクスポートし、Advanced Designerで新規作成したDocument skillにインポートしてください。次に、以下の2つの選択肢があります。
  • Document skillの処理フローにFast Learningアクティビティを追加し、アップロードしたdocumentsで学習します。このアクティビティは学習に大量のdocumentsを必要としません。フォーム用テクノロジーで学習を開始するには、同一フォームのインスタンスとして識別できる3件のdocumentsを追加するだけで十分です。
  • Document skillの処理フローにFormsアクティビティを追加し、空白フォームの画像をアップロードします。空白フォーム上のfieldにラベル付けを行い、アクティビティを学習させます。アップロードしたdocumentsで結果をテストします。
固定フォームの処理を他のアクティビティと組み合わせる必要がない場合は、Advanced Designerを使用せず、Vantageでフォーム用のシンプルなDocument skillを作成できます。
多くの場合、既存のDocument Definitionは、組み込みのSkillに簡単に置き換えるか、ラベル付きdocumentsを使ってVantageまたはAdvanced Designerで新しいSkillを学習させることで対応できます。ただし、既存のFlexiLayoutに相当するものをAdvanced Designerですばやく作成する方法もあります。Advanced DesignerのDocument skillにFlexiLayoutをインポートできます。FlexiLayoutプロジェクトに基づいて新しいDocument skillを作成することも、Extraction RulesアクティビティにFlexiLayoutをインポートすることもできます。OCRの言語設定はFlexiLayoutの設定から引き継がれますが、インポート後にSkillのOCR設定を確認することをお勧めします。学習結果はAdvanced Designerに引き継げませんが、学習バッチからラベル付きdocumentsをインポートし、それらを使ってAdvanced Designerでアクティビティを再学習できます。
学習済みのModelはAdvanced Designerにインポートできません。ただし、Advanced Designerで利用可能なNLP Modelの1つをSkillアクティビティとして選択し、sample documentsをアップロードしてアクティビティを学習させることはできます。独自のNLP Modelを学習させるには、Advanced DesignerのDocument skillでSegmentationアクティビティおよび/またはDeep Learningアクティビティを使用します。抽出scriptsは、Advanced DesignerでもVantageでも再利用できません。
ルールは、VantageまたはAdvanced Designerのいずれでも再作成できます。script ruleは、Vantage JavaScriptインタープリターに対応するように書き直す必要があります。
Process skillのAssembleアクティビティを使用します。ドキュメントのアセンブリscriptを追加するには、Advanced DesignerでDocument Splitter skillを作成して設定します。scriptは、JavaScriptインタープリターに対応するように書き直す必要があります。
Vantage APIを介して処理結果をエクスポートするか、connectorsを使用して処理結果をさまざまなサードパーティアプリケーションにエクスポートできます。shared folderへのエクスポートは、Process skillのOutput アクティビティで設定できます。同じアクティビティを使用してエクスポート形式も設定します。Process skillのOutput アクティビティまたはカスタム アクティビティで、scriptを使ってエクスポートを設定できます。scriptは、Vantage JavaScriptインタープリターに対応するように書き直す必要があります。Vantageでは、サードパーティサービスの認証情報をenvironment variablesに保存できます。これらの変数には、これらのscriptsからアクセスできます。
ラベル付きdocumentsまたはFlexiLayoutをAdvanced Designerにインポートすると、field構造は自動的に再作成されます。その後、VantageまたはAdvanced Designerを使用してデータ フォームのlayoutを編集できます。

ABBYY FlexiCapture for Invoices

組み込み Skill に置き換える

Vantage には、請求書、レシート、購買注文書、商用インボイスなど、さまざまな種類のドキュメントを処理する多数の組み込み Skill が用意されています。これらはそのまま利用でき、ABBYY FlexiCapture for Invoices で作成されたプロジェクトの代替として使用できます。 まずはお手元のドキュメントで組み込み Skill をテストすることをお勧めします。抽出結果に満足できない場合は、以降のガイダンスを参照して Skill の作成やカスタマイズをご検討ください。 プロジェクトで使用するデータセットは、CSV 形式でデータ カタログにアップロードできます。データセットと同等の列構成を持つ必要なデータ カタログは、Invoice、Commercial Invoice、Purchase Order の各 Skill 用に自動的に作成されます。

FlexiLayout を使用したカスタマイズ

お手元のドキュメントで学習済みだが、手動のカスタマイズ設定やカスタム field がない FlexiCapture for Invoices プロジェクトを使用していた場合、Vantage で追加設定を行う必要はありません。目的の組み込み請求書 Skill から Skill を派生し、ラベル付きドキュメントをインポートして、その結果のドキュメント セットで派生 Skill を学習させてください。 カスタム FlexiLayout を使用していた場合は、目的の組み込み請求書 Skill から Skill を派生し、カスタム FlexiLayout をインポートして Extraction Rules アクティビティを作成することをお勧めします。作成した Extraction Rules アクティビティは、Base: <Base Skill Name> アクティビティの後に追加します。この方法は、たとえば請求書の追加の field を取得する場合に利用できます。 複数の FlexiLayout がある場合は、Extraction Rules アクティビティを複数追加できます。たとえば、ベンダーごとに専用の FlexiLayout がある場合、各 FlexiLayout を Extraction Rules アクティビティとしてインポートし、ベースの請求書 Skill によって抽出されたベンダー ID の値を対応する各アクティビティにマッピングします。 FlexiCapture で使用していた FlexiLayout には、通貨の書式設定、地域設定、税率など、多くの追加設定が含まれている場合があります。これらの設定は通常 Vantage では不要です。組み込み Skill に関連情報がすでにすべて含まれているためです。

監視とレポート

Skill Monitor で生産性や処理データを監視できます。処理イベントやエラーに関する情報は、Skill Monitor の Transactions および Error Log セクションで確認できます。ビジネス処理のレポートを作成するには、Vantage に含まれる Business Processing Reporting Warehouse を使用します。ビジネストランザクション処理に関連しないアクティビティに関する情報は、Security Log で確認できます。

Vantage でサポートされていない機能の一覧

次の FlexiCapture の機能は Vantage ではサポートされていません。
  • SLA 制御
  • バッチ優先度
  • 再スキャン
  • ドキュメントのアセンブリ チェック
  • インポートした画像へのユーザー添付ファイル
  • ホット フォルダーから取り込んだバッチ用の説明ファイル
  • 二重検証
  • 分散検証
  • Processing インターフェイス イベント
  • スキン設定 (独自のシステムに手動確認クライアントを統合する場合にのみ、Vantage ロゴを削除できます)
  • カスタム認識スクリプト
  • サービス field
  • 既存の field へのリンク (トランザクション内のすべての documents の field 値にはスクリプトでアクセスできます)
  • Optical Character Recognition (OCR) 言語用の辞書
  • ルール チェーン (Advanced Script Rule を使用した場合にのみ設定可能)
  • documents のエクスポート時の機密データの墨消し
  • データ フォーム、ルール名、スクリプト メッセージのローカライズ

PDF Processing Mode

Vantage で、埋め込み PDF のテキストレイヤー、Optical Character Recognition (OCR)、またはその両方を使用するかどうかを制御します。

Skill Catalog

テナント全体で Skill を検索、公開、再利用できます。

Process skill を設定する

preset workflow または一から Process skill を構築します。

Document skill を設定する

文書タイプから field を抽出するように Document skill を設定します。

Skill バージョン

Vantage における Skill のバージョン管理の仕組みと、バージョンの表示、編集、削除の方法を説明します。