FlexiCapture プロジェクトの変換

この記事は、Vantage への移行を予定している FlexiCapture ユーザーを対象としています。Vantage では、FlexiLayouts を含む FlexiCapture プロジェクトの各種コンポーネントを再利用できます。さらに、既存のラベル付きドキュメントで容易に学習できる強力な最新の機械学習テクノロジーの利点も得られます。まずは Vantage に用意されているビルトインの Skill をご確認ください。多くの場合、それらは少なくともお使いの FlexiCapture プロジェクトと同等以上の性能を発揮します。Advanced Designer と Vantage が提供する学習効率により、FlexiLayout Studio で作成した FlexiLayouts を再利用する必要がなくなる可能性もあります。 Skill Catalog には 50 を超えるビルトイン Skill が用意されています。ほかにも、Vantage には請求書、購買注文書、レシート、商業インボイスの処理向けの Skill があり、ABBYY FlexiCapture for Invoices の代替として利用できます。

重要な概念

Vantage では、ドキュメントはトランザクション単位で処理されます。バッチとは異なり、トランザクションには種類は割り当てられません。トランザクションの処理フローと Optical Character Recognition (OCR) の設定は、そのトランザクションを扱う Skill によって定義されます。一般的には、Document Definitions を組み込みまたは手動で構成した Document skill に置き換え、Process skill を作成し、その処理フローを設定して、ドキュメントを適切な Document skill や他の処理段階へルーティングする必要があります。

主要概念の対応

FlexiCapture の概念	Vantage における同等概念
FlexiCapture project	Vantage および Advanced Designer で作成された他の Skill（Optical Character Recognition (OCR)、Classification、Document、Document Splitter）を参照する Process skill
Batch	トランザクション（部分的に同等）
Batch type, project properties	Process skill で構成されたドキュメント処理ワークフロー、Skill 設定およびアクティビティ設定
Classification batches	分類スキルの Document セット
Training batches	Document skill における Document セット（部分的に同等）
Test batches	Advanced Designer の Document skill におけるテスト用 Document セット
Document Definition	Document skill
Workflow	Process skill におけるドキュメント処理ワークフロー
Auto-learning for field extraction	Document skill 向けの Online Learning
NLP models	Advanced Designer の Document skill における非構造化ドキュメント向けアクティビティ

Documents の取り込み

FlexiCapture 12 Scanning Stations は ABBYY Vantage Scanning Stations に完全に置き換えることができます。 Vantage では、shared folder と呼ばれる hot folder またはメールからの取り込みを、Process skill の Input activity で設定できます。ソース種別、ソースファイル名、メールに関する情報は、登録 Parameter に自動的に保存されます。また、Vantage API を使用してドキュメントを取り込み、カスタム登録 Parameter を設定することもできます（/ja/vantage/documentation/developer-guide/registration-parameters）。あるいは、connectors を使用して、各種サードパーティアプリケーションからドキュメントを取り込むことも可能です。

ワークフローのセットアップ

バッチ処理ワークフローを再現するには、Process skill を構成します。Vantage では、Process skill のアクティビティは処理ステージに相当します。Document セットは、トランザクション内の documents の集合を指します。

ワークフロー段階の対応

FlexiCapture のワークフロー段階	Vantage での対応機能
スキャン	ABBYY Vantage Scanning Station（Process skill のアクティビティには統合されていません）
再スキャン	非対応
認識	Process skill の OCR、Classify、Extract、Assemble アクティビティを含む場合があるワークフロー。OCR 設定は Classification と Document skill ごとに個別に設定できます。Process skill の OCR アクティビティでは、すべてのドキュメントに対する一般的な事前認識オプションを指定できます。Classify アクティビティはドキュメントの種類を判定し、Extract アクティビティにマッピングされた適切な Document skill にルーティングしてデータを抽出します。Assemble アクティビティはドキュメントの組み立てに使用できます。
ドキュメント組み立てチェック	ドキュメント集合の完全性検証は非対応です。ドキュメントを組み立てるには、Process skill の Assemble アクティビティを使用できます。
バッチ完全性チェック	Scanning Station は、ドキュメントが Vantage に送信される前に自動でバッチ完全性チェックを実行します。オペレーターは Scanning Station 上で手動チェックを実行することもできます。
データ検証、検証、エクスポート確認	Process skill の Manual Review アクティビティ。
エクスポート	Process skill の Output アクティビティまたは Custom アクティビティ。
Processed、Exceptions	Vantage によって自動的に割り当てられるトランザクションのステータス。Skill Monitor の Transactions セクションでトランザクションのステータスを確認できます。
ユーザータイプ	Process skill の Condition アクティビティまたは Custom アクティビティ。

Vantage のワークフローは、Manual Review アクティビティが含まれている場合にのみ、人間のオペレーターとの対話を必要とします。

ユーザーの役割

Vantage では、Process skill 内に複数の手動確認アクティビティを作成できます。Manual Review Operator は、特定の手動確認ステージへのアクセスが制限される場合があります。ユーザーを作成して権限を編集するには、Vantage の Users タブに移動します。

役割のマッピング

FlexiCapture の役割	Vantage の役割
Scanning Operator	Skill User
Data Verification Operator	Manual Review Operator（特定の Skill や手動確認ステージへのアクセスを制限可能）
Verification Operator	Manual Review Operator（特定の Skill や手動確認ステージへのアクセスを制限可能）
Senior Verification Operator	Processing Supervisor
Project Settings Editor	Skill Designer
Monitoring Operator	Processing Supervisor（手動確認にもアクセス可能）
Administrator	Tenant Administrator
Web Capture Operator	Skill User + Manual Review Operator
Operators Manager	Tenant Administrator（ユーザー権限を管理できる唯一の役割）

分類

分類モデルは、Vantage で直接再利用できません。 異なる種類のドキュメントを識別するには、Classification skill を作成します。その Skill に、FlexiCapture で分類モデルの学習に使用したドキュメントをアップロードし、同じクラスを作成して、Vantage で Skill を学習させます。さらに、この Skill を Process skill の Classify アクティビティで使用し、クラスを Extract アクティビティにマッピングできます。各 Extract アクティビティは Document skill を使用し、Document Definition セクションに相当します。 Vantage ではクラスタリングが常に有効なため、同じ種類のドキュメントでも異なるバリエーションが自動的に識別される場合があります。ただし、レイアウトが大きく異なる場合は、Advanced Designer で Document skill を作成し、そのワークフローに Classify アクティビティを追加して適切に学習させることを検討してください。Classify アクティビティの後に複数の Extraction Rules アクティビティを配置することで、ドキュメントのバリエーションに基づいて自動選択されるように、Extraction Rules アクティビティ（FlexiLayout のほぼ同等）を設定できます。 入力ページのストリーム内でドキュメントを分割するには、Process skill に Assemble アクティビティを追加します。Advanced Designer で Document Splitter skill を作成・構成する必要がある場合もあります。

Document Definitions

一般に、異なる種類の文書向けの Document Definitions は、適切な Document skill に置き換える必要があります。同一タイプの文書でもバリエーションが異なる場合は、それぞれを1つの Document skill 内の個別のactivitiesに置き換える必要があります。ある Document Definition に複数のセクションが含まれる場合は、各セクションを適切な Document skill に置き換えてください。 Optical Character Recognition (OCR) の設定と手書き文字認識は、Document skill の範囲で設定します。文書を異なる Document skill に振り分けるために Process skill を使用する場合は、OCR activity で共通の事前認識設定（言語、手書き文字認識、バーコード）も設定できます。なお、手書き文字認識は Document skill の設定では既定で有効、OCR activity では既定で無効です。

Tip: Vantage のデータ抽出テクノロジーは、FlexiCapture と比べて大幅に変更・改善されています。Vantage で利用可能な Extraction Rules およびその他のアクティビティの動作は、FlexiCapture の同等機能とは異なるため、場合によっては結果が異なることがあります。Document Definitions を Document skill に置き換えた後は、抽出結果に問題がないことを必ず確認してください。

固定レイアウトのドキュメント定義

フォーム向けのDocument DefinitionsはVantageで直接再利用できません。組み込みのSkillが要件に合わない場合は、FlexiCaptureからラベル付きdocumentsの該当バッチをエクスポートし、Advanced Designerで新規作成したDocument skillにインポートしてください。次に、以下の2つの選択肢があります。

Document skillの処理フローにFast Learningアクティビティを追加し、アップロードしたdocumentsで学習します。このアクティビティは学習に大量のdocumentsを必要としません。フォーム用テクノロジーで学習を開始するには、同一フォームのインスタンスとして識別できる3件のdocumentsを追加するだけで十分です。
Document skillの処理フローにFormsアクティビティを追加し、空白フォームの画像をアップロードします。空白フォーム上のfieldにラベル付けを行い、アクティビティを学習させます。アップロードしたdocumentsで結果をテストします。

固定フォームの処理を他のアクティビティと組み合わせる必要がない場合は、Advanced Designerを使用せず、Vantageでフォーム用のシンプルなDocument skillを作成できます。

柔軟な記述に基づく Document 定義

多くの場合、既存の Document 定義は組み込みの Skill に容易に置き換えるか、ラベル付きドキュメントを使って Vantage または Advanced Designer で新しい Skill を学習させることができます。さらに、Advanced Designer で既存の FlexiLayout と同等のものを迅速に作成する方法もあります。 Advanced Designer では、FlexiLayout を Document skill にインポートできます。FlexiLayout プロジェクトに基づいて新しい Document skill を作成することも、Extraction Rules アクティビティに FlexiLayout をインポートすることも可能です。OCR の言語設定は FlexiLayout の設定を継承しますが、インポート後は Skill の OCR 設定を確認することをお勧めします。学習結果は Advanced Designer に移行できませんが、学習バッチからラベル付きドキュメントをインポートして、Advanced Designer でアクティビティを再学習させることができます。

NLP テクノロジーを使用した Document の定義

学習済みモデルは Advanced Designer にインポートできません。ただし、Advanced Designer で利用可能な NLP モデルのいずれかを Skill のアクティビティとして選択し、サンプルドキュメントをアップロードしてそのアクティビティを学習できます。独自の NLP モデルを学習するには、Advanced Designer の Document skill で Segmentation および/または Deep Learning アクティビティを使用します。抽出スクリプトは Advanced Designer や Vantage で再利用できません。

ルール検証

ルールは Vantage または Advanced Designer のいずれかで再作成できます。スクリプトルールは、Vantage の JavaScript インタープリタに対応するように書き換える必要があります。

ドキュメントの組み立て

Process skill の Assemble アクティビティを使用します。ドキュメント組み立て用のスクリプトを追加するには、Advanced Designer で Document Splitter Skill を作成して構成します。スクリプトは JavaScript インタープリタと互換性を持たせるために書き直す必要があります。

エクスポート設定

処理結果は Vantage API を介してエクスポートするか、コネクタを使用して各種のサードパーティ製アプリケーションへエクスポートできます。共有フォルダーへのエクスポートは、Process skill の Output アクティビティで設定できます。エクスポート形式も同じアクティビティで設定します。エクスポートは、Process skill の Output アクティビティまたは Custom アクティビティでスクリプトを用いて設定できます。スクリプトは Vantage の JavaScript インタープリタと互換性を持たせるために書き換える必要があります。Vantage はサードパーティサービスの認証情報を環境変数に保存することをサポートしています。これらの変数は、上記のスクリプトから参照できます。

データフォーム

ラベル付きドキュメントまたは FlexiLayout を Advanced Designer にインポートすると、field の構造は自動的に再作成されます。その後、Vantage または Advanced Designer を使用して、データフォームのレイアウトを編集できます。

ABBYY FlexiCapture for Invoices

Vantage には、請求書、レシート、購買注文書、商用インボイスなど、さまざまな種類のドキュメントを処理する多数の組み込み Skill が用意されています。これらはそのまま利用でき、ABBYY FlexiCapture for Invoices で作成されたプロジェクトの代替として使用できます。

Tip: まずはお手元のドキュメントで組み込み Skill をテストすることをお勧めします。抽出結果に満足できない場合は、以降のガイダンスを参照して Skill の作成やカスタマイズをご検討ください。

プロジェクトで使用するデータセットは、CSV 形式でデータカタログにアップロードできます。データセットと同等の列構成を持つ必要なデータカタログは、Invoice、Commercial Invoice、Purchase Order の各 Skill 用に自動的に作成されます。お手元のドキュメントで学習済みだが、手動のカスタマイズ設定やカスタム field がない FlexiCapture for Invoices プロジェクトを使用していた場合、Vantage で追加設定を行う必要はありません。目的の組み込み請求書 Skill から Skill を派生し、ラベル付きドキュメントをインポートして、その結果のドキュメントセットで派生 Skill を学習させてください。カスタム FlexiLayout を使用していた場合は、目的の組み込み請求書 Skill から Skill を派生し、カスタム FlexiLayout をインポートして Extraction Rules アクティビティを作成することをお勧めします。作成した Extraction Rules アクティビティは、Base: <Base Skill Name> アクティビティの後に追加します。この方法は、たとえば請求書の追加の field を取得する場合に利用できます。

Tip: 複数の FlexiLayout がある場合は、Extraction Rules アクティビティを複数追加できます。たとえば、ベンダーごとに専用の FlexiLayout がある場合、各 FlexiLayout を Extraction Rules アクティビティとしてインポートし、ベースの請求書 Skill によって抽出されたベンダー ID の値を対応する各アクティビティにマッピングします。

FlexiCapture で使用していた FlexiLayout には、通貨の書式設定、地域設定、税率など、多くの追加設定が含まれている場合があります。これらの設定は通常 Vantage では不要です。組み込み Skill に関連情報がすでにすべて含まれているためです。

監視とレポート

Skill Monitor で生産性や処理データを監視できます。処理イベントやエラーに関する情報は、Skill Monitor の Transactions および Error Log セクションで確認できます。ビジネス処理のレポートを作成するには、Vantage に含まれる Business Processing Reporting Warehouse を使用します。ビジネストランザクション処理に関連しないアクティビティに関する情報は、Security Log で確認できます。

Vantage で未サポートの機能一覧

次の FlexiCapture の機能は Vantage ではサポートされていません:

SLA 制御
バッチの優先度
再スキャン
ドキュメント組み立てチェック
取り込んだ画像へのユーザー添付
ホットフォルダーからのバッチ向け説明ファイル
ダブル検証
分散検証
処理インターフェースイベント
スキン設定（独自システムに手動確認クライアントを統合する場合にのみ Vantage ロゴを削除可能）
カスタム認識スクリプト
サービス field
既存 field へのリンク（トランザクション内のすべての documents の field 値にはスクリプトでアクセス可能）
Optical Character Recognition (OCR) 言語用の辞書
ルールチェーン（Advanced Script ルールでのみ設定可能）
documents のエクスポート時の機微データのマスキング
データフォーム、ルール名、スクリプトメッセージのローカライズ

はじめに

クイックスタート

Skill Catalog

Skill Designer

Advanced Designer

ランタイムガイド

テナント管理者ガイド

Scanning Station ガイド

開発者ガイド

重要な概念

主要概念の対応

Documents の取り込み

ワークフローのセットアップ

ワークフロー段階の対応

ユーザーの役割

役割のマッピング

分類

Document Definitions

固定レイアウトのドキュメント定義

柔軟な記述に基づく Document 定義

NLP テクノロジーを使用した Document の定義

ルール検証

ドキュメントの組み立て

エクスポート設定

データフォーム

ABBYY FlexiCapture for Invoices

監視とレポート

Vantage で未サポートの機能一覧

はじめに

クイックスタート

Skill Catalog

Skill Designer

Advanced Designer

ランタイム ガイド

テナント管理者ガイド

Scanning Station ガイド

開発者ガイド

​重要な概念

​主要概念の対応

​Documents の取り込み

​ワークフローのセットアップ

​ワークフロー段階の対応

​ユーザーの役割

​役割のマッピング

​分類

​Document Definitions

​固定レイアウトのドキュメント定義

​柔軟な記述に基づく Document 定義

​NLP テクノロジーを使用した Document の定義

​ルール検証

​ドキュメントの組み立て

​エクスポート設定

​データ フォーム

​ABBYY FlexiCapture for Invoices

​監視とレポート

​Vantage で未サポートの機能一覧

ランタイムガイド

重要な概念

主要概念の対応

Documents の取り込み

ワークフローのセットアップ

ワークフロー段階の対応

ユーザーの役割

役割のマッピング

分類

Document Definitions

固定レイアウトのドキュメント定義

柔軟な記述に基づく Document 定義

NLP テクノロジーを使用した Document の定義

ルール検証

ドキュメントの組み立て

エクスポート設定

データフォーム

ABBYY FlexiCapture for Invoices

監視とレポート

Vantage で未サポートの機能一覧