メインコンテンツへスキップ

はじめに

ABBYY Vantage をインストールする際、サービスおよびワーカーの数は負荷によって異なります。ABBYY Vantage は、ドキュメント処理を最適化するためにサービスとワーカーを自動的にスケーリングします。本ガイドでは、負荷に応じて ABBYY Vantage が必要とするリソースに関する情報と、システム管理者が ABBYY Vantage にこれらのリソースを適切に提供するための推奨事項を記載しています。

参照構成

リソース消費量は、ドキュメント処理シナリオ、つまり処理されるドキュメントの種類、使用される Skill、およびページ負荷(一定時間内に処理されるページ数)によって異なります。 参照用の 高可用性 構成では、デフォルトの Process skill を使用して、次の負荷条件で 3 ページおよび 50 ページの請求書を処理するテストを行いました。
  • 8 時間あたり 50,000 ページ
  • 8 時間あたり 100,000 ページ
  • 8 時間あたり 150,000 ページ
  • 8 時間あたり 200,000 ページ
参照用の 高可用性なし 構成では、デフォルトの Process skill を使用して、次の負荷条件で 3 ページの請求書を処理するテストを行いました。
  • 8 時間あたり 10,000 ページ
  • 8 時間あたり 30,000 ページ
  • 8 時間あたり 50,000 ページ
高可用性なし構成では、Deep Learning アクティビティを使用した Skill のトレーニングはサポートしていません。
参照構成のテスト中、ファイルは REST API 経由でシステムに送信されました。次のワークフローを持つデフォルトの Process skill が使用されました。
  1. ファイルをインポートする。
  2. ドキュメントを認識する。
  3. ドキュメントを分類し、ドキュメントタイプを判別する。
  4. ドキュメントからデータを抽出する。
  5. データを JSON にエクスポートする。

ノードタイプ

ノードタイプCPU コア数(各ノード)RAM(各ノード、GB)ディスクサイズ(GB)
サービスノード1248120*
ワーカーノード1248120
*上記のディスクサイズ要件は最小サイズの要件を示しており、追加のディスク容量が必要となる場合があります。既定では、Vantage は仮想マシン上に NFS ファイルストレージをインストールします。この場合、最初のサービスノードとして使用される仮想マシンには、負荷に応じて追加のディスク容量が必要になります。

ストレージ要件

構成ストレージストレージの場所ディスク サイズ (GB)
高可用性なし内部 NFSサービス ノード500 (8 時間ごとに 10,000 ページを処理する場合)
高可用性なし外部 NFSNFS サーバー マシン500 (8 時間ごとに 10,000 ページを処理する場合)
高可用性あり外部 NFSNFS サーバー マシン50 (8 時間ごとに 10,000 ページを処理する場合)
高可用性ありローカル永続ボリューム最初のサービス ノード (インベントリ ファイルで定義)500 (8 時間ごとに 10,000 ページを処理する場合)
大規模なデータ カタログ、多数のアクティビティを含む Skill、または共有フォルダーへのデータ エクスポートを使用する場合は、追加のストレージが必要になることがあります。
8 時間あたり 10,000 ページを超える負荷がある場合は、外部ストレージの使用を推奨します。

パフォーマンス結果

ページ数(負荷)に応じて、ABBYY Vantage が各構成でドキュメントを効率的に処理するのに必要なリソースは次のとおりです。

高可用性構成

負荷(ページ/8時間)サービス用ノード(3ページの請求書)サービス用ノード(50ページの請求書)ワーカー用ノード(3ページの請求書)ワーカー用ノード(50ページの請求書)
50,0004444
100,0004457
150,0004479
200,00044811
テスト時には、BLOB ストレージに使用されるディスクの入出力(I/O)操作に関する統計も収集しました。実運用環境でも、これらの数値を超えることはないと見込めます。

ディスク I/O 操作

負荷(ページ数/8時間)ディスク I/O 操作数/秒(3ページの請求書)ディスク I/O 操作数/秒(50ページの請求書)
50,00010050
100,000250100
150,000400170
200,000600230

高可用性構成なし

負荷(ページ/8時間)サービス用ノード数ワーカー用ノード数
10,00011*
30,00013
50,00013
*ワーカーノード1台での構成はテスト目的のみの使用を想定しており、どのアクティビティでも Skill のトレーニングはサポートされません。
ABBYY Vantage をスケーリングしても、ドキュメント処理時間の増加は確認されませんでした。

ノードの管理

システム管理者は、処理能力を拡張するために、クラスターに追加のワーカーノードを追加できます。ノードの準備方法の詳細については、System Requirements を参照してください。

Workerノードの追加

Workerノードを追加するには、次の手順に従います。
  1. インストールディレクトリ内のインベントリファイルを開きます。
  2. [abbyy_workers] セクションで、ノード名とIPアドレスを指定してノードを追加します。
  3. インストーラーを実行します。
docker run -it \
-v $PWD/kube:/root/.kube \
-v $PWD/ssh/ansible:/root/.ssh/ansible \
-v "//var/run/docker.sock:/var/run/docker.sock" \
-v $PWD/inventory:/ansible/inventories/k8s/inventory \
-v $PWD/env_specific.yml:/ansible/inventories/k8s/group_vars/all/env_specific.yml \
-v $PWD/ssl:/ansible/files/ssl:ro \
--privileged \
registry.local/vantage/vantage-k8s:2.7.1
  1. 次のプレイブックを実行します。
ansible-playbook -i inventories/k8s -v playbooks/4-Kubernetes-k8s.yml