Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
はじめに
参照構成
- 8 時間あたり 50,000 ページ
- 8 時間あたり 100,000 ページ
- 8 時間あたり 150,000 ページ
- 8 時間あたり 200,000 ページ
- 8 時間あたり 10,000 ページ
- 8 時間あたり 30,000 ページ
- 8 時間あたり 50,000 ページ
高可用性なし構成では、Deep Learning アクティビティを使用した Skill のトレーニングはサポートしていません。
- ファイルをインポートする。
- ドキュメントを認識する。
- ドキュメントを分類し、ドキュメントタイプを判別する。
- ドキュメントからデータを抽出する。
- データを JSON にエクスポートする。
ノードタイプ
| ノードタイプ | CPU コア数 (各ノード) | RAM (各ノード、GB) | ディスクサイズ (GB) |
|---|---|---|---|
| サービスノード | 12 | 48 | 120* |
| ワーカーノード | 12 | 48 | 120 |
ストレージ要件
| 構成 | ストレージ | ストレージの場所 | ディスク サイズ (GB) |
|---|---|---|---|
| 高可用性なし | 内部 NFS | サービス ノード | 500 (8 時間ごとに 10,000 ページを処理する場合) |
| 高可用性なし | 外部 NFS | NFS サーバー マシン | 500 (8 時間ごとに 10,000 ページを処理する場合) |
| 高可用性あり | 外部 NFS | NFS サーバー マシン | 50 (8 時間ごとに 10,000 ページを処理する場合) |
| 高可用性あり | ローカル永続ボリューム | 最初のサービス ノード (インベントリ ファイルで定義) | 500 (8 時間ごとに 10,000 ページを処理する場合) |
8 時間あたり 10,000 ページを超える負荷がある場合は、外部ストレージの使用を推奨します。
パフォーマンス結果
高可用性構成
| 負荷 (ページ/8時間) | サービス用ノード (3ページの請求書) | サービス用ノード (50ページの請求書) | ワーカー用ノード (3ページの請求書) | ワーカー用ノード (50ページの請求書) |
|---|---|---|---|---|
| 50,000 | 4 | 4 | 4 | 4 |
| 100,000 | 4 | 4 | 5 | 7 |
| 150,000 | 4 | 4 | 7 | 9 |
| 200,000 | 4 | 4 | 8 | 11 |
ディスク I/O 操作
| 負荷 (ページ数/8時間) | ディスク I/O 操作数/秒 (3ページの請求書) | ディスク I/O 操作数/秒 (50ページの請求書) |
|---|---|---|
| 50,000 | 100 | 50 |
| 100,000 | 250 | 100 |
| 150,000 | 400 | 170 |
| 200,000 | 600 | 230 |
高可用性構成なし
| 負荷 (ページ/8時間) | サービス用ノード数 | ワーカー用ノード数 |
|---|---|---|
| 10,000 | 1 | 1* |
| 30,000 | 1 | 3 |
| 50,000 | 1 | 3 |
ABBYY Vantage をスケーリングしても、ドキュメント処理時間の増加は確認されませんでした。
ノードの管理
Workerノードの追加
- インストールディレクトリ内のインベントリファイルを開きます。
[abbyy_workers]セクションで、ノード名とIPアドレスを指定してノードを追加します。- インストーラーを実行します。
- 次のプレイブックを実行します。
