- 分散型
- スタンドアロン
オペレーターは、あらかじめ設定されたプログラムを使用します。文書処理には、次の段階があります。
- 画像の追加 文書処理は画像の取り込みから始まります。取り込み方法は、スキャンするか、インポートプロファイル (例: Hot Folders) を使用して画像を自動的にロードするかのいずれかです。スキャンは Scanning Station の Operator が実行し、自動ロードは Processing Station が実行します。
- 認識 認識は Processing Station で自動的に実行されます。プログラムは static elements の位置に基づいて適切な Document Definition を選択し、その Document Definition を適用して、そこに指定された field のデータを認識します。
- 検証
データを確認する工程である検証は、Operator の作業の中でも最も手間のかかる部分です。これには次が含まれます。
- 文書アセンブリの検証 文書ページが正しくアセンブリされているかどうかの確認。
- グループ検証 同じように認識された文字のグループを目視で確認。
- フィールド検証 値の範囲が既知の field の文脈で、不確実に認識された文字を確認。
- ルール検証 ルールエラーの確認。
- バッチ整合性チェック - 整合性スクリプトを開始し、エラーがあれば修正します。
