メインコンテンツへスキップ
ABBYY Documentation home page
日本語
FineReader Engine
Search documentation...
⌘K
AIに質問
Website
Get Started
Get Started
検索...
Navigation
主な新機能
文書解析
紹介
ガイド付きツアー
API リファレンス
Visual Components リファレンス
ライセンス管理
インストール
配布
仕様
よくある質問
リリースノート
概要
ABBYY FineReader Engine 12 の紹介
基本的な使用シナリオの概要
主な新機能
主な新機能
ドキュメントスキャンと画像のインポート
画像前処理
文書解析
Optical Character Recognition (OCR)とその他の認識技術
PDF変換
高度な開発ツール
認識テキストの取得とエクスポート
マルチCPU認識アーキテクチャ
メリット
主な仕様
はじめに
ABBYY FineReader Engine 用語集
このページの内容
基本的な文書解析機能
一般文書解析
請求書向けの文書解析
全文索引用の文書解析
フィールドレベル認識の手動ブロック指定
関連項目
主な新機能
文書解析
ページをコピー
ページをコピー
基本的な文書解析機能
文書解析 は、ページ上の次のオブジェクトを自動検出するための一連の機能です。
テキストブロック
画像
テーブルとテーブルセル
バーコード
区切り線
さらに、文書解析には OCR 用に画像を準備するための特別な機能もあります。
ページの向き (90 度、180 度、270 度) を検出する
見開きページを分割する
テーブルセル内の縦書きテキストを検出する
ページ上の不要なブロックを検出してマークする
この前処理は、ページ上のどの field を認識対象にするか、またどの部分を元のまま保持するかを指定するうえで非常に重要です。
また、認識対象の field を手動で選択することもできます。この場合は、field の座標とその中のデータ型を設定する必要があります。これは主にデータキャプチャのための
フィールドレベル認識
シナリオで使用されます。
ABBYY FineReader Engine 12 では、3 種類の自動文書解析と 1 種類の手動文書解析が提供されています。
一般文書解析
請求書向け文書解析
全文索引用文書解析
フィールドレベル認識のための手動ブロック指定
一般文書解析
これは既定の文書解析タイプで、テキストブロック、画像、表、バーコード、区切り要素など、すべてのオブジェクトを検出します。この解析の結果は、
コンテンツ再利用シナリオ
で文書構造およびレイアウトを取得するために使用されます。すべての画像と図は、内部のテキストを認識せず、元の形のまま保持されます。
請求書向けの文書解析
これは、請求書、支払依頼書、請求書類、送り状、名刺、契約書、医療保険請求書、履歴書などの半構造化文書を変換するための前処理エンジンです。これらの文書内にあるすべてのテキストを、文字や数字も含めて正確に特定できるよう設計されており、その情報がスタンプ、画像、ロゴ、または小さな文字領域内にある場合でも対応できます。
標準的なページ全体の文書解析とは異なり、このエンジンでは、文書上の印字情報はすべてテキストであることを前提としています。また、重要なテキスト情報が図形要素として識別されたり、単語や数値が個々の文字に分割されたりしないようにします。その結果、座標を含むテキストに関する可能な限り多くの情報を利用できるようになり、後続の処理段階で他のシステムによる解析、field単位の処理、パースに活用できます。
全文索引用の文書解析
画像、グラフ、図表に埋め込まれたテキストを含め、文書内のあらゆるテキストを自動的に検出・認識します。開発者は、この文書解析モードを使用して、文書インデックスの構築 (DMS、CMS、アーカイブシステムなど) に必要な、文書内の全文情報を網羅的に抽出できます。
フィールドレベル認識の手動ブロック指定
このケースでは、認識対象のフィールドがユーザーまたはアプリケーションによって直接定義されるため、分析は不要です。Recognizer はフィールドの座標とテキストの種類を受け取り、指定された領域で OCR を実行します。
関連項目
主な機能
このページは役に立ちましたか?
はい
いいえ
画像前処理
前へ
Optical Character Recognition (OCR)とその他の認識技術
次へ
⌘I
アシスタント
AIにより生成された回答には誤りが含まれる可能性があります。