画像前処理 - ABBYY Documentation

なぜ画像を改善するのですか？

画像品質の改善には、2 つの目的があります。 1 つは、画像の品質を高めて、Optical Character Recognition (OCR) により適した状態にすることです。

もう 1 つは、画像の見た目を改善することです。これは、たとえば文書画像をアーカイブに保存する場合に必要になります。

ABBYY の技術は文書の解析と認識に重点を置いているため、このシステムには、適応的二値化、ゆがみ補正、テキスト行の傾き補正、見開きページの分割など、強力な画像前処理技術が一式備わっています。正確な OCR 結果を得るために、サードパーティ製ツールは必要ありません。ABBYY は、OCR 向けに最適化された前処理技術を包括的に提供しています。

画像の前処理

ABBYY FineReader Engineは、画像を受け取ると、認識やアーカイブの精度を高めるために、ドキュメント画像の品質を向上させるさまざまな画像前処理機能を実行します。


	このドキュメントイメージング機能は、ドキュメントページのスキャン方向が不明だったり、ページごとに異なる可能性がある場合の一括画像入力において非常に重要です。システムは各ページの向きを自動的に検出し、必要に応じて補正します。
	この機能は、書籍を見開き (左右両ページ) でスキャンする際に使用します。ページを2つに分割して各ページを書籍の1ページに対応させることで、認識精度が向上します。その後、各ページに対して認識とレイアウト解析が個別に実行され、必要に応じて傾き補正も行われます。
	これは、画像の傾きを補正する必要があるスキャン済みドキュメントに適用される、ドキュメントイメージングの重要な機能です。先端の枠線や罫線は不要です。新しい ABBYY FineReader Engine 12 では、黒い正方形のペア、罫線、またはテキスト行を使用するなど、複数の傾き補正方法を提供しています。
	スキャンまたは撮影した書籍からテキストを取り込む際、テキスト行が不均一になり、Optical Character Recognition (OCR) による認識が困難になる場合があります。ABBYY のテクノロジーは、傾きを補正してテキスト行を整え、正確なテキスト認識を実現する専用アルゴリズムを提供しています。
	低品質から中程度の品質のドキュメントをスキャンすると、多数のドットや斑点を含むノイズの多い画像が生成されることがあります。これらの斑点が文字や数字の近くに現れると、OCR の品質に影響する可能性があります。この機能はそのようなノイズを除去します。除去する斑点のサイズはユーザーが指定できます。画像全体だけでなく、画像内の個々のブロック (ゾーン) にも適用できます。
	このテクノロジーはデジタル写真を自動的に識別し、デジタルカメラによって生じる典型的な歪みを補正します。システムは、歪んだテキスト行や台形の3D歪み、ピンぼけ、にじみ、厚い書籍の見開きページの暗い部分、グレア、ISOノイズなど、デジタル画像に一般的に見られる欠陥を認識します。これらの欠陥はシステムが自動的に補正するため、ユーザーがサードパーティのアプリケーションを使って写真を補正する必要はありません。
	テクスチャフィルタリングテクノロジーは、色やテクスチャといった背景の「ノイズ」を除去し、新聞紙、カラードキュメント、ファックス、コピーなど、読み取りが困難なドキュメントの認識精度を向上させます。


	画像を白黒に変換し、ノイズ・背景・テクスチャを除去して鮮明なテキストを得るプロセスです。このプロセスにより、最高のOptical Character Recognition (OCR)品質が確保されます。必要なパラメーターは各フラグメントごとに個別に特定されます。薄い新聞紙の場合、裏面に印刷されたテキストがスキャン画像に透けて見えることがありますが、適応的二値化によってこのテキストが除去されます。革新的な適応的二値化技術は、認識処理中に各画像フラグメントの輝度しきい値を動的に調整します。個別の認識パラメーターを適用することで、グレーまたはカラーの可変コントラストの背景やテクスチャを持つドキュメントに対しても、正確な認識結果を生成します。
	非常に小さなドットを使用してグレースケール画像を二値化する処理です。より多くの階調が表現されるように見えるため、ドキュメントの外観が向上します。

画像を白黒に変換し、ノイズ・背景・テクスチャを除去して鮮明なテキストを得るプロセスです。このプロセスにより、最高のOptical Character Recognition (OCR)品質が確保されます。必要なパラメーターは各フラグメントごとに個別に特定されます。薄い新聞紙の場合、裏面に印刷されたテキストがスキャン画像に透けて見えることがありますが、適応的二値化によってこのテキストが除去されます。

革新的な適応的二値化技術は、認識処理中に各画像フラグメントの輝度しきい値を動的に調整します。個別の認識パラメーターを適用することで、グレーまたはカラーの可変コントラストの背景やテクスチャを持つドキュメントに対しても、正確な認識結果を生成します。

非常に小さなドットを使用してグレースケール画像を二値化する処理です。より多くの階調が表現されるように見えるため、ドキュメントの外観が向上します。

二値画像用のフィルター
画像の拡大	低解像度 (120 dpi未満) でスキャンされた文書や、小さいフォント (10 pt未満) を含む文書では、Optical Character Recognition (OCR)の品質を向上させるために、画像をデジタル処理で拡大する場合があります。

​なぜ画像を改善するのですか？

​画像の前処理

​関連項目

なぜ画像を改善するのですか？

画像の前処理

関連項目