メインコンテンツへスキップ
このオブジェクトは、特殊な「プレーンテキスト」形式の認識テキストを表します。認識されたテキスト記号、それらの認識信頼度、およびソース画像に対する相対的な位置に関する情報のみを提供します。この情報は、単一の文字についても、テキスト内のすべての文字についても取得できます。
バーコード認識の場合、PlainText オブジェクトの Text プロパティは空になります。単一のバーコードを含む 1 ページの文書から認識テキストを取得する必要がある場合は、レイアウト内の最初のブロックの Text プロパティを使用してください。
document.Pages[0].Layout.Blocks[0].GetAsBarcodeBlock().Text

プロパティ

,read-only

Engine オブジェクトを返します。

, read-only

認識されたテキスト全体に Unicode 文字列の形式でアクセスできます。この文字列には、以下の特殊文字が含まれる場合があります。

  • 0x2028 — 改行記号
  • 0x2029 — 段落区切り記号
  • 0xFFFC — オブジェクト置換文字 (テキスト内に埋め込まれた画像を示す)
  • 0x0009 — タブ
  • 0x005E — サーカムフレックスアクセント (^) 。ABBYY FineReader Engine が認識できない文字の代替として使用される
  • 0x00AC — ソフトハイフン
画像に表が含まれる場合、表のセル内のテキストは論理的な読み取り順序 (左から右、上から下) で格納されます。

, read-only

特殊文字を含む、テキスト内の文字数を返します。

, read-only

このプロパティは、認識されたテキスト内の文字のインデックスを入力パラメーターとして受け取ります。指定した文字が存在するページ番号を返します。

, read-only

文字の認識信頼度の値を返します。これは、主要な (選択された) 認識バリアントの信頼度です。

信頼度は認識バリアントの精度を推定するものです。一般的な認識品質の指標として解釈すべきではありません。信頼度を安全に使用できる唯一の用途は、同じ文字の認識バリアントを比較することです。認識を行わずにソース PDF ファイルから抽出された文字の信頼度は 55 に設定されます。

, read-only

指定した文字が誤って認識された推定確率 (0 ~ 100 の範囲) を返します。

, read-only

指定した文字が信頼性の低い状態で認識された場合に TRUE を返します。検証が必要かどうかを判断するには、このプロパティを使用してください。

このプロパティは、ErrorProbability の値と認識設定に基づいて計算されます。検証においてより細かい区別を実装する必要がある場合は、代わりに ErrorProbability を使用してください。

, read-only

このプロパティは、認識されたテキスト内の文字のインデックスを入力パラメーターとして受け取ります。傾き補正済みの白黒ソース画像の平面。

、読み取り専用

このプロパティは、認識されたテキスト内の記号のインデックスを入力パラメーターとして受け取ります。ソース画像のデスキュー済み白黒平面を基準とした、文字の Rectangle の左端の座標を返します。

、読み取り専用

このプロパティは、認識されたテキスト内の記号のインデックスを入力パラメーターとして受け取ります。ソース画像のデスキュー済み白黒平面を基準とした、記号の Rectangle の右端の座標を返します。

、読み取り専用

このプロパティは、認識されたテキスト内の記号のインデックスを入力パラメーターとして受け取ります。ソース画像のデスキュー済み白黒平面を基準とした、記号の Rectangle の上端の座標を返します。

メソッド

名前説明
GetCharacterData <Note> Windows のみ。 </Note>テキスト内のすべての文字に関する情報を、文字が存在するページ番号、文字の Rectangle の座標、各文字の信頼度を含む配列セットとして返します。
SaveToAsciiXMLFile認識されたテキストを XML ファイルに保存します。
SaveToTextFile認識されたテキストを、指定したエンコーディングのテキストファイルに保存します。
PlainText オブジェクト図

関連項目

CharConfidence、ErrorProbability、IsSuspicious の違いは何ですか? Text の操作 プロパティ の操作