FineReader Engine 用語集 - ABBYY Documentation

用語がFREの特定のプラットフォームにのみ該当する場合は、後ろに L (Linux) 、M (macOS) 、または W (Windows) が付きます。

A-E

F-O

P-Z

ABBYY FineReader Engine

紙の文書や画像からテキスト情報を抽出するアプリケーションをソフトウェア開発者が作成できるようにするソフトウェア開発キットです。別名: FineReader Engine、FRE、FREngine。

API

アプリケーションプログラミングインターフェイス。詳細はWikipediaをご覧ください。

二値化または適応型二値化

グレースケール画像またはカラー画像を白黒画像に変換する処理です。FineReader Engine では、最適な処理品質が得られるよう、画像の各フラグメントごとに輝度バランスが動的に調整されます。

Block

ABBYY FineReader Engine API の内部エンティティで、元画像内の領域とその種類 (テキスト、バーコード、チェックマークなど) を定義します。Block は手動で指定することも、文書解析後に自動的に作成することもできます。Block は、画像内のどの領域をどの順序で認識するかを決定し、認識後はその結果を保持します。詳細については、Block、Layout と Block の操作を参照してください。

CJK または CJK 言語

中国語 (簡体字・繁体字) 、日本語、韓国語。詳しくは、CJK 言語の認識をご覧ください。

CLI

コマンドラインインターフェイス。ABBYY FineReader Engine での実装方法を確認するには、distribution package に含まれている該当のコードサンプルを参照してください。このコードサンプルでは、多数のオプションキーを使用して、ABBYY FineReader Engine API の機能の大部分を利用できます。

信頼度レベル

テキスト中で特定の文字が使われている確率。詳細は Using Voting API を参照してください。

混同行列または誤差行列

オブジェクトの分類に用いられるアルゴリズムの結果を示す表です。詳しくは、Wikipedia、ConfusionMatrix を参照してください。

コンテナ

アプリケーションとそのすべての依存関係をまとめてパッケージ化し、さまざまなコンピューティング環境で安定して実行できるようにするための、実行環境全体を含むソフトウェア単位です。詳細については、DockerのウェブサイトまたはDockerコンテナ内で ABBYY FineReader Engine 12 を実行する (Linux および Windows) を参照してください。

カウンターまたはライセンスカウンター

一定期間内に認識およびエクスポートできるページ数または文字数を制限するためのライセンスエンティティです。

CPID

Customer Project ID。開発時に製品を初期化する際、一意の string として使用される英数字の組み合わせです。この string は 1 つまたは複数のシリアル番号 (Developer または Runtime ライセンス) に関連付けられることがあり、ABBYY の営業担当者によって発行されます。詳しくは、InitializeEngine を参照してください。

DIB (W)

デバイス非依存ビットマップ。DIB ファイルはメモリから直接開けます。詳細は次を参照してください: Wikipedia, OpenDib, PrepareDib。

DLL

動的リンクライブラリ。Windows 向けの ABBYY FineReader Engine 配布パッケージには、顧客製品に統合するための .dll 一式が含まれています。詳細については、Wikipediaを参照してください。

文書解析

文書構造の要素を検出し、ブロックのコレクションを表す Layout を作成する Optical Character Recognition (OCR) の処理段階です。詳しくは、Document Analysis、Layout と Block の操作を参照してください。

Dpi

1インチあたりのドット数。詳しくは: Wikipedia。

EULA

エンドユーザー使用許諾契約。この文書は ABBYY FineReader Engine の配布パッケージに含まれているほか、オンラインヘルプからも参照できます。詳細は Wikipedia をご覧ください。

EXIF

Exchangeable image file format。デジタルカメラで撮影した画像ファイルや音声ファイルに付加される特定のデータ (GPS位置情報、日付/時刻、カメラ設定など) を定義する標準です。詳細は Wikipedia を参照してください。

抽出

画像やテキストからデータを抽出する処理です。この処理は、テキスト、バーコード、field、またはMRZを認識するシナリオに適用されます。さらに、抽出は画像内の追加オブジェクトを取得するためにも使用されます。詳細は、ObjectExtractionParamsをご覧ください。

仮説

テキスト内の単一の文字または単語に対する認識結果の候補です。各仮説には信頼度が設定されており、複数の候補の中から最も適切なものを選択する必要がある場合に役立ちます。詳細は、Voting API の使用を参照してください。

ICAO

国際民間航空機関。機械読取式渡航文書の標準および仕様を定める組織です。詳しくは、ICAOのウェブサイトを参照してください。

ICR

Intelligent Character Recognition。1文字ずつ分けて記入された手書き文字を認識するための技術です。これらの文字は、文書内のフィールド、ボックス、フレームから検出されます。詳細については、OCR and Other Recognition Technologies、Recognizing Handwritten Textsを参照してください。

InprocLoader (W)

クライアントと同じプロセス内で、ABBYY FineReader Engine をインプロセスサーバー (DLL) としてロードおよびアンロードできるオブジェクトです。クライアントとインプロセスサーバー間の通信は、オブジェクト実装を直接呼び出す方式に基づいています。

JNI (L, W)

Java Native Interface。Java Virtual Machine 上で Java コードを実行し、C、C++、アセンブリで記述されたネイティブアプリケーションに組み込むための標準的なプログラミングインターフェイスです。詳細については、次を参照してください: Wikipedia、Java での使用。

ライブラリモジュール

ユーザーが利用できる ABBYY FineReader Engine の機能を構成し、その機能の実行に必要なファイルを決定する一連のライセンスモジュールです。詳細は、Windows 向けのライブラリモジュールを参照してください。

ライセンスモジュール

ABBYY FineReader Engine の特定の機能へのアクセスを提供するために使用されるライセンスエンティティです。各ライセンスモジュールは、インストールする特定の Library Modules に対応しています。詳細は、Modules を参照してください。

ライセンスサーバー (L、W)

ABBYY FineReader Engine のライセンス関連コンポーネントである Licensing Service と License Manager ユーティリティのインストールと管理に使用する、専用のワークステーションです。ライセンスサーバーは、ネットワークライセンスを使用してライセンスをネットワーク経由で各ワークステーションに配布する場合に必要です。License Manager ユーティリティを使用すると、GUI またはコマンドラインインターフェイスから、あらゆる種類の ABBYY FineReader Engine ライセンスを管理できます。詳しくは、Licensing を参照してください。

合字

2 つ以上の文字を組み合わせて作られた文字です。詳細は、Wikipedia または Windows 向けのユーザーパターンのトレーニングを参照してください。

ローダーまたは Engine ローダー

ABBYY FineReader Engine API のメイン Engine オブジェクトを初期化するためのインターフェイスとオブジェクトです。各種オペレーティングシステムで Engine オブジェクトをロードする方法はいくつかあります。

	Windows	Linux	macOS
スタンドアロンアプリケーション	標準の InitializeEngine 関数を使用 InprocLoader を使用した COM 経由	標準の InitializeEngine 関数を使用	標準の InitializeEngine 関数を使用
サーバーソリューション	OutprocLoader を使用した COM 経由	プロセス外サーバーとして	サポートされていません

どの方法がご使用のシナリオに適しているか (シングルスレッドまたはマルチスレッドのアプリケーション、インプロセスまたはアウトオブプロセスでのロード、GUI の使用など) を判断するには、以下を参照してください。

LZW

Lempel–Ziv–Welch。ファイルをより小さく圧縮するためのファイル圧縮方式の一種で、主に GIF で使用され、PDF と TIFF でもオプションで使用されます。LZW は、Abraham Lempel、Jacob Ziv、Terry Welch が考案した、テーブルベースの検索アルゴリズムに基づいています。詳細は、Wikipedia、ColorPictureFormatsEnum を参照してください。

MICR

磁気インク文字認識。小切手や振替伝票などの銀行書類を識別するために使用される技術です。MICRコードはスキャンでき、API経由でも人でも容易に読み取れます。MICRテキスト自体には、英数字で構成される2種類のテキストタイプ (CMC-7 と E13-B) があります。ABBYY FineReader Engine では、これらのテキストタイプを認識できるのはラテン文字言語のみです。詳細は、Wikipedia、Text Types を参照してください。

MRC

Mixed Raster Content。この技術は PDF (PDF/A) ファイルに適用でき、文書を 3 つの異なるレイヤーとして表現します。1 つ目は画像を含む前景プレーン、2 つ目はテキストとその色を含むマスクプレーン、3 つ目は背景画像やテクスチャを含む背景プレーンです。各レイヤーは、そのデータ型に最適な圧縮方式を使用して個別に圧縮されます。詳細については、PDF Conversionを参照してください。

OBR

Optical Barcode Recognition。画像内のバーコードを自動的に検出、認識、識別するプロセスです。詳しくは、OCR とその他の認識技術、バーコードの種類、バーコードの認識をご覧ください。

OCR

Optical Character Recognition (OCR)。手書き、タイプされた文字、または印刷文字を含む画像 (通常はスキャナーで取り込まれます) を、コンピューターで編集可能なテキストに電子的に変換する多段階の処理です。これには、前処理、文書解析、認識、合成が含まれます。詳細は、OCR とその他の認識技術を参照してください。

オンラインライセンスサービスまたはABBYY オンラインライセンスサービス (L, W)

特定のオンラインライセンスの真正性と有効性を、定期的な確認によって検証するABBYY提供のサービスです。詳細はオンラインライセンスを参照してください。

OMR

光学式マーク認識、またはチェックマーク認識。開発者が定義した画像または文書の領域内にあるチェックマークを自動的に検出・認識する処理です。詳細は、OCR とその他の認識技術、チェックマークの認識を参照してください。

OutprocLoader (W)

クライアントと同じマシン上の別プロセスで、ABBYY FineReader Engine をプロセス外サーバー (EXE) としてロードおよびアンロードできるオブジェクトです。クライアントとプロセス外サーバー間の通信は、プロセス境界をまたぐ呼び出しに基づいて行われます。

PDFium

PDFを開いたり、画像に変換したり、添付ファイル、フォント、メタデータを抽出したりするためのクロスプラットフォームライブラリです。詳細は、Googlesource を参照してください。

プレーンテキストまたはPlainText

認識された文字のみを含むテキストを格納する ABBYY FineReader Engine オブジェクトです。このテキストは、文字の認識信頼度とソース画像内での位置情報に基づいています。認識結果には、フレーム、表、その他のレイアウト要素に関する情報は意図的に含まれず、文字だけが残されます。詳細は PlainText を参照してください。

前処理または画像前処理

後続の認識やアーカイブのために、文書画像の品質を向上させる処理。

プロファイル

ABBYY FineReader Engine のパラメーターを、適切な既定値にあらかじめ設定したセットです。各プロファイルは、ABBYY FineReader Engine の特定の使用シナリオに適用できます。詳しくは、プロファイルの操作をご覧ください。

Pt

1/72インチに相当するポイント、つまり活字のポイントです。詳しくは Wikipedia を参照してください。

ラスター化

画像を、たとえばピクセル、ドット、または線で構成されるラスター画像に変換する処理です。詳しくは、Wikipedia を参照してください。

認識

画像上のすべてのブロックからデータ (テキスト、バーコード、チェックマークなど) を抽出し、コンピューターで編集可能な情報に変換する処理です。詳細については、OCR とその他の認識技術を参照してください。

Region

ABBYY FineReader Engine における内部エンティティで、1 つまたは複数の文書要素から構成されます。1 つの Region には、1 つまたは複数の矩形を含めることができます。詳細は Region を参照してください。

RHEL (L)

Red Hat Enterprise Linux。

RMI (L)

リモートメソッド呼び出し。ある Java Virtual Machine から別の Java Virtual Machine に呼び出しを行い、リモートオブジェクト上のメソッドを呼び出すための仕組みです。詳細: Wikipedia, Java での使用.

シナリオ

ABBYY FineReader Engine を使用した文書処理における特定のタスクに最適な、一連の手順と推奨事項です。詳細については、Basic Usage Scenarios Implementation を参照してください。

合成

ABBYY FineReader Engine を使用して、文書の論理構造 (目次、テキストの順序、フォントスタイル、見出しなど) を検出する OCR の処理ステップです。認識結果を TXT 形式のファイルまたは画像のみの PDF にエクスポートする場合は、このステップを省略できます。

トレーニング (W)

特徴のある文書 (特定のフォント (装飾文字やアウトライン文字) 、文字 (合字) など) を認識する前や、特定の基準 (たとえば、バーコード、MRZ、請求書の有無など) に基づいて文書を分類する前に行う事前処理です。詳しくは、トレーニングを使用した認識をご覧ください。

Twip

ポイントの1/20、または1インチの1/1440に相当する、タイポグラフィで用いられる長さの単位です。詳しくはWikipediaをご覧ください。

TWAIN (W)

ソフトウェアと、スキャナー、ウェブカメラ、CCTV、デジタルカメラなどのデジタル画像デバイスとの通信を担う、クロスプラットフォームのAPIおよびプロトコルです。詳細は、Wikipedia、スキャンを参照してください。

Visual Components または VC (W)

ActiveX コンポーネントおよび補助的な COM クラスのライブラリです。ABBYY FineReader Engine には、スキャン、画像編集、認識テキストの検証などを行う独自の OCR アプリケーションを作成するためのグラフィカルユーザーインターフェイス要素一式が用意されています。詳細については、Visual Components Reference を参照してください。

仮想マシン

物理コンピューターとその特性を仮想環境上で再現したものです。リモートからアクセスできるほか、コンピューターに追加でインストールすることもできます。詳細は Wikipedia を参照してください。

XFA

XML Forms Architecture。ユーザー指定のデータを含む対話型Webフォームの処理ルールを定義するXML仕様です。詳細はWikipediaを参照してください。

WIA (W)

Windows Image Acquisition。グラフィックスソフトウェアが、プリンター、スキャナー、デジタルカメラ、そのほかの映像機器などのハードウェアと通信するための API とプロトコルです。詳細: Wikipedia, スキャン。

ワークステーション

ABBYY FineReader Engine ライブラリをインストールして使用するためのマシンです。ライブラリを基にしたアプリケーションを開発するには、Developer License が必要です。配布されたアプリケーションを使用する場合は、Runtime License で十分です。詳しくは、ライセンスを参照してください。

ZUGFeRD

Forum elektronische Rechnung Deutschland の Zentraler User Guide (ドイツ語) 、または Central User Guide for Electronic Invoicing (英語) の略。PDF文書 (PDF/A-3 規格に準拠している必要があります) と XML 構造化データを統合するための形式を定めた、ドイツの電子請求書標準です。詳細は、ZUGFeRD 準拠の電子請求書を参照してください。

​A-E

​F-O

​P-Z

​ABBYY FineReader Engine

​API

​二値化または適応型二値化

​Block

​CJK または CJK 言語

​CLI

​信頼度レベル

​混同行列または誤差行列

​コンテナ

​カウンターまたはライセンスカウンター

​CPID

​DIB (W)

​DLL

​文書解析

​Dpi

​EULA

​EXIF

​抽出

​仮説

​ICAO

​ICR

​InprocLoader (W)

​JNI (L, W)

​ライブラリモジュール

​ライセンスモジュール

​ライセンスサーバー (L、W)

​合字

​ローダーまたは Engine ローダー

​LZW

​MICR

​MRC

​OBR

​OCR

​オンライン ライセンス サービスまたはABBYY オンライン ライセンス サービス (L, W)

​OMR

​OutprocLoader (W)

​PDFium

​プレーンテキストまたはPlainText

​前処理または画像前処理

​プロファイル

​Pt

​ラスター化

​認識

​Region

​RHEL (L)

​RMI (L)

​シナリオ

​合成

​トレーニング (W)

​Twip

​TWAIN (W)

​Visual Components または VC (W)

​仮想マシン

​XFA

​WIA (W)

​ワークステーション

​ZUGFeRD

A-E

F-O

P-Z

ABBYY FineReader Engine

API

二値化または適応型二値化

Block

CJK または CJK 言語

CLI

信頼度レベル

混同行列または誤差行列

コンテナ

カウンターまたはライセンスカウンター

CPID

DIB (W)

DLL

文書解析

Dpi

EULA

EXIF

抽出

仮説

ICAO

ICR

InprocLoader (W)

JNI (L, W)

ライブラリモジュール

ライセンスモジュール

ライセンスサーバー (L、W)

合字

ローダーまたは Engine ローダー

LZW

MICR

MRC

OBR

OCR

オンラインライセンスサービスまたはABBYY オンラインライセンスサービス (L, W)

OMR

OutprocLoader (W)

PDFium

プレーンテキストまたはPlainText

前処理または画像前処理

プロファイル

Pt

ラスター化

認識

Region

RHEL (L)

RMI (L)

シナリオ

合成

トレーニング (W)

Twip

TWAIN (W)

Visual Components または VC (W)

仮想マシン

XFA

WIA (W)

ワークステーション

ZUGFeRD