メインコンテンツへスキップ
このセクションでは、ABBYY FineReader Engine の代表的な利用シナリオについて説明します。まずは、ご自身のタスクに最も適したシナリオを選んで、ABBYY FineReader Engine の使用を開始することをお勧めします。適切なシナリオが見つかったら、基本的な使用シナリオの実装 セクションで、そのシナリオの詳細な説明、実装に関するアドバイス、さらに特定のタスク向けにコードを最適化するための提案を確認できます。

intro_Scenarios_DocumentConversion

このシナリオの結果として、ドキュメントの編集可能なバージョンが得られます。

このシナリオでは、ドキュメント画像が認識され、元の書式をすべて保持したまま、データが編集可能なファイル形式に保存されます。その結果、エラーの確認や修正が容易な編集可能なドキュメントが得られます。

詳細については、ドキュメント変換を参照してください。

intro_Scenarios_DocumentArchiving

この処理シナリオでは、紙のドキュメントが、すべての情報を検索可能な形式で含む編集不可のデジタルコピーに変換されます。この処理により、ドキュメントのデジタルコピーを全文検索で電子アーカイブから簡単に検索したり、テキスト部分をコピーしたり、メールで送信したり、印刷したりすることができます。

詳細については、ドキュメントアーカイブを参照してください。

intro_Scenarios_DataExtraction

このシナリオは、ドキュメントからあらゆるデータを抽出し、構造化された形式で保存するために使用します。

結果はドキュメント構造を表すJSONファイルです。このファイルには、印刷テキストおよび手書き文字、表、バーコード、チェックマーク、画像とその位置および属性など、すべてのドキュメントオブジェクトが格納されます。この形式は、後続の処理、データベースへのデータ保存、または他のアプリケーションとの統合に最適です。

詳細については、データ抽出を参照してください。

intro_Scenarios_TextExtraction

このシナリオでは、ドキュメントの本文テキストに加え、ロゴや印鑑など本文以外のあらゆる要素上のテキストも抽出できます。

テキストの自然な順序 (「人間が読む順序」) が保持されます。その後、ドキュメントをお客様側の自然言語処理 (NLP) エンジンに渡して、迅速な要約、機密情報の検索、センチメント分析などを行うことができます。

詳細については、テキスト抽出を参照してください。

intro_Scenarios_FieldLevelRecognition

field-level recognitionでは、特定のfieldからデータをキャプチャするために短いテキストフラグメントが認識されます。このシナリオでは認識品質が非常に重要です。

このシナリオは、ドキュメントから有用なデータを抽出する必要があるより複雑なシナリオの一部としても使用できます (例:紙のドキュメントから情報システムやデータベースへのデータキャプチャ、文書管理システムでのドキュメントの自動分類とインデックス付けなど) 。

このシナリオでは、システムは一部のfieldのみの複数行テキスト、または小さな画像上のテキスト全体を認識します。システムは認識された各文字に対して確信度を計算します。この確信度は認識結果の確認時に活用できます。さらに、システムはテキスト内の単語や文字に対して複数の認識候補を保存でき、これらを投票アルゴリズムで利用して認識品質を向上させることができます。

詳細については、Field-Level Recognitionを参照してください。

intro_Scenarios_BarcodeRecognition

このシナリオでは、ABBYY FineReader Engineを使用してバーコードを読み取ります。バーコードの読み取りは、自動ドキュメント分割、文書管理システムによるドキュメント処理、ドキュメントのインデックス付けと分類など、さまざまな目的で必要になる場合があります。

このシナリオは他のシナリオの一部として使用できます。たとえば、高速プロダクションスキャナーでスキャンされたドキュメントをバーコードで分割したり、長期保存用に準備されたドキュメントをバーコードの値に基づいてアーカイブ用文書管理システムに格納したりすることが可能です。

テキストからバーコードを抽出する際、システムはすべてのバーコードを検出するか、特定の値を持つ特定の種類のバーコードのみを検出することができます。システムはバーコードの値を取得し、チェックサムを計算することができます。

認識されたバーコードの値は、後続の処理に最適な形式 (例:TXT形式) で保存できます。

詳細については、バーコード認識を参照してください。

intro_Scenarios_BusinessCardsRecognition

名刺には、企業または個人に関するビジネス情報が記載されています。名刺には、氏名、会社名、電話番号、FAX、メールアドレス、ウェブサイトのアドレスなどの情報が含まれることがあります。紙の名刺からこれらの情報をキャプチャして電子形式で保存する必要が生じることがあります。保存先としては、携帯電話の電子アドレス帳、メールクライアント、またはその他のデータストレージシステムなどが考えられます。たとえば、名刺はvCard形式でメールやネットワーク経由でやり取りされることがよくあります。

詳細については、名刺認識詳細については、こちらをご覧ください。

intro_Scenarios_Machine-readable-zone-extraction

多くの国の公式渡航書類や身分証明書には、文書データをより正確に処理するための機械可読ゾーン (MRZ) が含まれています。

このシナリオは、顧客のオンボーディングや本人確認プロセスにおいて、身分証明書の機械可読ゾーンからデータを抽出するために使用されます。システムは文書画像上のMRZを認識し、そこからデータを抽出します。抽出されたデータには、文書および所持者に関する個人情報 (文書の種類と有効期限、所持者の姓名など) を含む複数のfieldが含まれます。fieldを検索してデータを検証し、さらなる処理のために外部ファイルに保存することができます。

詳細については、Machine-Readable Zone Captureをご覧ください。

intro_Scenarios_Scanning

Windowsのみ

このシナリオでは、ABBYY FineReader Engineを「スキャンコンピューター」上で使用し、画像をスキャンしてファイルとして保存します。

このシナリオは、文書処理の前段階として他のシナリオの一部に組み込むことができます。つまり、後続の処理に向けて文書の電子版を取得する目的で使用されます。具体的な用途としては、アーカイブ目的での文書スキャン、編集可能な形式での文書取得、文書からの有用なデータ抽出などが挙げられます。

紙の文書をスキャンして画像を電子フォーマットで保存することで、印刷された文書の高品質な電子版を作成します。

詳細については、Scanningをご覧ください。

intro_Scenarios_DocumentClassification

文書分類とは、文書をユーザー定義のカテゴリのいずれかに割り当てる処理です。契約書、請求書、領収書など、複数の種類の文書が混在する文書フローを扱う場面では、各文書の種類を識別する必要があります。たとえば、文書を種類別のフォルダーに振り分けたり、種類に応じてファイル名を変更したりする場合があります。こうした処理は、事前学習済みのシステムを使用して自動化できます。

このシナリオの前提条件は、処理対象の文書の種類があらかじめわかっていることです。ABBYY FineReader Engineは、文書の外観または内容に基づいて文書を分類できます。

詳細については、Document Classificationをご覧ください。

intro_Scenarios_DocumentComparison

紙の文書を扱う際には、誤りや意図的に加えられた変更箇所を発見して修正する必要があります。

このシナリオは、契約書や銀行書類などの重要な文書をそのコピーと比較するために使用されます。比較結果には、コンテンツの種類 (テキストのみ) 、変更の種類 (削除、挿入、または修正) 、および原本とコピーにおける位置の差異に関する情報が含まれます。検出された差異の一覧や変更箇所のregionを取得し、さらなる処理や長期保存のために比較結果を外部ファイルに保存することができます。

詳細については、ドキュメント比較をご覧ください。

関連項目

基本的な使用シナリオの実装