メインコンテンツへスキップ
これでデータ抽出を開始する準備が整いました。ドイツの書類はレイアウトのばらつきが小さいため、一部のfieldはFast Learningアクティビティで抽出できます。 この方法で以下のデータを抽出します:
  • 病欠証明の発行日
  • 病気の初日と病欠の最終日
  • 健康保険会社名
  • 医師ID
  • 患者に関する次のデータ:
    • 保険ID
    • ドイツの保険ID
    • 生年月日
AD_Tutorial_Fields
  1. パイプラインでFast Learningアクティビティをダブルクリックします。
  2. Fields タブに移動します。VantageのDocument Skill Editorに似たウィンドウが表示されます。
  3. 最初のドイツ語の書類を選択します。
  4. 最初のfieldにラベルを付けます。
    a. データ フォームにテキストfieldを追加するiconをクリックします。
    b. 書類画像で発行日を含む領域を選択します。fieldはその領域のテキストで自動入力されます。
    c. field名をダブルクリックし、“Date” に変更します。
    d. field名の右側にあるiconをクリックし、fieldタイプを Date に変更します。
    e. Advanced field settings を開き、Acceptable orders of components セクションで Day-Month-Year オプションを選択します。
    f. Save をクリックします。
  5. 手順4を繰り返し、“Start Date” と “End Date” のfieldにラベルを付けます。
  6. 手順4.a〜4.cを繰り返し、“Health Insurer” のfieldにラベルを付けます。
  7. iconをクリックしてグループを作成し、“Patient” に名前を変更します。
  8. “Patient” グループを展開し、First group item プレースホルダーをクリックします。fieldの領域を選択し、field名を “Insurance ID” に変更します。
  9. “Patient” グループで “German Insurance ID” と “Date of Birth” のfieldを作成してラベル付けします。“Date of Birth” のfieldオプションは手順4と同様に構成します。
  10. 手順5と6を繰り返して “Doctor” グループを作成し、“Doctor ID” のfieldにラベルを付けます。
  11. ページ左側のドキュメントセットで次のドイツ語の書類を選択します。作成したfieldにラベルを付けます。
  12. ドキュメントセット内のすべてのドイツ語の書類について手順11を繰り返します。
  13. Train Activity をクリックします。トレーニングが完了すると、達成した精度が Results タブのヘッダーに表示されます。
  14. 精度が低い場合は、Results タブで抽出の問題を修正します。この手順はVantageのDocument skillで抽出の問題を修正する場合と同様です。抽出結果を更新するため、アクティビティを再トレーニングすることを忘れないでください。
さまざまな理由により、次のようなデータはFast Learningでは抽出しません:
  • 患者の氏名と住所が同じfieldにあります。氏名は1行または2行の場合があり、住所が欠落していることもあります。
  • 病欠証明の種類を示すチェックマークの位置が一定ではありません。
これらの要因により、Fast Learningアクティビティではfieldを特定できない、または抽出品質が低下する可能性があります。