セグメンテーション アクティビティの学習には、独立したドキュメント セットを使用できます。これを行うには、スキル名の横にあるドロップダウン リストからセグメンテーション アクティビティを選択します。次に、Upload ボタンの左にあるドロップダウン リストで必要なドキュメント セットを選択するか、Create Set… をクリックして新規作成します。このタブでは、Documents セクションで説明しているとおりに、ドキュメントのアップロード、削除、回転を行えます。Documentation Index
Fetch the complete documentation index at: https://docs.abbyy.com/llms.txt
Use this file to discover all available pages before exploring further.
アクティビティを追加する
Activities タブで、ドキュメント処理フローにセグメンテーション アクティビティを追加します。セグメンテーション アクティビティは、テキスト セグメントから field を抽出するアクティビティの前に配置する必要がある点にご注意ください。
field を選択する
Activity Properties ペインで、抽出対象のセグメントに対応するすべての field を選択します。
Text 型でデータ型が Text に設定されている field のみがサポートされます。
アクティビティを学習させる
Train Activity をクリックします。学習は Fast または Thorough モードで実行できます。
- Fast モードはデフォルトで選択されています。このモードは小規模なドキュメント セットでも機能し、短時間で学習が完了します。
- Fast モードの結果に満足できない場合は、Deep Learning モデルを学習する Thorough モードへの切り替えを検討してください。このモードでは学習セット内のドキュメントがより多く必要になり、学習に時間がかかりますが、幅広いドキュメントでより良い精度が期待できます。ドキュメント セットには少なくとも 50 件のラベル付きドキュメントが必要ですが、150 件以上を推奨します。Thorough モードへの切り替えは、Train Activity ボタン横のドロップダウン メニューを使用します。
- 両方のモードをテストし、ドキュメントに最適なものを選択するとよいでしょう。
Thorough モードは英語のドキュメントでのみ機能します。
アクティビティの学習とテストは、ラベリングが確定しているドキュメントでのみ実行できます。参照ラベリングが予測ラベリングに基づいて自動生成された場合、ドキュメントのラベリングは未確定のままです。ドキュメントのコンテキスト メニューで該当オプションを使用して予測ラベリングを参照にコピーしない限り、確定されません。各ドキュメントのラベリング ステータスは Documents タブで確認できます。ドキュメントのラベリングを確定するには、Fields タブでレビューしてください。
