メインコンテンツへスキップセグメンテーション アクティビティの学習には、独立したドキュメント セットを使用できます。これを行うには、スキル名の横にあるドロップダウン リストからセグメンテーション アクティビティを選択します。次に、Upload ボタンの左にあるドロップダウン リストで必要なドキュメント セットを選択するか、Create Set… をクリックして新規作成します。このタブでは、Documents セクションで説明しているとおりに、ドキュメントのアップロード、削除、回転を行えます。
セグメンテーション アクティビティをセットアップするには:
- Activities タブで、ドキュメント処理フローにセグメンテーション アクティビティを追加します。セグメンテーション アクティビティは、テキスト セグメントから field を抽出するアクティビティの前に配置する必要がある点にご注意ください。
- Activity Properties ペインで、抽出対象のセグメントに対応するすべての field を選択します。
Note: Text 型でデータ型が Text に設定されている field のみがサポートされます。
- Activity Editor をクリックします。必要に応じて、Fields タブでドキュメントのラベリングをさらに調整します。
- Train Activity をクリックします。学習は Fast または Thorough モードで実行できます。
- Fast モードはデフォルトで選択されています。このモードは小規模なドキュメント セットでも機能し、短時間で学習が完了します。
- Fast モードの結果に満足できない場合は、Deep Learning モデルを学習する Thorough モードへの切り替えを検討してください。このモードでは学習セット内のドキュメントがより多く必要になり、学習に時間がかかりますが、幅広いドキュメントでより良い精度が期待できます。ドキュメント セットには少なくとも 50 件のラベル付きドキュメントが必要ですが、150 件以上を推奨します。Thorough モードへの切り替えは、Train Activity ボタン横のドロップダウン メニューを使用します。
- 両方のモードをテストし、ドキュメントに最適なものを選択するとよいでしょう。
Note: Thorough モードは英語のドキュメントでのみ機能します。
- アクティビティの学習が完了すると、テストが自動的に開始されます。テスト完了後、Results タブに移動して、アクティビティの field 抽出結果を分析します。Results タブに表示される統計は、Results タブに表示される Skill 全体の統計と同一です。必要に応じてラベリングを修正し、再度アクティビティを学習させてください。
Note: アクティビティの学習とテストは、ラベリングが確定しているドキュメントでのみ実行できます。参照ラベリングが予測ラベリングに基づいて自動生成された場合、ドキュメントのラベリングは未確定のままです。ドキュメントのコンテキスト メニューで該当オプションを使用して予測ラベリングを参照にコピーしない限り、確定されません。各ドキュメントのラベリング ステータスは Documents タブで確認できます。ドキュメントのラベリングを確定するには、Fields タブでレビューしてください。
サポートされている言語: English、Russian、German、French、Spanish、Italian、Portuguese (Standard)、Japanese、Dutch。