メインコンテンツへスキップ
セグメンテーションアクティビティの学習には、別のドキュメントセットを使用できます。実行するには、スキル名の横にあるドロップダウンリストから Segmentation activity を選択します。次に、Upload ボタンの左側にあるドロップダウンリストで必要なドキュメントセットを選択するか、Create Set… をクリックして新規作成します。ドキュメントのアップロード、削除、回転は、Documents セクションで説明しているとおり、このタブで行えます。 セグメンテーションアクティビティをセットアップするには:
  1. Activities タブで、ドキュメント処理フローに Segmentation activity を追加します。セグメンテーションアクティビティは、テキストセグメントから field を抽出するアクティビティの前に配置する必要があります。
  2. Activity Properties ペインで、抽出するセグメントに対応するすべての field を選択します。
Note: Text タイプでデータ型が Text に設定されている field のみがサポートされます。
  1. Activity Editor をクリックします。必要に応じて、Fields タブでドキュメントのラベリングをさらに調整します。
  2. Train Activity をクリックします。学習は Fast または Thorough モードで実行できます。
    • 既定では Fast モードが選択されています。このモードは小規模なドキュメントセットでも機能し、短時間で学習が完了します。
    • Fast モードの結果に満足できない場合は、Deep Learning モデルを学習する Thorough モードへの切り替えを検討してください。このモードではトレーニングセットにより多くのドキュメントが必要で、学習時間も長くなりますが、より多様なドキュメントに対して高い性能を発揮できます。ドキュメントセットには少なくとも 50 件のラベル付きドキュメントが必要ですが、150 件以上を推奨します。Thorough モードに切り替えるには、Train Activity ボタンの横にあるドロップダウンメニューを使用します。
    • 両方のモードをテストし、ドキュメントに最適なものを選択することをお勧めします。
Note: Thorough モードは英語のドキュメントでのみ動作します。
  1. アクティビティの学習が完了すると、テストが自動的に開始されます。テスト完了後、Results タブに移動し、アクティビティの field 抽出結果を分析します。Results タブに表示される統計は、Results タブに表示される Skill の全体統計と同一です。必要に応じてラベリングを見直して変更し、アクティビティを再学習してください。
Note: このアクティビティの学習とテストは、ラベリングが確定済みのドキュメントでのみ実行できます。参照ラベリングが予測ラベリングに基づいて自動生成された場合、ドキュメントは未確定のラベリングとなります。ドキュメントのコンテキストメニューで該当オプションを使用して予測ラベリングを参照にコピーしない限り、確定されません。各ドキュメントのラベリング状況は Documents タブで確認できます。ドキュメントのラベリングを確定するには、Fields タブでレビューしてください。
サポートされている言語: English、Russian、German、French、Spanish、Italian、Portuguese (Standard)、Japanese、Dutch。