Entraînement à l’extraction de champs effectué par l’administrateur

L’entraînement à l’extraction de champs peut être effectué par l’administrateur lorsqu’un projet doit être entraîné avant que les opérateurs ne commencent à travailler dessus. Un entraînement par l’administrateur peut également être nécessaire si l’auto-apprentissage s’avère insuffisant.

Scénario standard

Dans le scénario standard, effectuez les étapes suivantes :

Créez une définition de document.
Dans les propriétés de la section de la définition de document, sélectionnez Allow field location training.
Créez les champs nécessaires dans la section. Sélectionnez Can have region dans les propriétés de chaque champ.
Enregistrez et publiez la définition de document.
Passez en mode Field Extraction Training Batches et créez un nouveau lot.
Sélectionnez la définition de document que vous avez créée.
Sélectionnez la variante Default dans la liste des variantes.
Chargez les images de document et lancez leur reconnaissance. Nous vous recommandons de charger entre 3 et 50 images pour chaque type de document.
Ajustez la position des champs.
Définissez les états suivants pour vos documents :

Sélectionnez une partie des documents, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For training dans le menu contextuel.
Sélectionnez les documents restants, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For testing dans le menu contextuel. Remarque : Nous vous recommandons d’utiliser 60 % des documents du lot d’entraînement pour l’entraînement, et les 40 % restants pour les tests.

Entraînez le programme à extraire les champs :

(Standalone) Cliquez sur Fields Training → (Standalone) Train
- (Distributed) Cliquez sur Fields Training → (Distributed) Train pour démarrer l’entraînement sur la même machine que celle où le composant Project Setup Station est installé.
- (Distributed) Cliquez avec le bouton droit sur le lot et sélectionnez (Distributed) Send for Training dans le menu contextuel si vous souhaitez que l’entraînement soit effectué sur une Processing Station.

Projets avec plusieurs variantes de document

Dans le cas de documents dont l’emplacement des champs varie, vous devez créer des variantes et entraîner un classificateur pour les distinguer. Pour en savoir plus sur les documents dont l’emplacement des champs varie et sur les variantes, consultez Emplacements de champ variables sur des documents appartenant au même type.Effectuez les étapes suivantes :

Créez une définition de document.
Dans les propriétés de la section de la définition de document, sélectionnez Allow field location training.
Créez les champs nécessaires dans la section. Dans les propriétés de chaque champ, sélectionnez Can have region.
Ajoutez des variantes de section à l’aide de l’une des trois méthodes suivantes :
- Créez les variantes manuellement. Pour ce faire, cliquez sur l’onglet Jeux de données dans les propriétés de la section, puis sur le bouton View… Cliquez ensuite sur le bouton Add… pour ajouter des variantes.
- Chargez les variantes depuis une base de données. Pour ce faire, cliquez sur l’onglet Jeux de données dans les propriétés de la section, puis sur le bouton Set Up… Dans la liste déroulante, sélectionnez Database comme source de données.
- Créez les variantes à l’aide d’un script. Pour ce faire, cliquez sur l’onglet Jeux de données dans les propriétés de la section, puis sur le bouton Set Up… Dans la liste déroulante, sélectionnez Script comme source de données.
Enregistrez et publiez la définition de document.
Entraînez un classificateur sur les variantes que vous venez de créer :
- Passez en mode Open Classifier Training Batches et chargez des images de document dans un nouveau lot.
- Attribuez une classe de référence à chaque document, en utilisant les variantes comme classes distinctes :
  - Cliquez sur Set Class… → Add… → Add…
  - Sélectionnez Specify variant.
  - Sélectionnez une variante dans la liste.
- Entraînez un classificateur en cliquant sur Classification Training → Train.

Remarque : Vous pouvez créer un classificateur dans FlexiLayout Studio, puis l’importer dans ABBYY FlexiCapture. Pour plus de détails, consultez Exportation et importation de classificateurs.

Entraînez ABBYY FlexiCapture à détecter les régions de champ pour chaque variante :
- Passez en mode Field Extraction Training Batches.
- Créez un nouveau lot. Sélectionnez votre définition de document, puis la variante à entraîner.
- Chargez des images de document et lancez leur reconnaissance. Nous vous recommandons de charger de 3 à 50 images pour chaque type de document.
- Ajustez la position des champs.
- Définissez les états suivants pour vos documents :
  - Sélectionnez certains documents, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For training dans le menu contextuel.
  - Sélectionnez les documents restants, cliquez avec le bouton droit sur la sélection, puis cliquez sur Set Document State → For testing dans le menu contextuel.
- Entraînez le programme à extraire les champs :
  - (Standalone) Cliquez sur Fields Training → (Standalone) Train
  - (Distributed) Cliquez sur Fields Training → (Distributed) Train pour démarrer l’entraînement sur la même machine que celle où le composant Project Setup Station est installé.
  - (Distributed) Cliquez avec le bouton droit sur le lot et sélectionnez (Distributed) Send for Training dans le menu contextuel si vous souhaitez que l’entraînement soit effectué sur une Processing Station.

Lorsque vous travaillez avec les résultats de l’entraînement, vous devrez peut-être vérifier quelle variante a été attribuée à un document et la modifier si nécessaire. Pour afficher les ID des variantes sur le formulaire, créez un champ de service. Pour plus de détails, consultez Permettre aux opérateurs de modifier les variantes.

Nous vous recommandons de configurer l’auto-apprentissage pour l’extraction de champs. Une fois l’auto-apprentissage configuré, le programme apprend automatiquement à extraire les champs pendant que les opérateurs travaillent sur le projet configuré.

(Distributed) Envoi de lots d’entraînement à une Processing Station pour entraînement

(Distributed) Comme le processus d’entraînement peut prendre beaucoup de temps et consommer d’importantes ressources de calcul, l’administrateur peut choisir d’entraîner les lots sur une Processing Station.

(Distributed) Avant d’envoyer un lot d’entraînement à une Processing Station, veuillez vous assurer que :

(Distributed) Au moins une Processing Station a été ajoutée au Processing Server.
(Distributed) Le projet a été téléversé vers le serveur.

(Distributed) Pour envoyer un lot d’entraînement à une Processing Station, cliquez avec le bouton droit sur le lot, puis sélectionnez (Distributed) Send for Training dans le menu contextuel. Une fois le lot envoyé, une tâche d’entraînement apparaîtra dans la file d’attente des tâches du Processing Server Monitor. L’entraînement proprement dit aura lieu sur la Processing Station. Plusieurs lots d’entraînement peuvent être envoyés sur une Processing Station pour entraînement. Si nécessaire, l’administrateur peut annuler une tâche d’entraînement dans le Processing Server Monitor. Les lots d’entraînement envoyés pour entraînement seront verrouillés jusqu’à la fin de l’entraînement, et l’administrateur ne pourra apporter aucune modification à ces lots d’entraînement.

​(Distributed) Envoi de lots d’entraînement à une Processing Station pour entraînement

(Distributed) Envoi de lots d’entraînement à une Processing Station pour entraînement