Passer au contenu principal
Nous sommes maintenant prêts à commencer l’extraction de données. La mise en page des documents allemands varie peu, certains champs peuvent donc être extraits à l’aide de l’activité Fast Learning. Nous utiliserons cette méthode pour extraire les données suivantes :
  • Date de délivrance de l’arrêt de travail.
  • Premier jour de maladie et dernier jour de l’arrêt.
  • Nom de la caisse d’assurance maladie.
  • ID du médecin.
  • Les données suivantes pour le patient :
    • ID d’assurance
    • ID d’assurance allemand
    • Date de naissance
AD_Tutorial_Fields
  1. Double-cliquez sur l’activité Fast Learning dans le pipeline.
  2. Accédez à l’onglet Fields. Vous verrez une fenêtre similaire à l’éditeur de Compétence de document dans Vantage.
  3. Sélectionnez le premier document allemand.
  4. Annotez le premier champ.
    a. Cliquez sur l’icône pour ajouter un champ de texte dans le formulaire de données.
    b. Sélectionnez la zone contenant la date de délivrance sur l’image du document. Le champ sera rempli avec le texte de cette zone.
    c. Double-cliquez sur le nom du champ et remplacez-le par “Date”.
    d. Cliquez sur l’icône à droite du nom du champ et changez le type du champ en Date.
    e. Ouvrez les paramètres avancés du champ et sélectionnez l’option Jour-Mois-Année dans la section Acceptable orders of components.
    f. Cliquez sur Save.
  5. Répétez l’étape 4 et annotez les champs “Start Date” et “End Date”.
  6. Répétez les étapes 4.a-4.c et annotez le champ “Health Insurer”.
  7. Cliquez sur l’icône pour créer un groupe. Renommez-le “Patient”.
  8. Développez le groupe “Patient” et cliquez sur l’espace réservé First group item. Sélectionnez la zone pour le champ et renommez le champ “Insurance ID”.
  9. Créez et annotez les champs “German Insurance ID” et “Date of Birth” dans le groupe “Patient”. Configurez les options du champ “Date of Birth” comme décrit à l’étape 4.
  10. Répétez les étapes 5 et 6 pour créer le groupe “Doctor” et annotez le champ “Doctor ID”.
  11. Sélectionnez le document allemand suivant dans l’ensemble de documents sur le côté gauche de la Page. Annotez les champs que vous avez créés.
  12. Répétez l’étape 11 pour tous les documents allemands de l’ensemble de documents.
  13. Cliquez sur Train Activity. Une fois l’entraînement terminé, la précision obtenue s’affichera dans l’en-tête de l’onglet Results.
  14. Si la précision est trop faible, accédez à l’onglet Results et corrigez les problèmes d’extraction. Ce processus est similaire à la correction des problèmes d’extraction pour une Compétence de document dans Vantage. N’oubliez pas de réentraîner l’activité afin de mettre à jour les résultats d’extraction.
Nous n’extrayons pas d’autres données à l’aide de Fast Learning pour diverses raisons, notamment les suivantes :
  • Le nom et l’adresse du patient se trouvent dans le même champ. Le nom peut tenir sur une ou deux lignes, et l’adresse peut être absente.
  • L’emplacement des coches indiquant le type d’arrêt de travail varie.
Tous ces facteurs entraînent une faible qualité d’extraction ou l’impossibilité de localiser le champ à l’aide de l’activité Fast Learning.