Vai al contenuto principale
Ora siamo pronti per iniziare l’estrazione dei dati. I layout dei documenti tedeschi non variano in modo significativo, quindi alcuni field possono essere estratti utilizzando l’attività Fast Learning. Useremo questo metodo per estrarre i seguenti dati:
  • Data di emissione del certificato medico.
  • Primo giorno di malattia e ultimo giorno di congedo per malattia.
  • Nome della compagnia di assicurazione sanitaria.
  • ID del medico.
  • I seguenti dati per il paziente:
    • ID assicurazione
    • ID assicurazione tedesca
    • Data di nascita
AD_Tutorial_Fields
  1. Fare doppio clic sull’attività Fast Learning nella pipeline.
  2. Andare alla scheda Fields. Verrà visualizzata una finestra simile al Document Skill Editor in Vantage.
  3. Selezionare il primo documento tedesco.
  4. Etichettare il primo field.
    a. Fare clic sull’icon per aggiungere un field di testo nel modulo dati.
    b. Selezionare la regione contenente la data di emissione sull’immagine del documento. Il field verrà compilato con il testo della regione.
    c. Fare doppio clic sul nome del field e cambiarlo in “Date”.
    d. Fare clic sull’icon a destra del nome del field e cambiare il tipo di field in Date.
    e. Aprire le impostazioni avanzate del field e selezionare l’opzione Day-Month-Year nella sezione Acceptable orders of components.
    f. Fare clic su Save.
  5. Ripetere il passo 4 ed etichettare i field “Start Date” e “End Date”.
  6. Ripetere i passaggi 4.a-4.c ed etichettare il field “Health Insurer”.
  7. Fare clic sull’icon per creare un gruppo. Rinominarlo in “Patient”.
  8. Espandere il gruppo “Patient” e fare clic sul placeholder First group item. Selezionare la regione per il field e rinominare il field in “Insurance ID”.
  9. Creare ed etichettare i field “German Insurance ID” e “Date of Birth” nel gruppo “Patient”. Configurare le opzioni del field “Date of Birth” come descritto nel passo 4.
  10. Ripetere i passaggi 5 e 6 per creare il gruppo “Doctor” ed etichettare il field “Doctor ID”.
  11. Selezionare il documento tedesco successivo nel set di documenti sul lato sinistro della pagina. Etichettare i field creati.
  12. Ripetere il passo 11 per tutti i documenti tedeschi nel set di documenti.
  13. Fare clic su Train Activity. Al termine dell’addestramento, l’accuratezza raggiunta verrà visualizzata nell’intestazione della scheda Results.
  14. Se l’accuratezza è troppo bassa, andare alla scheda Results e correggere i problemi di estrazione. Questo processo è simile alla correzione dei problemi di estrazione per una Document skill in Vantage. Ricordarsi di riaddestrare l’attività per aggiornare i risultati di estrazione.
Non estraiamo altri dati utilizzando Fast Learning per vari motivi, tra cui:
  • Il nome e l’indirizzo del paziente si trovano nello stesso field. Il nome può occupare una o due righe e l’indirizzo può mancare.
  • La posizione delle caselle di spunta che specificano il tipo di certificato medico varia.
Tutti questi fattori portano a una scarsa qualità di estrazione o all’impossibilità di individuare il field utilizzando l’attività Fast Learning.