Vai al contenuto principale
L’apprendimento online avviene durante il runtime. Man mano che vengono elaborati più documenti, alcuni verranno raccolti dal sistema e inseriti nel training set e nel test set della skill. La skill quindi migliorerà su questi set in tempo reale. L’apprendimento online è disponibile per le Document skill e le Skill di classificazione.
Nota: L’apprendimento online non è disponibile per le skill progettate per elaborare documenti strutturati. In questi casi, l’opzione Collect documents and learn sarà disabilitata. I documenti verranno comunque raccolti, ma non avverrà alcun apprendimento.

Come funziona l’Online learning

Nota: Questa sezione presuppone che la tua Process skill includa una fase di revisione manuale e che la funzionalità Online learning sia stata abilitata.
Il processo di Online learning può essere riassunto come segue:
  1. I nuovi documenti vengono raccolti e inseriti nel set di training oppure nel set di test.
  2. Viene avviata una sessione di apprendimento utilizzando il set di training.
  3. La skill viene testata.

Passaggio 1. Come vengono raccolti i documenti

I documenti verranno raccolti nel modo seguente:
  1. Online learning inizierà a raccogliere documenti non appena riceverà il primo documento corretto da un Operatore di revisione manuale.
    • Per una Document skill, questo sarà il primo documento in cui è stata corretta l’area di almeno un field.
    • Per una Skill di classificazione, questo sarà il primo documento il cui tipo è stato modificato.
  2. Dopo che è stato ottenuto il primo documento, i documenti successivi verranno raccolti come segue:
    • Tutti i documenti che sono passati attraverso la revisione manuale.
    • Alcuni documenti che non sono passati attraverso la revisione manuale (la loro quota non supererà il 33% di tutti i documenti presenti nel set di training e nel set di test combinati).
  3. Man mano che nuovi documenti vengono raccolti, verranno inseriti nel set di training o nel set di test.
    • Il numero massimo di documenti nel set di training è 10.000. Il numero massimo di documenti nel set di test è 1.000.
Nota: Questi limiti possono essere superati se il set di training contiene già più di 10.000 documenti al momento in cui Online learning inizia a raccogliere nuovi documenti. In tal caso, ogni nuovo documento aggiunto a un set sovraccarico sostituirà il documento esistente più vecchio in quel set.
  • I documenti verranno inseriti solo nel set di training finché il numero di documenti nel set di training non raggiunge 30. Una volta raggiunto questo numero, i documenti verranno inseriti nel set di training o nel set di test.
  • Finché entrambi i set non sono pieni, ogni nuovo documento ha l’80% di probabilità di essere inserito nel set di training e il 20% di probabilità di essere inserito nel set di test.
  • Quando uno dei set è pieno, i nuovi documenti verranno inseriti nell’altro set finché anche questo non sarà pieno.
  • Quando entrambi i set sono pieni, i nuovi documenti possono comunque essere inseriti in uno dei due set, sostituendo i documenti esistenti più vecchi.
  • Quando entrambi i set sono pieni, ogni nuovo documento ha il 20% di probabilità di essere inserito in uno dei set e l’80% di probabilità di essere scartato.
  • Quando entrambi i set sono pieni, ogni nuovo documento che non è stato scartato ha l’80% di probabilità di essere inserito nel set di training e il 20% di probabilità di essere inserito nel set di test, sostituendo il documento esistente più vecchio in uno dei due set.
Schema del processo di Online learning

Passaggio 2. Quando viene avviata una sessione di apprendimento

  • Se questa è la prima sessione di apprendimento dopo la pubblicazione della versione della Skill, inizierà quando il set di documenti avrà ricevuto il 10% di nuovi documenti. Ad esempio, se nel set di documenti ci sono in totale 95 documenti, una nuova sessione di apprendimento inizierà dopo l’aggiunta di 10 nuovi documenti.
  • Se l’ultima sessione di apprendimento è stata completata con successo e la Skill è stata aggiornata, una nuova sessione inizierà alle stesse condizioni della prima.
  • Se l’ultima sessione di apprendimento non è andata a buon fine e la Skill non è stata aggiornata, una nuova sessione di apprendimento inizierà quando il set di documenti avrà ricevuto il 5% di nuovi documenti. Ad esempio, se nel set di documenti ci sono in totale 95 documenti, una nuova sessione di apprendimento inizierà dopo l’aggiunta di 5 nuovi documenti.

Passaggio 3. Come viene testata la skill

La skill verrà aggiornata quando l’Online learning comporta almeno un aumento dell’1% dell’accuratezza. L’accuratezza della skill verrà verificata come segue:
  • Se il set di test contiene almeno 20 documenti, la skill verrà testata sul set di test.
  • Se il set di test contiene meno di 20 documenti:
    • Una Document skill verrà testata sia sul set di training sia sul set di test.
    • Per una Skill di classificazione, se non ci sono documenti sufficienti nel set (se ogni classe ha meno di cinque documenti), la skill verrà testata sia sul set di training sia sul set di test. Se i documenti sono sufficienti, verrà utilizzata la convalida incrociata per valutare l’accuratezza.
Dopodiché, vengono raccolti altri documenti e viene avviata una nuova sessione di apprendimento.
Nota: L’Online learning non crea una nuova versione della skill. Un cambio di versione avviene solo quando una skill viene pubblicata. Vedi Pubblicazione di una skill.