Vai al contenuto principale
L’apprendimento online avviene durante l’esecuzione (runtime). Man mano che vengono elaborati più documenti, alcuni verranno raccolti dal programma e inseriti nel set di training e nel set di test della skill. La skill si perfezionerà su questi set in tempo reale. L’apprendimento online è disponibile per le Document skill e le Skill di classificazione.
Nota: L’apprendimento online è disattivato per impostazione predefinita. Per informazioni su come abilitare questa funzionalità, vedere Abilitare l’apprendimento online.

Come funziona l’Online learning

Nota: Questa sezione presuppone che la tua Process skill includa una fase di revisione manuale e che la funzionalità Online learning sia stata abilitata.
Il processo di Online learning può essere riassunto come segue:
  1. I nuovi documenti vengono raccolti e inseriti nel set di training oppure nel set di test.
  2. Viene avviata una sessione di apprendimento utilizzando il set di training.
  3. La skill viene testata.

Passo 1. Modalità di raccolta dei documenti

I documenti verranno raccolti come segue:
  1. Online learning inizierà a raccogliere documenti non appena riceverà il primo documento corretto da un operatore di revisione manuale.
    • Per una Document skill, si tratta del primo documento in cui è stata corretta la regione di almeno un field.
    • Per una Skill di classificazione, si tratta del primo documento il cui tipo è stato modificato.
  2. Dopo il primo documento, verranno raccolti i seguenti documenti:
    • Tutti i documenti che hanno superato la revisione manuale.
    • Alcuni documenti che non hanno superato la revisione manuale (la loro quota non supererà il 33% del totale dei documenti nei set di training e di test combinati).
  3. Man mano che vengono raccolti nuovi documenti, verranno inseriti nel set di training o nel set di test.
    • Il numero massimo di documenti nel set di training è 10.000. Il numero massimo di documenti nel set di test è 1.000.
Nota: Questi limiti possono essere superati se il set di training contiene già più di 10.000 documenti al momento in cui Online learning inizia a raccogliere nuovi documenti. In tal caso, ogni nuovo documento aggiunto a un set sovrariempito sostituirà il documento più vecchio presente in quel set.
  • I documenti verranno inseriti solo nel set di training finché il numero di documenti in tale set non raggiunge 30. Una volta raggiunto questo numero, i documenti verranno inseriti nel set di training o nel set di test.
  • Finché entrambi i set non sono pieni, ogni nuovo documento ha l’80% di probabilità di finire nel set di training e il 20% di probabilità di finire nel set di test.
  • Quando uno dei set è pieno, i nuovi documenti verranno inseriti nell’altro set finché anche questo non sarà pieno.
  • Quando entrambi i set sono pieni, i nuovi documenti possono comunque essere inseriti in uno dei due set, sostituendo i documenti più vecchi.
  • Quando entrambi i set sono pieni, ogni nuovo documento ha il 20% di probabilità di finire in uno dei set e l’80% di probabilità di essere scartato.
  • Quando entrambi i set sono pieni, ogni nuovo documento non scartato ha l’80% di probabilità di finire nel set di training e il 20% di probabilità di finire nel set di test, sostituendo il documento più vecchio in uno dei due set.
Schema del processo di Online learning

Passaggio 2. Quando viene avviata una sessione di apprendimento

  • Se questa è la prima sessione di apprendimento dopo la pubblicazione della versione della Skill, inizierà quando il set di documenti avrà ricevuto il 10% di nuovi documenti. Ad esempio, se nel set di documenti ci sono in totale 95 documenti, una nuova sessione di apprendimento inizierà dopo l’aggiunta di 10 nuovi documenti.
  • Se l’ultima sessione di apprendimento è stata completata con successo e la Skill è stata aggiornata, una nuova sessione inizierà alle stesse condizioni della prima.
  • Se l’ultima sessione di apprendimento non è andata a buon fine e la Skill non è stata aggiornata, una nuova sessione di apprendimento inizierà quando il set di documenti avrà ricevuto il 5% di nuovi documenti. Ad esempio, se nel set di documenti ci sono in totale 95 documenti, una nuova sessione di apprendimento inizierà dopo l’aggiunta di 5 nuovi documenti.

Passaggio 3. Come viene testata la skill

La skill verrà aggiornata quando l’Online learning comporta un aumento dell’accuratezza di almeno l’1%. L’accuratezza della skill verrà verificata come segue:
  • Se nel set di test ci sono almeno 20 documenti, la skill verrà testata sul set di test.
  • Se nel set di test ci sono meno di 20 documenti:
    • Una Document skill verrà testata sia sul set di training sia sul set di test.
    • Per una Skill di classificazione, se non ci sono abbastanza documenti nel set di documenti (se ciascuna classe ha meno di cinque documenti), la skill verrà testata sia sul set di training sia sul set di test. Se ci sono abbastanza documenti, verrà utilizzata la cross‑validation per valutare l’accuratezza.
Successivamente vengono raccolti altri documenti e viene avviata una nuova sessione di apprendimento.
Nota: L’Online learning non crea una nuova versione della skill. Il cambio di versione avviene solo quando una skill viene pubblicata. Vedi Pubblicare una skill.