Saltar al contenido principal
El aprendizaje en línea se lleva a cabo en tiempo de ejecución. A medida que se procesan más documentos, el sistema recopilará algunos y los incluirá en el conjunto de entrenamiento y en el conjunto de prueba de la skill. La skill se irá mejorando en estos conjuntos en tiempo real. El aprendizaje en línea está disponible para Skill de documento y Skill de clasificación.
Nota: El aprendizaje en línea no está disponible para skills diseñadas para procesar documentos estructurados. En estos casos, la opción Recopilar documentos y aprender estará deshabilitada. Los documentos seguirán recopilándose, pero no se realizará ningún aprendizaje.

Cómo funciona el aprendizaje en línea

Nota: Esta sección supone que su Habilidad de proceso incluye una etapa de revisión manual y que la función de aprendizaje en línea está habilitada.
El proceso de aprendizaje en línea puede describirse de la siguiente manera:
  1. Se recopilan nuevos documentos y se colocan en el conjunto de entrenamiento o en el conjunto de prueba.
  2. Se inicia una sesión de aprendizaje utilizando el conjunto de entrenamiento.
  3. Se prueba la skill.

Paso 1. Cómo se recopilan los documentos

Los documentos se recopilarán de la siguiente manera:
  1. Online Learning empezará a recopilar documentos tan pronto como reciba el primer documento corregido de un Operador de revisión manual.
    • Para una Skill de documento, será el primer documento en el que se haya corregido la región de al menos un campo.
    • Para una Skill de clasificación, será el primer documento cuyo tipo se haya cambiado.
  2. Una vez obtenido el primer documento, se recopilarán los documentos siguientes:
    • Todos los documentos que hayan pasado por revisión manual.
    • Algunos documentos que no hayan pasado por revisión manual (su proporción no superará el 33% de todos los documentos de los conjuntos de entrenamiento y de prueba combinados).
  3. A medida que se recopilen nuevos documentos, se colocarán en el conjunto de entrenamiento o en el conjunto de prueba.
    • El número máximo de documentos en el conjunto de entrenamiento es 10 000. El número máximo de documentos en el conjunto de prueba es 1 000.
Nota: Estos límites pueden superarse si el conjunto de entrenamiento ya contiene más de 10 000 documentos en el momento en que Online learning empieza a recopilar nuevos documentos. Si este es el caso, cada nuevo documento añadido a un conjunto lleno sustituirá al documento existente más antiguo de ese conjunto.
  • Los documentos se colocarán únicamente en el conjunto de entrenamiento hasta que el número de documentos en el conjunto de entrenamiento alcance 30. Una vez alcanzado este número, los documentos se colocarán en el conjunto de entrenamiento o en el conjunto de prueba.
  • Hasta que ambos conjuntos estén llenos, cada nuevo documento tiene un 80% de probabilidad de terminar en el conjunto de entrenamiento y un 20% de probabilidad de terminar en el conjunto de prueba.
  • Cuando uno de los conjuntos esté lleno, los nuevos documentos se colocarán en el otro conjunto hasta que este también esté lleno.
  • Cuando ambos conjuntos estén llenos, aún se podrán colocar nuevos documentos en cualquiera de los conjuntos, sustituyendo a los documentos existentes más antiguos.
  • Cuando ambos conjuntos estén llenos, cada nuevo documento tiene un 20% de probabilidad de terminar en uno de los conjuntos y un 80% de probabilidad de ser descartado.
  • Cuando ambos conjuntos estén llenos, cada nuevo documento que no haya sido descartado tiene un 80% de probabilidad de terminar en el conjunto de entrenamiento y un 20% de probabilidad de terminar en el conjunto de prueba, sustituyendo al documento existente más antiguo en cualquiera de los dos conjuntos.
Esquema del proceso de Online Learning

Paso 2. Cuándo se inicia una sesión de aprendizaje

  • Si esta es la primera sesión de aprendizaje después de que se publicó la versión de la skill, se iniciará una vez que el conjunto de documentos reciba un 10% de documentos nuevos. Por ejemplo, si hay un total de 95 documentos en el conjunto, una nueva sesión de aprendizaje comenzará después de que se agreguen 10 documentos nuevos.
  • Si la última sesión de aprendizaje fue satisfactoria y la skill se actualizó, una nueva sesión se iniciará bajo las mismas condiciones que la primera sesión.
  • Si la última sesión de aprendizaje no fue satisfactoria y la skill no se actualizó, una nueva sesión de aprendizaje se iniciará una vez que el conjunto de documentos reciba un 5% de documentos nuevos. Por ejemplo, si hay un total de 95 documentos en el conjunto, una nueva sesión de aprendizaje comenzará después de que se agreguen 5 documentos nuevos.

Paso 3. Cómo se prueba la skill

La skill se actualizará cuando Online learning implique al menos un aumento del 1 % en la precisión. La precisión de la skill se comprobará de la siguiente manera:
  • Si hay al menos 20 documentos en el conjunto de prueba, la skill se probará en el conjunto de prueba.
  • Si hay menos de 20 documentos en el conjunto de prueba:
    • Se probará una Skill de documento tanto en el conjunto de entrenamiento como en el conjunto de prueba.
    • Para una Skill de clasificación, si no hay suficientes documentos en el conjunto de documentos (si cada clase tiene menos de cinco documentos), la skill se probará tanto en el conjunto de entrenamiento como en el conjunto de prueba. Si hay suficientes documentos, se utilizará la validación cruzada para evaluar la precisión.
Después, se recopilan más documentos y se inicia una nueva sesión de aprendizaje.
Nota: Online learning no crea una versión nueva de la skill. El cambio de versión solo se produce cuando se publica una skill. Consulta Publicar una skill.