Saltar al contenido principalEl aprendizaje en línea se realiza en tiempo de ejecución. A medida que se procesan más documentos, el programa recopila algunos y los coloca en el conjunto de entrenamiento y en el conjunto de prueba de la skill. Luego, la skill mejora con estos conjuntos en tiempo real.
El aprendizaje en línea está disponible para Skill de documento y Skill de clasificación.
Nota: El aprendizaje en línea está deshabilitado de forma predeterminada. Para obtener información sobre cómo habilitar esta función, consulta Habilitar el aprendizaje en línea.
Cómo funciona el aprendizaje en línea
Nota: Esta sección supone que su Habilidad de proceso incluye una etapa de revisión manual y que la función de aprendizaje en línea está habilitada.
El proceso de aprendizaje en línea puede describirse de la siguiente manera:
- Se recopilan nuevos documentos y se colocan en el conjunto de entrenamiento o en el conjunto de prueba.
- Se inicia una sesión de aprendizaje utilizando el conjunto de entrenamiento.
- Se prueba la skill.
Paso 1. Cómo se recopilan los documentos
Los documentos se recopilarán de la siguiente manera:
- Online learning empezará a recopilar documentos en cuanto reciba el primer documento corregido por un Operador de revisión manual.
- Para una Skill de documento, será el primer documento en el que se haya corregido la región de al menos un campo.
- Para una Skill de clasificación, será el primer documento cuyo tipo se haya cambiado.
- Después de obtener el primer documento, se recopilarán los siguientes documentos:
- Todos los documentos que hayan pasado por revisión manual.
- Algunos documentos que no hayan pasado por revisión manual (su proporción no superará el 33% del total de documentos de los conjuntos de entrenamiento y prueba combinados).
- A medida que se recopilen nuevos documentos, se colocarán en el conjunto de entrenamiento o en el conjunto de prueba.
- El número máximo de documentos en el conjunto de entrenamiento es 10.000. El número máximo de documentos en el conjunto de prueba es 1.000.
Nota: Estos límites pueden superarse si el conjunto de entrenamiento ya contiene más de 10.000 documentos en el momento en que Online learning comienza a recopilar nuevos documentos. En ese caso, cada documento nuevo añadido a un conjunto con exceso de elementos reemplazará al documento existente más antiguo de ese conjunto.
- Los documentos se colocarán solo en el conjunto de entrenamiento hasta que el número de documentos en el conjunto de entrenamiento alcance 30. Una vez alcanzado este número, los documentos se colocarán en el conjunto de entrenamiento o en el conjunto de prueba.
- Hasta que ambos conjuntos estén completos, cada documento nuevo tiene un 80% de probabilidad de acabar en el conjunto de entrenamiento y un 20% de probabilidad de acabar en el conjunto de prueba.
- Cuando uno de los conjuntos esté completo, los nuevos documentos se colocarán en el otro conjunto hasta que también se complete.
- Cuando ambos conjuntos estén completos, los nuevos documentos aún podrán colocarse en cualquiera de los conjuntos, reemplazando a los documentos existentes más antiguos.
- Cuando ambos conjuntos estén completos, cada documento nuevo tiene un 20% de probabilidad de acabar en uno de los conjuntos y un 80% de probabilidad de ser descartado.
- Cuando ambos conjuntos estén completos, cada nuevo documento que no haya sido descartado tiene un 80% de probabilidad de acabar en el conjunto de entrenamiento y un 20% de probabilidad de acabar en el conjunto de prueba, reemplazando al documento existente más antiguo en cualquiera de los conjuntos.
Paso 2. Cuándo se inicia una sesión de aprendizaje
- Si esta es la primera sesión de aprendizaje después de que se publicó la versión de la skill, se iniciará una vez que el conjunto de documentos reciba un 10% de documentos nuevos. Por ejemplo, si hay un total de 95 documentos en el conjunto, una nueva sesión de aprendizaje comenzará después de que se agreguen 10 documentos nuevos.
- Si la última sesión de aprendizaje fue satisfactoria y la skill se actualizó, una nueva sesión se iniciará bajo las mismas condiciones que la primera sesión.
- Si la última sesión de aprendizaje no fue satisfactoria y la skill no se actualizó, una nueva sesión de aprendizaje se iniciará una vez que el conjunto de documentos reciba un 5% de documentos nuevos. Por ejemplo, si hay un total de 95 documentos en el conjunto, una nueva sesión de aprendizaje comenzará después de que se agreguen 5 documentos nuevos.
Paso 3. Cómo se prueba la skill
La skill se actualizará cuando el aprendizaje en línea suponga al menos un aumento del 1 % en la precisión.
La precisión de la skill se evaluará de la siguiente manera:
- Si hay al menos 20 documentos en el conjunto de prueba, la skill se probará en el conjunto de prueba.
- Si hay menos de 20 documentos en el conjunto de prueba:
- Una Skill de documento se probará tanto en el conjunto de entrenamiento como en el conjunto de prueba.
- Para una Skill de clasificación, si no hay suficientes documentos en el conjunto de documentos (si cada clase tiene menos de cinco documentos), la skill se probará tanto en el conjunto de entrenamiento como en el conjunto de prueba. Si hay suficientes documentos, se utilizará la validación cruzada para evaluar la precisión.
Después de eso, se recopilan más documentos y se inicia una nueva sesión de aprendizaje.
Nota: El aprendizaje en línea no crea una nueva versión de la skill. Un cambio de versión solo se produce cuando se publica una skill. Consulta Publicar una skill.