온라인 학습은 런타임에 수행됩니다. 더 많은 문서가 처리될수록 일부 문서는 시스템에 의해 수집되어 해당 스킬의 학습 세트와 테스트 세트에 포함됩니다. 이후 스킬은 이 세트들을 기반으로 실시간으로 성능을 향상시킵니다.온라인 학습은 Document skill 및 분류 스킬에서 사용할 수 있습니다.온라인 학습은 구조화된 문서를 처리하도록 설계된 스킬에는 사용할 수 없습니다. 이 경우 문서를 수집하고 학습 옵션이 비활성화됩니다. 문서는 계속 수집되지만, 학습은 수행되지 않습니다.
온라인 학습은 수동 검토 작업자로부터 첫 번째 수정된 문서를 받는 즉시 문서 수집을 시작합니다.
Document skill의 경우, 적어도 하나의 field 영역이 수정된 첫 번째 문서가 됩니다.
분류 스킬의 경우, 문서 유형이 변경된 첫 번째 문서가 됩니다.
첫 번째 문서가 수집된 뒤에는 다음 문서들이 수집됩니다.
수동 검토를 거친 모든 문서.
수동 검토를 거치지 않은 일부 문서(이 문서들의 비중은 학습 세트와 테스트 세트를 합친 전체 문서 수의 33%를 넘지 않습니다).
새 문서가 수집되면, 학습 세트 또는 테스트 세트에 배치됩니다.
학습 세트에 포함될 수 있는 문서의 최대 개수는 10,000개입니다. 테스트 세트에 포함될 수 있는 문서의 최대 개수는 1,000개입니다.
Online learning이 새 문서 수집을 시작하는 시점에 이미 학습 세트에 10,000개를 초과해 문서가 포함되어 있는 경우, 위 제한을 초과할 수 있습니다. 이 경우, 과도하게 채워진 세트에 새 문서가 추가될 때마다 해당 세트에서 가장 오래된 기존 문서를 대체합니다.
학습 세트의 문서 수가 30개에 도달할 때까지는 문서가 학습 세트에만 배치됩니다. 이 수에 도달하면, 문서는 학습 세트 또는 테스트 세트에 배치됩니다.
두 세트가 모두 가득 찰 때까지, 각 새 문서는 학습 세트에 배치될 확률이 80%, 테스트 세트에 배치될 확률이 20%입니다.
두 세트 중 하나가 가득 차면, 다른 세트도 가득 찰 때까지 새 문서는 나머지 세트에만 배치됩니다.
두 세트가 모두 가득 찬 후에도, 새 문서는 여전히 두 세트 중 어느 한 세트에 배치될 수 있으며, 이 경우 기존의 가장 오래된 문서를 대체합니다.
두 세트가 모두 가득 찬 상태에서는, 각 새 문서가 두 세트 중 하나에 배치될 확률이 20%, 폐기될 확률이 80%입니다.
두 세트가 모두 가득 찬 상태에서 폐기되지 않은 각 새 문서는 학습 세트에 배치될 확률이 80%, 테스트 세트에 배치될 확률이 20%이며, 두 세트 중 해당 세트에 있는 가장 오래된 기존 문서를 대체합니다.