메인 콘텐츠로 건너뛰기
온라인 학습은 런타임에 수행됩니다. 더 많은 문서가 처리될수록 일부 문서는 시스템에 의해 수집되어 해당 스킬의 학습 세트와 테스트 세트에 포함됩니다. 이후 스킬은 이 세트들을 기반으로 실시간으로 성능을 향상시킵니다. 온라인 학습은 Document skill 및 분류 스킬에서 사용할 수 있습니다.
참고: 온라인 학습은 구조화된 문서를 처리하도록 설계된 스킬에는 사용할 수 없습니다. 이 경우 문서를 수집하고 학습 옵션이 비활성화됩니다. 문서는 계속 수집되지만, 학습은 수행되지 않습니다.

Online Learning 작동 방식

참고: 이 섹션은 프로세스 스킬에 수동 검토 단계가 포함되어 있으며 Online learning 기능이 활성화되어 있다고 가정합니다.
Online learning 프로세스는 다음과 같이 요약할 수 있습니다.
  1. 새로운 문서들을 수집하여 학습 세트 또는 테스트 세트에 할당합니다.
  2. 학습 세트를 사용하여 학습 세션을 시작합니다.
  3. 스킬을 테스트합니다.

1단계. 문서가 수집되는 방식

문서는 다음과 같이 수집됩니다.
  1. 온라인 학습은 수동 검토 작업자로부터 첫 번째 수정된 문서를 받는 즉시 문서 수집을 시작합니다.
    • Document skill의 경우, 적어도 하나의 field 영역이 수정된 첫 번째 문서가 됩니다.
    • 분류 스킬의 경우, 문서 유형이 변경된 첫 번째 문서가 됩니다.
  2. 첫 번째 문서가 수집된 뒤에는 다음 문서들이 수집됩니다.
    • 수동 검토를 거친 모든 문서.
    • 수동 검토를 거치지 않은 일부 문서(이 문서들의 비중은 학습 세트와 테스트 세트를 합친 전체 문서 수의 33%를 넘지 않습니다).
  3. 새 문서가 수집되면, 학습 세트 또는 테스트 세트에 배치됩니다.
    • 학습 세트에 포함될 수 있는 문서의 최대 개수는 10,000개입니다. 테스트 세트에 포함될 수 있는 문서의 최대 개수는 1,000개입니다.
참고: Online learning이 새 문서 수집을 시작하는 시점에 이미 학습 세트에 10,000개를 초과해 문서가 포함되어 있는 경우, 위 제한을 초과할 수 있습니다. 이 경우, 과도하게 채워진 세트에 새 문서가 추가될 때마다 해당 세트에서 가장 오래된 기존 문서를 대체합니다.
  • 학습 세트의 문서 수가 30개에 도달할 때까지는 문서가 학습 세트에만 배치됩니다. 이 수에 도달하면, 문서는 학습 세트 또는 테스트 세트에 배치됩니다.
  • 두 세트가 모두 가득 찰 때까지, 각 새 문서는 학습 세트에 배치될 확률이 80%, 테스트 세트에 배치될 확률이 20%입니다.
  • 두 세트 중 하나가 가득 차면, 다른 세트도 가득 찰 때까지 새 문서는 나머지 세트에만 배치됩니다.
  • 두 세트가 모두 가득 찬 후에도, 새 문서는 여전히 두 세트 중 어느 한 세트에 배치될 수 있으며, 이 경우 기존의 가장 오래된 문서를 대체합니다.
  • 두 세트가 모두 가득 찬 상태에서는, 각 새 문서가 두 세트 중 하나에 배치될 확률이 20%, 폐기될 확률이 80%입니다.
  • 두 세트가 모두 가득 찬 상태에서 폐기되지 않은 각 새 문서는 학습 세트에 배치될 확률이 80%, 테스트 세트에 배치될 확률이 20%이며, 두 세트 중 해당 세트에 있는 가장 오래된 기존 문서를 대체합니다.
Online Learning Process Scheme

단계 2. 학습 세션이 시작되는 시점

  • 스킬 버전이 게시된 후 첫 번째 학습 세션인 경우, 문서 세트가 기존 문서 수의 10%에 해당하는 새 문서를 수신하면 세션이 시작됩니다. 예를 들어, 문서 세트에 총 95개의 문서가 있는 경우, 새 문서 10개가 추가되면 새 학습 세션이 시작됩니다.
  • 마지막 학습 세션이 성공적이었고 스킬이 업데이트된 경우, 새 세션은 첫 번째 세션과 동일한 조건에서 시작됩니다.
  • 마지막 학습 세션이 실패했고 스킬이 업데이트되지 않은 경우, 문서 세트가 기존 문서 수의 5%에 해당하는 새 문서를 수신하면 새 학습 세션이 시작됩니다. 예를 들어, 문서 세트에 총 95개의 문서가 있는 경우, 새 문서 5개가 추가되면 새 학습 세션이 시작됩니다.

3단계. 스킬 테스트 방식

Online learning으로 인해 정확도가 1% 이상 증가하면 스킬이 업데이트됩니다. 스킬의 정확도는 다음과 같이 테스트됩니다.
  • 테스트 세트에 문서가 20개 이상 있는 경우, 스킬은 테스트 세트에서 테스트됩니다.
  • 테스트 세트에 문서가 20개 미만인 경우:
    • Document skill은 학습 세트와 테스트 세트 모두에서 테스트됩니다.
    • 분류 스킬의 경우, 문서 세트에 문서가 충분하지 않은 경우(각 클래스에 문서가 5개 미만인 경우), 스킬은 학습 세트와 테스트 세트 모두에서 테스트됩니다. 문서가 충분한 경우에는 교차 검증을 사용하여 정확도를 평가합니다.
이후 더 많은 문서를 수집한 다음, 새로운 학습 세션을 시작합니다.
참고: Online learning은 스킬의 새 버전을 생성하지 않습니다. 버전 변경은 스킬이 게시될 때만 발생합니다. 자세한 내용은 스킬 게시하기를 참조하세요.