메인 콘텐츠로 건너뛰기
자동 감지는 인식된 텍스트 조각의 유형을 판별합니다. 자동 감지는 RecognizerParams 객체의 TextTypes 속성이 여러 상수로 설정된 경우 실행됩니다. 이 모드는 주로 양식 인식을 위해 설계되었습니다. 일반적인 OCR에서는 꼭 필요한 경우에만 사용하는 것이 좋습니다. 자동 감지가 켜져 있으면 ABBYY FineReader Engine은 먼저 지정된 블록 또는 블록 그룹의 텍스트 유형을 판별하려고 시도합니다(이 블록들에 대해서는 RecognizerParams 객체의 TextTypes 속성이 여러 상수로 설정됨). ABBYY FineReader Engine은 TextTypes 속성에 지정된 상수 중에서 선택합니다. 이 속성에는 인식에 사용할 수 있는 텍스트 유형을 나타내는 TextTypeEnum 열거형 상수들의 OR 조합이 포함됩니다. 예를 들어 이 값이 TT_Normal | TT_Index로 설정되어 있으면 ABBYY FineReader Engine은 텍스트에 일반적인 인쇄체 텍스트와 우편번호 형식으로 작성된 숫자만 포함되어 있다고 가정하고, 그 밖의 모든 유형은 무시합니다. 자동 감지 중에는 ABBYY FineReader Engine이 TextTypes 속성에 지정된 모든 텍스트 유형에 대해 인식을 수행합니다. 그런 다음 OCR 결과를 비교하여 ABBYY FineReader Engine이 최종 결과로 가장 적합한 결과를 선택합니다.

자동 감지 사용 방법

자동 감지는 모두 같은 유형의 텍스트를 포함하는 블록 집합에 사용해야 합니다. 블록마다 서로 다른 텍스트 유형을 선택해야 하는 경우에는 각 블록에 대해 RecognizeBlocks 메서드를 호출해야 하며, RecognizerParams 객체에 가능한 텍스트 유형이 나열되어 있어야 합니다.
하나의 블록에 서로 다른 유형의 텍스트가 포함되어 있으면 모든 텍스트 유형에 대해 인식이 수행되지만, 최종적으로는 결과 하나만 선택됩니다. 따라서 블록 전체의 텍스트는 모두 같은 유형인 것처럼 인식됩니다. 이런 이유로 여러 유형의 텍스트가 포함된 블록의 인식 결과는 한 가지 유형의 텍스트만 포함된 블록의 결과와 다를 수 있습니다. 더 나은 OCR 결과를 얻으려면 텍스트 유형별로 블록을 따로 그리십시오.

텍스트 유형 집합 선택

자동 감지의 속도와 정확도는 TextTypes 속성에 지정된 텍스트 유형 집합에 따라 달라집니다. 자동 감지는 TT_Normal, TT_Matrix, TT_Typewriter, TT_OCR_A, TT_OCR_B 유형의 조합(이를 “빠른 자동 감지 집합”이라고 할 수 있음)에서 가장 빠르게 수행됩니다. 이 경우 인식기는 한 번만 실행되며, 자동 감지는 OCR 중에 수행되고, 텍스트 유형을 감지할 때 블록이 아니라 개별 단어가 사용됩니다. 텍스트 유형을 하나만 지정한 경우에는 자동 감지가 실행되지 않으며, 엔진이 지정된 텍스트 유형에 해당하는 인식기를 실행합니다.
TextTypes 속성이 TT_Matrix, TT_Typewriter, TT_OCR_A, TT_OCR_B의 조합으로만 구성된 경우, RecognizerParams 객체의 ProhibitItalic, ProhibitSubscript, ProhibitSuperscript 속성 값과 관계없이 이탤릭체 글꼴과 위첨자/아래첨자는 인식되지 않습니다.
“빠른 자동 감지 집합”에 포함되지 않는 텍스트의 경우, 텍스트 유형은 개별 단어가 아니라 블록 단위로 감지됩니다. 즉, 가능한 텍스트 유형 집합에 TT_Normal, TT_Matrix, TT_Typewriter, TT_OCR_A, TT_OCR_B 이외의 텍스트 유형이 포함되면 자동 감지 속도가 느려집니다. 이 경우 엔진은 예비 OCR을 여러 번 수행해야 합니다. 먼저 “빠른 자동 감지 집합”의 유형에 대해 한 번 수행하고, 추가되는 각 텍스트 유형에 대해 예비 인식을 한 번씩 더 수행합니다. 그런 다음 결과를 비교하여 가장 적합한 텍스트 유형을 선택합니다.
Windows의 경우…
  • TextTypes 속성의 텍스트 유형 수는 가능한 한 최소로 유지하십시오.
  • TextTypes 속성이 TT_Handwritten 및 TT_Index의 조합으로만 구성된 경우, RecognizerParams 객체의 TrainUserPatterns 속성은 TRUE로 설정할 수 없습니다.

참고 항목

RecognizerParams TextTypeEnum