메인 콘텐츠로 건너뛰기
이 객체를 사용하면 인식된 텍스트에서 단일 문자의 여러 매개변수(서식, 이미지에서의 사각형, 인식 언어, 인식 가설)에 액세스할 수 있습니다. 이 유형의 새로 생성된 객체의 모든 Boolean 속성은 FALSE로 설정됩니다.
인식된 텍스트의 특정 문자 매개변수로 작업하려면 먼저 합성을 수행하는 함수(예: FRDocument 객체의 Process 또는 Synthesize 메서드)를 호출해야 합니다. 이러한 매개변수는 합성이 완료된 후에만 의미를 갖기 때문입니다.
문자가 명함 텍스트에서 추출된 경우에는 객체의 다음 속성만 설정됩니다.
  • BaseLine
  • Bottom
  • Left
  • Right
  • Top
  • IsSuspicious
  • ErrorProbability
  • CharacterRegion
  • CharacterRecognitionVariantIndex
  • CharacterRecognitionVariants
  • SelectedCharacterRecognitionVariant
  • WordRecognitionVariants
  • IsFromSourceContent
  • IsWordFirst
  • IsWordLeftmost

속성

,읽기 전용

Engine 객체를 반환합니다.

문자의 언어 ID를 지정합니다. Win32 LCID로 변환하려면메서드를 사용하십시오.

기본적으로 이 속성은 시스템 기본 언어 ID로 초기화됩니다.

문자에 대한 언어의 내부 이름을 저장하고 설정할 수 있습니다.

하나의기본 인식 언어가 인식된 단어 하나에 대응하는 경우, 해당 단어의 각 문자에 대한 LanguageName 속성은 인식 후 기본 언어의 내부 이름으로 설정됩니다. 여러 기본 인식 언어가 단어 하나에 대응하는 경우(예: 이중 언어 복합어), 해당 단어의 문자에 대한 LanguageName 속성은 비어 있습니다. 반면 LanguageId 속성은 인식된 단어에 관계없이 기본 언어의 식별자를 포함합니다.

기본적으로 이 속성의 값은 빈 문자열입니다.

문자의 정확한 영역을 지정합니다. 이 영역은 직사각형이 아닐 수 있으며, 초기에는 Left, Top, Right, Bottom 속성으로 정의된 사각형 내에 포함됩니다. 문자의 정확한 영역을 변경해도 Left, Top, Right, Bottom 속성은 변경되지 않습니다.

이 속성은속성을 TRUE로 설정한 상태에서 인식을 완료한 경우에만 사용할 수 있습니다.

이 속성은 상수 객체를 반환합니다. 문자의 정확한 영역을 변경하려면 먼저IEngine::CreateRegion메서드를 사용하여 중간 Region 객체를 가져온 후 필요한 매개변수를 변경하고, 얻은 객체를 속성에 할당해야 합니다.

, 읽기 전용

문자 사각형의 하단 경계 좌표를 저장합니다. 이 사각형은 텍스트 방향을 고려하지 않고 이미지 위에 정의됩니다. 정의되지 않은 경우 네 좌표 모두 0이 됩니다. 이 속성은 직접 변경할 수 없으며 SetRect 메서드를 통해서만 변경할 수 있습니다.

이 속성의 기본값은 0입니다.

, 읽기 전용

문자 사각형의 왼쪽 경계 좌표를 저장합니다. 이 사각형은 텍스트 방향을 고려하지 않고 이미지 위에 정의됩니다. 정의되지 않은 경우 네 좌표 모두 0이 됩니다. 이 속성은 직접 변경할 수 없으며 SetRect 메서드를 통해서만 변경할 수 있습니다.

이 속성의 기본값은 0입니다.

, 읽기 전용

문자 사각형의 오른쪽 경계 좌표를 저장합니다. 이 사각형은 텍스트 방향을 고려하지 않고 이미지 위에 정의됩니다. 정의되지 않은 경우 네 좌표 모두 0이 됩니다. 이 속성은 직접 변경할 수 없으며 SetRect 메서드를 통해서만 변경할 수 있습니다.

이 속성의 기본값은 0입니다.

, 읽기 전용

문자 사각형의 상단 경계 좌표를 저장합니다. 이 사각형은 텍스트 방향을 고려하지 않고 이미지 위에 정의됩니다. 정의되지 않을 수 있으며, 이 경우 네 좌표 값이 모두 0입니다. 이 속성은 직접 변경할 수 없으며 SetRect 메서드를 통해서만 변경할 수 있습니다.

이 속성의 기본값은 0입니다.

해당 문자가 단어에서 가장 왼쪽에 위치한 문자인지 여부를 지정합니다.

복잡한 상황(예: 공백으로 구분되지 않은 두 단어, 또는 공백 없이 구두점을 포함하는 단어)에서는 이 속성이 올바르게 작동하지 않을 수 있습니다. 인식기는 문자에 대한 플래그가 설정된 후 단어 수에 대한 인식 후보를 변경할 수 있습니다.

이 속성은 합성 단계에서 설정됩니다. 합성이 완료되기 전에 이 속성을 호출하면 기본값은 FALSE입니다.

For중국어, 일본어 또는 한국어의 경우 단어가 감지되지 않으므로 이 속성은 신뢰할 수 없습니다.

해당 문자가 단어의 첫 번째 문자인지 여부를 지정합니다.

이 속성은 합성 단계에서 설정됩니다. 합성이 완료되기 전에 이 속성을 호출하면 기본값은 FALSE입니다.

참고:

  • 오른쪽에서 왼쪽으로 쓰는 언어(예: 히브리어)의 경우, 이 속성은 단어에서 가장 오른쪽에 위치한 문자를 나타냅니다.
  • For중국어, 일본어 또는 한국어의 경우 단어가 감지되지 않으므로 이 속성은 신뢰할 수 없습니다.

문자열의 기준선으로부터 문자의 오프셋을 픽셀 단위로 설정합니다. 문자열의 기준선은속성으로 정의됩니다. 이 속성은 주로 텍스트에 삽입된 이미지에 사용됩니다.

기본적으로 이 속성의 값은 0입니다.

문자 간 추가 간격을 twip 단위로 지정합니다. 1 twip은 포인트의 1/20이며, 1포인트는 1/72인치입니다.

이 속성의 기본값은 0입니다.

문자의 수평 배율을 1/1000 단위로 저장합니다.

명함 텍스트에서 가져온 문자인 경우 이 속성은 기본값을 갖습니다.

이 속성의 기본값은 1000이며, 이는 배율 조정 없음을 의미합니다.

문자의 RGB 컬러 값을 설정합니다. 배경 컬러는속성을 통해 단락 전체에 대해 정의됩니다.

이 속성의 값은 -1일 수 있으며, 이는 컬러가 투명함을 의미합니다.

The int value is calculated from the RGB triplet using the formula: ( red value ) + (256 x green value ) + (65536 x blue value ), where red value is the first triplet component, green value is the second triplet component, blue value is the third triplet component. For example, the int value of the color white equals 16777215.

기본적으로 텍스트 컬러는 검정색 또는 RGB(0,0,0)입니다.

문자가 굵게 표시되는지 여부를 지정합니다.

명함 텍스트에서 가져온 문자인 경우, 이 속성은 기본값을 갖습니다.

이 속성의 기본값은 FALSE입니다.

문자가 기울임꼴로 표시되는지 여부를 지정합니다.

명함 텍스트에서 가져온 문자인 경우, 이 속성은 기본값을 갖습니다.

이 속성의 기본값은 FALSE입니다.

문자에 밑줄이 표시되는지 여부를 지정합니다.

이 속성의 기본값은 FALSE입니다.

문자에 취소선이 표시되는지 여부를 지정합니다.

명함 텍스트에서 가져온 문자인 경우, 이 속성은 기본값을 갖습니다.

이 속성의 기본값은 FALSE입니다.

문자가 아래 첨자인지 여부를 지정합니다. IsSuperscript 속성과 동시에 TRUE로 설정할 수 없으며, 동시에 설정하면 인식된 텍스트 내보내기 시 오류가 발생합니다.

명함 텍스트에서 가져온 문자인 경우, 이 속성은 기본값을 갖습니다.

이 속성의 기본값은 FALSE입니다.

문자가 위 첨자인지 여부를 지정합니다. IsSubscript 속성과 동시에 TRUE로 설정할 수 없으며, 동시에 설정하면 인식된 텍스트 내보내기 시 오류가 발생합니다.

명함 텍스트에서 가져온 문자인 경우, 이 속성은 기본값을 갖습니다.

이 속성의 기본값은 FALSE입니다.

문자에 “작은 대문자(small caps)” 스타일이 적용되는지 여부를 지정합니다. 이 스타일이 적용되면 소문자가 작은 대문자로 표시됩니다.

이 속성의 기본값은 FALSE입니다.

, 읽기 전용

문자의 글꼴 이름을 저장합니다. 이 속성은 직접 변경할 수 없으며, SetFont 메서드를 통해서만 변경할 수 있습니다.

기본값은 “Times New Roman”입니다.

문자의 글꼴 높이를 twip 단위로 지정합니다. 1 twip은 1/20포인트이며, 1포인트는 1/72인치입니다.

이 속성의 기본값은 10포인트(200 twip)입니다.

문자의 글꼴 스타일에 액세스합니다.

, 읽기 전용

문자의 글꼴 유형을 저장합니다. 이 속성은 SetFont 메서드를 통해서만 변경할 수 있습니다.

기본적으로 이 값은 FT_Unknown입니다.

문자가 불확실하게 인식된 경우 TRUE를 반환합니다. 이 속성을 사용하여 검증이 필요한지 여부를 확인하십시오.

이 속성은 ErrorProbability 값과 인식 설정을 기반으로 계산됩니다. 검증을 위해 더 세밀한 구분이 필요한 경우 ErrorProbability를 대신 사용하십시오.

이 속성의 기본값은 FALSE입니다.

, 읽기 전용

문자가 잘못 인식되었을 추정 확률(0~100 범위)을 반환합니다.

오류 확률은 전체 컨텍스트를 고려하기 때문에, 개별 문자 인식 후보가 아닌 인식 결과에 대해서만 사용할 수 있습니다. 인식 후보를 서로 비교하려면를 사용하십시오.

인식 없이 획득한 문자(예: 소스 PDF 파일에서 직접 가져온 문자)에 대해서는 오류 확률이 계산되지 않습니다.

,읽기 전용

문자 인식 후보의 컬렉션을 반환합니다.

이 속성은 인쇄 불가능한 문자(공백, 줄 바꿈 등)와 인식되지 않았지만 명시적 편집 중에 텍스트에 추가된 문자에 대해 0을 포함합니다. 이전 ABBYY FineReader Engine 버전으로 텍스트가 인식된 경우에도 0이 반환됩니다.

속성이 FALSE로 설정된 경우 반환 컬렉션에는 요소가 하나 포함되며, 그렇지 않은 경우 컬렉션에는 하나 이상의 요소가 포함되고 후보는 최상에서 최하 순으로 정렬됩니다.

, 읽기 전용

CharacterRecognitionVariants 컬렉션에서 선택된 문자 인식 후보의 인덱스를 저장합니다.

,읽기 전용

선택된 문자 인식 후보를 저장합니다. 이는 문자 인식 후보 컬렉션(CharacterRecognitionVariants 속성)에서 인덱스 CharacterRecognitionVariantIndex에 해당하는 요소입니다.

,읽기 전용

해당 문자가 속한 단어의 인식 후보 컬렉션을 반환합니다.

이 속성은 인쇄 불가능한 문자(공백, 줄 바꿈 등)와 인식되지 않았지만 명시적 편집 중에 텍스트에 추가된 문자에 대해 0을 포함합니다. 이전 ABBYY FineReader Engine 버전으로 텍스트가 인식된 경우에도 0이 반환됩니다.

속성이 FALSE로 설정된 경우 반환 컬렉션에는 요소가 하나 포함되며, 그렇지 않은 경우 컬렉션에는 하나 이상의 요소가 포함되고 후보는 내부 추정 메커니즘에 의해 최상에서 최하 순으로 정렬됩니다.

, 읽기 전용

문자가 인식 과정 없이 입력 파일의 텍스트 콘텐츠에서 추출되었는지 여부를 지정합니다. 예를 들어, 텍스트 레이어가 있는 PDF 파일에서 추출될 수 있습니다.

이 문자에 대해 맞춤법 검사가 수행되었는지 여부를 지정합니다. ABBYY FineReader Engine 내부에서는 사용되거나 설정되지 않으며, 맞춤법 검사를 위한 프레임워크를 제공하는 용도로만 사용됩니다.

메서드

이름설명
CopyFrom다른 객체의 해당 속성 값을 사용해 현재 객체의 속성을 초기화합니다.
SetFont문자에 새 글꼴을 설정합니다.
SetRect문자에 새 사각형을 설정합니다.
CharParams 객체 다이어그램

출력 매개변수

이 객체는 다음 메서드의 출력 매개변수입니다.

입력 매개변수

이 객체는 다음 메서드에 입력 매개변수로 전달됩니다.

샘플

int suspiciousCharsCount = 0;
// 텍스트 블록의 의심스러운 문자 수를 계산합니다
void computeStatisticsForBlock(FREngine.IBlock block)
{
 if (block.Type == FREngine.BlockTypeEnum.BT_Text)
 {
  FREngine.ITextBlock textBlock = block.GetAsTextBlock();
  int paragraphsCount = textBlock.Text.Paragraphs.Count;
  for (int iPar = 0; iPar < paragraphsCount; iPar++)
  {
   FREngine.IParagraph par = textBlock.Text.Paragraphs[iPar];
   string text = par.Text;
   FREngine.ICharParams charParams = engine.CreateCharParams();
   for (int iChar = 0; iChar < text.Length; iChar++)
   {
    par.GetCharParams(iChar, charParams);
    if (charParams.IsSuspicious)
    {
     suspiciousCharsCount++;
    }
   }
  }
 }
}
이 객체는 다음 코드 샘플에서 사용됩니다: RecognizedTextProcessing (Win) 및 Windows 데모 도구 Engine Predefined Processing Profiles.

참고 항목

Paragraph CharConfidence, ErrorProbability, IsSuspicious의 차이점은 무엇인가요? 텍스트 다루기 속성 다루기