문자열 가설 - ABBYY Documentation

Parameter	Description
`String Value()`	가설 영역 내 이미지에 있는 텍스트의 값입니다.

프로그램은 검색 영역과 수평으로 교차하는 모든 텍스트 객체를 고려합니다(수직 방향으로는 객체 전체가 검색 영역 안에 완전히 들어와야 합니다). 그런 다음 텍스트 객체들을 줄 단위로 그룹화합니다. 줄은 왼쪽에서 오른쪽으로 구성됩니다. 프로그램은 공백의 최대 길이(Max. space length 속성에서 설정)를 초과하면 줄 구성을 중지합니다. 결과로 얻어진 줄에서, 프로그램은 각 줄 안에서 사용자 정의 문자 집합 중 하나에만 속하는 문자로 이루어진 문자열들을 식별합니다. 마찬가지로 프로그램은 줄을 여러 조각으로 나눕니다. 다음으로 프로그램은 각 조각에 대해 가설을 구성합니다. Allow embedded hypotheses가 선택되었는지 여부에 따라, 가설은 두 가지 서로 다른 방식으로 구성됩니다. 이전에 프로그램이 세 개의 조각을 검출했다고 가정해 보겠습니다. Allow embedded hypotheses가 선택되어 있으면 가설은 다음과 같이 구성됩니다: 가설 1: 조각 1 가설 2: 조각 1 + 조각 2 가설 3: 조각 1 + 조각 2 + 조각 3 가설 4: 조각 2 가설 5: 조각 2 + 조각 3 가설 6: 조각 3 각 가설에 대해, 프로그램은 각 문자 집합에서 차지하는 문자 비율이 Portion in text, % field에 설정된 값을 초과하지 않는지 확인합니다. 마찬가지로, 알파벳이 아닌 문자의 비율이 Allowed errors field에 설정된 값을 초과하지 않는지도 확인합니다. 두 검사 중 하나라도 실패하면 해당 가설은 구성되지 않습니다. Allow embedded hypotheses가 선택되지 않은 경우, 위 목록에서 포함된 가설은 버려집니다. 포함된 가설이란 위 목록에서 다른 가설에 완전히 포함되어 있는 가설을 의미합니다. 모든 가설에 대한 검사가 성공적이었다면, 다음 가설만 남게 됩니다: 조각 1 + 조각 2 + 조각 3. 따라서 Allow embedded hypotheses가 선택되지 않은 경우, 프로그램은 모든 조건을 만족하는 최대 길이의 가설을 구성합니다. 포함된 가설은 제외되지만, 가설들이 서로 교차할 수는 있습니다. 이는 독립된 문자나 단어일 수 있고, 또는 다른 가설의 일부이지만 별도의 가설로는 구성되지 않은 문자열일 수 있습니다. 예를 들어, 프로그램은 두 개의 가설(즉, 두 개의 문자열)을 구성할 수 있는데, 하나는 특정 단어나 구에서 끝나고 다른 하나는 그 단어나 구에서 시작하는 방식일 수 있습니다. 예: 가설 1: 조각 1 + 조각 2 가설 2: 조각 2 + 조각 3 가능한 모든 가설이 생성되면, 프로그램은 각 가설에 대해 Search condition quality를 계산합니다(이는 해당 가설이 Search Conditions에 설정된 검색 제약을 얼마나 잘 만족하는지에 대한 추정치입니다). 이 단계에서 품질은, 문자 기준 가설 길이가 Character count 속성에 지정된 퍼지 구간 안에 드는지 여부, 줄에서 전체 공백 길이가 TotalGapLength에 지정된 퍼지 구간 안에 드는지 여부, 그리고 줄에서 단어 개수가 Word count에 지정된 퍼지 구간 안에 드는지 여부를 기준으로 계산됩니다. 가설의 전체 품질은 이러한 개별 품질 값을 모두 곱하여 계산됩니다.

Advanced Designer