메인 콘텐츠로 건너뛰기
XML 파일에는 인식된 텍스트와 함께 구조, 속성 및 인식 변형에 대한 추가 정보가 XML 태그로 기술됩니다. 사용 가능한 태그에 대한 설명은 아래 표를 참조하십시오. 일부 태그는 인식 매개변수 값에 따라 포함되지 않을 수 있습니다. 예를 들어, 단어 또는 문자 인식 변형은 XMLExportParams 객체의 해당 속성이 TRUE로 설정된 경우에만 저장됩니다. XML 스키마는 ABBYY_Scheme_XML.xsd 파일에서 확인할 수 있습니다. 이 파일은 macOS의 경우 Headers 폴더에 있으며, LinuxWindows의 경우 Inc 폴더에 있습니다(Start > Programs > ABBYY FineReader Engine 12 > Installation Folders > Include Files Folder). 아래 그림은 출력 XML 파일에서 Picture, Text 및 테이블 블록의 예를 보여 줍니다. XMLScheme

문서 태그 설명

복합 유형

1

없음

문서.

복합 유형, block 태그의 시퀀스

0…unbounded

document

인식된 페이지.

BlockType

0…unbounded

page

인식된 블록.

복합 유형, rect 태그의 시퀀스

유형 속성 없음

1

block

블록 영역, 사각형의 집합.

복합 유형

1…unbounded

region

블록 영역의 사각형.

TextType

0…unbounded

block

인식된 텍스트 블록의 텍스트 (blockType 속성이 “Text”인 경우 block 태그의 요소로 표시됩니다).

0…unbounded

cell

표 셀의 텍스트.

ParagraphType

0…unbounded

text

인식된 텍스트의 단락.

LineType

0…unbounded

par

단락의 줄.

FormattingType

0…unbounded

line

동일한 서식을 가진 문자 그룹입니다. 문자 속성은 단어의 인식 변형과 교대로 나타납니다. 단어의 인식 변형은 해당 단어 앞에 기록됩니다.

CharParamsType

0…unbounded

formatting

단일 문자의 속성입니다.

복합 유형, charRecVariant 태그의 시퀀스

유형 속성 없음


charParams

문자 인식 변형입니다.

CharRecognitionVariant

0…unbounded

charRecVariants

문자 인식의 단일 변형입니다.

복합 유형, wordRecVariant 태그의 시퀀스

유형 속성 없음


formatting

다음 단어의 인식 변형입니다.

WordRecognitionVariant 유형

0…unbounded

wordRecVariants

다음 단어의 인식 변형.

복합 유형, charParams 태그의 시퀀스

유형 속성 없음

1

wordRecVariant

단어.

TableRowType

유형 속성 없음

0…unbounded

block

표 행(blockType 속성이 Table인 경우 표시됩니다).

복합 유형, TextType 태그의 시퀀스

0…unbounded

row

표 셀(blockType 속성이 Table인 경우 표시됩니다).

복합 유형, separator 태그의 시퀀스

유형 속성 없음

0…1

block

구분자 그룹으로, blockType 속성이 “SeparatorsBox”인 경우 표시됩니다

SeparatorBlockType type

0…1

block

단일 구분자로, blockType 속성이 “Separator”인 경우 표시됩니다.

0…unbounded

separatorsBox

구분자 그룹 내의 구분자.

복합 유형, checkmark 태그의 시퀀스

유형 속성 없음

0…1

block

blockType 속성이 “GroupCheckmark”인 경우 표시되는 체크 표시 그룹

CheckmarkBlockType 유형

0…1

block

blockType 속성이 “Checkmark”인 경우 표시되는 단일 체크 표시.

0…unbounded

checkmarkGroup

체크 표시 그룹 내의 체크 표시.

BarcodeInfoType 유형

0…1

block

blockType 속성이 “Barcode”인 경우 표시되는 바코드 정보.

Point 유형

1

separator

구분선의 시작점.

Point 유형

1

separator

구분선의 끝점.

복합 유형

유형 속성 없음

0…1

document

문서의 단락 및 글꼴 스타일 매개변수.

복합 유형, paragraphStyle 태그의 시퀀스

유형 속성 없음

0…1

documentData

단락 서식 스타일 모음.

ParagraphStyleType 유형

0…unbounded

paragraphStyles

단락의 서식 스타일.

FontStyleType Type

0…unbounded

paragraphStyle

글꼴 스타일.

Complex Type, a sequence of section tags

유형 속성 없음

0…1

documentData

문서 섹션의 컬렉션.

SectionType Type

유형 속성 없음

0…unbounded

sections

문서 섹션.

TextStreamType Type

0…unbounded

section

단락과 블록의 시퀀스.

Complex Type

0…1

stream


복합 유형

0…unbounded

stream

페이지 요소의 ID입니다.

태그 계층 다이어그램

XMLSchemeDiagram

참고 항목

XMLExportParams