Vai al contenuto principale
Un file XML contiene il testo riconosciuto, insieme a informazioni aggiuntive sulla sua struttura, sugli attributi e sulle varianti di riconoscimento, descritte mediante tag XML. Consulta la tabella seguente per la descrizione dei possibili tag. Alcuni tag potrebbero non essere presenti a seconda dei valori dei parametri di riconoscimento. Ad esempio, le varianti di riconoscimento di parole o caratteri vengono salvate solo se le proprietà corrispondenti dell’oggetto XMLExportParams sono impostate su TRUE. Puoi trovare lo schema XML nel file ABBYY_Scheme_XML.xsd. Questo file si trova nella cartella Headers per macOS oppure nella cartella Inc per Linux e Windows (Start > Programs > ABBYY FineReader Engine 12 > Installation Folders > Include Files Folder). L’immagine seguente mostra un esempio di blocchi Picture, Text e Table nel file XML di output. XMLScheme

Descrizione dei tag del documento

Tipo complesso

1

no

Documento.

Tipo complesso, una sequenza di tag block

0…unbounded

document

Pagina riconosciuta.

BlockType

0…unbounded

page

Blocco riconosciuto.

Tipo complesso, una sequenza di tag rect

Non ha attributi di tipo

1

block

Regione del blocco, un insieme di rettangoli.

Tipo complesso

1…unbounded

region

Rettangolo di una regione di blocco.

TextType

0…unbounded

block

Testo di un blocco di testo riconosciuto (presente come elemento del tag block, se l’attributo blockType è “Text”).

0…unbounded

cell

Testo di una cella di tabella.

ParagraphType

0…unbounded

text

Paragrafo di un testo riconosciuto.

LineType

0…unbounded

par

Riga di un paragrafo.

FormattingType

0…unbounded

line

Gruppo di caratteri con formattazione uniforme. Gli attributi dei caratteri si alternano con le varianti di riconoscimento della parola. Le varianti di riconoscimento della parola precedono la parola stessa.

CharParamsType

0…unbounded

formatting

Attributi di un singolo carattere.

Tipo complesso, una sequenza di tag charRecVariant

Non ha attributi di tipo


charParams

Varianti di riconoscimento di un carattere.

CharRecognitionVariant

0…unbounded

charRecVariants

Variante di riconoscimento di un carattere.

Tipo complesso, una sequenza di tag wordRecVariant

Non ha attributi di tipo


formatting

Varianti di riconoscimento della parola successiva.

Tipo WordRecognitionVariant

0…unbounded

wordRecVariants

Variante di riconoscimento della parola successiva.

Tipo complesso, una sequenza di tag charParams

Non ha attributi di tipo

1

wordRecVariant

Parola.

TableRowType

Non ha attributi di tipo

0…unbounded

block

Riga di tabella (presente se l’attributo blockType è Table).

Tipo complesso, una sequenza di tag TextType

0…unbounded

row

Cella di tabella (presente se l’attributo blockType è Table).

Tipo complesso, una sequenza di tag separator

Non ha attributi di tipo

0…1

block

Gruppo di separatori, presente se l’attributo blockType è “SeparatorsBox”

Tipo SeparatorBlockType

0…1

block

Separatore singolo, presente se l’attributo blockType è “Separator”.

0…unbounded

separatorsBox

Separatore in un gruppo di separatori.

Tipo complesso, una sequenza di tag checkmark

Non ha attributi di tipo

0…1

block

Gruppo di segni di spunta, presente se l’attributo blockType è “GroupCheckmark”

CheckmarkBlockType type

0…1

block

Segno di spunta singolo, presente se l’attributo blockType è “Checkmark”.

0…unbounded

checkmarkGroup

Segno di spunta all’interno di un gruppo di segni di spunta.

BarcodeInfoType type

0…1

block

Informazioni sul barcode, presente se l’attributo blockType è “Barcode”.

Point type

1

separator

Punto iniziale di un separatore.

Point type

1

separator

Punto finale di un separatore.

Tipo complesso

Non ha attributi di tipo

0…1

document

Parametri degli stili di paragrafo e di carattere del documento.

Tipo complesso, una sequenza di tag paragraphStyle

Non ha attributi di tipo

0…1

documentData

Raccolta di stili di formattazione del paragrafo.

ParagraphStyleType Type

0…unbounded

paragraphStyles

Stile di formattazione di un paragrafo.

FontStyleType Type

0…unbounded

paragraphStyle

Lo stile del carattere.

Complex Type, a sequence of section tags

Non ha attributi di tipo

0…1

documentData

La raccolta delle sezioni del documento.

SectionType Type

Non ha attributi di tipo

0…unbounded

sections

Una sezione del documento.

TextStreamType Type

0…unbounded

section

Una sequenza di paragrafi e blocchi.

Complex Type

0…1

stream


Tipo complesso

0…unbounded

stream

L’ID di un elemento della pagina.

Diagramma gerarchico dei tag

XMLSchemeDiagram

Vedi anche

XMLExportParams