Saltar al contenido principal
Vantage ofrece las siguientes opciones de exportación para campos del documento, texto e imágenes.

Opciones para exportar valores de Field extraídos (pestaña Fields)

FormatoOpción de exportaciónDescripciónNombre de archivo
JSONValores, metadatos y estructura de Field para cada documentoResultados completos de la extracción de datos. La estructura del archivo de salida se describe en la Guía del desarrollador.<Applied_skill_name>.json
JSONSolo valoresValores de Field y errores de reglas. La estructura del archivo de salida se describe en la Guía del desarrollador.<Applied_skill_name>_fields.json
CSVSolo valoresValores de Field. Nota: al exportar campos de imagen, sus valores en el archivo CSV estarán vacíos. Si una estructura repetida está anidada dentro de un grupo, su nombre aparecerá como “New Group/New Table”, pero en el nombre de un archivo secundario la barra se reemplazará por un guion bajo (por ejemplo, New Group_New Table_055fe8c.csv)<Applied_skill_name>.csv*
*Si un documento contiene objetos repetidos (campos repetidos, grupos repetidos de campos, tablas), se exportan como archivos independientes. Se utiliza el siguiente esquema de nomenclatura:
  • Nombre del archivo CSV principal: <Applied_skill_name>.csv
  • Nombres de los archivos CSV secundarios para objetos repetidos: <Field_path>_<random 7-character identifier>.csv
  • Si el nombre del archivo CSV secundario supera los 250 caracteres, se utilizará un esquema de nomenclatura alternativo: <Field_ID>_<random 7-character identifier>.csv
Al exportar a una carpeta compartida, el archivo CSV principal se guarda en la carpeta de la transacción. Si hay varios documentos del mismo tipo en la transacción y se genera un archivo CSV independiente para cada documento, se aplican las siguientes reglas y el siguiente esquema de nomenclatura:
  • Se agrega un sufijo numérico a partir de 2 al nombre del archivo CSV.
  • Se crea una subcarpeta en la carpeta de la transacción para los archivos CSV secundarios.
  • La subcarpeta se nombrará de la siguiente manera: <Applied_skill_name>_<N> o <Applied_skill_name>_fields_<N> (si la exportación JSON —Solo valores— está habilitada), donde N es el número secuencial del documento en la transacción (comenzando desde 2 si hay más de un documento en la transacción).
  • Para objetos repetidos, el nombre del archivo CSV secundario se especifica en el valor del campo del archivo CSV principal.
El archivo CSV se formatea de la siguiente manera:
  • Los nombres de los campos se escriben en la primera fila del archivo CSV.
  • Se usa una coma para separar las columnas.
  • El tipo de codificación utilizado es UTF-8 con BOM.
  • Las instancias vacías de los campos o grupos repetidos, o las filas vacías de la tabla, no se exportan; es decir, el archivo CSV resultante no contendrá filas vacías.

Opciones para exportar el texto del documento (pestaña Text)

FormatExport OptionDescriptionFile Name
JSONSolo textoUn archivo JSON que contiene únicamente texto reconocido; no se conserva el diseño del documento. Nota: Si selecciona esta opción, no será posible exportar a DOCX, XLSX y PPTX.<Applied_skill_name>_text.json
JSONConservar la estructura del documentoUn archivo JSON que contiene texto reconocido y conserva el diseño del documento.<Applied_skill_name>_text.json
XMLSolo textoUn archivo XML que contiene únicamente texto reconocido; no se conserva el diseño del documento. Nota: Si selecciona esta opción, no será posible exportar a DOCX, XLSX y PPTX.<Applied_skill_name>.xml
XMLConservar la estructura del documentoUn archivo XML que contiene texto reconocido y conserva el diseño del documento.<Applied_skill_name>.xml
ALTOXMLSolo textoUn archivo ALTO XML que contiene únicamente texto reconocido; no se conserva el diseño del documento. El archivo cumple el estándar ALTO, versión de esquema 4.2. Nota: Si selecciona esta opción, no será posible exportar a DOCX, XLSX y PPTX.<Applied_skill_name>.xml
ALTOXMLConservar la estructura del documentoUn archivo ALTO XML que contiene texto reconocido y conserva el diseño del documento. El archivo cumple el estándar ALTO, versión de esquema 4.2.<Applied_skill_name>.xml
TXTUn documento de texto sin formato. La estructura original del documento se conserva mediante espacios en blanco.<Applied_skill_name>.txt
DOCXEditableUn documento de Word editable que puede no verse exactamente como el original.<Applied_skill_name>.docx
DOCXExactoUn documento de Word no editable. La estructura original del documento se conserva completamente.<Applied_skill_name>.docx
XLSXUn documento de Excel editable. Se conserva la estructura original del documento.<Applied_skill_name>.xlsx
PPTXUn documento de PowerPoint editable. Se conserva la estructura original del documento.<Applied_skill_name>.pptx
HTMLUn documento HTML que conserva la estructura original del documento.<Applied_skill_name>.html
Al exportar a una carpeta compartida, todos los archivos se guardan en la carpeta de la transacción. Se agregarán sufijos numéricos a partir de 2 a los nombres de archivo si hay más de un documento del mismo tipo en la transacción. El texto exportado refleja los cambios en los valores de los campos realizados por el operador de revisión manual durante la revisión manual.
Nota: Las opciones de exportación (Solo texto y Conservar la estructura del documento) para JSON, XML y ALTOXML no pueden diferir. Si especifica otra opción de exportación para uno de estos formatos, esa opción se aplicará a los otros formatos.

Opciones para exportar la imagen del documento (pestaña Imagen)

FormatoOpción de exportaciónDescripciónNombre de archivo
PDFPDF/A-3aUn archivo PDF con una capa de texto sobre la imagen del documento. La capa de texto refleja los cambios en los valores de los campos realizados por el Operador de Revisión Manual durante la revisión manual.<Applied_skill_name>.pdf
PDFPDF/A-3bUn archivo PDF con una capa de texto sobre la imagen del documento. La capa de texto refleja los cambios en los valores de los campos realizados por el Operador de Revisión Manual durante la revisión manual.<Applied_skill_name>.pdf
PDFSolo imagenUn PDF no editable con el estándar PDF/A-3b sin capa de texto.<Applied_skill_name>.pdf
TIFFUn archivo que contiene una imagen mejorada en formato TIFF.<Applied_skill_name>.tiff
JPEGCalidad máximaUn archivo que contiene una imagen mejorada en formato JPEG. Si elige esta opción de compresión, el nivel de calidad de la imagen se establecerá en 95%.pages/page_<N>.jpg
JPEGTamaño de archivo reducidoUn archivo que contiene una imagen mejorada en formato JPEG. Si elige esta opción de compresión, el nivel de calidad de la imagen se establecerá en 75%. Esto le permitirá guardar la imagen en un formato legible y, a la vez, reducir su tamaño.pages/page_<N>.jpg
Nota: Para cada opción de exportación a PDF, puede elegir entre «tamaño de archivo reducido» (opción predeterminada) y «calidad máxima». El tamaño de archivo reducido se logra usando la compresión Mixed Raster Content (MRC), que determina tasas de compresión óptimas por separado para el texto, las imágenes y el fondo.
Al exportar a una carpeta compartida, se crea una subcarpeta para cada documento en la transacción. Se utilizarán las siguientes reglas y el siguiente esquema de nombres:
  • La subcarpeta se nombrará de la siguiente manera: <Applied_skill_name>_<N>, o <Applied_skill_name>_fields_<N> (si la exportación JSON - Solo valores está habilitada). N es el número secuencial del documento en la transacción (comenzando desde 2 si hay más de un documento en la transacción).
  • Dentro de esta subcarpeta, se crea una subcarpeta Pages para almacenar los archivos JPG. Los nombres de archivo se formatean como page_<N>.jpg, donde N es el número secuencial de la página.
  • Los archivos PDF y TIFF se guardan en la carpeta de la transacción.
  • Se agregarán sufijos numéricos a partir de 2 a los nombres de archivo si hay más de un documento del mismo tipo en la transacción.

Esquema general de nomenclatura

La mayoría de los archivos exportados incluirán <Applied_skill_name> en sus nombres, que corresponde a uno de los siguientes valores:
  • El nombre de la última Skill de documento aplicada al documento.
  • El nombre de la última Skill de clasificación aplicada al documento si no se aplicaron Skills de documento.
  • “Unknown” si no se aplicaron Skills de documento ni de clasificación, aunque al menos una de ellas exista en el flujo de la Habilidad de proceso.
Si hay varios archivos de salida y está configurada la exportación a una carpeta compartida, se añadirán números consecutivos a los nombres de archivo para que cada nombre sea único.

Transacciones con errores

Si una transacción no se completa correctamente, Vantage genera un archivo Error.json, que contiene una cadena JSON con la siguiente información sobre la transacción:
  • El identificador de la transacción
  • El estado de la transacción (Failed)
  • El mensaje de error
  • La matriz que contiene todos los identificadores y nombres de los archivos de origen en la transacción
De forma predeterminada, los datos exportados se almacenan durante 2 semanas, de acuerdo con la política de retención.