Opciones para exportar valores de Field extraídos (pestaña Fields)
| Formato | Opción de exportación | Descripción | Nombre de archivo |
|---|---|---|---|
| JSON | Valores, metadatos y estructura de Field para cada documento | Resultados completos de la extracción de datos. La estructura del archivo de salida se describe en la Guía del desarrollador. | <Applied_skill_name>.json |
| JSON | Solo valores | Valores de Field y errores de reglas. La estructura del archivo de salida se describe en la Guía del desarrollador. | <Applied_skill_name>_fields.json |
| CSV | Solo valores | Valores de Field. Nota: al exportar campos de imagen, sus valores en el archivo CSV estarán vacíos. Si una estructura repetida está anidada dentro de un grupo, su nombre aparecerá como “New Group/New Table”, pero en el nombre de un archivo secundario la barra se reemplazará por un guion bajo (por ejemplo, New Group_New Table_055fe8c.csv) | <Applied_skill_name>.csv* |
- Nombre del archivo CSV principal:
<Applied_skill_name>.csv - Nombres de los archivos CSV secundarios para objetos repetidos:
<Field_path>_<random 7-character identifier>.csv - Si el nombre del archivo CSV secundario supera los 250 caracteres, se utilizará un esquema de nomenclatura alternativo:
<Field_ID>_<random 7-character identifier>.csv
- Se agrega un sufijo numérico a partir de 2 al nombre del archivo CSV.
- Se crea una subcarpeta en la carpeta de la transacción para los archivos CSV secundarios.
- La subcarpeta se nombrará de la siguiente manera:
<Applied_skill_name>_<N>o<Applied_skill_name>_fields_<N>(si la exportación JSON —Solo valores— está habilitada), donde N es el número secuencial del documento en la transacción (comenzando desde 2 si hay más de un documento en la transacción). - Para objetos repetidos, el nombre del archivo CSV secundario se especifica en el valor del campo del archivo CSV principal.
- Los nombres de los campos se escriben en la primera fila del archivo CSV.
- Se usa una coma para separar las columnas.
- El tipo de codificación utilizado es UTF-8 con BOM.
- Las instancias vacías de los campos o grupos repetidos, o las filas vacías de la tabla, no se exportan; es decir, el archivo CSV resultante no contendrá filas vacías.
Opciones para exportar el texto del documento (pestaña Text)
| Format | Export Option | Description | File Name |
|---|---|---|---|
| JSON | Solo texto | Un archivo JSON que contiene únicamente texto reconocido; no se conserva el diseño del documento. Nota: Si selecciona esta opción, no será posible exportar a DOCX, XLSX y PPTX. | <Applied_skill_name>_text.json |
| JSON | Conservar la estructura del documento | Un archivo JSON que contiene texto reconocido y conserva el diseño del documento. | <Applied_skill_name>_text.json |
| XML | Solo texto | Un archivo XML que contiene únicamente texto reconocido; no se conserva el diseño del documento. Nota: Si selecciona esta opción, no será posible exportar a DOCX, XLSX y PPTX. | <Applied_skill_name>.xml |
| XML | Conservar la estructura del documento | Un archivo XML que contiene texto reconocido y conserva el diseño del documento. | <Applied_skill_name>.xml |
| ALTOXML | Solo texto | Un archivo ALTO XML que contiene únicamente texto reconocido; no se conserva el diseño del documento. El archivo cumple el estándar ALTO, versión de esquema 4.2. Nota: Si selecciona esta opción, no será posible exportar a DOCX, XLSX y PPTX. | <Applied_skill_name>.xml |
| ALTOXML | Conservar la estructura del documento | Un archivo ALTO XML que contiene texto reconocido y conserva el diseño del documento. El archivo cumple el estándar ALTO, versión de esquema 4.2. | <Applied_skill_name>.xml |
| TXT | Un documento de texto sin formato. La estructura original del documento se conserva mediante espacios en blanco. | <Applied_skill_name>.txt | |
| DOCX | Editable | Un documento de Word editable que puede no verse exactamente como el original. | <Applied_skill_name>.docx |
| DOCX | Exacto | Un documento de Word no editable. La estructura original del documento se conserva completamente. | <Applied_skill_name>.docx |
| XLSX | Un documento de Excel editable. Se conserva la estructura original del documento. | <Applied_skill_name>.xlsx | |
| PPTX | Un documento de PowerPoint editable. Se conserva la estructura original del documento. | <Applied_skill_name>.pptx | |
| HTML | Un documento HTML que conserva la estructura original del documento. | <Applied_skill_name>.html |
Nota: Las opciones de exportación (Solo texto y Conservar la estructura del documento) para JSON, XML y ALTOXML no pueden diferir. Si especifica otra opción de exportación para uno de estos formatos, esa opción se aplicará a los otros formatos.
Opciones para exportar la imagen del documento (pestaña Imagen)
| Formato | Opción de exportación | Descripción | Nombre de archivo |
|---|---|---|---|
| PDF/A-3a | Un archivo PDF con una capa de texto sobre la imagen del documento. La capa de texto refleja los cambios en los valores de los campos realizados por el Operador de Revisión Manual durante la revisión manual. | <Applied_skill_name>.pdf | |
| PDF/A-3b | Un archivo PDF con una capa de texto sobre la imagen del documento. La capa de texto refleja los cambios en los valores de los campos realizados por el Operador de Revisión Manual durante la revisión manual. | <Applied_skill_name>.pdf | |
| Solo imagen | Un PDF no editable con el estándar PDF/A-3b sin capa de texto. | <Applied_skill_name>.pdf | |
| TIFF | Un archivo que contiene una imagen mejorada en formato TIFF. | <Applied_skill_name>.tiff | |
| JPEG | Calidad máxima | Un archivo que contiene una imagen mejorada en formato JPEG. Si elige esta opción de compresión, el nivel de calidad de la imagen se establecerá en 95%. | pages/page_<N>.jpg |
| JPEG | Tamaño de archivo reducido | Un archivo que contiene una imagen mejorada en formato JPEG. Si elige esta opción de compresión, el nivel de calidad de la imagen se establecerá en 75%. Esto le permitirá guardar la imagen en un formato legible y, a la vez, reducir su tamaño. | pages/page_<N>.jpg |
Nota: Para cada opción de exportación a PDF, puede elegir entre «tamaño de archivo reducido» (opción predeterminada) y «calidad máxima». El tamaño de archivo reducido se logra usando la compresión Mixed Raster Content (MRC), que determina tasas de compresión óptimas por separado para el texto, las imágenes y el fondo.Al exportar a una carpeta compartida, se crea una subcarpeta para cada documento en la transacción. Se utilizarán las siguientes reglas y el siguiente esquema de nombres:
- La subcarpeta se nombrará de la siguiente manera:
<Applied_skill_name>_<N>, o<Applied_skill_name>_fields_<N>(si la exportación JSON - Solo valores está habilitada). N es el número secuencial del documento en la transacción (comenzando desde 2 si hay más de un documento en la transacción). - Dentro de esta subcarpeta, se crea una subcarpeta Pages para almacenar los archivos JPG. Los nombres de archivo se
formatean como page_<N>.jpg, donde N es el número secuencial de la página. - Los archivos PDF y TIFF se guardan en la carpeta de la transacción.
- Se agregarán sufijos numéricos a partir de 2 a los nombres de archivo si hay más de un documento del mismo tipo en la transacción.
Esquema general de nomenclatura
<Applied_skill_name> en sus nombres, que corresponde a uno de los siguientes valores:
- El nombre de la última Skill de documento aplicada al documento.
- El nombre de la última Skill de clasificación aplicada al documento si no se aplicaron Skills de documento.
- “Unknown” si no se aplicaron Skills de documento ni de clasificación, aunque al menos una de ellas exista en el flujo de la Habilidad de proceso.
Transacciones con errores
Error.json, que contiene una cadena JSON con la siguiente información sobre la transacción:
- El identificador de la transacción
- El estado de la transacción (Failed)
- El mensaje de error
- La matriz que contiene todos los identificadores y nombres de los archivos de origen en la transacción
