Saltar al contenido principal
Puede agregar un campo de texto de una de las siguientes maneras:
  • Especifique una región del campo en la imagen del documento haciendo clic en el valor de un campo (se resalta en verde al pasar el cursor) o delimitando una región rectangular alrededor del valor del campo. Después de esto, su nuevo campo aparecerá en el formulario de datos. Puede modificar el nombre del campo haciendo doble clic en él en el formulario de datos o haciendo clic en él en las propiedades del campo. Puede seleccionar el nombre completo haciendo triple clic. Para abrir las propiedades del campo, haga clic en el botón Field options.
  • Agregue un nuevo campo al formulario de datos haciendo clic en Add Field en la barra de herramientas y luego marcando la región del campo en la imagen. Esto establecerá como valor del campo en el formulario de datos los datos detectados dentro de la región seleccionada.
También puede agregar nuevas regiones de campo de texto a campos existentes en el formulario de datos seleccionando el campo correspondiente en el formulario de datos y luego haciendo clic en su ubicación en la imagen del documento. Si un campo debe contener más de una palabra, seleccione varias palabras delimitando toda la región del campo.

Agregar un campo de texto con varias regiones

Algunos campos de texto requieren varias regiones en un solo documento por los siguientes motivos:
  • Algunos valores de campo pueden comenzar en una línea de texto y terminar en otra.
  • Algunos valores de campo pueden comenzar en una página y terminar en otra.
Para agregar un campo de texto con varias regiones, haga lo siguiente:
  • Agregue un campo usando uno de los métodos descritos arriba.
  • Mantenga presionada la tecla Shift y seleccione regiones adicionales para el campo agregado.
Las regiones de un campo de texto también se pueden marcar:
  • En diferentes páginas
  • Dentro de otra región de un campo (en este caso, la región interna se resaltará con un color más oscuro y, si está activa, se resaltará en amarillo).

Propiedades generales del campo de texto

  • Nombre del campo. El nombre único del campo en una skill determinada. El nombre del campo no puede contener caracteres especiales como puntos, comas, barras, dos puntos, asteriscos, signos de interrogación, comillas, signos de menor que, signos de mayor que o barras verticales. La longitud máxima permitida de un nombre de campo es de 90 caracteres.
  • Tipo de datos. El tipo de datos que contiene un campo. Este es un parámetro crucial del campo de texto, ya que afecta la precisión del reconocimiento. Cada tipo de datos tiene su propio conjunto de restricciones para el valor del campo, lo que acota los valores posibles para un carácter y hace que la extracción de datos sea más precisa.
Tipo de datosDescripción
TextPuede contener letras latinas y cirílicas, dígitos, ideogramas y caracteres especiales.
DateLa fecha y la hora en cualquier formato. Se pueden usar como separadores los siguientes caracteres: el punto (.), el espacio ( ), el guion (-), la barra inversa (), y la barra diagonal (/).
NumberPuede contener dígitos, separadores decimales y el carácter de porcentaje (%). Se pueden usar como separadores decimales los siguientes caracteres: el punto (.), la coma (,), el guion (-), el signo igual (=) y el espacio ( ). Se pueden usar como separadores de miles los siguientes caracteres: el punto (.), la coma (,), la comilla simple (’), y el espacio ( ).
MoneyContiene tanto un valor numérico como un símbolo de divisa. El símbolo de divisa puede colocarse antes o después del monto.
Ejemplo: La letra minúscula «l» (L), la letra mayúscula «I» (i) y el dígito «1» pueden tener una apariencia similar. Si se detecta un carácter con este aspecto en un campo Number o Currency Amount, se reconocerá como «1», ya que los fields de este tipo no pueden contener letras.
  • Permitir varios elementos. Especifica si el campo es repetitivo o no. Las instancias de campos repetitivos pueden hacer referencia a varios objetos del mismo tipo. Por ejemplo, nombres de hijos o números de cuenta.
  • Campo obligatorio. Especifica que el valor del campo no puede quedar vacío. Al habilitar esta propiedad se agrega una regla de validación a la Página. Si el campo queda vacío después de la extracción, el documento se enviará a revisión manual con un error.
  • Campo clave. Especifica si el valor del campo se utiliza para buscar documentos.
  • Campo de dimensión. Especifica si el valor del campo se utiliza para obtener información detallada sobre las transacciones de la skill en Skill Monitor.

Apariencia del texto

Este grupo de propiedades se refiere a la apariencia de los caracteres esperados en el campo.
  • Origen del texto. Especifica si el campo puede contener solo caracteres impresos, solo caracteres manuscritos o ambos. Si agrega un campo marcando una región rectangular en el documento, el valor de esta propiedad se establece según los caracteres que se encuentren en esa región. Si agrega un campo haciendo clic en Add Field, el valor de esta propiedad se establece en Printed de forma predeterminada.
Puede consultar la lista de todos los idiomas para los que se admite el reconocimiento de texto manuscrito aquí.
Nota: El reconocimiento de texto manuscrito está habilitado de forma predeterminada para las nuevas Skill de documento. Para deshabilitarlo o volver a habilitarlo, haga clic en el icono de configuración de la skill a la derecha del nombre de la skill y luego vaya a la pestaña Languages y seleccione la opción Handwritten en la sección Text Appearance.
  • Eliminar fondo del campo. Esta opción puede utilizarse para mejorar la precisión del reconocimiento si el campo tiene un marco, casillas para caracteres individuales o texto de marcador de posición. Si habilita esta opción, debe cargar el documento de formulario en blanco que se utilizará como plantilla para el reconocimiento del fondo y etiquetar el campo correspondiente en el formulario en blanco. El documento de formulario en blanco aparece en el Document Set y está marcado con un icono.
  • Fuentes especiales. Si se espera que el campo contenga texto escrito con una fuente específica, puede usar esta opción para seleccionar el tipo de fuente, lo que mejorará la precisión del reconocimiento. También se pueden seleccionar varias fuentes.

Fuentes compatibles

FuenteDescripciónMuestra de fuente
FaxFuente típicamente utilizada por las máquinas de fax.Fax Font
GothicTextos impresos en tipografía gótica.Gothic Font
IndexConjunto especial de caracteres que incluye solo dígitos escritos al estilo de códigos postales.Index Font
Matrix printerTextos impresos en una impresora de matriz de puntos.Matrix Font
MICR CMC-7Fuente especial de código de barras MICR (CMC-7).CMC-7 Font
MICR E-13BConjunto especial de caracteres numéricos impresos con tinta magnética. Los caracteres MICR (Magnetic Ink Character Recognition) se encuentran en diversos documentos, incluidos los cheques personales.E-13B Font
OCR-AFuente monoespaciada diseñada para Reconocimiento óptico de caracteres (OCR). Ampliamente utilizada por bancos, emisores de tarjetas de crédito y negocios similares.OCR-A Font
OCR-BFuente diseñada para Reconocimiento óptico de caracteres (OCR).OCR-B Font
ReceiptEl reconocedor esperará texto de baja calidad, principalmente en una fuente monoespaciada o regular, típica de los recibos.Receipt Font
TypewriterTextos mecanografiados.Typewriter Font

Propiedades adicionales del campo de Text

Las propiedades adicionales dependen del tipo de datos especificado para el campo.

Objeto

El grupo de configuraciones de Value:
  • Longitud máxima. El número máximo permitido de caracteres en el campo. Si la cantidad de caracteres del valor extraído supera esta longitud, se mostrará un mensaje de error. Si hay una etapa de revisión manual en el proceso, el documento se enviará a revisión manual.
  • Expresión regular. Esta opción permite añadir una expresión regular (es decir, una descripción formal de la estructura del valor del campo). Un campo configurado con una expresión regular puede incluir letras, dígitos y otros caracteres según lo establecido en el formulario de datos.
El uso de una expresión regular puede mejorar la precisión de la extracción, es decir, la detección de patrones en el texto, lo que afectará el resultado de la extracción al restringir el conjunto de caracteres válidos. Por ejemplo, si un campo de texto contiene solo números, puede especificar una expresión regular que describa la estructura del campo como compuesta únicamente por dígitos. En ese caso, al reconocer el campo, el programa intentará reconocer cada carácter como un dígito. También puede especificar una expresión regular para un formato específico de número de teléfono (ejemplo 1), o verificar que el campo contenga 2 palabras y que una de ellas sea un número, por ejemplo, 50 lbs (ejemplo 2): Ejemplo 1 (para números de teléfono como 1-(234)-567-8900 o 2 (987) 654 3211)
/^(1|2)(\-|\s)\([\d]{3}\)(\-|\s)[\d]{3}(\-|\s)[\d]{4}$/
Ejemplo 2 (para valores de peso de 50 lb/50 lbs/50 lb/50 lbs/50 lb/50 lbs, etc.)
/^[\d]*(\s)?(L|l)b(s)?$/
Nota: Las expresiones regulares no afectan al reconocimiento de texto de un documento PDF.

Fecha

El grupo de configuraciones El valor puede incluir:
  • Hora. Seleccione esta opción para campos de Fecha que también puedan incluir la hora. Si no se permite un valor de hora, no se extraerá durante el reconocimiento.
  • Día de la semana. Esta opción permite indicar el día de la semana en el campo Fecha. Si el día de la semana no está permitido, no se extraerá durante el reconocimiento.
  • Mes por nombre. Esta opción permite especificar el mes en forma de palabra.
El grupo de configuraciones Orden aceptable de componentes le permite seleccionar un formato de fecha adecuado entre las siguientes opciones: Día-Mes-Año, Mes-Día-Año y Año-Mes-Día. También puede indicar varios formatos a la vez. Si el formato de fecha detectado no coincide con los formatos especificados, el documento se enviará a revisión manual con un error. El grupo de configuraciones Fecha aceptable le permite definir un rango de fechas válidas. Puede establecerlo seleccionando un número de meses antes y después del día en que se procesó el documento. El número de meses debe indicarse como un entero. Se utiliza una regla para comprobar si la fecha indicada está dentro del rango definido. Si no lo está, la regla mostrará un error y el documento se enviará a revisión manual.

Número

El grupo de opciones Value le permite especificar qué tipo de número es el valor detectado (entero o decimal), así como qué formatos numéricos pueden detectarse en este campo. Si el valor de este campo no cumple los requisitos especificados, el documento se enviará a revisión manual.
  • Solo enteros indica que el valor solo puede ser un entero. Si se detecta en el campo un número con separador mientras esta opción está habilitada, dichos separadores se interpretarán como separadores de miles.
  • La parte fraccionaria puede contener más de dos dígitos. Habilite esta opción si se espera que la parte decimal del valor extraído tenga más de dos dígitos. Se pueden usar los siguientes caracteres como separadores decimales: punto (.), coma (,), guion (-), signo igual (=) y espacio ( ).
  • Puede tener valores negativos. Esta opción permite que el valor extraído sea negativo. Los valores negativos pueden indicarse con un signo menos o entre corchetes.
  • Puede incluir el símbolo ’%’. Esta opción permite que el valor extraído tenga el signo de porcentaje antes o después del valor.
El grupo de opciones Number must be within interval le permite especificar un intervalo en el que el valor debe estar para ser válido. El rango del intervalo se define indicando un valor mínimo y un valor máximo. Estos valores pueden ser enteros o decimales. También se pueden especificar valores negativos. Luego se utiliza una regla para comprobar si el valor está dentro del rango especificado. Si no lo está, la regla mostrará un error y el documento se enviará a revisión manual.

Dinero

Las propiedades de Dinero son idénticas a las de Número, con la única excepción de que el campo Dinero no puede contener el carácter de porcentaje.

Consulta también