Tip: Para obtener pautas sobre el etiquetado de documentos no estructurados, consulte la guía de Advanced Designer.
Documentos estructurados
- Asegúrese de especificar con precisión la región de cada campo, ya que los valores de campo por sí solos no son suficientes para el entrenamiento.
- Para marcar la región de un campo, no haga clic en su valor; marque el marcador de posición completo.
- Si un campo no contiene valor, marque el marcador de posición vacío.
- Si un campo consta de varias partes, mantenga presionada la tecla Shift para añadir las partes. Tenga en cuenta que todas las partes deben estar en la misma Página.
- Si un formulario fijo contiene una tabla, marque todas las filas, incluidas las vacías.
- Si se agrega un campo después de haber realizado parte del etiquetado, este nuevo Field debe etiquetarse en todos los Documentos del conjunto de entrenamiento. Revise todos sus Documentos y etiquete el nuevo Field en todos los Documentos donde aparezca.
Documentos semiestructurados
- Asegúrese de especificar con precisión la región de cada campo, ya que los valores de los campos por sí solos no bastan para el entrenamiento.
- Para delimitar la región de un campo, haga clic en su valor (es decir, la palabra o palabras que contiene) y la región se creará automáticamente.
- Si un campo no contiene ningún valor, no cree una región para dicho campo.
- No delimite partes de palabras, ya que el programa solo puede aprender con palabras completas.
- Si un campo consta de varias partes, mantenga presionada la tecla Shift para añadir las partes. Tenga en cuenta que todas las partes deben estar en la misma página.
- Si tiene una estructura repetida, analice primero sus documentos y cree una tabla o un grupo repetido. Si sus documentos contienen tablas con un encabezado común y valores que no tienen palabras clave junto a ellos, cree una tabla. Si sus datos están menos estructurados y tienen palabras clave junto a los valores, cree un grupo con la opción Allow multiple items. Si los datos están organizados de manera diferente en distintos documentos, seleccione la opción que mejor se ajuste a la mayoría de los documentos.
- Al etiquetar una tabla, marque la primera fila y luego haga clic en Continue table from this row, asegurándose de que toda la tabla se haya etiquetado correctamente. Para delimitar las celdas de la primera fila, haga clic en sus celdas una por una y las columnas correspondientes se crearán automáticamente. Continúe hasta delimitar toda la tabla.
Tip: Si las tablas son grandes y las páginas del documento tienen un aspecto similar, puede eliminar las páginas repetidas y etiquetar la primera y la última, además de algunas páginas intermedias.
- No indique al programa que busque campos dentro de la región de otro campo, ya sea un campo individual (como una dirección) o una celda de tabla (como “Description”). Si necesita extraer datos de un fragmento de texto grande, use el Advanced Designer.
- Si se añade un campo después de haber realizado parte del etiquetado, este nuevo campo debe etiquetarse en todos los documentos del conjunto de entrenamiento. Revise todos sus documentos y etiquete el nuevo campo en todos los documentos en los que aparezca.
