Saltar al contenido principal
Creación de campos de documento Para cada entidad que desee extraer, se debe crear un campo correspondiente en la Definición de Document. Para crear un campo:
  1. En el Editor de Definición de Document, haga clic con el botón derecho en el nombre de la sección del documento y seleccione Create Field.
  2. Cree un campo de texto.
  3. En la pestaña General, seleccione la opción Can have region.
  4. En el campo Name, especifique un nombre para el campo (por ejemplo, PreambleSegment). ¡Importante! Los nombres de los campos no deben contener espacios ni caracteres no ingleses, ni comenzar con un número.
Repita los pasos anteriores para cada entidad.
Si se usa la segmentación, debe crearse un campo de texto independiente para cada segmento.
Para cada segmento del que se extraerán entidades:
  • Cree un campo no repetible en un grupo repetido.
  • Seleccione la opción Text segment en las propiedades del campo.
  • Seleccione la opción Allow multiple regions si algunos segmentos comienzan y terminan en páginas diferentes.
Creación de un modelo NLP de segmentación La segmentación mejora la precisión y la velocidad de la extracción de entidades. La segmentación es opcional. Se requiere un modelo NLP especial para segmentar documentos. ¡Importante! Solo puede haber un modelo de segmentación para cada sección del documento. Para crear un modelo de segmentación:
  1. En el Editor de Definición de Document, haga clic con el botón derecho en el nombre de la sección del documento.
  2. Seleccione Properties…
  3. En el cuadro de diálogo que se abre, haga clic en la pestaña NLP y, a continuación, en Create…
  4. En el campo Name, especifique un nombre para su modelo de segmentación (por ejemplo, SegmentationModel).
  5. En el campo Model type, elija Segmentation.
  6. En la lista Language, seleccione el idioma requerido.
  1. Haga clic en Next…
  2. En el cuadro de diálogo que se abre, especifique todos los campos en los que se extraerán los segmentos.
  3. Haga clic en OK.
Una vez que haya creado un modelo de segmentación, debe entrenarlo con algunos documentos de ejemplo.
La opción Allow training le permite entrenar su modelo NLP durante el procesamiento de documentos. Su modelo NLP se entrenará cuando entrene la extracción de campos mediante un lote de entrenamiento de extracción de campos. Los resultados del entrenamiento pueden deshabilitarse o eliminarse. Para deshabilitar los resultados del entrenamiento, haga clic con el botón derecho en el lote de entrenamiento y seleccione el elemento Disabled en el menú contextual. Para eliminar los resultados del entrenamiento, haga clic con el botón derecho en el lote de entrenamiento y seleccione el elemento Delete en el menú contextual.
Creación de un modelo NLP de extracción de entidades Para extraer entidades, necesita un modelo NLP de extracción de entidades que haya sido entrenado con documentos anotados manualmente. Para crear un modelo NLP:
  1. En el Editor de Definición de Document, abra las propiedades de la sección del documento y haga clic en la pestaña NLP.
  2. Haga clic en Create…
  3. Especifique un Name para su modelo NLP (por ejemplo, EntitiesExtraction).
  4. Como origen de datos, seleccione una sección (si no se usa segmentación) o un segmento (si ha decidido usar segmentación).
  5. En el campo Model type, elija Extraction.
  6. En la lista Language, seleccione el idioma requerido.
  7. Haga clic en Next…
  8. Elija los campos de resultado que se extraerán de la sección o el segmento del documento seleccionado.
Repita los pasos del 1 al 9 para cada segmento o sección del documento del que deban extraerse entidades.
  1. Haga clic en Document Definition > Save para guardar su Definición de Document.
  2. Haga clic en Document Definition > Close para cerrar el Editor de Definición de Document.
  3. Haga clic en Document Definition > Publish para publicar su Definición de Document.
Una vez que haya creado un modelo NLP de extracción de entidades, debe entrenarlo con algunos documentos de ejemplo.
La opción Allow training le permite entrenar su modelo NLP durante el procesamiento de documentos. Su modelo NLP se entrenará cuando entrene la extracción de campos mediante un lote de entrenamiento de extracción de campos. Los resultados del entrenamiento pueden deshabilitarse o eliminarse. Para deshabilitar los resultados del entrenamiento, haga clic con el botón derecho en el lote y seleccione el elemento Disabled en el menú contextual. Para eliminar los resultados del entrenamiento, haga clic con el botón derecho en el lote y seleccione el elemento Delete en el menú contextual.