Saltar al contenido principal
La pestaña Knowledge Base Settings le permite configurar cómo se procesan y fragmentan sus documentos. Estas configuraciones afectan cómo se fragmentan, incrustan y recuperan los contenidos por su agente.

Estrategia de Fragmentación

Elija cómo se dividirán sus documentos en fragmentos para su procesamiento.
EstrategiaDescripción
Sentence ChunkingUtiliza un tokenizador de oraciones para límites de lenguaje natural. Ideal para contenido de propósito general donde preservar el contexto de la oración es importante.
Semantic ChunkingDetermina automáticamente los límites de los fragmentos según el significado semántico. Ideal para documentos complejos o técnicos donde el contexto semántico es más importante que la estructura de la oración.

Configuración de Fragmentos

Configure el tamaño de fragmento y la superposición para la fragmentación basada en oraciones. Esta sección se aplica cuando se selecciona Sentence Chunking.
ConfiguraciónPredeterminadoRecomendaciónDescripción
Chunk Size6464–512 tokensEl tamaño máximo de cada fragmento. Los fragmentos más grandes preservan más contexto pero pueden reducir la precisión de recuperación. Los fragmentos más pequeños son más precisos pero pueden perder contexto.
Chunk Overlap610–20% del tamaño del fragmentoEl número de tokens superpuestos entre fragmentos adyacentes. Ayuda a mantener el contexto a través de los límites de los fragmentos. Debe ser no negativo y menor que el tamaño del fragmento.

Configuración de Mejora de Fragmentos

Configure el enriquecimiento de fragmentos y la selección del modelo LLM para un mejor procesamiento de contenido.
ConfiguraciónDescripción
Chunk EnrichmentCuando está habilitado, usa IA para mejorar los fragmentos con contexto adicional para una mayor precisión de recuperación.
LLM ModelSeleccione el modelo LLM a usar para el enriquecimiento de fragmentos. Requerido cuando Chunk Enrichment está habilitado.
Si no hay modelos de Chunk Enrichment configurados en Super Admin, el modelo predeterminado se usará automáticamente.
El enriquecimiento de fragmentos mejora la calidad de búsqueda pero aumenta el tiempo de procesamiento y el costo computacional. Habilítelo para contenido complejo donde la fragmentación simple no es suficiente.

Zona de Peligro

Las acciones en esta sección son irreversibles. Proceda con precaución.
Eliminar Toda la Base de Conocimiento — Elimina permanentemente todos los documentos, fragmentos e incrustaciones de su base de conocimiento. Esta acción no se puede deshacer.

Guardar y Aplicar Configuraciones

AcciónDescripción
Save SettingsGuarda su configuración. Se aplica solo a documentos nuevos agregados o sincronizados en adelante.
ResetRestablece el formulario a la última configuración guardada.
Apply to All DocumentsRe-indexa todos los documentos existentes en su base de conocimiento con la configuración actual. Use esto después de guardar para aplicar cambios a contenido previamente cargado.
Aplicar configuraciones a todos los documentos puede tomar un tiempo significativo dependiendo del número de documentos en su base de conocimiento. Este proceso no se puede cancelar una vez iniciado.

Mejores Prácticas

Estrategia de Fragmentación

  • Comience con Sentence Chunking para la mayoría de los casos de uso.
  • Cambie a Semantic Chunking para documentos complejos o técnicos donde los límites de oración no se alinean con divisiones de contenido significativas.

Tamaño del Fragmento

  • Comience con el valor predeterminado (64) como línea base.
  • Aumente para contenido que requiera más contexto por fragmento.
  • Disminuya cuando la recuperación precisa y dirigida sea más importante que el contexto.

Superposición de Fragmentos

  • Mantenga la superposición en 10–20% del tamaño de su fragmento.
  • Aumente la superposición cuando la información crítica pueda abarcar los límites de los fragmentos.

Enriquecimiento de Fragmentos

  • Habilite para contenido complejo donde la calidad de recuperación necesita mejoras.
  • Elija un modelo con sólidas capacidades de razonamiento para mejores resultados.
  • Monitoree el tiempo de procesamiento después de habilitar — el enriquecimiento agrega costo computacional.