Descripción General
La pestaña Settings incluye:- Estrategia de Fragmentación - Cómo se dividen los documentos en fragmentos
- Configuración de Fragmentos - Ajustes de tamaño y superposición para fragmentos
- Ajustes de Mejora de Fragmentos - Enriquecimiento de fragmentos opcional con IA
Acceder a los Ajustes
- Navegue a Knowledge Base en la barra lateral
- Vaya a la sección KB Data
- Haga clic en el icono de Ajustes (icono de engranaje)
- Seleccione la pestaña Settings
Estrategia de Fragmentación
La estrategia de fragmentación determina cómo se dividen los documentos en fragmentos más pequeños y procesables para la incrustación y recuperación.Fragmentación por Oraciones
Divide el texto en fragmentos basándose en los límites de oraciones, asegurando que cada fragmento contenga oraciones completas. Ideal Para:- Documentos de lenguaje natural
- Preservar el contexto de las oraciones
- Contenido de propósito general
- Usa el tokenizador de oraciones para los límites del lenguaje natural
- Asegura que los fragmentos contengan oraciones completas
- Mantiene la legibilidad y el contexto
Fragmentación Semántica
Divide el texto en fragmentos semánticamente significativos, que pueden no alinearse con los límites de las oraciones. Ideal Para:- Documentos complejos
- Preservar el contexto semántico
- Necesidades avanzadas de recuperación
- Determina automáticamente los límites de los fragmentos
- Preserva el significado semántico
- Puede no alinearse con los límites de las oraciones
Configuración de Fragmentos
La configuración de fragmentos aparece cuando selecciona Fragmentación por Oraciones. Esto le permite ajustar cómo se dividen los documentos.Tamaño del Fragmento
El tamaño máximo de cada fragmento en tokens/caracteres. Predeterminado: 64 Recomendación: 64-512 tokens para la mayoría de los casos de uso Consideraciones:- Los fragmentos más grandes preservan más contexto pero pueden ser menos precisos para la recuperación
- Los fragmentos más pequeños son más precisos pero pueden perder contexto
- Equilibrio entre preservación de contexto y precisión de recuperación
- Seleccione Fragmentación por Oraciones como su estrategia de fragmentación
- Ingrese el tamaño de fragmento deseado en el campo Chunk Size
- El valor debe ser al menos 1
Superposición de Fragmentos
El número de tokens/caracteres superpuestos entre fragmentos adyacentes. Esto ayuda a mantener el contexto a través de los límites de los fragmentos. Predeterminado: 6 Recomendación: 10-20% del tamaño de fragmento establecido Consideraciones:- La superposición asegura que la información importante no se divida a través de los límites de los fragmentos
- Demasiada superposición desperdicia almacenamiento y procesamiento
- Demasiada poca superposición puede perder contexto entre fragmentos
- Seleccione Fragmentación por Oraciones como su estrategia de fragmentación
- Ingrese la superposición deseada en el campo Chunk Overlap
- El valor debe ser no negativo y menor que el tamaño del fragmento
- Si el tamaño del fragmento es 64, la superposición recomendada es 6-13 tokens
- Si el tamaño del fragmento es 512, la superposición recomendada es 51-102 tokens
Ajustes de Mejora de Fragmentos
La mejora de fragmentos usa IA para mejorar los fragmentos con contexto adicional y metadatos para una mejor recuperación.Enriquecimiento de Fragmentos
Habilite el enriquecimiento de fragmentos para mejorar los fragmentos con contexto adicional para una mejor recuperación. Beneficios:- Mejor precisión de búsqueda
- Comprensión de contexto mejorada
- Calidad de recuperación mejorada
- Active el interruptor Chunk Enrichment
- Seleccione un Modelo LLM para el enriquecimiento (requerido cuando está habilitado)
- Guarde los ajustes
- Aumenta el tiempo de procesamiento
- Requiere selección del modelo LLM
- Agrega costo computacional
- Mejora la calidad de búsqueda
Selección del Modelo LLM
Cuando el enriquecimiento de fragmentos está habilitado, debe seleccionar un modelo LLM para el enriquecimiento de fragmentos y el análisis de contenido. Modelos Disponibles:- Todos los modelos predefinidos (GPT-4o, Claude, Gemini, etc.)
- Modelos personalizados configurados en su proyecto
- Habilite Chunk Enrichment
- Haga clic en el menú desplegable LLM Model
- Seleccione el modelo deseado de la lista
- Guarde los ajustes
- Use modelos con sólidas capacidades de razonamiento para un mejor enriquecimiento
- Considere las compensaciones entre tiempo de procesamiento y calidad
- Pruebe diferentes modelos para encontrar el más adecuado para su contenido
Guardar y Aplicar Ajustes
Guardar Ajustes
Guarda su configuración pero solo se aplica a documentos nuevos sincronizados o agregados a partir de ahora. Pasos:- Configure sus ajustes
- Haga clic en Save Settings
- Los ajustes se guardan en la base de datos
- Los documentos nuevos usarán estos ajustes
Aplicar a Todos los Documentos
Re-indexa todos los documentos existentes en su base de conocimiento con los ajustes actuales. Pasos:- Configure y guarde sus ajustes
- Haga clic en Apply to All Documents
- Confirme la acción en el modal
- Monitoree el progreso a medida que los documentos se vuelven a sincronizar
- Todos los documentos se vuelven a sincronizar con los nuevos ajustes
- Los fragmentos se regeneran con la nueva configuración
- Las incrustaciones se actualizan
- El proceso se ejecuta en segundo plano
- Actualizaciones en tiempo real del estado de sincronización de documentos
- Estado de éxito/fallo para cada documento
- Indicador de archivos totales procesados
Mejores Prácticas
Selección de Estrategia de Fragmentación
- Comience con Fragmentación por Oraciones - Ideal para la mayoría de los casos de uso
- Use Fragmentación Semántica - Para documentos complejos o técnicos
- Pruebe Ambas - Compare la calidad de recuperación para su contenido
Configuración del Tamaño del Fragmento
- Comience con el Predeterminado (64) - Buen punto de partida para la mayoría del contenido
- Aumente para Contenido Rico en Contexto - Documentos que requieren más contexto
- Reduzca para Recuperación Precisa - Cuando las coincidencias exactas son importantes
- Pruebe Diferentes Tamaños - Encuentre el tamaño óptimo para su caso de uso
Configuración de Superposición de Fragmentos
- Use 10-20% del Tamaño del Fragmento - Rango recomendado
- Aumente para Información Crítica - Cuando el contexto es esencial
- Reduzca para Eficiencia de Almacenamiento - Cuando el almacenamiento es una preocupación
- Equilibre Contexto vs. Eficiencia - Encuentre el punto óptimo
Enriquecimiento de Fragmentos
- Habilite para Contenido Complejo - Cuando la fragmentación simple no es suficiente
- Seleccione el Modelo Apropiado - Use modelos con sólido razonamiento
- Monitoree el Rendimiento - Observe aumentos en el tiempo de procesamiento
- Pruebe Mejoras de Calidad - Verifique la calidad de recuperación mejorada
Solución de Problemas
Ajustes No Aplicados
Problema: Los ajustes se guardaron pero los documentos no usan la nueva configuración Soluciones:- Haga clic en Apply to All Documents para re-indexar documentos existentes
- Verifique que los ajustes se guardaron correctamente
- Compruebe si los documentos nuevos están usando los ajustes
- Espere a que la sincronización en segundo plano se complete
Mala Calidad de Recuperación
Problema: El agente de IA no encuentra información relevante Soluciones:- Ajuste el tamaño del fragmento (intente fragmentos más grandes para más contexto)
- Aumente la superposición de fragmentos
- Habilite el enriquecimiento de fragmentos
- Pruebe diferentes estrategias de fragmentación
Problemas de Tiempo de Procesamiento
Problema: Los documentos tardan demasiado en procesarse Soluciones:- Reduzca el tamaño del fragmento
- Deshabilite el enriquecimiento de fragmentos
- Use modelos LLM más rápidos para el enriquecimiento
- Verifique el tamaño y complejidad del documento
Características Relacionadas
- Conectores - Integre fuentes de datos externas
- Rastreadores - Obtenga contenido web automáticamente
- Sincronización y Programación - Gestione las programaciones de sincronización
- Plantillas - Cree plantillas de respuesta
Conectores
Aprenda sobre la conexión de fuentes de datos externas
Rastreadores
Aprenda sobre rastreadores web
Sincronización y Programación
Aprenda sobre la programación de sincronización