Aperçu
L’onglet Paramètres comprend :- Stratégie de segmentation - Comment les documents sont divisés en segments
- Configuration des segments - Paramètres de taille et de chevauchement des segments
- Paramètres d’amélioration des segments - Enrichissement des segments alimenté par l’IA en option
Accès aux paramètres
- Accédez à Base de connaissances dans la barre latérale
- Allez à la section Données KB
- Cliquez sur l’icône Paramètres (icône d’engrenage)
- Sélectionnez l’onglet Paramètres
Stratégie de segmentation
La stratégie de segmentation détermine comment les documents sont divisés en segments plus petits et traitables pour l’intégration et la récupération.Segmentation par phrases
Divise le texte en segments basés sur les limites des phrases, en s’assurant que chaque segment contient des phrases complètes. Idéal pour :- Les documents en langage naturel
- La préservation du contexte des phrases
- Le contenu à usage général
- Utilise un tokeniseur de phrases pour les limites du langage naturel
- Assure que les segments contiennent des phrases complètes
- Maintient la lisibilité et le contexte
Segmentation sémantique
Divise le texte en segments sémantiquement significatifs, qui peuvent ne pas s’aligner avec les limites des phrases. Idéal pour :- Les documents complexes
- La préservation du contexte sémantique
- Les besoins de récupération avancés
- Détermine automatiquement les limites des segments
- Préserve le sens sémantique
- Peut ne pas s’aligner avec les limites des phrases
Configuration des segments
La configuration des segments apparaît lorsque vous sélectionnez Segmentation par phrases. Cela vous permet d’affiner la façon dont les documents sont divisés.Taille du segment
La taille maximale de chaque segment en jetons/caractères. Par défaut : 64 Recommandation : 64-512 jetons pour la plupart des cas d’usage Considérations :- Les segments plus grands préservent plus de contexte mais peuvent être moins précis pour la récupération
- Les segments plus petits sont plus précis mais peuvent perdre le contexte
- Équilibre entre la préservation du contexte et la précision de la récupération
- Sélectionnez Segmentation par phrases comme stratégie de segmentation
- Entrez la taille de segment souhaitée dans le champ Taille du segment
- La valeur doit être au moins 1
Chevauchement des segments
Le nombre de jetons/caractères qui se chevauchent entre les segments adjacents. Cela aide à maintenir le contexte sur les limites des segments. Par défaut : 6 Recommandation : 10-20 % de la taille du segment défini Considérations :- Le chevauchement assure que les informations importantes ne sont pas divisées sur les limites des segments
- Trop de chevauchement gaspille le stockage et le traitement
- Trop peu de chevauchement peut perdre le contexte entre les segments
- Sélectionnez Segmentation par phrases comme stratégie de segmentation
- Entrez le chevauchement souhaité dans le champ Chevauchement des segments
- La valeur doit être non négative et inférieure à la taille du segment
- Si la taille du segment est 64, le chevauchement recommandé est 6-13 jetons
- Si la taille du segment est 512, le chevauchement recommandé est 51-102 jetons
Paramètres d’amélioration des segments
L’amélioration des segments utilise l’IA pour améliorer les segments avec un contexte et des métadonnées supplémentaires pour une meilleure récupération.Enrichissement des segments
Activez l’enrichissement des segments pour améliorer les segments avec un contexte supplémentaire pour une meilleure récupération. Avantages :- Meilleure précision de recherche
- Compréhension améliorée du contexte
- Qualité de récupération améliorée
- Basculez le commutateur Enrichissement des segments pour l’activer
- Sélectionnez un Modèle LLM pour l’enrichissement (requis lorsqu’il est activé)
- Enregistrez les paramètres
- Augmente le temps de traitement
- Nécessite la sélection d’un modèle LLM
- Ajoute un coût de calcul
- Améliore la qualité de la recherche
Sélection du modèle LLM
Lorsque l’enrichissement des segments est activé, vous devez sélectionner un modèle LLM pour l’enrichissement des segments et l’analyse du contenu. Modèles disponibles :- Tous les modèles prédéfinis (GPT-4o, Claude, Gemini, etc.)
- Modèles personnalisés configurés dans votre projet
- Activez Enrichissement des segments
- Cliquez sur le menu déroulant Modèle LLM
- Sélectionnez le modèle souhaité dans la liste
- Enregistrez les paramètres
- Utilisez des modèles avec de fortes capacités de raisonnement pour un meilleur enrichissement
- Considérez les compromis entre le temps de traitement et la qualité
- Testez différents modèles pour trouver le meilleur pour votre contenu
Sauvegarde et application des paramètres
Enregistrer les paramètres
Enregistre votre configuration mais ne s’applique qu’aux nouveaux documents synchronisés ou ajoutés à l’avenir. Étapes :- Configurez vos paramètres
- Cliquez sur Enregistrer les paramètres
- Les paramètres sont sauvegardés dans la base de données
- Les nouveaux documents utiliseront ces paramètres
Appliquer à tous les documents
Réindexe tous les documents existants de votre base de connaissances avec les paramètres actuels. Étapes :- Configurez et enregistrez vos paramètres
- Cliquez sur Appliquer à tous les documents
- Confirmez l’action dans la fenêtre modale
- Surveillez la progression à mesure que les documents sont resynchronisés
- Tous les documents sont resynchronisés avec les nouveaux paramètres
- Les segments sont régénérés avec la nouvelle configuration
- Les intégrations sont mises à jour
- Le processus s’exécute en arrière-plan
- Mises à jour en temps réel sur l’état de la synchronisation des documents
- État de réussite/échec pour chaque document
- Indicateur du total des fichiers traités
Meilleures pratiques
Sélection de la stratégie de segmentation
- Commencez par la segmentation par phrases - Meilleure pour la plupart des cas d’usage
- Utilisez la segmentation sémantique - Pour les documents complexes ou techniques
- Testez les deux - Comparez la qualité de la récupération pour votre contenu
Configuration de la taille du segment
- Commencez par le paramètre par défaut (64) - Bonne base de référence pour la plupart du contenu
- Augmentez pour le contenu riche en contexte - Documents nécessitant plus de contexte
- Réduisez pour une récupération précise - Lorsque les correspondances exactes sont importantes
- Testez différentes tailles - Trouvez la taille optimale pour votre cas d’usage
Configuration du chevauchement des segments
- Utilisez 10-20 % de la taille du segment - Plage recommandée
- Augmentez pour les informations critiques - Lorsque le contexte est essentiel
- Réduisez pour l’efficacité du stockage - Lorsque le stockage est une préoccupation
- Équilibrez le contexte et l’efficacité - Trouvez le juste équilibre
Enrichissement des segments
- Activez pour le contenu complexe - Lorsque la segmentation simple n’est pas suffisante
- Sélectionnez le modèle approprié - Utilisez des modèles avec un fort raisonnement
- Surveillez les performances - Soyez attentif aux augmentations du temps de traitement
- Testez les améliorations de qualité - Vérifiez la qualité améliorée de la récupération
Dépannage
Paramètres non appliqués
Problème : Paramètres sauvegardés mais documents n’utilisant pas la nouvelle configuration Solutions :- Cliquez sur Appliquer à tous les documents pour réindexer les documents existants
- Vérifiez que les paramètres ont été sauvegardés correctement
- Vérifiez si les nouveaux documents utilisent les paramètres
- Attendez que la synchronisation en arrière-plan se termine
Qualité de récupération médiocre
Problème : L’agent IA ne trouve pas les informations pertinentes Solutions :- Ajustez la taille du segment (essayez des segments plus grands pour plus de contexte)
- Augmentez le chevauchement des segments
- Activez l’enrichissement des segments
- Testez différentes stratégies de segmentation
Problèmes de temps de traitement
Problème : Les documents prennent trop de temps à traiter Solutions :- Réduisez la taille du segment
- Désactivez l’enrichissement des segments
- Utilisez des modèles LLM plus rapides pour l’enrichissement
- Vérifiez la taille et la complexité du document
Fonctionnalités associées
- Connecteurs - Intégrez les sources de données externes
- Crawlers - Récupérez automatiquement le contenu web
- Synchronisation et planification - Gérez les calendriers de synchronisation
- Modèles - Créez des modèles de réponse
Connecteurs
Apprenez à connecter les sources de données externes
Crawlers
Apprenez les crawlers web
Synchronisation et planification
Apprenez la planification de la synchronisation