Passer au contenu principal
L’onglet Paramètres dans les paramètres de la base de connaissances vous permet de configurer la manière dont vos documents sont traités et segmentés. Ces paramètres contrôlent la façon dont le contenu est divisé en segments, ce qui affecte la manière dont l’agent IA récupère et utilise les informations de votre base de connaissances.

Aperçu

L’onglet Paramètres comprend :
  • Stratégie de segmentation - Comment les documents sont divisés en segments
  • Configuration des segments - Paramètres de taille et de chevauchement des segments
  • Paramètres d’amélioration des segments - Enrichissement des segments alimenté par l’IA en option

Accès aux paramètres

  1. Accédez à Base de connaissances dans la barre latérale
  2. Allez à la section Données KB
  3. Cliquez sur l’icône Paramètres (icône d’engrenage)
  4. Sélectionnez l’onglet Paramètres

Stratégie de segmentation

La stratégie de segmentation détermine comment les documents sont divisés en segments plus petits et traitables pour l’intégration et la récupération.

Segmentation par phrases

Divise le texte en segments basés sur les limites des phrases, en s’assurant que chaque segment contient des phrases complètes. Idéal pour :
  • Les documents en langage naturel
  • La préservation du contexte des phrases
  • Le contenu à usage général
Configuration :
  • Utilise un tokeniseur de phrases pour les limites du langage naturel
  • Assure que les segments contiennent des phrases complètes
  • Maintient la lisibilité et le contexte

Segmentation sémantique

Divise le texte en segments sémantiquement significatifs, qui peuvent ne pas s’aligner avec les limites des phrases. Idéal pour :
  • Les documents complexes
  • La préservation du contexte sémantique
  • Les besoins de récupération avancés
Configuration :
  • Détermine automatiquement les limites des segments
  • Préserve le sens sémantique
  • Peut ne pas s’aligner avec les limites des phrases

Configuration des segments

La configuration des segments apparaît lorsque vous sélectionnez Segmentation par phrases. Cela vous permet d’affiner la façon dont les documents sont divisés.

Taille du segment

La taille maximale de chaque segment en jetons/caractères. Par défaut : 64 Recommandation : 64-512 jetons pour la plupart des cas d’usage Considérations :
  • Les segments plus grands préservent plus de contexte mais peuvent être moins précis pour la récupération
  • Les segments plus petits sont plus précis mais peuvent perdre le contexte
  • Équilibre entre la préservation du contexte et la précision de la récupération
Comment configurer :
  1. Sélectionnez Segmentation par phrases comme stratégie de segmentation
  2. Entrez la taille de segment souhaitée dans le champ Taille du segment
  3. La valeur doit être au moins 1

Chevauchement des segments

Le nombre de jetons/caractères qui se chevauchent entre les segments adjacents. Cela aide à maintenir le contexte sur les limites des segments. Par défaut : 6 Recommandation : 10-20 % de la taille du segment défini Considérations :
  • Le chevauchement assure que les informations importantes ne sont pas divisées sur les limites des segments
  • Trop de chevauchement gaspille le stockage et le traitement
  • Trop peu de chevauchement peut perdre le contexte entre les segments
Comment configurer :
  1. Sélectionnez Segmentation par phrases comme stratégie de segmentation
  2. Entrez le chevauchement souhaité dans le champ Chevauchement des segments
  3. La valeur doit être non négative et inférieure à la taille du segment
Exemple :
  • Si la taille du segment est 64, le chevauchement recommandé est 6-13 jetons
  • Si la taille du segment est 512, le chevauchement recommandé est 51-102 jetons

Paramètres d’amélioration des segments

L’amélioration des segments utilise l’IA pour améliorer les segments avec un contexte et des métadonnées supplémentaires pour une meilleure récupération.

Enrichissement des segments

Activez l’enrichissement des segments pour améliorer les segments avec un contexte supplémentaire pour une meilleure récupération. Avantages :
  • Meilleure précision de recherche
  • Compréhension améliorée du contexte
  • Qualité de récupération améliorée
Comment activer :
  1. Basculez le commutateur Enrichissement des segments pour l’activer
  2. Sélectionnez un Modèle LLM pour l’enrichissement (requis lorsqu’il est activé)
  3. Enregistrez les paramètres
Considérations :
  • Augmente le temps de traitement
  • Nécessite la sélection d’un modèle LLM
  • Ajoute un coût de calcul
  • Améliore la qualité de la recherche

Sélection du modèle LLM

Lorsque l’enrichissement des segments est activé, vous devez sélectionner un modèle LLM pour l’enrichissement des segments et l’analyse du contenu. Modèles disponibles :
  • Tous les modèles prédéfinis (GPT-4o, Claude, Gemini, etc.)
  • Modèles personnalisés configurés dans votre projet
Comment sélectionner :
  1. Activez Enrichissement des segments
  2. Cliquez sur le menu déroulant Modèle LLM
  3. Sélectionnez le modèle souhaité dans la liste
  4. Enregistrez les paramètres
Conseils de sélection du modèle :
  • Utilisez des modèles avec de fortes capacités de raisonnement pour un meilleur enrichissement
  • Considérez les compromis entre le temps de traitement et la qualité
  • Testez différents modèles pour trouver le meilleur pour votre contenu

Sauvegarde et application des paramètres

Enregistrer les paramètres

Enregistre votre configuration mais ne s’applique qu’aux nouveaux documents synchronisés ou ajoutés à l’avenir. Étapes :
  1. Configurez vos paramètres
  2. Cliquez sur Enregistrer les paramètres
  3. Les paramètres sont sauvegardés dans la base de données
  4. Les nouveaux documents utiliseront ces paramètres
Les paramètres enregistrés s’appliquent uniquement aux nouveaux documents. Les documents existants continuent d’utiliser leur configuration de segmentation d’origine.

Appliquer à tous les documents

Réindexe tous les documents existants de votre base de connaissances avec les paramètres actuels. Étapes :
  1. Configurez et enregistrez vos paramètres
  2. Cliquez sur Appliquer à tous les documents
  3. Confirmez l’action dans la fenêtre modale
  4. Surveillez la progression à mesure que les documents sont resynchronisés
Ce qui se passe :
  • Tous les documents sont resynchronisés avec les nouveaux paramètres
  • Les segments sont régénérés avec la nouvelle configuration
  • Les intégrations sont mises à jour
  • Le processus s’exécute en arrière-plan
Suivi de la progression :
  • Mises à jour en temps réel sur l’état de la synchronisation des documents
  • État de réussite/échec pour chaque document
  • Indicateur du total des fichiers traités
L’application de paramètres à tous les documents peut prendre un temps considérable en fonction du nombre de documents. Ce processus ne peut pas être annulé une fois lancé.

Meilleures pratiques

Sélection de la stratégie de segmentation

  1. Commencez par la segmentation par phrases - Meilleure pour la plupart des cas d’usage
  2. Utilisez la segmentation sémantique - Pour les documents complexes ou techniques
  3. Testez les deux - Comparez la qualité de la récupération pour votre contenu

Configuration de la taille du segment

  1. Commencez par le paramètre par défaut (64) - Bonne base de référence pour la plupart du contenu
  2. Augmentez pour le contenu riche en contexte - Documents nécessitant plus de contexte
  3. Réduisez pour une récupération précise - Lorsque les correspondances exactes sont importantes
  4. Testez différentes tailles - Trouvez la taille optimale pour votre cas d’usage

Configuration du chevauchement des segments

  1. Utilisez 10-20 % de la taille du segment - Plage recommandée
  2. Augmentez pour les informations critiques - Lorsque le contexte est essentiel
  3. Réduisez pour l’efficacité du stockage - Lorsque le stockage est une préoccupation
  4. Équilibrez le contexte et l’efficacité - Trouvez le juste équilibre

Enrichissement des segments

  1. Activez pour le contenu complexe - Lorsque la segmentation simple n’est pas suffisante
  2. Sélectionnez le modèle approprié - Utilisez des modèles avec un fort raisonnement
  3. Surveillez les performances - Soyez attentif aux augmentations du temps de traitement
  4. Testez les améliorations de qualité - Vérifiez la qualité améliorée de la récupération

Dépannage

Paramètres non appliqués

Problème : Paramètres sauvegardés mais documents n’utilisant pas la nouvelle configuration Solutions :
  1. Cliquez sur Appliquer à tous les documents pour réindexer les documents existants
  2. Vérifiez que les paramètres ont été sauvegardés correctement
  3. Vérifiez si les nouveaux documents utilisent les paramètres
  4. Attendez que la synchronisation en arrière-plan se termine

Qualité de récupération médiocre

Problème : L’agent IA ne trouve pas les informations pertinentes Solutions :
  1. Ajustez la taille du segment (essayez des segments plus grands pour plus de contexte)
  2. Augmentez le chevauchement des segments
  3. Activez l’enrichissement des segments
  4. Testez différentes stratégies de segmentation

Problèmes de temps de traitement

Problème : Les documents prennent trop de temps à traiter Solutions :
  1. Réduisez la taille du segment
  2. Désactivez l’enrichissement des segments
  3. Utilisez des modèles LLM plus rapides pour l’enrichissement
  4. Vérifiez la taille et la complexité du document

Fonctionnalités associées

  • Connecteurs - Intégrez les sources de données externes
  • Crawlers - Récupérez automatiquement le contenu web
  • Synchronisation et planification - Gérez les calendriers de synchronisation
  • Modèles - Créez des modèles de réponse

Connecteurs

Apprenez à connecter les sources de données externes

Crawlers

Apprenez les crawlers web

Synchronisation et planification

Apprenez la planification de la synchronisation