Passer au contenu principal
Le toolkit Base de connaissances (KB) est la pierre angulaire des applications d’IA personnalisées. Il implémente la génération augmentée par récupération (RAG) pour permettre à l’agent de « lire » et de référencer vos données propriétaires. Sans cela, un agent repose uniquement sur ses données de pré-entraînement ; avec cet outil, l’agent devient un expert sur vos documents spécifiques.

Explication de la technologie RAG

Lorsque vous téléversez un fichier sur la plateforme, il est traité via un pipeline sophistiqué. Tout d’abord, l’extraction de texte récupère le texte brut à partir de PDF, DOCX et d’autres formats, en appliquant l’OCR aux images numérisées si nécessaire. Ensuite, le découpage en blocs divise le texte en segments plus petits et gérables. Puis, l’encodage convertit chaque bloc en un vecteur (une liste de nombres représentant le sens) à l’aide d’un modèle d’encodage. Enfin, le stockage enregistre ces vecteurs dans une base de données vectorielle. Lorsqu’un agent effectue une recherche, la requête est également encodée, et la base de données trouve les blocs avec la proximité mathématique la plus proche (sens) par rapport à la requête.

Panneau de configuration

Panneau de configuration de la Base de connaissances affichant les connexions et la sélection d'outils
  • Base de connaissances du projet en cours : Activée par défaut, accordant l’accès aux fichiers de l’espace de travail actuel.
  • Accès inter-projets : Permet de lier des KB depuis d’autres projets (par exemple, un projet central « Politiques de l’entreprise »).
  • Description : Les métadonnées décrivant le contenu de la KB aident l’agent à décider quand utiliser cet outil.
  • Citation avancée (+1 crédit) : Si activée, l’agent fournit des citations en ligne rigoureuses liées au texte source.
ModeDescriptionCoûtRecommandé pour
Citation standardRéférence le nom du document et les blocs en utilisant la similarité cosinus. Inclus.InclusQuestions-réponses générales, recherches rapides
Citation avancéeFournit une référence exacte page/paragraphe avec citation+1 crédit par requêteConformité, Juridique, Audit

Sous-outils disponibles

  • Outil de recherche : L’outil principal pour la récupération sémantique. Trouve des informations pertinentes même si les mots-clés ne correspondent pas exactement.
  • Outil de recherche de fichiers : Une recherche par métadonnées pour trouver des fichiers spécifiques par nom plutôt que par contenu.
  • Outil de lecture de lignes : Extrait le texte brut d’un fichier spécifique. Utile lorsque l’agent doit lire un chapitre ou une section entière en détail.
  • Outil de statistiques de fichier : Retourne les métadonnées : taille du fichier, auteur, date de création, nombre de pages.
  • Outil d’arborescence de fichiers : Lister la structure des répertoires. Essentiel pour que les agents explore une nouvelle KB et comprenne l’organisation des fichiers.

Exemples d’implémentation

  • Filtrage de CV : L’agent recherche « expérience Python » dans tous les PDF téléversés, récupère les blocs pertinents différents CV et résume les meilleurs candidats.
  • Questions-réponses sur les politiques : L’utilisateur demande « Puis-je rembourser un taxi ? ». L’agent recherche la « Politique de déplacement », trouve la section transport terrestre et répond « Oui, s’il s’agit d’un déplacement client, conformément à la section 4.2. »
  • Support technique : L’agent recherche dans les manuels techniques pour trouver les codes d’erreur et les étapes de dépannage.