Explication de la technologie RAG
Lorsque vous téléversez un fichier sur la plateforme, il est traité via un pipeline sophistiqué. Tout d’abord, l’extraction de texte récupère le texte brut à partir de PDF, DOCX et d’autres formats, en appliquant l’OCR aux images numérisées si nécessaire. Ensuite, le découpage en blocs divise le texte en segments plus petits et gérables. Puis, l’encodage convertit chaque bloc en un vecteur (une liste de nombres représentant le sens) à l’aide d’un modèle d’encodage. Enfin, le stockage enregistre ces vecteurs dans une base de données vectorielle. Lorsqu’un agent effectue une recherche, la requête est également encodée, et la base de données trouve les blocs avec la proximité mathématique la plus proche (sens) par rapport à la requête.Panneau de configuration

- Base de connaissances du projet en cours : Activée par défaut, accordant l’accès aux fichiers de l’espace de travail actuel.
- Accès inter-projets : Permet de lier des KB depuis d’autres projets (par exemple, un projet central « Politiques de l’entreprise »).
- Description : Les métadonnées décrivant le contenu de la KB aident l’agent à décider quand utiliser cet outil.
- Citation avancée (+1 crédit) : Si activée, l’agent fournit des citations en ligne rigoureuses liées au texte source.
| Mode | Description | Coût | Recommandé pour |
|---|---|---|---|
| Citation standard | Référence le nom du document et les blocs en utilisant la similarité cosinus. Inclus. | Inclus | Questions-réponses générales, recherches rapides |
| Citation avancée | Fournit une référence exacte page/paragraphe avec citation | +1 crédit par requête | Conformité, Juridique, Audit |
Sous-outils disponibles
- Outil de recherche : L’outil principal pour la récupération sémantique. Trouve des informations pertinentes même si les mots-clés ne correspondent pas exactement.
- Outil de recherche de fichiers : Une recherche par métadonnées pour trouver des fichiers spécifiques par nom plutôt que par contenu.
- Outil de lecture de lignes : Extrait le texte brut d’un fichier spécifique. Utile lorsque l’agent doit lire un chapitre ou une section entière en détail.
- Outil de statistiques de fichier : Retourne les métadonnées : taille du fichier, auteur, date de création, nombre de pages.
- Outil d’arborescence de fichiers : Lister la structure des répertoires. Essentiel pour que les agents explore une nouvelle KB et comprenne l’organisation des fichiers.
Exemples d’implémentation
- Filtrage de CV : L’agent recherche « expérience Python » dans tous les PDF téléversés, récupère les blocs pertinents différents CV et résume les meilleurs candidats.
- Questions-réponses sur les politiques : L’utilisateur demande « Puis-je rembourser un taxi ? ». L’agent recherche la « Politique de déplacement », trouve la section transport terrestre et répond « Oui, s’il s’agit d’un déplacement client, conformément à la section 4.2. »
- Support technique : L’agent recherche dans les manuels techniques pour trouver les codes d’erreur et les étapes de dépannage.