Options

Token d'authentification (requis)

Si le serveur a été démarré avec un token d'authentification (variable d'environnement RAG_AUTH_TOKEN), il faut le coller ici pour pouvoir poser des questions. Le token est conservé localement dans le navigateur (localStorage) — pas besoin de le ressaisir à chaque visite.

Qu'est-ce qu'un RAG ?

Le RAG, ou Retrieval-Augmented Generation (génération augmentée par récupération), est une architecture d'intelligence artificielle qui améliore la précision des modèles de langage (LLM) en les connectant à des sources de connaissances externes. Elle permet d'éviter les « hallucinations » et de fournir des réponses basées sur des données à jour et spécifiques.

Fonctionnement : le système cherche d'abord des informations pertinentes dans une base de données (documents, transcriptions, web) avant de générer une réponse — comme une IA qui aurait accès à une bibliothèque.

En résumé, le RAG permet de faire passer l'IA d'un examen « de mémoire » à un examen « à livre ouvert », garantissant des réponses plus fiables et traçables.

À quoi sert le seuil ?

Le seuil est la valeur minimale de pertinence (score de fusion dense + sparse, entre 0 et 1) qu'un extrait doit atteindre pour être retenu comme source. Plus le seuil est élevé, plus le filtrage est strict.

Seuil bas (0 – 0.20) : beaucoup d'extraits remontent, dont certains faiblement reliés.
Seuil moyen (0.25 – 0.40) : compromis usuel, on garde les passages vraiment pertinents (défaut : 0.30).
Seuil haut (0.5 et +) : très strict ; seuls les extraits qui matchent presque parfaitement remontent, parfois aucun.

Si la réponse manque de matière, baisse le seuil. Si elle dérive sur des passages hors sujet, monte-le.

Seuil

0.30

Suivre la réponse en défilant

Suggestions « Pour aller plus loin »

Exporter la conversation

Contexte LLM

— / 256 K

Discussions enregistrées

Aucune discussion enregistrée.

Documentation de l'API ↗

RAG - Eckhart Tolle