Le RAG, ou Retrieval-Augmented Generation
(génération augmentée par récupération), est une architecture
d'intelligence artificielle qui améliore la précision des
modèles de langage (LLM) en les connectant à des sources de
connaissances externes. Elle permet d'éviter les
« hallucinations » et de fournir des réponses basées sur des
données à jour et spécifiques.
Fonctionnement : le système cherche d'abord
des informations pertinentes dans une base de données
(documents, transcriptions, web) avant de générer une réponse —
comme une IA qui aurait accès à une bibliothèque.
En résumé, le RAG permet de faire passer l'IA d'un examen
« de mémoire » à un examen « à livre ouvert », garantissant
des réponses plus fiables et traçables.