Génération augmentée par récupération
Avantages de la RAG dans la conception d’un agent :
réduire ses hallucinations
lui fournir des données récentes à moindre coût
pouvoir modifier / supprimer ses informations facilement
Principe de la RAG :
récupérer des passages à partir de documents
qui sont proches du contexte sémantique d’une invite
et les envoyer avec l’ invite à un LLM pour la génération .
Préparation des documents :
nous les découpons en passages , selon une stratégie contrôlée
nous calculons le vecteur de chaque passage .
nous stockons :
le document
les vecteurs et les informations nécessaires pour récupérer les passages
Mécanisme de récupération des passages pertinents :
recherche vectorielle (aussi appelée recherche sémantique ) :
leurs vecteurs sont proches du vecteur de l’invite à compléter.
Mécanisme d’ envoi au LLM :
le texte des passages est ajouté à l’invite initiale
tout est envoyé au LLM comme une invite standard .