Génération augmentée par récupération

 
Avantages de la RAG dans la conception d’un agent :
réduire ses hallucinations
lui fournir des données récentes à moindre coût
pouvoir modifier / supprimer ses informations facilement
 
Principe de la RAG :
récupérer des passages à partir de documents
qui sont proches du contexte sémantique d’une invite
et les envoyer avec l’ invite à un LLM pour la génération .
 
Préparation des documents :
nous les découpons en passages , selon une stratégie contrôlée
nous calculons le vecteur de chaque passage .
nous stockons :
le document
les vecteurs et les informations nécessaires pour récupérer les passages
 
Mécanisme de récupération des passages pertinents :
recherche vectorielle (aussi appelée recherche sémantique ) :
leurs vecteurs sont proches du vecteur de l’invite à compléter.
 
Mécanisme d’ envoi au LLM :
le texte des passages est ajouté à l’invite initiale
tout est envoyé au LLM comme une invite standard .

Envoyer une remarque

Vous avez une question ou une suggestion ? N'hésitez pas à me laisser un message.

0/200
Si vous souhaitez être contacté pour une réponse