"D'avoir de meilleures données d'entraînement, plus pertinentes, ça reste le nerf de la guerre, même avec les plus gros modèles."
 

 Le D.E.V. de la semaine est Guillaume Laforge, Developer Advocate AI chez Google. Dans cet épisode, Guillaume revient sur l'évolution du RAG, loin d'être enterré malgré l'agrandissement des fenêtres de contexte des LLM. Il partage pourquoi, même avec un million de tokens, les besoins des entreprises dépassent largement les capacités actuelles des modèles. On parle de découpage sémantique, de context engineering et des nouveaux défis liés à la hiérarchisation des données. Enfin, Guillaume détaille comment, face à la multiplication des données et la chasse à la pertinence, la qualité prime sur la quantité. Un tour d'horizon pragmatique et technique du futur des architectures RAG.
 Chapitrages00:00:53 : Introduction Inspirante
 00:01:59 : Présentation de Guillaume
 00:03:44 : &Eacutevolution du RAG
 00:05:13 : Importance du Chunking
 00:10:26 : Techniques de Tokenisation
 00:13:09 : Avantages de Notion
 00:16:18 : Modèles d'Embedding Multilingues
 00:18:03 : Recommandations de Modèles
 00:19:47 : Pertinence des Questions
 00:23:42 : Approche des Questions Générées
 00:30:18 : Hybridation des Contextes
 00:32:17 : &Eacutemergence du Contexte Engineering
 00:35:07 : Co&ucircts de l'Inférence
 00:38:51 : Qualité des Données
 00:40:40 : Recommandations et Cl&ocircture
 

Liens évoqués pendant l'émission
Glaforge.dev: Site de Guillaume avec tous ses articles autour du RAG
 

 
 
 
 
 🎙️ Soutenez le podcast If This Then Dev ! 🎙️ Chaque contribution aide à maintenir et améliorer nos épisodes. Cliquez ici pour nous soutenir sur Tipeee 🙏
 
 Retrouvez toutes les expertises de tous les experts et expertes passées dans IFTTD directement dans votre IDE avec le MCP IFTTD !
 
 Archives | Site | Boutique | TikTok | Discord | LinkedIn | Instagram | Youtube | Twitch | 
 
 
 Hébergé par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.

IFTTD - If This Then Dev

Bruno Soulez | Orso Media

#361.src - RAG: Pourquoi le RAG n'est pas mort (et ne le sera pas de sitôt) avec Guillaume Laforge

JUN 17, 202643 MIN
IFTTD - If This Then Dev

#361.src - RAG: Pourquoi le RAG n'est pas mort (et ne le sera pas de sitôt) avec Guillaume Laforge

JUN 17, 202643 MIN

Description

"D'avoir de meilleures données d'entraînement, plus pertinentes, ça reste le nerf de la guerre, même avec les plus gros modèles." Le D.E.V. de la semaine est Guillaume Laforge, Developer Advocate AI chez Google. Dans cet épisode, Guillaume revient sur l'évolution du RAG, loin d'être enterré malgré l'agrandissement des fenêtres de contexte des LLM. Il partage pourquoi, même avec un million de tokens, les besoins des entreprises dépassent largement les capacités actuelles des modèles. On parle de découpage sémantique, de context engineering et des nouveaux défis liés à la hiérarchisation des données. Enfin, Guillaume détaille comment, face à la multiplication des données et la chasse à la pertinence, la qualité prime sur la quantité. Un tour d'horizon pragmatique et technique du futur des architectures RAG.Chapitrages00:00:53 : Introduction Inspirante00:01:59 : Présentation de Guillaume00:03:44 : Évolution du RAG00:05:13 : Importance du Chunking00:10:26 : Techniques de Tokenisation00:13:09 : Avantages de Notion00:16:18 : Modèles d'Embedding Multilingues00:18:03 : Recommandations de Modèles00:19:47 : Pertinence des Questions00:23:42 : Approche des Questions Générées00:30:18 : Hybridation des Contextes00:32:17 : Émergence du Contexte Engineering00:35:07 : Coûts de l'Inférence00:38:51 : Qualité des Données00:40:40 : Recommandations et Clôture Liens évoqués pendant l'émission Glaforge.dev: Site de Guillaume avec tous ses articles autour du RAG 🎙️ Soutenez le podcast If This Then Dev ! 🎙️ Chaque contribution aide à maintenir et améliorer nos épisodes. Cliquez ici pour nous soutenir sur Tipeee 🙏Retrouvez toutes les expertises de tous les experts et expertes passées dans IFTTD directement dans votre IDE avec le MCP IFTTD !Archives | Site | Boutique | TikTok | Discord | LinkedIn | Instagram | Youtube | Twitch | Hébergé par Audiomeans. Visitez audiomeans.fr/politique-de-confidentialite pour plus d'informations.