Generative AI Rennes #3 - eXplain : Fine-tuning d'un RAG : challenges, arbitrage coût & évaluation.

Опубликовано: 03 Июнь 2024
на канале: Generative AI France

303

Captation vidéo du meetup n°3 de Generative AI Rennes (30 Mai 2024 chez Epitech)

🎤 Benjamin Lion de LaB@se propose une démonstration d'un LLM branché à Whatsapp grâce à Matrix & Synapse.

🎤 Retour d'expérience de Guillaume Barrois, CTO chez eXplain, sur l'implémentation d'une fonctionnalité de RAG permettant de diviser par 10 le temps de lecture des documents administratifs:
Implémenter une fonctionnalité de RAG n'a jamais été aussi rapide. Néanmoins, quand il s'agit de passer d'un POC à la production, de nombreuses questions techniques ou UX émergent. Dans ce talk, Guillaume raconte les challenges rencontrés chez eXplain, en particulier :
•⁠ ⁠l'arbitrages entre les coûts, la latence et la fiabilité des LLMs,
•⁠ ⁠la gestion des problèmes d'hallucination pour garder la confiance des utilisateurs,
•⁠ ⁠l'évaluation d'une fonctionnalité de RAG pour pouvoir itérer rapidement.

👉 Pour rejoindre le meetup Generative AI Rennes : https://www.meetup.com/fr-FR/generati...
👉 Découvrez LaB@se : https://basefab.fr/
👉 Découvrez eXplain : https://www.explain.fr/