L’objectif du stage est d’améliorer la plateforme interne de Rerieval Augmented Generation (RAG), appelée CA Generative Search (CAGS) et déjà déployée en production pour de multiples métiers, en participant aux développements de nouvelles fonctionnalités. Vous serez amené(e) à intervenir sur différentes problématiques :
- Développer et tester des connecteurs à différentes sources de données ;
- Implémenter et tester un processus d’appels asynchrones aux modèles LLM et bases de données ;
- Améliorer le système de cache.
Le stage vise à identifier et comparer différentes techniques et stratégies pour optimiser la plateforme CAGS et à travailler conjointement avec un autre stagiaire data scientist sur des pistes d’amélioration de ses performances algorithmiques.
Dans l’objectif de livrer des fonctionnalités intégrables au sein des solutions industrielles en production, les stages se déroulent sous l’encadrement d’experts IA au sein d’une Squad pluridisciplinaire ayant comme référent fonctionnel un chef de projet IA, et selon la méthode Projet du DataLab Groupe qui fait l’objet d’une certification IA de confiance et d’une labélisation RSE.
Les étapes clés du stage sont les suivantes :
- Veille bibliographique sur la problématique ;
- Sélection et implémentation des approches les plus adaptées à la problématique ;
- Réalisation d’une étude comparative sur des données internes et externes ;
- Intégration des développements dans les produits du DataLab Groupe ;
- Publication scientifique si les travaux aboutissent à de nouvelles approches plus performantes que l’état de l’art.
Vous aurez accès à des environnements d’engineering industriel puissants et à l’état de l’art, en local et dans le cloud.
Les modèles seront évalués sur des données internes (annotées si besoin) ainsi que des données externes (open-data), et seront intégrés dans les produits et services IA en production.
Des interactions avec l’ensemble des équipes data science et engineering et des experts métier du Groupe auront lieu.