Internship/Trainee

STAGE - Assistant(e) Data Scientist – Amélioration de systèmes R.A.G H/F

Modified on 10/12/2024

  • Montrouge - France
  • IT, Digital et Data
  • 2024-92917

Job description

L’objectif du stage est d’améliorer la plateforme interne de Rerieval Augmented Generation (RAG), appelée CA Generative Search (CAGS) et déjà déployée en production pour de multiples métiers, en participant aux développements de nouvelles fonctionnalités. Vous serez amené(e) à intervenir sur différentes problématiques :

    - Améliorer l’étape de recherche du système,

  - Investiguer la problématique de RAG multimodal pour étendre le champ d’application de CAGS, 

  - Investiguer l’apport du finetuning de LLM afin de spécialiser les modèles génératifs pour certains cas d’usage.

 

Après avoir réalisé un état de l’art spécifique à chaque axe de travail, vous devrez comparer les différentes pistes d’amélioration afin de sélectionner les plus pertinentes, avant d’intégrer ses travaux à CAGS, conjointement avec un stagiaire travaillant sur les aspects de Data & AI Engineering.

 

Dans l’objectif de livrer des fonctionnalités intégrables au sein des solutions industrielles en production, les stages se déroulent sous l’encadrement d’experts IA au sein d’une Squad pluridisciplinaire ayant comme référent fonctionnel un chef de projet IA, et selon la méthode Projet du DataLab Groupe qui fait l’objet d’une certification IA de confiance et d’une labélisation RSE.

 

Les étapes clés du stage sont les suivantes :

 

   - Veille bibliographique sur la problématique ;

 - Sélection et implémentation des approches les plus adaptées à la problématique ;

   - Réalisation d’une étude comparative sur des données internes et externes ;

   - Intégration des développements dans les produits du DataLab Groupe ;

  - Publication scientifique si les travaux aboutissent à de nouvelles approches plus performantes que l’état de l’art.

 

Vous aurez accès à des environnements d’engineering industriel puissants et à l’état de l’art, en local et dans le cloud.

 

Les modèles seront évalués sur des données internes (annotées si besoin) ainsi que des données externes (open-data), et seront intégrés dans les produits et services IA en production.

 

Des interactions avec l’ensemble des équipes data science et engineering et des experts métier du Groupe auront lieu.

    • Starting date
    • 01/03/2025
    • Duration
    • 6 mois
    • Position with management
    • No
    • Executive / Non Executive
    • Non cadre
    • Minimum level of study
    • Postgraduate degree – MA/MSc/PhD/Doctorate or equivalent
    • Training / Specialization
    • Université / Ecole d’ingénieur

      Spécialisation : Formation Data Science avec une dominante traitement de langage naturel (NLP), deep learning et développement logiciel.

    • Minimum experience level
    • 0-2 years
    • Compétences recherchées
    • Compétences techniques ou spécifiques au poste :    - Deep Learning   - Traitement du langage naturel   - Développement python  Compétences générales et transverses :    - Grande rigueur et autonomie   - Aptitude pour le travail en équipe
    • IT tools
    • Librairies de développement : PyTorch, NLTK, Hugging Face, Transformers, ONNX
    • Languages
    • Français
  • Join a company at the centre of Crédit Agricole Group activities, evolutions and transformation. As the Group holding listed company and listed company, Crédit Agricole S.A ensures coordination, consistency and synergies between the entities to support the ambitions of the Group Project. The missions of our employees offer a transversal and global view of the Group economic and strategic challenges. By working every day in the interest of society, we are a group committed to diversity and inclusion. All our positions are open to people with disabilities.

Crédit Agricole S.A.
Crédit Agricole S.A.
Crédit Agricole S.A.

Crédit Agricole S.A.

STAGE - Assistant(e) Data Scientist – Amélioration de systèmes R.A.G H/F

Published the 22/11/2024

Internship/Trainee
  • Montrouge - France
  • IT, Digital et Data
  • 2024-92917

These offers may interest you!