Stage

STAGE - Assistant Data Scientist – Confidentialité des IA Génératives textuelles H/F

Modifiée le 29/04/2024

  • Montrouge - France
  • IT, Digital et Data
  • 2023-82104

Description du poste

Contexte et objectif du stage :

 Les modèles de langage génératifs, tels que les grands modèles de langage (LLM), ont récemment connu un essor considérable dans de nombreux domaines, tels que la traduction, la génération et la synthèse de texte, ou encore la réponse aux questions. Ces modèles sont entraînés sur des ensembles de données textuelles très volumineux, ce qui leur permet de générer des textes cohérents et pertinents. Cependant, il a été démontré que ces modèles de langage génératifs sont vulnérables à des attaques permettant de reconstituer une partie des données sur lesquelles ils ont été entraînés.

 Le stage proposé vise dans un premier temps à étudier les vulnérabilités des modèles de langage génératifs, finetunés sur des données confidentielles, aux attaques de reconstruction des données d'entraînement ; et dans un second temps à explorer les techniques de défense pour protéger ces données.

 

 Dans l’objectif de livrer des fonctionnalités nativement industrielles, déployables en production, les stages se déroulent :

 

  • Sous l’encadrement d’experts Data/IA au sein d’une Squad pluridisciplinaire (IA Documentaire),
  • Avec un Chef de Projet référent fonctionnel,
  • Et selon la méthode Projet du DataLab Groupe qui fait l’objet d’une certification.

 

Les étapes clés du stage sont les suivantes :

  • Veille bibliographique sur la problématique des attaques de reconstruction des données d’entraînement,
  • Sélection et implémentation des approches les plus adaptées pour protéger les données d’entrainement,
  • Réalisation d’une étude comparative sur des données internes et externes,
  • Intégration des développements dans les produits du DataLab Groupe,
  • Documentation rigoureuse du stage pour faciliter la reproductibilité et la capitalisation des connaissances acquises,
  • Publication scientifique si les travaux aboutissent à de nouvelles approches plus performantes que l’état de l’art.

    • Date de prise de fonction
    • 01/04/2023
    • Durée
    • 6 mois
    • Poste avec management
    • Non
    • Cadre / Non Cadre
    • Non cadre
    • Niveau d'étude minimum
    • Bac + 5 / M2 et plus
    • Formation / Spécialisation
    • ☒Université ☒Ecole d’ingénieurSpécialisation data science avec une dominante traitement de langage naturel (NLP), deep Learning et développement logiciel.
    • Niveau d'expérience minimum
    • 0 - 2 ans
    • Compétences recherchées
    • Compétences techniques ou spécifiques au poste :
      • Deep Learning
      • Traitement de langage naturel
      • Développement python
       Compétences générales et transverses :
      • Grande rigueur et autonomie
      • Aptitude pour le travail en équipe
    • Outils informatiques
    • PyTorch, NLTK, Hugging Face, ONNX, etc.
    • Langues
    • Français
  • Rejoignez une entreprise au cœur des activités du groupe Crédit Agricole, de ses évolutions et de sa transformation. Holding et société cotée du Groupe, Crédit Agricole S.A assure la coordination, la cohérence et les synergies entre les entités pour porter les ambitions du Projet du Groupe. Les missions confiées à nos collaborateurs offrent une vision transversale des enjeux économiques et stratégiques du Groupe. En agissant chaque jour dans l'intérêt de la société, nous sommes un groupe engagé en faveur des diversités et de l'inclusion. Tous nos postes sont ouverts aux personnes en situation de handicap.

Crédit Agricole S.A.
Crédit Agricole S.A.
Crédit Agricole S.A.

Crédit Agricole S.A.

STAGE - Assistant Data Scientist – Confidentialité des IA Génératives textuelles H/F

Publiée le 19/09/2023

Stage
  • Montrouge - France
  • IT, Digital et Data
  • 2023-82104
Rejoignez
-nous

Nos avantages

Avantages

Nous proposons de nombreux services et avantages afin de veiller à un bon équilibre entre vie personnelle et vie professionnelle : CSE, aides et services aux familles, complémentaire santé, avantages bancaires, conciergerie, salles de sport.

Intégration et Formation

Nous accompagnons nos collaborateurs dans la découverte de leur environnement professionnel afin de faciliter leur intégration au sein du campus et de notre entité. Nos collaborateurs accèdent à une offre de formation complète afin de développer leurs compétences tout au long de leur parcours professionnel.

Cadre de travail

Nos campus sont situés à Montrouge (92) et Saint-Quentin-en-Yvelines (78), au cœur de vastes espaces verts. Nos locaux sont contemporains, équipés des dernières technologies et de « meeting centers ». Le site propose plusieurs cafétérias et restaurants d’entreprise. Pour permettre plus de flexibilité dans l’organisation du travail, nos collaborateurs disposent de jours de travail à distance.

Ces offres pourraient vous intéresser !