Au sein du pôle Innovation & Transformation Digitale, la Direction Data Groupe a pour ambition de maximiser la contribution de la Data et de l’Intelligence Artificielle au fonctionnement du Crédit Agricole. Elle s’appuie pour cela sur la fonction de Chief Data Officer Groupe et le DataLab Groupe, pôle de référence en conception interne de solutions Data & IA innovantes et industrielles en partenariat avec les Caisses régionales, filiales et métiers de Crédit Agricole SA.
Le DataLab Groupe est organisé en 4 équipes spécialisées travaillant sur des projets au sein de Squads pluridisciplinaires selon une méthode interne d’inspiration Agile:
- Data & AI Engineering visant à préparer les données, définir les architectures, infrastructures et «packager» les solutions qui y seront déployées pour intégration dans le SI
- Data Science Analytique et Sémantique qui conçoit des algorithmes d’Intelligence Artificielle basés sur l’open source exploitant respectivement des données structurées (tabulaires) et des données non structurée (texte, image, voix, vidéos) afin de répondre aux besoins exprimés par les métiers des entités du Groupe
- Gestion de projets qui avec l’ensemble des partenaires et les autres équipes du DataLab Groupe, identifie et étudie les opportunités, cadre les projets et en coordonne la réalisation
Dans le cadre de ce stage, vous rejoindrez l’équipe Data Science Sémantique.
La phase de construction d’une base de connaissance joue un rôle important dans un processus de fabrication d’IA sémantique. Son impact est fort sur la performance finale du modèle IA. Souvent, cette phase projet est menée avec les experts métier afin d’aboutir à un modèle de données qui minimise les ambiguïtés sémantiques tout en répondant au besoin métier. Une analyse exploratoire et préliminaire du corpus est nécessaire pour bien mener cette étape.
Au sein du DataLab Groupe, nous avons implémenté un certain nombre de méthodes linguistiques et statistiques qui nous permettent de mener cette analyse. Ce stage a pour but d’industrialiser cette analyse en développant une solution packagée, sur la base d’open-source, selon les standards industriels de notre entité. La solution est à enrichir par des nouvelles approches non-supervisées d’exploration de Corpus bruts.
Descriptif de la mission:
Le stage se déroulera sous l’encadrement de Data Scientists selon les étapes suivantes:
-Veille technologique sur les outil d’analyse NLP
-Proposition de fonctionnalités pour enrichir les méthodes d’analyse existantes notamment dans le domaine d’analyse non-supervisée
-Sélection et implémentation des approches les plus adaptées à la problématique
-Intégration des développements dans une librairie python développée selon les standards du DataLab Groupe
-Publication scientifique si les travaux aboutissent à de nouvelles approches plus performantes que l’état de l’art
Le stage prévoit des interactions fréquentes avec les équipes de Data & AI Engineers du DataLab Groupe.