Programme – Machine Learning et Intelligence Artificielle

Module 1 : Outils de mathématiques et d’informatique

L’objectif de ce module est de remettre à niveau les étudiants en terme de compétences en mathématiques et informatique. Les aspects abordés sont l’algorithmique de base, la maitrise du langage Python et des bibliothèques de traitement de données (numpy, pandas, matplotlib, bokeh, …), ainsi que la gestion des entrées/sorties ainsi que l’analyse (intégration), l’algèbre linéaire (produit et inversion de matrices, valeurs propres et singulières), les probabilités et statistiques de base (espace probabilisé, échantillonnage, modèle statistique, inférence).

Organisation : 2 jours de conférence/mise en situation.
Dates : 7 et 8 mars 2025.

Module 2 : Cloud Computing et Big Data

L’objectif de ce module est de former les étudiants aux outils autour de la gestion de données massives. C’est un enseignement orienté outils informatique et infrastructure qui recouvre les aspects:

Bases de données SQL et NoSQL
Hadoop, Spark, MapReduce
Cloud Computing et virtualisation
Pig, Hive et SPARQL

Organisation : 2 jours de conférence/mise en situation.
Dates : 21 et 22 mars 2025.

Module 3 : Apprentissage statistique supervisé

Ce module dresse un panorama de l’apprentissage statistique aujourd’hui. Il aborde successivement les grandes problématiques du domaine et en présente les avancées majeures des dix dernières années avec un focus sur les modèles supervisé.

Cadre général de l’apprentissage supervisé
Classifieur bayésien naïf
Sur-apprentissage et validation croisée
Arbres : CART, forêts aléatoire et boosting
Minimisation du risque empirique
Régression logistique et machines à vecteurs supports
Perceptron, réseaux de neurones
Approches régularisées
Traitement de données incertaines et incomplètes

Organisation : 2 jours de conférence/mise en situation.
Dates : 4 et 5 avril 2025.

Module 4 : Apprentissage non-supervisé et apprentissage profond

Cet enseignement se focalise sur les algorithmiques classiques utilisés en apprentissage non-supervisé, ainsi que sur les modèles de réseaux de neurones profonds.

Clustering : classification hiérarchique, k-means et ses variantes, modèles de mélange gaussiens, méthodes spectrales
Réduction de dimension et visualisation : décomposition en valeurs singulières, ACP et ses variantes, ACM, MDS, ISOMAP, t-SNE
Algorithmes de descente de gradient, back-propagation et variantes
Réseaux de neurones convolutionnels et réseaux récurrents

Organisation : 2 jours de conférence/mise en situation.
Dates : 16 et 17 mai 2025.

Module 5 : Apprentissage profond et réseaux de neurones pour les images

L’objectif de ce module est d’étudier les outils informatiques associés aux réseaux de neurones profonds et l’application de ces derniers pour la reconnaissance automatique d’images.

Outils : plateforme déclarative (TensorFlow) et algorithmique (PyTorch)
Descripteurs SIFT et architectures de réseaux de neurones appliqués aux images (réseaux convolutifs, …)

Organisation : 2 jours de conférence/mise en situation.
Dates : 13 et 14 juin 2025.

Module 6 : Réseaux de neurones pour le traitement du langage et environnement des données

Ce module vise étudier les réseaux de neurones appliqués aux données textuelles et à appréhender le contexte global dans lequel s’inscrivent les approches industrielles liées au Big Data. Il sensibilise notamment les participants aux notions de réglementation et d’éthique, et insiste sur l’intégration des méthodologies de data science dans un environnement professionnel

Représentations de mots et architectures de réseaux de neurones appliqués au texte (réseaux récurrents, d’attention et « adversariaux »).
Gouvernance et éthique des données
Cyber-sécurité, business Analytics
Communication, « data story telling »

Organisation : 2 jours de conférence/mise en situation.
Dates : 27 et 28 juin 2025.

Module 7 : Applications (et déclinaisons par secteur d’activité)

L’objectif de ce module est d’aborder des applications particulières nécessitant la mise en oeuvre d’outils mathématiques et informatique particuliers. Ce module sera organisé sous forme de conférences, en fonction du profil des étudiants.

Les thèmes seront choisis parmi les applications suivantes:

Recommandation
Graphes et réseaux sociaux
Text Mining
Publicité
Intelligence Artificielle
Actuariat
Finance
Gestion des risques
…

Organisation : 2 jours de conférence.
Dates : 19 et 20 septembre 2025.

Module 8 : Projet Data

L’objectif de l’UE est d’encadrer les étudiants autour de projets de traitement de données. Les sujets des projets et les données à traiter seront propoposés par les étudiants eux-mêmes. Un effort particulier sera porté sur la restitution (Data story telling) des résultats et des modèles proposés.

Organisation : Suivi personnalisé, articulé autour de séances de regroupement en présence d’un ou plusieurs enseignants référents.
Date : 10 octobre 2025.