Apprentissage Statistique
CNRS - INRIA - École Normale Supérieure
(Université Paris-Sud), 2ème semestre, 2014/2015
Les cours ont lieu le lundi de 14h à 17h, au département de Mathématiques de l'Université Paris-Sud (Orsay), bâtiment 425, salle 117-119.
Dates des cours:
- 02/02 (S. Arlot): Théorie de l'apprentissage, de Vapnik à la localisation (1/2)
- Notes de cours
- 09/02 (S. Arlot): Théorie de l'apprentissage, de Vapnik à la localisation (2/2)
- Notes de cours
- 16/02 (F. Bach): Convexification du risque
- Notes de cours
- 23/02: vacances
- 02/03 (F. Bach): Régularisation l2
- Notes de cours
- 09/03 (S. Arlot): Choix d'algorithmes statistiques (1/2): Sélection d'estimateurs linéaires
- Notes de cours
- 16/03 (S. Arlot): Choix d'algorithmes statistiques (2/2): Sélection d'estimateurs par rééchantillonnage ou validation croisée
- Notes de cours
- 23/03 (F. Bach): Optimisation (1/2)
- 30/03 (F. Bach): Optimisation (2/2)
- Notes de cours
- Validation du cours: exposé sur un article.
Résumé
Nous présenterons dans un premier temps la théorie
statistique de l'apprentissage supervisé classique due à
Vapnik. Après en avoir précisé les limitations,
nous étudierons ses améliorations et extensions
récentes. Nous mettrons l'accent sur trois aspects :
- Convexification du risque de classification (support vector machines, boosting).
- Contrôle de la capacité de généralisation,
par sélection de modèles ou régularisation (L1 et
L2)
- Méthodes de calibration adaptative (pénalités
minimales, rééchantillonnage, validation croisée).
Les rappels nécessaires sur les techniques de choix de
modèles et les outils de probabilité utilisés
seront effectués à mesure afin de rendre ce cours aussi
largement accessible avec un minimum de prérequis.
Retour à l'index - Back to index