Apprentissage Statistique
CNRS - INRIA - Ecole Normale Supérieure
(Universite Paris-Sud), 2eme semestre, 2009/2010
Les cours ont lieu au departement de Mathematiques de l'universite Paris-Sud (Orsay)
Dates des cours:
1er fevrier 2010 de 9h a 12h (S. Arlot) - notes de cours (succintes) - exercises
8 fevrier 2010 de 9h a 12h (S. Arlot) - notes de cours (succintes) - exercises
15 fevrier 2010 de 9h a 12h (F. Bach) - notes de cours (succintes)
22 fevrier 2010 de 9h a 12h (F. Bach) - notes de cours (succintes)
10 mars 2010 de 9h a 12h (S. Arlot)
17 mars 2010 de 9h a 12h (S. Arlot)
24 mars 2010 de 9h a 12h (F. Bach) - transparents en anglais
**Lundi** 29 mars 2010 de 9h a 12h (F. Bach) - transparents en anglais
Résumé
Nous présenterons dans un premier temps la théorie
statistique de l'apprentissage supervisé classique due à
Vapnik. Après en avoir précisé les limitations,
nous étudierons ses améliorations et extensions
récentes. Nous mettrons l'accent sur trois aspects :
- Convexification du risque de classification (support vector machines, boosting).
- Contrôle de la capacité de généralisation,
par sélection de modèles ou régularisation (L1 et
L2)
- Méthodes de calibration adaptative (pénalités
minimales, rééchantillonnage, validation croisée).
Les rappels nécessaires sur les techniques de choix de
modèles et les outils de probabilité utilisés
seront effectués à mesure afin de rendre ce cours aussi
largement accessible avec un minimum de prérequis.
Lecture d'articles