Apprentissage Statistique

Sylvain Arlot et Francis Bach

CNRS - INRIA - Ecole Normale Supérieure

Mastere M2 Probabilites et Statistiques

(Universite Paris-Sud), 2eme semestre, 2009/2010
 



Les cours ont lieu au departement de Mathematiques de l'universite Paris-Sud (Orsay)

Dates des cours:

1er fevrier 2010 de 9h a 12h (S. Arlot) - notes de cours (succintes) - exercises
8 fevrier 2010 de 9h a 12h (S. Arlot) - notes de cours (succintes) - exercises
15 fevrier 2010 de 9h a 12h (F. Bach) - notes de cours (succintes)
22 fevrier 2010 de 9h a 12h (F. Bach) - notes de cours (succintes)
10 mars 2010 de 9h a 12h (S. Arlot)
17 mars 2010 de 9h a 12h (S. Arlot)
24 mars 2010 de 9h a 12h (F. Bach) - transparents en anglais
**Lundi** 29 mars 2010 de 9h a 12h (F. Bach) - transparents en anglais



Résumé


Nous présenterons dans un premier temps la théorie statistique de l'apprentissage supervisé classique due à Vapnik. Après en avoir précisé les limitations, nous étudierons ses améliorations et extensions récentes. Nous mettrons l'accent sur trois aspects :

- Convexification du risque de classification (support vector machines, boosting).
- Contrôle de la capacité de généralisation, par sélection de modèles ou régularisation (L1 et L2)
- Méthodes de calibration adaptative (pénalités minimales, rééchantillonnage, validation croisée).

Les rappels nécessaires sur les techniques de choix de modèles et les outils de probabilité utilisés seront effectués à mesure afin de rendre ce cours aussi largement accessible avec un minimum de prérequis.


Lecture d'articles