- Équipes
- Productions scientifiques
-
- Séminaires
Plus qu'un projet le sujet de l'année se décompose en une série d'exercices disponible sur la page projet2015
A propos des contrastes: une manière de comprendre le recodage des variables qualitatives engendré par un contraste, il est possible d'utiliser l'instruction model.matrix(model), qui montre la matrice de design X utiliser pour faire la régression.
Dans une régression logistique, l'exponentiel de l'intercept peut s'interpréter comme l'odd ratio P(Y)/(1-P(Y)), c'est à dire rapport de proportion hors tout effet fixe X observé.
Dans le formalisme R, Y~X1+X2 - 1 permet de faire une régression sans intercept.
Quelques jeux de données issus de packages R:
De nos jours, le problème n'est pas tant de trouver de l'information que de sélectionner une information de qualité. Voici quelques références qui pourront vous servir de guides fiables:
Les méthodes de régression pénalisée (chapitre 3 du livre de Hastie et Tibshirani - shrinkage method) permettent de réaliser simultanément estimation et sélection des paramètres du modèle.
glmnet
Le projet vise à évaluer quelques problèmes communs de sur-apprentissage liés à la sélection de variables en apprentissage (régression et discrimination).
Nous partirons des papiers de Juha Reunanen,
Nous considérerons