Vous trouverez sur ce site les énoncés de TDs associés au cours de démarche statistique

Liste des TDs du module

Nom Lien
TD1 : Charger, manipuler et visualiser des données dans R TD1
TD2 : Charger, manipuler et visualiser des données dans R TD2
TD3: Analyse en composantes principales TD3
TD4 : La pollution de l’eau du Buëch TD4
TD5 : Comparer plusieurs populations TD5
TD6 : Puissance et comparaison post-Hoc TD6
TD7 : Prendre en compte un effet bloc TD7
TD8 : Comparaison de compotes TD8
TD9 : La régression simple et au-delà TD9
TD10 : Régression multiple TD10
TD14 : Expliquer la variabilité d’une grandeur d’intérêt TD11
TD12 : Planification expérimentale TD12

Scripts et données

Script

  • TD1_script.R : le script pour bien démarrer le TD1.
  • TD2_script.R : le script pour bien démarrer le TD2 si vous n’avez pas fait le TD1, sinon reprenez la suite du TD1.

Données

  • Abricots : données sur la maturité des abricots,
  • Angle : données sur l’évaluation des angles,
  • Bébé : données sur le poids des bébés à la naiussance en fonction du sexe et du nombre de semaines de grossesse,
  • Buëch : La pollution des eaux du Buëch
  • Cafe : données sur la qualité des cafés en fonction de différentes provenances,
  • Compote : données sur les compotes,
  • dataSportV1 et dataSportV2
  • Deboisement : effet du déboisement sur e coefficient de transfert entre température de l’air et température de l’eau
  • Decathlon : résultats des 20 meilleurs athlètes aux décathlons des Jeux Olympiques d’Athènes en 2004, de ceux de Rio en 2016, des championnats d’Europe 2018 et du decastar de Talence en 2018.
  • Douglas : relation entre volume et diamètre pour les pins Douglas,
  • Financiers 3 : données sur la longueur des financiers produits,
  • Jambon : données sur les dégustations de jambon,
  • Lait : données sur le lien entre rendement fromager et composition du lait,
  • Manchots de Palmer : ce jeu de données est distribué dans le package palmerpenguins d’Allison Horst manchot
  • Données paléo climatiques actuelles et données paléo climatiques passé
  • Poussins : Evolution du poids des poussins selon le sexe et le traitement,
  • puissance1 et puissance2,
  • Sonde et sol compariason de 3 sondes sur 2 types de sol.

Vocabulaire du module

Statistique

nom TD
ACP TD10
TD3
TD4
AIC TD10
Analyse de la covariance TD11
Analyse de la variance TD5
TD9
Analyse de la variance à 2 facteurs TD11
TD7
Axe et plan principal TD3
TD4
BIC TD10
Comparaison de droites de régression (Ancova) TD9
Comparaison des niveaux d’un facteur TD7
Confusion entre effets TD12
distribution d’une variable TD2
Distribution d’une variable TD1
Droites de régression avec effet groupe TD11
Effet de la taille d’échantillon sur la puissance de détection TD6
Inertie TD3
TD4
Plan fractionnaire TD12
Regression TD9
Régression multiple TD10
Test d’analyse de la variance TD6
TD8
Test d’égalité d’un coefficient à une valeur TD7
TD9
Test post-hoc (comparaison entre modalités d’un facteur) TD6
TD8
Variable qualitative TD1
Variable quantitative TD1

Environnement R

nom TD
argument TD1
Factoshiny TD3
TD4
fonction TD1
package TD1
package(MASS) TD10
projet TD1
Reprendre un projet TD2
script TD1

Commandes R

nom TD
%>% TD2
anova TD9
Anova (package car) TD8
anova et lm TD6
TD8
as.factor TD5
compMeans TD11
cor TD3
emmeans TD7
emmeans (package emmeans) TD6
TD8
extractAIC TD10
Factoshiny TD3
TD4
filter TD2
geom_bar TD1
geom_boxplot TD2
geom_histogram TD1
geom_jitter TD2
geom_point TD2
geom_smooth TD2
TD9
ggplot TD1
ggtitle TD1
group_by TD5
is.na TD2
labs TD2
library TD1
LinearModel TD11
lm TD7
pairwise.t.test TD6
pf TD5
read.table TD1
rename TD1
round TD3
select TD2
stepAIC TD10
summarise TD5
summary TD1

Informations diverses

Installation de logiciels

Les séances de travaux dirigés se feront sur vos ordinateurs personels, merci de venir à chaque séance avec au moins un ordinateur pour deux étudiants.

Nous utiliserons le logiciel R et l’environnement RStudio. Ces logiciels sont aujourd’hui les standards en statistique dans un grand nombre d’entreprises et sont disponibles pour Windows, Mac et Linux. (L’installation sur chromebook est en théorie possible mais la théorie pourrait être mise en défaut par les faits).

Processus d’installation :

  • Il faut en premier lieu installer R
  • puis installer l’environnement RStudio (version Rstudio Desktop).

C’est prêt.

Des ressources

Pour les graphiques

Les travaux dirigés sont l’occasion d’explorer quelques fonctionalités de R, suffisantes pour mettre en oeuvre la démarche statistique enseignée dans ce cours. Néanmoins il est probable que lors des projets, lors de vos stages à venir ou lorsque vous serez en situation professionnelle, vous ayez besoin d’acquérir de nouvelles connaissances pour répondre à vos besoins. nous listons ici quelques ressources intéressantes

Des aides mémoires

Des données

Le projet de statistique demande d’identifier une problématique et de l’analyser à partir d’un jeu de données de votre choix. Voici quelques pistes pour trouver un jeu de données, à choisir selon vos intérêts personnels.