Vous trouverez sur ce site les énoncés de TDs associés au cours de démarche statistique

Liste des TDs du module

Nom Lien
TD1 : Charger, manipuler et visualiser des données dans R TD1
TD2 : Charger, manipuler et visualiser des données dans R TD2
TD3 : Tester l’existence d’un effet groupe TD3
TD4 : Comparaison de l’effet groupe dans deux situations différentes TD4
TD5 : Comparer les moyennes de 2 groupes TD5
TD6 : Puissance et comparaison post-Hoc TD6
TD7 : Analyse de variance à 2 facteurs TD7
TD8 : Puissance de test TD8
TD9 : La régression simple et au-delà TD9
TD10 : Comparaison de droites de régression TD10
TD11 : Construction et choix de modèle TD11
TD12 : Construction et choix de modèle bis TD12
TD13 : Prendre en compte un effet bloc TD13
TD14 : Expliquer la variabilité d’une grandeur d’intérêt TD14
TD15 : Analyse en composantes principales TD15
TD16 : La pollution de l’eau du Buëch TD16
TD17 : Planification expérimentale (1) TD17
TD18 : Planification expérimentale (2) TD18

Scripts et données

Script

  • TD1_script.R : le script pour bien démarrer le TD1.
  • TD2_script.R : le script pour bien démarrer le TD2 si vous n’avez pas fait le TD1, sinon reprenez la suite du TD1.

Données

  • Abricots : données sur la maturité des abricots,
  • Angle : données sur l’évaluation des angles,
  • Bébé : données sur le poids des bébés à la naiussance en fonction du sexe et du nombre de semaines de grossesse,
  • Buëch : La pollution des eaux du Buëch
  • Cafe : données sur la qualité des cafés en fonction de différentes provenances,
  • Compote : données sur les compotes,
  • dataSportV1 et dataSportV2
  • Deboisement : effet du déboisement sur e coefficient de transfert entre température de l’air et température de l’eau
  • Decathlon : résultats des 20 meilleurs athlètes aux décathlons des Jeux Olympiques d’Athènes en 2004, de ceux de Rio en 2016, des championnats d’Europe 2018 et du decastar de Talence en 2018.
  • Douglas : relation entre volume et diamètre pour les pins Douglas,
  • Financiers 3 : données sur la longueur des financiers produits,
  • Jambon : données sur les dégustations de jambon,
  • Lait : données sur le lien entre rendement fromager et composition du lait,
  • Manchots de Palmer : ce jeu de données est distribué dans le package palmerpenguins d’Allison Horst manchot
  • Poussins : Evolution du poids des poussins selon le sexe et le traitement,
  • puissance1 et puissance2,
  • Sonde et sol compariason de 3 sondes sur 2 types de sol.

Vocabulaire du module

Statistique

nom TD
ACP TD15
TD16
Alias TD18
Analyse de la covariance TD14
Analyse de la variance TD10
TD3
TD9
Analyse de la variance à 2 facteurs TD13
TD14
Analyse de variance TD11
Axe et plan principal TD15
TD16
Comparaison de droites de régression (Ancova) TD10
TD9
Comparaison des niveaux d’un facteur TD13
Confusion entre effets TD17
Construction de modèle TD11
distribution d’une variable TD2
Distribution d’une variable TD1
Droites de régression avec effet groupe TD14
Effet de la taille d’échantillon sur la puissance de détection TD6
Inertie TD15
TD16
Plan fractionnaire TD17
Puissance des tests TD8
Regression TD10
TD9
Régression linéaire multiple TD11
TD12
Résolution d’un plan fractionnaire TD18
Sélection de sous-modèle TD11
TD12
Table d’analyse de la variance TD4
Test d’analyse de la variance TD6
TD7
TD8
Test d’égalité d’un coefficient à une valeur TD13
TD9
Test d’égalité de 2 moyennes TD5
Test de comparaison de moyenne TD8
Test de conformité TD5
Test post-hoc (comparaison entre modalités d’un facteur) TD6
TD7
Test unilatéral TD5
Variable qualitative TD1
Variable quantitative TD1

Environnement R

nom TD
argument TD1
Factoshiny TD15
TD16
fonction TD1
package TD1
projet TD1
Reprendre un projet TD2
script TD1

Commandes R

nom TD
%>% TD2
anova TD10
TD4
TD5
TD8
TD9
Anova (package car) TD10
TD7
TD8
anova et lm TD6
TD7
as.factor TD3
TD5
compMeans TD13
TD14
cor TD15
emmeans (package emmeans) TD6
TD7
Factoshiny TD15
TD16
filter TD2
geom_bar TD1
geom_boxplot TD2
geom_histogram TD1
geom_jitter TD2
geom_point TD2
geom_smooth TD10
TD2
TD9
ggcorrplot TD11
ggpairs TD11
TD12
ggplot TD1
ggtitle TD1
group_by TD3
TD5
is.na TD2
labs TD2
library TD1
LinearModel TD11
TD12
TD13
TD14
lm TD5
pairwise.t.test TD6
pf TD3
power.t.test TD8
predict TD10
read.table TD1
rename TD1
round TD15
select TD2
summarise TD3
summary TD1
t.test TD5
TD8

Informations diverses

Installation de logiciels

Les séances de travaux dirigés se feront sur vos ordinateurs personels, merci de venir à chaque séance avec au moins un ordinateur pour deux étudiants.

Nous utiliserons le logiciel R et l’environnement RStudio. Ces logiciels sont aujourd’hui les standards en statistique dans un grand nombre d’entreprises et sont disponibles pour Windows, Mac et Linux. (L’installation sur chromebook est en théorie possible mais la théorie pourrait être mise en défaut par les faits).

Processus d’installation :

  • Il faut en premier lieu installer R
  • puis installer l’environnement RStudio (version Rstudio Desktop).

C’est prêt.

Des ressources

Pour les graphiques

Les travaux dirigés sont l’occasion d’explorer quelques fonctionalités de R, suffisantes pour mettre en oeuvre la démarche statistique enseignée dans ce cours. Néanmoins il est probable que lors des projets, lors de vos stages à venir ou lorsque vous serez en situation professionnelle, vous ayez besoin d’acquérir de nouvelles connaissances pour répondre à vos besoins. nous listons ici quelques ressources intéressantes

Des aides mémoires

Des données

Le projet de statistique demande d’identifier une problématique et de l’analyser à partir d’un jeu de données de votre choix. Voici quelques pistes pour trouver un jeu de données, à choisir selon vos intérêts personnels.