Vous trouverez sur ce site les énoncés de TDs associés au cours de démarche statistique. Les exercices utilisés lors de l’année universitaire 2022-2023 sont disponibles sur https://agrocampusds.github.io/demarche_statistique2022_2023/.

Liste des TDs du module

Nom Lien
TD1 : Charger, manipuler et visualiser des données dans R TD1
TD2 : Charger, manipuler et visualiser des données dans R TD2
TD3 : Comparaison de moyennes TD3
TD4 : Comparer les moyennes de 2 groupes TD4
TD5 : Tester l’existence d’un effet groupe TD5
TD6 : Puissance et comparaison post-Hoc TD6
TD7 : Régression linéaire TD7
TD8 : Régression linéaire simple TD8
TD9 : Construction et choix de modèle TD9
TD10 : Construction et choix de modèle bis TD10
TD11 : Prédiction et interprétation TD11
TD12 : Expliquer la variabilité d’une grandeur d’intérêt TD12
TD13 : Modélisation TD13
TD14 : Etude de cas : analyse des surfaces d’algues échouées TD14
TD15 : Analyse en composantes principales TD15
TD16 : La pollution de l’eau du Buëch TD16
TD17 : Planification expérimentale (1) TD17
TD18 : Planification expérimentale (2) TD18

Scripts et données

Script

  • TD1_script.R : le script pour bien démarrer le TD1.
  • TD2_script.R : le script pour bien démarrer le TD2 si vous n’avez pas fait le TD1, sinon reprenez la suite du TD1.

Données

  • Abricots : données sur la maturité des abricots,
  • Angle : données sur l’évaluation des angles,
  • Bébé : données sur le poids des bébés à la naiussance en fonction du sexe et du nombre de semaines de grossesse,
  • Buëch : La pollution des eaux du Buëch
  • Cafe : données sur la qualité des cafés en fonction de différentes provenances,
  • Chocolat : données sur la perception de la teneur en cacao de chocolats,
  • Compote : données sur les compotes,
  • dataSportV1 et dataSportV2
  • Deboisement : effet du déboisement sur e coefficient de transfert entre température de l’air et température de l’eau
  • Decathlon : résultats des 20 meilleurs athlètes aux décathlons des Jeux Olympiques d’Athènes en 2004, de ceux de Rio en 2016, des championnats d’Europe 2018 et du decastar de Talence en 2018.
  • Douglas : relation entre volume et diamètre pour les pins Douglas,
  • Financiers 3 : données sur la longueur des financiers produits,
  • Jambon : données sur les dégustations de jambon,
  • Lait : données sur le lien entre rendement fromager et composition du lait,
  • Manchots de Palmer : ce jeu de données est distribué dans le package palmerpenguins d’Allison Horst manchot
  • Poussins : Evolution du poids des poussins selon le sexe et le traitement,
  • puissance1 et puissance2,
  • Sonde et sol comparaison de 3 sondes sur 2 types de sol,
  • Vaches comparaison de prises de poids de deux races bovines.
  • Vitesse des Rugbymen étude de la vitesse sur 10m en tenant compte de l’âge des sportifs

Vocabulaire du module

Statistique

nom TD
ACP TD15
TD16
Alias TD18
Analyse de la covariance TD12
Analyse de la variance TD5
Analyse de la variance à 2 facteurs TD11
TD12
Analyse de variance TD9
Axe et plan principal TD15
TD16
Comparaison de moyennes TD3
Comparaison de variances TD3
Comparaison des niveaux d’un facteur TD11
Confusion entre effets TD17
Construction de modèle TD9
distribution d’une variable TD2
Distribution d’une variable TD1
Droites de régression avec effet groupe TD12
Effet de la taille d’échantillon sur la puissance de détection TD6
Inertie TD15
TD16
Plan fractionnaire TD17
Régression linéaire TD7
TD8
Régression linéaire multiple TD10
TD9
Résolution d’un plan fractionnaire TD18
Sélection de sous-modèle TD9
TD10
Test d’adéquation TD3
Test d’analyse de la variance TD6
Test d’égalité d’un coefficient à une valeur TD11
TD8
Test d’égalité de 2 moyennes TD4
Test d’égalité de 2 variances TD4
Test de conformité TD4
Test de corrélation de Pearson TD7
TD8
Test post-hoc (comparaison entre modalités d’un facteur) TD6
Test unilatéral TD4
Tests post-hoc TD5
Variable qualitative TD1
Variable quantitative TD1

Environnement R

nom TD
argument TD1
Factoshiny TD15
TD16
fonction TD1
package TD1
projet TD1
Reprendre un projet TD2
script TD1

Commandes R

nom TD
%>% TD2
as.factor TD3
TD4
TD5
compMeans TD11
TD12
cor TD15
cor.test TD7
TD8
Factoshiny TD15
TD16
filter TD2
geom_bar TD1
geom_boxplot TD2
geom_dotplot TD2
geom_histogram TD1
geom_point TD2
geom_smooth TD2
TD7
TD8
ggcorrplot TD9
ggpairs TD10
TD9
ggplot TD1
ggtitle TD1
group_by TD3
TD4
TD5
is.na TD2
labs TD2
library TD1
LinearModel TD10
TD11
TD12
TD4
TD5
TD6
TD7
TD8
TD9
meansComp TD5
TD6
pf TD3
read.table TD1
rename TD1
round TD15
select TD2
summarise TD3
TD5
summary TD1
t.test TD4
var.test TD4

Informations diverses

Installation de logiciels

Les séances de travaux dirigés se feront sur vos ordinateurs personels, merci de venir à chaque séance avec au moins un ordinateur pour deux étudiants.

Nous utiliserons le logiciel R et l’environnement RStudio. Ces logiciels sont aujourd’hui les standards en statistique dans un grand nombre d’entreprises et sont disponibles pour Windows, Mac et Linux. (L’installation sur chromebook est en théorie possible mais la théorie pourrait être mise en défaut par les faits).

Processus d’installation :

  • Il faut en premier lieu installer R
  • puis installer l’environnement RStudio (version Rstudio Desktop).

C’est prêt.

Des ressources

Un guide complet en français

Pour les graphiques

Les travaux dirigés sont l’occasion d’explorer quelques fonctionalités de R, suffisantes pour mettre en oeuvre la démarche statistique enseignée dans ce cours. Néanmoins il est probable que lors des projets, lors de vos stages à venir ou lorsque vous serez en situation professionnelle, vous ayez besoin d’acquérir de nouvelles connaissances pour répondre à vos besoins. nous listons ici quelques ressources intéressantes

Des aides mémoires

Des données

Le projet de statistique demande d’identifier une problématique et de l’analyser à partir d’un jeu de données de votre choix. Voici quelques pistes pour trouver un jeu de données, à choisir selon vos intérêts personnels.