Objectifs de la séance

  • Manipulation de données
    • Grouper les données par modalité d’un facteur
    • Effectuer des calculs par modalité du facteur
  • Visualisation de données
    • Boîte à moustaches
  • Tests
    • Démarche statistique
    • Reconnaître le contexte d’un test de comparaison ou d’adéquation
    • Ecrire les hypothèses correspondantes du test et leur interprétation
    • Donner la statistique de test et sa loi sous l’hypothèse nulle
    • Mettre en oeuvre le test

Exercices

Dégustation de chocolats

Importation et exploration des données

Dans le cadre d’un cours d’analyse sensorielle à l’Institut Agro, des étudiants ont dégusté des chocolats. Le but ici consiste à savoir dans quelle mesure le consommateur détecte ou non une différence de teneur en cacao. Chaque personne a goûté un seul chocolat dont la teneur en cacao est soit 72%, soit 85%. Elle devait alors deviner la teneur en cacao du chocolat dégusté. Les données sont enregistrées dans le fichier chocolat_72_85.csv.

  • Importer les données.

  • Pour constituer les deux groupes de goûteurs, il faut que la variable Pourcentage_reel soit reconnue comme une variable qualitative

chocolat <- chocolat %>% 
  mutate(Pourcentage.reel = as.factor(Pourcentage.reel))
  • Représenter à l’aide du graphique adapté les différences de réponses entre ceux qui ont goûté un chocolat à 72% et ceux qui ont goûté un chocolat à 85%.

  • Pour aider dans l’exploration des données, installer le package plotly, puis exécuter les commandes suivantes

library(plotly)
p <- chocolat %>% ggplot() +
  aes(x = Pourcentage.reel,
      y = Pourcentage.percu,
      col = Pourcentage.reel,
      fill = Pourcentage.reel) + geom_boxplot(alpha = 0.3)
p
ggplotly(p)

La commande suivante permet de calculer la moyenne et la médiane des réponses pour les deux groupes de goûteurs :

chocolat %>% 
  group_by(Pourcentage.reel) %>% 
  summarise(moyennes = mean(Pourcentage.percu), ecarts_type = sd(Pourcentage.percu))

Mise en place de la comparaison de moyennes

  • Rappeler le cadre du test de comparaison de moyennes (hypothèses, statistique de test, loi de la statistique, décision), que faut-il vérifier en premier lieu ?

  • Effectuer cette vérification, puis répondre à la problématique.

  • On cherche à savoir maintenant si les goûteurs du chocolat à 72% ont su reconnaître le véritable pourcentage. Mettre en place le test correspondant en rappelant leur cadre avant d’effectuer les calculs dans R.

  • On pense que les gens qui goûtent un chocolat à haute teneur en cacao ont tendance à sous-estimer cette teneur. Mettre en place le test correspondant en rappelant leur cadre avant d’effectuer les calculs dans R.

  • Par rapport au test de comparaison de moyennes, suggérez une autre façon de recueillir les données qui permettraient de mieux mettre en avant une différence potentielle de perceptions.

Elevage bovin

Le gain moyen quotidien (GMQ) est défini comme la moyenne sur une période des prises de poids journalières. C’est un indicateur courant pour les élevages bovins pour la simple raison qu’un GMQ élevé garantit une carcasse plus lourde, donc plus rentable. Les données sont fournies dans le fichier vaches.csv.

  • Une fois les données correctement chargées, formuler la problématique adaptée

  • Répondre à la problématique en reprenant les étapes de l’exercice précédent puis conclure

Le vocabulaire de la séance

Commandes R

  • as.factor
  • group_by
  • pf
  • summarise

Environnement R

Statistique

  • Comparaison de moyennes
  • Comparaison de variances
  • Test d’adéquation