Dans le cadre d’un cours d’analyse sensorielle à l’Institut Agro, des étudiants ont dégusté des chocolats. Le but ici consiste à savoir dans quelle mesure le consommateur détecte ou non une différence de teneur en cacao. Chaque personne a goûté un seul chocolat dont la teneur en cacao est soit 72%, soit 85%. Elle devait alors deviner la teneur en cacao du chocolat dégusté. Les données sont enregistrées dans le fichier chocolat_72_85.csv
.
Importer les données.
Pour constituer les deux groupes de goûteurs, il faut que la variable Pourcentage_reel
soit reconnue comme une variable qualitative
<- chocolat %>%
chocolat mutate(Pourcentage.reel = as.factor(Pourcentage.reel))
Représenter à l’aide du graphique adapté les différences de réponses entre ceux qui ont goûté un chocolat à 72% et ceux qui ont goûté un chocolat à 85%.
Pour aider dans l’exploration des données, installer le package plotly
, puis exécuter les commandes suivantes
library(plotly)
<- chocolat %>% ggplot() +
p aes(x = Pourcentage.reel,
y = Pourcentage.percu,
col = Pourcentage.reel,
fill = Pourcentage.reel) + geom_boxplot(alpha = 0.3)
pggplotly(p)
La commande suivante permet de calculer la moyenne et la médiane des réponses pour les deux groupes de goûteurs :
%>%
chocolat group_by(Pourcentage.reel) %>%
summarise(moyennes = mean(Pourcentage.percu), ecarts_type = sd(Pourcentage.percu))
Rappeler le cadre du test de comparaison de moyennes (hypothèses, statistique de test, loi de la statistique, décision), que faut-il vérifier en premier lieu ?
Effectuer cette vérification, puis répondre à la problématique.
On cherche à savoir maintenant si les goûteurs du chocolat à 72% ont su reconnaître le véritable pourcentage. Mettre en place le test correspondant en rappelant leur cadre avant d’effectuer les calculs dans R
.
On pense que les gens qui goûtent un chocolat à haute teneur en cacao ont tendance à sous-estimer cette teneur. Mettre en place le test correspondant en rappelant leur cadre avant d’effectuer les calculs dans R
.
Par rapport au test de comparaison de moyennes, suggérez une autre façon de recueillir les données qui permettraient de mieux mettre en avant une différence potentielle de perceptions.
Le gain moyen quotidien (GMQ) est défini comme la moyenne sur une période des prises de poids journalières. C’est un indicateur courant pour les élevages bovins pour la simple raison qu’un GMQ élevé garantit une carcasse plus lourde, donc plus rentable. Les données sont fournies dans le fichier vaches.csv
.
Une fois les données correctement chargées, formuler la problématique adaptée
Répondre à la problématique en reprenant les étapes de l’exercice précédent puis conclure