TD4 : Comparer les moyennes de 2 groupes

Objectifs de la séance

Visualisation de données
- Boîte à moustaches
Analyse de données
- Construire un test de conformité à une valeur
- Construire un test de comparaison de variances
- Construire un test de comparaison de moyennes
- Adapter la règle de décision pour un test unilatéral

Exercices

Le compas dans l’oeil

Recueil des données

A l’oeil, sans l’aide d’outil (rapporteur, règle ou compas) et indépendamment de vos voisins, évaluer l’angle (en degrés, au dixième de degré près) entre AB et AC (selon votre groupe, celui de la figure 1 ou de la figure 2).

Evaluation de l’angle entre AB et AC

Une fois toutes les données recueillies dans votre tableur préféré, considérons deux groupes : les évaluations faites par les garçons et les évaluations faites par les filles. On suppose que la mesure d’un angle suit une loi normale d’espérance \(\mu_{1}\) et de variance \(\sigma^2\) lorsqu’elle est évaluée par des garçons et une loi normale d’espérance \(\mu_{2}\) et de variance \(\sigma^2\) lorsqu’elle est évaluée par des filles.

Importation du jeu de données

Saisir les données et les sauvegarder dans un fichier angle.csv.
Importer le jeu de données angle.csv dans un objet nommé don_Angle en utilisant un script TD4_script.R que vous aurez créé dans votre répertoire de projet.

Visualisation des données

Visualiser les données pour avoir une idée de la distribution des angles pour les garçons, et pour les filles. Calculer quelques statistiques par sexe.

Mise en place de l’analyse statistique

On cherche dans un premier temps à savoir si, en moyenne, les filles ont une évaluation non biaisée de l’angle.

Exprimer la problématique ci-dessus sous la forme d’un test d’hypothèses.
Dans cette problématique de test, quel est l’échantillon et quelle est la population ?
A l’aide des données recueillies, mettre en oeuvre le test avec un niveau de confiance de 95 % (i.e. un seuil de 5 % pour l’erreur de type I).
Pour les garçons, tester si, en moyenne, ils évaluent justement ou s’ils sous-estiment l’angle (préciser \(H_0\) et \(H_1\) avant de construire le test sous R).
On souhaite maintenant tester l’égalité des moyennes entre garçons et filles. Préciser l’hypothèse \(H_0\) et l’hypothèse \(H_1\).

La puissance d’un test

Reprenons la problématique d’élevage bovin du TD précédent. Cette fois-ci on souhaiterait réaliser une étude sur des Charolaises et des Limousines. On suppose que la variabilité des gains moyens pour une race de vache est connu et vaut 85 g/jour.

Avec un effectif de 60 vaches de chaque race, quelle différence de gains moyens serait détectable avec une probabilité de 0.90 ?
Combien de vaches faut-il avoir pour avoir une probabilité de 0.90 de détecter un écart de 100g entre les gains moyens des Charolaises et des Limousines ?

Le vocabulaire de la séance

Commandes R

as.factor
group_by
var.test
t.test
LinearModel

Environnement R

Statistique

Test d’égalité de 2 variances
Test d’égalité de 2 moyennes
Test de conformité
Test unilatéral