On souhaite étudier le poids des bébés à la naissance en fonction du sexe du bébé et du nombre de semaines de grossesse. On dispose pour cela d’un échantillon constitué de 477 nouveaux nés (242 filles et 255 garçons) et du nombre de semaines d’aménorrhée (plus exactement du nombre de semaines par rapport au terme normal qui est de 40 semaines en France: −3 signifie donc 37 semaines d’aménorrhée, et 1, 41 semaines d’aménorrhée).
Nous cherchons à déterminer si le poids à la naissance est différent chez les garçons et les filles.
Les données sont disponibles dans le fichier bebe.csv
.
Importer les données. Pour chaque bébé , on note son sexe, le nombre de semaines d’aménorrhée Nbsem
, et le poids du bébé à la naissance PoidsBB
Proposer une visualisation permettant de visualiser l’effet du nombre de semaines de grossesse sur le poids du bébé à la naissance. Cet effet peut être différent pour les garçons et les filles.
Qu’est ce que le code ci-dessous permet de visualiser ?
%>% ggplot() +
bebe_dta geom_point(aes(x=Nbsem, y = PoidsBB, col = Sexe)) +
geom_smooth(method = 'lm', aes(x=Nbsem, y = PoidsBB, col = Sexe), se = FALSE)
En préparation d’une future expérimentation en champs, on a comparé, dans deux types de sols, trois types de sondes destinées à prélever des échantillons de terre, en effectuant plusieurs prélèvements et en mesurant la teneur en anhydride phosphorique (\(P_20_5\)) en mg pour 100 g de terre sèche. On s’intéresse principalement aux différences qui pourraient exister d’un type de sonde à l’autre, et aux interférences éventuelles des types de sonde avec les types de sol. Les données sont disponibles dans le fichier sonde_sol.csv.
Importer les données et les représenter sous forme d’un boxplot dans lequel l’abscisse est le sol, ce boxplot étant rempli par une couleur qui représente la sonde.
Visualiser l’effet de l’interaction Sol - Sonde sur la variable réponse.
%>%
dta group_by(Sonde, Sol) %>%
summarize(P205_m = mean(P205)) %>%
ggplot() + aes(x=Sol, col = Sonde, y=P205_m) + geom_line(aes(group = Sonde)) + geom_point()
Construire un modèle permettant de répondre à la question “Le taux d’anhydride phosphaté est-il le même dans tous les types de sol, pour tous les sortes de sonde ?”
Les différences entre les sondes sont elles les mêmes quel que soit le type de sol ?
Y a-t-il des différences de résultats entre les sondes ?
Quelles sondes donnent des résultats équivalents ?
library(FactoMineR)
<- LinearModel(P205 ~ Sol*Sonde, data=dta)
mod meansComp(mod, ~sonde)