Objectifs de la séance

  • Construire un modèle
    • choisir les effets et interactions potentiels
    • écrire le modèle
  • Sélectionner un sous-modèle
  • Interpréter la présence ou l’absence d’effet
  • Comprendre l’intérêt d’un effet bloc

Exercices

Construction d’un modèle, choix des effets et interactions

  1. Quelles variables explicatives, quelles interactions utiliseriez-vous pour construire un modèle permettant de prédire (répondre à 2 questions au choix parmi les 4)
  • la taille d’un individu adulte ?
  • la taille d’un enfant entre 2 et 15 ans.
  • le nombre de lombrics dans un cube de terre de 10 cm de côté ?
  • le poids des poubelles à la cantine de l’IA ?
  1. Préciser quelles variables sont quantitatives (resp. qualitatives)
  2. Ecrire le modèle

Choix de modèle pour la préférence d’un jambon

Un organisme d’analyse sensorielle souhaite savoir s’il est possible de prévoir l’appréciation globale d’un jambon à partir de sa description sensorielle. Un jury entraîné a utilisé les variables suivantes pour décrire 21 jambons : Jutosité, Caractère croquant, Tendreté, Caractère pâteux, Fibreux, Saveur salée, Saveur sucrée, Flaveur de viande, Assaisonnement, Flaveur métallique, Flaveur fèces/urine, Flaveur de gras, Flaveur braisé/fumé, Flaveur lactique . Puis une note d’ Appréciation globale a été attribué à chacun des jambons.

  • Charger le fichier de données jambon.txt, il est conseillé d’utiliser le paramètre row.names =.

  • A l’aide de la fonction ggpairs du paquet GGally lancez une première analyse descriptive du lien entre variables deux à deux.

library(ggcorrplot)
jambons %>% 
  cor() %>% 
  round(1) %>% 
  ggcorrplot(type = "lower",
             lab = TRUE)
library(GGally)
jambons %>% ggpairs(
  columns = c(1, 7:9),
  lower = list(continuous = wrap("points", color = "dodgerblue4")),
  diag = list(continuous = wrap("densityDiag", color = "dodgerblue4"))
  )
  • Proposer une problématique liée au contexte.
  • Sélectionner le modèle.

Prise en compte d’un effet bloc

On étudie le rendement de pois fourragers pour trois variétés et trois écartements entre les rangs des lignées. Pour disposer de répétitions, des expériences ont été menées sur 4 parcelles. Toutes les combinaisons variété-écartement ont été testé sur chacune des 4 parcelles. Les données sont regroupées dans le tableau suivant.

Parcelle
Variete Ecartement 1 2 3 4
I 4 51 47 47 50
8 60 50 45 48
12 64 55 48 48
II 4 64 58 57 61
8 60 58 56 60
12 58 58 53 60
III 4 64 65 54 57
8 62 68 67 60
12 71 75 75 63

On considérera ici que l’écartement est une variable qualitative avec 3 modalités (4= petit, 8=moyen, 12=grand).

  • Seuls les effets suivants intéressent l’agronome: variété, écartement, interaction variété-écartement. Pourtant, on choisit de rajouter l’effet parcelle dans le modèle. Quelle peut en être l’utilité?

  • Construire et sélectionner le “bon” sous-modèle.

  • Quels sont les effets significatifs (et les effets non significatifs) du sous-modèle sélectionné ?

  • Interpréter les effets significatifs (et l’absence des effets non significatifs) dans le modèle sélectionné.

  • Quelles conclusions auriez-vous eues si vous aviez (mal) travaillé en oubliant l’effet parcelle dans le modèle ?

Le vocabulaire de la séance

Commandes R

  • LinearModel
  • ggcorrplot
  • ggpairs

Environnement R

Statistique

  • Construction de modèle
  • Sélection de sous-modèle
  • Régression linéaire multiple
  • Analyse de variance