Objectifs de la séance

  • Visualisation de données
    • Visualiser les relations entre deux variables (quantitative ou qualitative)
  • Analyse de données
    • Ajuster un modèle d’analyse de la variance et exploiter les résultats qui en découlent
    • Ajuster un modèle de régresssion et examiner les résultats qui en découlent
    • Comparer des droites de régression (modèle d’analyse de la covariance)

Exercices

Prédiction du taux de glucose d’un abricot par colorimétrie

Une des difficultés que rencontrent les producteurs d’abricots est la détermination du stade de maturité du fruit, information utile pour choisir le moment opportun de la récolte. Un abricot cueilli à maturité a un taux de glucose élevé. La colorimétrie est parfois identifiée comme un bon marqueur de la maturité. Il est en effet possible de mesurer précisément la couleur d’un fruit selon trois dimensions correspondant à trois composantes numériques :

  • L, la clarté, qui va de 0 (noir) à 100 (blanc),
  • a, sur un axe vert (-) - rouge (+),
  • b, sur un axe bleu (-) - jaune (+).

Lien entre colorimétrie et maturité de l’abricot

Dans un premier temps, on souhaite vérifier le lien entre colorimétrie et maturité d’un abricot à partir de données expérimentales sur 108 abricots d’une même variété, répartis selon 3 stades de maturité (1, 2 ou 3 du moins mûr au plus mûr). Les données sont disponibles dans le fichier abricots

  • Importer le jeu de données dans un objet nommé abricots et indiquer le nombre d’abricots dans chaque stade.

  • Construire un graphique illsutrant le lien entre la maturité d’un abricot et son indice colorimétrique a.

  • Construire un test d’égalité des indices a moyens des abricots aux différents stades de maturité.

  • L’indice a est-il un bon candidat pour évaluer la maturité d’un abricot ?

Etude du lien entre l’indice colorimétrique a et le taux de glucose

Un des indicateurs de la qualité de l’abricot est son taux de glucose. On cherche maintenant à savoir comment le taux de glocose dépend du marqueur indirect de la maturité qu’est l’indice colorimétrique a.

  • Construire un graphique décrivant la relation entre le taux de glucose et l’indice a.

  • Proposer un modèle du lien entre le taux de glucose et l’indice a d’un abricot.

  • A l’aide de ce modèle, donner un intervalle de confiance de niveau 95% du taux de glucose moyen d’un abricot dont l’indice colorimétrique a est égal à 5.

  • A l’aide de ce modèle, donnez un intervalle de prédiction de niveau 95% pour le taux de glucose d’un abricot dont l’indice colorimétrique ‘a’ est égal à 5.

La différence entre intervalle de confiance pour la valeur moyenne et intervalle de prédiction peut-être représentée graphiquement sous la forme suivante :

La ligne bleue indique le taux de Glucose moyen prédit par le modèle en fonction de l'indice a, la zone grisée représente l'intervalle de confiance pour ce taux moyen tandis que les deux lignes pointillées rouges délimitent le taux de Glucose prédit pour un abricot selon son indice a

La ligne bleue indique le taux de Glucose moyen prédit par le modèle en fonction de l’indice a, la zone grisée représente l’intervalle de confiance pour ce taux moyen tandis que les deux lignes pointillées rouges délimitent le taux de Glucose prédit pour un abricot selon son indice a

  • Montrer graphiquement qu’en moyenne la prédiction du taux de glucose d’un abricot par le modèle ci-dessus sur-estime le taux de glucose pour les abricots au stade de maturité 2 et au contraire, le sous-estime pour les abricots au stade de maturité 3.

  • Proposer une extension du modèle ci-dessus visant à corriger le problème de biais de prédiction mis en avant dans la question précédente.

  • La relation liant l’indice a et le taux de Glucose est-elle la même à tous les stades de Maturité ?

  • Au vu des résultats précédents, choisir un modèle pour prédire au mieux le taux de glucose d’un abricot.

  • Donner un intervalle de confiance de niveau 95 % de la valeur prédite du taux de glucose pour un abricot dont l’indice colorimétrique ‘a’ est égal à 5 et dont le stade de maturité est ‘2’ et pour un abricot de stade de maturité ‘3’.

Le vocabulaire de la séance

Commandes R

  • anova
  • Anova (package car)
  • predict
  • geom_smooth

Environnement R

Statistique

  • Analyse de la variance
  • Comparaison de droites de régression (Ancova)
  • Regression