Statistiques avec un tableur

Leçon 7 : comparaison de deux grandes séries de données

Deux espèces de chênes

Deux espèces de chênes existent en Belgique: le chêne pédonculé (Quercus robur) et le chêne sessile (Quercus petrae). Ces deux chênes ont-ils les mêmes caractéristiques? Peut-on les différencier? Comment?
Nous choisirons arbitrairement de nous intéresser aux feuilles et, faute de temps, nous nous limiterons à l'étude d'un seul caractère quantitatif: la longueur du pétiole. La clef de détermination donne une valeur variant de 5 à 10 mm pour le chêne pédonculé et de 10 à 30 mm pour le chêne sessile. Il s'agit donc d'un caractère permettant de distinguer les deux espèces, mais qui varie fortement au sein d'une même espèce.

Chêne pédonculé: pétiole très court Chêne sessile: long pétiole

Cependant, la longueur du pétiole dépend notamment de la taille de la feuille et donc de son âge (une jeune feuille, plus petite, aura normalement un pétiole plus court). Par contre, le rapport entre la longueur du pétiole et la longueur totale de la feuille est indépendant de l'âge et du choix de l'unité de mesure. Nous utiliserons donc ce rapport par la suite.
Le fichier ci-dessous contient les données : 500 mesures pour le chêne pédonculé et 570 pour le chêne sessile.

lecon07.xls (28 Ko)

Travail

  1. Comparez la répartition des mesures pour les deux types de chênes sur un histogramme (voir exemple ci-dessous). Vous avez remarqué qu'il n'y a pas le même nombre de mesures pour les deux types de chênes...
    Comment utiliser ce graphique pour différencier un chêne pédonculé d'un chêne sessile? Y a-t-il risque d'erreur? Développez!

  2. Comparez les répartitions des mesures pour les deux types de chênes avec la courbe de Gauss (aussi appelée courbe de Gauss-Laplace, ou courbe en cloche, ou loi normale) donnée par la formule:

    m est la moyenne et s l'écart-type.
    Attention! Pour comparer les deux histogrammes, il faut que les aires des deux histogrammes soient identiques (l'aire de l'histogramme de la loi normale vaut toujours 1, quels que soient m et s).
    Comment interprétez-vous ces graphiques?


Référence


Didier Müller, 4.10.03