Test du khi deux

Le test du c2 (prononcez khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Nous nous occuperons ici de déterminer si une répartition est uniforme dans le cas discret.

Méthode

  1. On répartit les valeurs de l'échantillon (de taille n) dans k classes distinctes et on calcule les effectifs de ces classes. Il faut vérifier que pour les i de 1 à k, on a npi(1-pi) 5 (éventuellement répartir les valeurs autrement). Appelons oi (i=1,...,k) les effectifs observés et ei les effectifs théoriques.

  2. On calcule
    La statistique Q donne une mesure de l'écart existant entre les effectifs théoriques attendus et ceux observés dans l'échantillon. En effet, plus Q sera grand, plus le désaccord sera important. La coïncidence sera parfaite si Q=0.

  3. On compare ensuite cette valeur Q avec une valeur issue d'un tableau (voir extrait ci-contre) à la ligne k-1 et à la colonne a. k-1 est le nombre de degrés de liberté et a la tolérance.

  4. Si Q > , et si n est suffisamment grand, alors l'hypothèse d'avoir effectivement affaire à la répartition théorique voulue est à rejeter avec une probabilité d'erreur d'au plus a.
a
0.05 0.01
k-1 1 3.84 6.64
2 5.99 9.21
3 7.82 11.35
4 9.49 13.28
5 11.07 15.09
6 12.59 16.81
7 14.07 18.48
8 15.51 20.09
9 16.92 21.67
10 18.31 23.21
11 19.68 24.73
12 21.03 26.22
Exemple
On a lancé un dé 90 fois et on a obtenu les issues 1 à 6 (k=6) avec les effectifs suivants: 12, 16, 20, 11, 13, 18 (on a vérifié que 90 lancers sont suffisants: n(1/6)(5/6) 5 implique que n 36).
Si le dé n'est pas pipé (notre hypothèse), on attend comme effectifs moyens théoriques 15 pour toutes les issues.

Pour k-1=5 degrés de liberté et un seuil de tolérance de 5%, la valeur du tableau est 11.1. Cela signifie que la probabilité que Q soit supérieur à 11.1 est de 5% (voir figure ci-contre). Comme 4.266 < 11.1, on accepte l'hypothèse selon laquelle le dé est régulier.


Fonction de répartition de la loi du c2 pour 5 degrés de liberté.


Programme javascript

Catégorie
Observé
Théorique










































Sommes:
[Notez que si k-1 = 1, la valeur du khi deux est corrigée pour la continuité.] [Pour k-1 = 1, valeur du khi deux sans correction de continuité.]
khi deux =
khi deux =

 Valeurs critiques du khi deux pour degrés de liberté:
a Seuils Verdict
0.05

0.01


Didier Müller, 30.12.02