Test du chi 2 et R

malavita · October 2022

Bonsoir,
je dispose de $n$ réalisations d'une variable aléatoire prenant pour valeurs $0,1,2,3,4,5$ et j'aimerais effectuer un test du chi2 pour décider si cette variable aléatoire suit une loi de Poisson.

Pour cela, j'estime le paramètre $\lambda$ de cette loi de Poisson, détermine la distribution théorique et effectue mon test avec la commande chisq.test.

Par défaut, cette commande calcule le nombre de degré de libertés à utiliser en fonction de la taille de mes données. Ici elle utilise donc 5 degrés de libertés. Or étant [donné] que j'ai effectué une estimation, ce nombre de degré devrait être de 4.

Est-il donc possible de modifier le nombre de degré à utiliser dans la fonction chisq.test ?

Bonne soirée
F.

Vassillia · October 2022

Bonjour, selon moi, le plus simple est de d'abord calculer la statistique de test, de fixer le nombre de degrés de liberté puis de demander la p-value

x2obs = chisq.test(nb, p = proba)$statistic
deg = nbdeclasses - 1 - nbdeparametresestimes
1 - pchisq(x2obs, deg)

malavita · October 2022

Ok, donc il faut le faire "à la main" ;-)
Merci et bonne journée.
F.

malavita · October 2022

Toujours sur le même sujet, je suis en train de regarder sur le test d'adéquation du chi2.
A priori, je me dis qu'à l'issue du test soit on accepte $H_0$ soit on accepte $H_1$. Or dans le corrigé, dans le cas "on accepte $H_0$" l'auteur conclut systématiquement le test par, "on ne peut rejeter $H_0$"...

Y a-t-il une raison particulière ou n'est ce qu'une figure de style ?
A+
F.

zeitnot · October 2022

On n'accepte ni l'un ni l'autre ! Soit "on rejette H0" avec le fameux risque alpha, soit "on ne peut pas rejeter H0" , car on n'a pas suffisamment de bonnes raisons de le faire.

Vassillia · October 2022

zeitnot a raison mais justement il y a une raison particulière qui fait que l'on traite différemment $H_0$ et $H_1$

Quand on fait un test statistique, on travaille sous l'hypothèse $H_0$ que l'on considère vraie (loi de Poisson pour toi).

Si les observations sont trop éloignées de ce qu'on aurait dû obtenir sous cette hypothèse alors on en déduit qu'on s'est trompé dès le départ et que notre hypothèse est fausse donc on rejette $H_0$ au risque d'erreur près évidemment.

Dans certains contextes, cela peut vouloir dire accepter $H_1$, notamment si $H_1$ englobe toutes les autres hypothèses.

Mais si nos observations sont conformes à notre hypothèse de départ, cela ne prouve pas que $H_0$ est vraie. Il faudrait évaluer nos observations sous toutes les autres hypothèses possibles, les rejeter une par une pour en déduire qu'il ne reste plus que $H_0$. C'est la raison pourquoi on n'accepte jamais vraiment $H_0$. Un test statistique est construit pour réfuter une hypothèse car il suffit d'un seul contre-exemple pour réfuter une théorie, pas pour la confirmer car un exemple ne prouve pas une théorie.

malavita · October 2022

Du coup c'est ballot d'avoir baptiser la zone "on ne peut pas rejeter H0", zone d'acceptation ;-)

zeitnot · October 2022

C'est effectivement ballot puisque ça ne s'appelle pas comme ça. Ce que tu appelles zone d'acceptation, s'appelle "zone de non-rejet".

malavita · October 2022

Image: https://les-mathematiques.net/vanilla/uploads/editor/r9/emwmhbefrayu.png

malavita · October 2022

Apparemment, il y a deux règles de décision que je n'arrive pas à différencier :
règle 1, je calcule ma statistique du chi2, je compare à une valeur de référence => je ne rejette pas H0.
règle 2, je calcule ma p-value, elle est supérieur à ma valeur de référence => j'accepte H0.

Quelque-chose m'échappe toujours ;-)
A+
F.

Bibix · October 2022

Pour la première règle, tu compares la statistique observée à une réalisation statistique de référence qui a peu de chances de s'observer. Si le résultat observé est encore plus extraordinaire que la valeur de référence, alors on rejette $H_0$ et on en déduit que $H_1$ est l'alternative rationnellement la plus vraisemblable au vu des données. C'est la règle "à la française".
Pour la deuxième règle, on oublie cette histoire d'alternative, et on regarde juste la probabilité d'avoir un résultat encore plus extraordinaire (en supposant $H_0$) que celui observé. Si cette probabilité est suffisamment faible, on rejette $H_0$. Sinon, on ne peut rien en faire (les données ne montrent pas une différence significative), donc aucune raison de rejeter $H_0$. Mais ça ne veut pas dire que $H_0$ est vraie. C'est la règle "anglosaxone" (et c'est ce qui se fait en général car c'est facile, il n'y a pas besoin de réfléchir).

malavita · October 2022

Ok,
donc pour résumer lorsque on effectue un test sur $H0$, on observe si nos données constituent un "contre exemple" de $H0$. Si c'est le cas, on rejette $H0$, sinon....on peut continuer à chercher ;-)
Par contre dans un contexte "concret": j'usine une série de pièces de 2 mètres, je fais un test pour savoir si mon usinage est correct. Si mes résultats sont dans le domaine de "non rejet", je considère que $H0$ est valide car il y a de fortes raisons qu'elle le soit.
Merci à tous, c'est plus clair.

@bibix: pas besoin de réfléchir, ça veut dire qu'on regarde juste la fameuse $p$-value que l'on compare à 0.05, si c'est plus petit c'est $H1$.
Bonne journée
F.

Bibix · October 2022

malavita a dit :
Si mes résultats sont dans le domaine de "non rejet", je considère que $H0$ est valide car il y a de fortes raisons qu'elle le soit.

Il n'y a surtout aucune raison qu'elle ne le soit pas.
Pas besoin de réfléchir, ça veut dire qu'on a pas à calculer la valeur de référence de la statistique, on calcule la proba et c'est tout (mais ça revient au même d'une certaine façon).

malavita · October 2022

#bibix : oui il n'y a aucune raison liée à l'échantillonnage qu'elle ne le soit pas, donc aucune raison de rejeter $H0$. Par fortes raisons, j'entendais qu'on a une machine à usiner, réglée sur 2 mètres... il y a quand même de bonnes chances de sortir des pièces de 2 m ;-)

Tandis que si j'ai un échantillon sorti de "nulle part", que je suppose suivre une loi exponentielle parce que le nuage de points a une bonne tête... que je fais mon test le "confirme". Je n'ai pas de bonnes raisons de rejeter mon hypothèse, ce qui ne garantit en aucun cas que mon hypothèse de départ est juste...

Merci et à bientôt
F.

Test du chi 2 et R

Réponses

Bonjour!

Catégories

In this Discussion

Qui est en ligne 30