Test du chi 2 et R

malavita
Modifié (October 2022) dans Statistiques
Bonsoir,
je dispose de $n$ réalisations d'une variable aléatoire prenant pour valeurs $0,1,2,3,4,5$ et j'aimerais effectuer un test du chi2 pour décider si cette variable aléatoire suit une loi de Poisson.
Pour cela, j'estime le paramètre $\lambda$ de cette loi de Poisson, détermine la distribution théorique et effectue mon test avec la commande chisq.test.
Par défaut, cette commande calcule le nombre de degré de libertés à utiliser en fonction de la taille de mes données. Ici elle utilise donc 5 degrés de libertés. Or étant [donné] que j'ai effectué une estimation, ce nombre de degré devrait être de 4.
Est-il donc possible de modifier le nombre de degré à utiliser dans la fonction chisq.test ?
Bonne soirée
F.

Réponses

  • Bonjour, selon moi, le plus simple est de d'abord calculer la statistique de test, de fixer le nombre de degrés de liberté puis de demander la p-value
    x2obs = chisq.test(nb, p = proba)$statistic
    deg = nbdeclasses - 1 - nbdeparametresestimes
    1 - pchisq(x2obs, deg)



    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • malavita
    Modifié (October 2022)
    Ok, donc il faut le faire "à la main" ;-)
    Merci et bonne journée.
    F.
  • malavita
    Modifié (October 2022)
    Toujours sur le même sujet, je suis en train de regarder sur le test d'adéquation du chi2.
    A priori, je me dis qu'à l'issue du test soit on accepte $H_0$ soit on accepte $H_1$. Or dans le corrigé, dans le cas "on accepte $H_0$" l'auteur conclut systématiquement le test par, "on ne peut rejeter $H_0$"...
    Y a-t-il une raison particulière ou n'est ce qu'une figure de style ?
    A+
    F.
  • zeitnot
    Modifié (October 2022)
    On n'accepte ni l'un ni l'autre ! Soit "on  rejette H0" avec le fameux risque alpha, soit "on ne peut pas rejeter H0" , car on n'a pas suffisamment de bonnes raisons de le faire.
    La vie est injuste surtout pour ceux qui partent avant les cheveux blancs.
  • Vassillia
    Modifié (October 2022)
    zeitnot a raison mais justement il y a une raison particulière qui fait que l'on traite différemment $H_0$ et $H_1$
    Quand on fait un test statistique, on travaille sous l'hypothèse $H_0$ que l'on considère vraie (loi de Poisson pour toi).
    Si les observations sont trop éloignées de ce qu'on aurait dû obtenir sous cette hypothèse alors on en déduit qu'on s'est trompé dès le départ et que notre hypothèse est fausse donc on rejette $H_0$ au risque d'erreur près évidemment.
    Dans certains contextes, cela peut vouloir dire accepter $H_1$, notamment si $H_1$ englobe toutes les autres hypothèses.
    Mais si nos observations sont conformes à notre hypothèse de départ, cela ne prouve pas que $H_0$ est vraie. Il faudrait évaluer nos observations sous toutes les autres hypothèses possibles, les rejeter une par une pour en déduire qu'il ne reste plus que $H_0$. C'est la raison pourquoi on n'accepte jamais vraiment $H_0$. Un test statistique est construit pour réfuter une hypothèse car il suffit d'un seul contre-exemple pour réfuter une théorie, pas pour la confirmer car un exemple ne prouve pas une théorie.
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • Du coup c'est ballot d'avoir baptiser la zone "on ne peut pas rejeter H0", zone d'acceptation ;-)
  • zeitnot
    Modifié (October 2022)
    C'est effectivement ballot puisque ça ne s'appelle pas comme ça. Ce que tu appelles zone d'acceptation, s'appelle "zone de non-rejet".
    La vie est injuste surtout pour ceux qui partent avant les cheveux blancs.
  • malavita
    Modifié (October 2022)

  • malavita
    Modifié (October 2022)
    Apparemment, il y a deux règles de décision que je n'arrive pas à différencier :
    règle 1, je calcule ma statistique du chi2, je compare à une valeur de référence => je ne rejette pas H0.
    règle 2, je calcule ma p-value, elle est supérieur à ma valeur de référence => j'accepte H0.
    Quelque-chose m'échappe toujours ;-)
    A+
    F.
  • Bibix
    Modifié (October 2022)
    Pour la première règle, tu compares la statistique observée à une réalisation statistique de référence qui a peu de chances de s'observer. Si le résultat observé est encore plus extraordinaire que la valeur de référence, alors on rejette $H_0$ et on en déduit que $H_1$ est l'alternative rationnellement la plus vraisemblable au vu des données. C'est la règle "à la française".
    Pour la deuxième règle, on oublie cette histoire d'alternative, et on regarde juste la probabilité d'avoir un résultat encore plus extraordinaire (en supposant $H_0$) que celui observé. Si cette probabilité est suffisamment faible, on rejette $H_0$. Sinon, on ne peut rien en faire (les données ne montrent pas une différence significative), donc aucune raison de rejeter $H_0$. Mais ça ne veut pas dire que $H_0$ est vraie. C'est la règle "anglosaxone" (et c'est ce qui se fait en général car c'est facile, il n'y a pas besoin de réfléchir).
  • malavita
    Modifié (October 2022)
    Ok,
    donc pour résumer lorsque on effectue un test sur $H0$, on observe si nos données constituent un "contre exemple" de $H0$. Si c'est le cas, on rejette $H0$, sinon....on peut continuer à chercher ;-)
    Par contre dans un contexte "concret": j'usine une série de pièces de 2 mètres, je fais un test pour savoir si mon usinage est correct. Si mes résultats sont dans le domaine de "non rejet", je considère que $H0$ est valide car il y a de fortes raisons qu'elle le soit.
    Merci à tous, c'est plus clair.
    @bibix: pas besoin de réfléchir, ça veut dire qu'on regarde juste la fameuse $p$-value que l'on compare à 0.05, si c'est plus petit c'est $H1$.
    Bonne journée
    F.
  • malavita a dit :
    Si mes résultats sont dans le domaine de "non rejet", je considère que $H0$ est valide car il y a de fortes raisons qu'elle le soit.
    Il n'y a surtout aucune raison qu'elle ne le soit pas.
    Pas besoin de réfléchir, ça veut dire qu'on a pas à calculer la valeur de référence de la statistique, on calcule la proba et c'est tout (mais ça revient au même d'une certaine façon).
  • malavita
    Modifié (October 2022)
    #bibix : oui il n'y a aucune raison liée à l'échantillonnage qu'elle ne le soit pas, donc aucune raison de rejeter $H0$. Par fortes raisons, j'entendais qu'on a une machine à usiner, réglée sur 2 mètres... il y a quand même de bonnes chances de sortir des pièces de 2 m ;-)
    Tandis que si j'ai un échantillon sorti de "nulle part", que je suppose suivre une loi exponentielle parce que le nuage de points a une bonne tête... que je fais mon test le "confirme". Je n'ai pas de bonnes raisons de rejeter mon hypothèse, ce qui ne garantit en aucun cas que mon hypothèse de départ est juste...
    Merci et à bientôt
    F.
Connectez-vous ou Inscrivez-vous pour répondre.