Principe des tests

Harmonique
Modifié (February 2023) dans Statistiques
Bonsoir à vous, j'ai une préoccupation sur les tests statistiques dont j'essaie d'éclairer depuis déjà  plusieurs jours.
 En fait sur mon coup à propos des tests le principe est de définir les différentes hypothèses Ho et H1, ensuite définir la variable de décision Z, puis déterminer la zone de rejet ou d'acception de Ho, et enfin de calculer une observation z de la statistique Z pour tirer les conclusions.
  Mais dans plusieurs documents à propos des tests le procédé n'est pas similaire, ils comparent parfois la valeur observée avec un quantil (pour conclure), ils calculent parfois la p-valeur pour conclure.
 Je me demande bien si toutes ces méthodes sont équivalentes.
 J'ai beau fouiller des documents à propos de la p-valeur pour en connaître davantage, mais les contenus à propos restent toujours flous à mon égard.
 Je vous prie de m'expliquer ce principe qui me semble fascinant. 
Merci d'avance...

Réponses

  • gerard0
    Modifié (February 2023)
    La p-valeur s'est imposée dans les logiciels de statistique, car une fois donnée, elle permet à l'utilisateur, en fonction du risque qu'il a choisi, de décider. Il n'est pas nécessaire que le logiciel demande le risque.
    L'idée est de calculer, parmi tous les risques possibles, celui pour lequel l'échantillon testé donnerait "on est juste à la limite entre accepter H0 ou pas". C'est moins informatif qu'une zone de rejet calculée à partir de H0 et du risque, mais ça suffit généralement aux utilisateurs.
    Cordialement.
  • Pomme de terre
    Modifié (February 2023)
    La construction de la zone de rejet te définit une certaine famille croissante d'évènements $(R_\alpha)_{\alpha \in [0,1]}$ tels que la probabilité de $R_\alpha$ sous $H_0$ est inférieure à $\alpha$ (le niveau du test).
    L'utilisation basique est alors la suivante.
    On fixe $\alpha \in [0,1]$. Le test de niveau $\alpha$ rejette $H_0$ lorsque $R_\alpha$ est réalisé (c'est-à-dire que $\omega \in R_\alpha$).
    La $p$-valeur est une manière un peu subtile de résumer le résultat du test.
    C'est un nombre associé à la réalisation $\omega$, défini comme le plus grand niveau pour lequel le test rejette $H_0$ :
    $$p(\omega) = \sup\{\alpha \in [0,1] \mid \omega \in R_\alpha\}.$$ Le test de niveau $\alpha$ rejette $H_0$ lorsque $p(\omega) < \alpha$.
  • Vassillia
    Modifié (February 2023)
    Bonjour, je te le fais en unilatéral car c'est plus lisible mais c'est le même principe en bilatéral.
    Considérons que sous H0 notre statistique de test Z suit une loi normale centrée réduite (puisque tu parles de z).
    On définit le risque $\alpha = P(Z>quantile)$ et on se dit "si notre observation arrive dans cette zone qui est trop improbable alors on rejettera H0".
    Cela nous permet de définir la zone de rejet : être supérieur à ce quantile et la zone de non rejet : être inférieur à ce quantile.
    On fait notre expérience et on tombe sur le zobs du schéma précédent qui vérifie zobs>quantile donc on rejette c'est ce qu'on appelle un test selon Neymar et Pearson.
    Mais on aurait pu réfléchir autrement. La pvalue correspond à la probabilité, toujours si H0 est vraie, d'avoir une observation encore plus improbable que celle observée, voir schéma ci-dessus. C'est le test selon Fisher.
    Numériquement parlant, on a bien évidemment zobs > quantile <=> pvalue < α donc tu verras souvent dire que c'est équivalent pour autant les puristes vont te dire qu'on n'a pas le droit de comparer la pvalue à quoi que ce soit comme il s'agit d'une probabilité conditionnelle (conditionnée par le fait que H0 soit vraie).
    Fondamentalement, ils n'ont pas tort, il est de nos jours plus ou moins reconnu qu'il va quand même falloir se décider à enseigner les stats baysiennes un de ces jours car c'est le seul moyen d'avoir des infos sur la probabilité que H0 soit vraie ou pas.
    Le gros problème des tests que je viens de te présenter, c'est qu'ils se font sous H0 or si cette hypothèse de départ est très très probable, le fait d'avoir un résultat improbable sous cette hypothèse ne peut pas forcément être suffisant pour rejeter H0, cela rend juste l'hypothèse de départ un peu moins probable et au fur et à mesure des expériences, on ajustera la probabilité de cette hypothèse de départ. Inconvénient cependant, il faut donner une probabilité à priori à cette hypothèse de départ. En pratique, le résultat d'une expérience va se traduire par un ajustement des paramètres de la loi que l'on avait supposée comme étant vraie comme hypothèse de départ et donc petit à petit on trouve la "meilleure loi" modélisant le phénomène.
    Edit. Zut, j'ai mis trop de temps à écrire mes histoires, je n'avais pas vu qu'on t'avait déjà répondu.
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • Merci à vous Vasisllia, Pomme de terre et gerad0, Merci pour ces explications enrichies d'illustrations, je suis très éclairé et inspiré par chacun de vos illustrations et exemples, c'est très sympathique.
      Je crois maintenant être mieux nanti à propos. :):)
     
Connectez-vous ou Inscrivez-vous pour répondre.