Test d'hypothèse vs intervalle de confiance

Je vais illustrer ma question par un exemple, mais l'idée générale est : j'ai le sentiment qu'un intervalle de confiance donne plus d'infos qu'un test d'hypothèses (dans des cas limités peut-être, qui sont ceux auxquels je m'intéresse en ce moment ...), est-ce que je me trompe ?

Par exemple, on souhaite comparer deux productions en usine par deux machines différentes.
On fait un relevé sur n jours d'un caractère quelconque et on souhaite tester s'il existe une différence significative sur les moyennes.

On peut donc tester, au risque x%, que les moyennes sont égales, ou bien réaliser un intervalle de confiance, à x%, de la différence entre les deux moyennes.

Dans un cas, on rejette ou non l'hypothèse, point. Dans l'autre on a le sentiment d'en connaître un peu plus sur l'ordre de grandeur de l'écart de production avec l'intervalle dans les mains. Et on peut tout simplement regarder si 0 fait partie ou non de l'intervalle.

Du coup, dans mon exemple, quel intérêt de tester une hypothèse ? (dans d'autres cas, c'est peut-être le seul recours ?)

À nouveau, désolé d'avance si mon message contient des erreurs grossières, mon niveau en statistiques (et probabilités) est un peu ridicule, mais j'essaye de me soigner !

Réponses

  • Bonjour.

    Il s'agit de deux idées différentes, qui, ici, sont faites par le même moyen (le test d'hypothèse est fait avec un intervalle de confiance). Donc dans ce cas, il y a proximité.
    Mais ce sont deux idées différentes :
    * intervalle de confiance : examiner
    * test d'hypothèse : décider

    Cordialement.
  • Merci.

    Mais dans mon exemple, on est bien d'accord que l'intervalle de confiance permet aussi de décider : si 0 n'est pas dans l'intervalle, on rejette l'hypothèse d'égalité des moyennes ?
  • Oui,

    tu utilises ton intervalle pour faire un test d'hypothèse ...Et ta phrase est incomplète; ce devrait être " on rejette l'hypothèse d'égalité des moyennes au risque t%" (si ton intervalle de confiance est à (100-t)%).
    En fait, dans un test d'hypothèse, on utiliserait plutôt un intervalle de dispersion à (100-t)% centré en 0 comme intervalle d'acceptation, et on rejetterait l'hypothèse "les moyennes sont égales" si la moyenne des écarts est en dehors de l'intervalle. Utiliser l'échantillon pour construire la zone d'acceptation se fait seulement quand on n'a pas d'autre moyen.

    Cordialement.
  • Un autre moyen serait utilisable si on connaît les caractéristiques (moyenne et ecart type) pour une des deux machines ?
    Mais tu es bien obligé de partir d'un échantillon pour une "nouvelle" machine ou suite à un réglage /réparation ?
  • Désolé, je ne comprends pas ta première phrase.
    Et pour la deuxième, si je reviens à ton premier message, tu faisais la comparaison entre deux échantillons.

    Connais-tu la théorie des tests d'hypothèses ? Quand on la connaît, on peut l'appliquer à ta situation, de différentes façons. Et il existe des tests classiques tout prêts, qu'on peut utiliser tranquillement. Le tien n'en fait pas partie, il est proche d'un test t de Student pour échantillons appariés.

    Il serait mieux que tu précises pourquoi tu poses ces questions (exercice à faire/apprentissage seul des stats/problème concret industriel/...).

    Cordialement.
  • Pardon, ma question faisait suite à la dernière phrase de ton message précédent :
    "Utiliser l'échantillon pour construire la zone d'acceptation se fait seulement quand on n'a pas d'autre moyen."

    Je me demandais de quel autre moyen on pourrait disposer, de manière générale. Puisque j'ai le sentiment que la démarche est systématiquement de partir d'un échantillon pour estimer les caractéristiques de la population entière.

    Dans "l'exemple" que j'ai cité, tiré de quelques exercices vus ça et là, on utilise effectivement un test de Student ( éventuellement avec données appariées, ou en supposant les variances égales pour utiliser un estimateur de cette variance commune etc ...)

    Et sinon, je ne fais des stats que pour mon bon plaisir, et tout seul, ce qui explique pas mal de choses sur mon niveau ;)
  • Prenons l'exemple que tu citais, le contrôle qualité d'une machine après réparation (changement d'outil). L'historique de fabrication de la machine nous indique que, à l'exception du jour de la panne, la cote C avait une moyenne de c avec un écart type e. On teste la machine après réparation. On admet que le changement d'outil ne modifie pas la dispersion des cotes.
    Le test est classique, c'est le test d'adéquation à une moyenne donnée, dans le cas gaussien (*). Avec une confiance de 95%, sous l'hypothèse H0 : "la moyenne de fabrication est C", la moyenne d'un échantillon de n pièces sera dans l'intervalle d'acceptation I (**). On prend un échantillon de 20 pièces au hasard sur la première centaine de pièces fabriquées (***), on mesure sa moyenne m de la cote C.
    Si m est dans I, on continue la fabrication;
    si m est en dehors de I, on peut rejeter H0, il faut reprendre le réglage (et éventuellement vérifier les 80 autres pièces).

    Tu pourras remarquer que le test est construit sur l'hypothèse H0, sans considération de l'échantillon; seule la décision est liée à l'échantillon. Mais parfois ce n'est pas possible.

    "...j'ai le sentiment que la démarche est systématiquement de partir d'un échantillon pour estimer les caractéristiques de la population entière. ". Encore une fois tu mélanges deux démarches très différentes : L'estimation par échantillon, et le test d'un hypothèse statistique. Il n'y a pas d'hypothèse dans l'estimation. Il va te falloir étudier de près la méthode des tests d'hypothèse (ça s'apprend facilement seul, je l'ai fait).

    Cordialement.

    (*) la variable aléatoire "cote d'une pièce prise au hasard" suit à priori une loi Normale, les erreurs de cotes venant de nombreuses causes aléatoires indépendantes et de même ordre de grandeur.
    (**) $I=[C-\frac{1,96e}{\sqrt n},C+\frac{1,96e}{\sqrt n}]$
    (***) on a laissé de côté les premières pièces de réglage
  • Merci pour ces explications.

    Même si j'avoue que je n'étais pas clair, la première partie de ton message était exactement ce que j'avais en tête quand je disais tout à l'heure que l'on connaissait déjà les caractéristiques d'une des deux machines (avant réglage ou pour la comparer à une nouvelle machine).

    Ensuite oui je suis restrictif quand je parle d'estimation mais que l'objectif soit une estimation ou prendre une décision (avec un test), ce que je voulais dire c'est qu'on a bien systématiquement besoin de partir d'un échantillon ?

    Pour les tests, c'est ce que je fais en ce moment même si ça ne ne se voit pas :p mais j'ai bien l'impression qu'il y en a des tonnes, même si la démarche générale est essentiellement la même, dans ceux que j'ai pu voir pour l'instant.
  • Il existe des tests sur la population (*), mais en général, quand on a des connaissances sur toute la population, on n'a pas vraiment d'hypothèse, puisqu'on sait. Donc oui, on fait des tests quand on n'a de connaissance que sur une partie de la population, donc sur un échantillon. Mais une chose est d'utiliser une étude de l'échantillon pour pratiquer un test déjà construit, une autre est d'utiliser l'échantillon pour construire le test (ce que tu faisais au départ). Tu donnes l'impression de ne pas arriver à faire la différence entre ces deux démarches.

    Cordialement.

    (*) par exemple le khi-deux d'indépendance de deux caractères. Pas d'échantillon.
  • Non effectivement, je ne la fais pas vraiment.

    J'ai simplement l'impression que la variable de test différe selon ce que l'on sait ou pas de la population
    : moyenne ou variance essentiellement.
    Du coup effectivement on peut se servir d'estimations de la moyenne ou de la variance si elles ne sont pas connues, c'est ce que tu appelles construire le test ?

    Pour le khi deux d'indépendance, là encore je passe à côté de quelque chose car dans les exemples que j'ai vus, on partait bien d'échantillons : on somme les carrés des ecarts entre effectifs relevés et effectifs théoriques en cas d'indépendance.
  • Relis ce message; compare à ce que tu disais au premier message. Si tu ne vois toujours pas la différence, j'expliquerai encore.

    Déjà une chose : la question n'est pas "échantillon ou pas"; mais construction du test.

    Je t'ai parlé du test du khi-deux d'indépendance sur une population. Que tu ais vu des tests par échantillon, c'est normal dans un cours de statistiques inférentielles. Mais dans l'étude d'une population (stats descriptives), ce qui compte est l'étude des caractères eux-mêmes. Et on a tous les résultats.
    Je n'en ai parlé que parce que tu revenais sans cesse à cette idée d'échantillon.

    Cordialement.

    NB : C'est une mauvaise idée de tirer des conclusions des énoncés d'exercices. Ce qui doit être source de ta réflexion, c'est la théorie (le "cours"). Les exercices n'en sont que des mises en pratique très particulières.
  • "Utiliser l'échantillon pour construire la zone d'acceptation se fait seulement quand on n'a pas d'autre moyen." -> je ne "revenais sans cesse" à cette idée d'échantillon que pour comprendre ce que tu avais voulu dire là.

    Je n'ai absolument jamais fait de stats ( et quasiment pas de probas ) durant tout mon cursus, donc je pars de rien ! Et ce qui m'intéresse avant tout, c'est de découvrir les applications que l'on peut en faire. Donc j'accorde beaucoup d'importance à la théorie ( c'est des maths après tout et j'aime ça ) mais ce qui m'intéresse particulièrement, ce sont les applications. Je ne suis pas étudiant, ne cherche pas à être un expert, juste à m'instruire de manière plaisante.
    D'autre part, la théorie ne m'indique pas ce qui se fait fréquemment ou pas, ce qu'on fait "seulement quand on n'a pas d'autre moyen".

    Bref, merci pour tes réponses.

    Edit : ok j'ai compris, je pense, ce que tu voulais dire. La nuance qui m'a échappé étant la différence entre "utiliser l'échantillon pour CONSTRUIRE la zone d'acceptation" et "utiliser l'échantillon pour se situer par rapport à cette zone et donc prendre sa décision". Et je vois bien, en relisant, que tu l'avais dit dans tes messages, mais il n'est pas forcément évident, pour moi en tout cas, de le comprendre directement.
Connectez-vous ou Inscrivez-vous pour répondre.