Savoir si la taille d'échantillon est significative

zamy
Modifié (March 2022) dans Statistiques
Bonjour
Je vais partir d'un exemple pour essayer de m'exprimer clairement.
Disons que je joue à des courses hippiques et que j'ai décidé d'une stratégie : toujours jouer sur le cheval numéro 1.
J'applique ma stratégie sur 10 courses en pariant 100€ à chaque fois. Je perds 8 fois, je gagne 1 fois 400€ et 1 fois 800€. Au final j'ai dépensé 1000€ et j'ai gagné 1200€. Je veux savoir si mon échantillon de 10 courses est suffisamment grand pour valider ma stratégie, et quel est mon degré de certitude. (même si sur cet exemple, je me doute du résultat :smile: )
Je me rappelle vaguement avoir utilisé la p value dans mes études, il y a déjà pas mal d'années... Mais il me semble que c'était pour des lois binaires de type pile ou face.
Quelle méthode/outil statistique dois-je utiliser pour savoir jusqu'à quel point je peux faire confiance à mon échantillon ?
Merci beaucoup pour votre aide :)

Réponses

  • gerard0
    Modifié (March 2022)
    Bonjour.
    La significativité (*) d'un échantillon n'est pas liée à sa taille. par contre, pour un échantillon significatif représentatif, la taille accroit la précision des résultats (les intervalles de confiance se réduisent, la puissance des tests augmente,...).
    La représentativité est généralement obtenue en prenant au hasard les individus de l'échantillon, de façon équiprobable dans l'ensemble de la population. On en déduit des valeurs probables de caractéristiques de cette population.
    Ce n'est évidemment pas possible pour des prévisions. Tout au plus, en espérant que la suite sera identique à ce qui s'est passé jusque là, peut-on penser que ce qu'on a trouvé sera utilisable. Attention aux biais (prendre des résultats de la saison de trot, alors qu'on va traiter de courses de galop, ...).
    En tout cas, intuitivement, et tu le sens bien, ton échantillon est trop petit.
    Cordialement.

    (*) notion très différente, je considère qu'il s'agit de la représentativité



  • zamy
    Modifié (March 2022)
    Bonjour,
    Merci pour ta réponse.
    Effectivement, même avec seulement 10 courses, si elles avaient toutes été gagnantes mon échantillon aurait déjà été beaucoup plus significatif.
    Il n'y a donc pas de méthode pour connaître la significativité de mon échantillon dans ce genre de situation ? Comment puis-je savoir, lorsque j'ai un échantillon plus conséquent et plus significatif, dans quelle mesure je peux lui faire confiance ?
    Cordialement.
  • Tu peux regarder du côté des intervalles de confiance.
  • gerard0
    Modifié (March 2022)
    Zamy,
    j'ai l'impression que tu emploies le terme "significatif" sans trop savoir ce qu'il veut dire. Tu sembles vouloir dire "qui permet de prévoir solidement". Et au départ, j'ai pensé que tu confondais avec "représentatif".
    En statistiques, le terme veut dire qu'on a fait un test d'hypothèse, et que le test a échoué. On peut raisonnablement penser que l'hypothèse est fausse.
    Donc que veux-tu dire à travers ce mot "significatif" ?
    Cordialement.
    NB. Je rectifie mon premier message.
  • Significatif pour signifier quoi ?

    J'ai joué $10$ fois, j'ai gagné $n$ fois, c'est significatif. Ca permet de parfaitement décrire le passé.

    Mais si tu veux extrapoler l'avenir, c'est une autre histoire.  Même 100 parties, ou 1000 parties, ça ne permet pas d'extrapoler l'avenir.  
    Si j'ai toujours perdu au jeu X, ça ne veut absolument pas dire que je perdrai toujours.
    Et pareil si j'ai toujours gagné.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Oui  bon lourran dans ce cas on range l'antenne et on arrête les stats
  • gerard0
    Modifié (March 2022)
    Pas tout à fait,
    mais les stats donnent des informations précises qui ne permettent de prévoir la suite que "toutes choses égales par ailleurs" et "avec tant de pourcent de confiance".
    Et les techniques d'échantillonnage sont un chapitre en soi des stats.
    Cordialement.
  • Merci pour toutes vos réponses. Et désolé si je me perds un peu dans le vocabulaire :o

    En effet, j'essaie de prévoir la suite. Si mon échantillon est de 100 courses et que j'observe toujours un gain "significatif" (j'espère que j'emploie le mot à bon escient ici :D ), je vais me dire que ma stratégie est gagnante. Et j'aimerais effectivement avoir un indice de confiance : quel est le pourcentage que ma stratégie soit bonne, ou quel est celui que ce soit juste un coup de chance ?

    J'ai commencé à regarder la notion d'intervalle de confiance, le sujet à l'air vaste :) Je ne pense pas avoir affaire à une loi normale, car je vais avoir un pic quand je perd, et peut-être une distribution normale uniquement quand je gagne (ici dans mon exemple en fonction de la cote de mon cheval).
  • gerard0
    Modifié (March 2022)
    "quel est le pourcentage que ma stratégie soit bonne" ?? Est-ce que cette question a un sens ?
    Tu peux commencer par étudier les probas, puis la théorie des jeux. Si tu ne gagnes pas en certitude sur tes paris, tu auras au moins appris des maths.
    NB : je ne vois pas ce qu'une "distribution Normale" vient faire ici.
  • Noobey,
    Il ne s'agit pas de jeter à l'eau toute la théorie des stats, pas du tout.

    Il y a effectivement des tas de résultats dans cette théorie. Par exemple les sondages, c'est d'actualité.

    Ici on a un contexte 'flou' : Disons que je joue à des courses hippiques et que j'ai décidé d'une stratégie : toujours jouer sur le cheval numéro 1. 

    C'est peut-être la stratégie, ou peut-être pas. Selon ce qui se cache derrière cette phrase, on pourra avancer. Selon que le jeu est un pur jeu de hasard, ou un jeu comme des pronostics sportifs, o on s'appuie sur des connaissances qu'on a accumulées, ou autre chose, les théories mathématiques évoquées marchent, ou pas.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
Connectez-vous ou Inscrivez-vous pour répondre.