Règle empirique

Voir le message suivant pour lire la question. Merci

Réponses

  • Je n'arrive pas à corriger mon message, voici ce que je voulais écrire :

    Bonjour,

    Pourriez-vous m'expliquer ou me donner un lien me permettant de comprendre pourquoi environ 68 % des valeurs se trouvent dans l'intervalle [x-s;x+s], 95 % dans [x-2s;x+2s]....

    J'ai hélas des lacunes énormes en stats (je n'ai jamais étudié les stas durant ma scolarité) et je ne suis pas franchement à l'aise lorsque je dois enseigner une notion sans la comprendre ......

    Merci de votre aide
  • Bonjour Dido.

    Dit ainsi, c'est faux. Pense à une série de 3 valeurs 0 puis 0,5 puis 1. La moyenne est 0,5, l'écart type est 0,41. L'intervalle [m-s;m+s] contient une seule valeur, soit 33%. Et [m-2s;m+2s] en contient 100%.

    La bonne idée est que pour une variable aléatoire Normale, de moyenne m, d'écart type s, la probabilité qu'une réalisation soit dans [m-s;m+s] est 68%, celle qu'elle soit dans [m-2s;m+2s] est 95%, celle qu'elle soit dans [m-3s;m+3s] est 99,7%.

    Soit maintenant une statistique gaussienne (les résultats obtenus pourraient être des réalisations d'une variable aléatoire Normale) sur un bon nombre de valeurs (au moins quelques dizaines); il est très probable que les valeurs vont se distribuer avec des proportions proches de ces probabilités. Donc la règle va se confirmer approximativement (mais il est très intéressant de simuler avec un tableur une loi Normale pour s'apercevoir que la dispersion d'échantillonnage joue des tours et qu'on peut avoir des déviations fortes, rarement).

    Enfin, pour une série quelconque, ces règles n'ont plus cours. Elles sont encore un peu utilisables pour des séries proches, par exemple des tirages au hasard avec remise (loi binomiale, qui s'approxime pour n important et p pas trop proche de 0 ou 1 par une loi Normale), donc pour une série de tirages binomiaux (on jette 100 fois 30 dés à la fois et on compte le nombre de six).

    Cordialement.

    NB : Si tu as un contexte plus précis, on pourra répondre de façon plus adaptée.
  • Merci pour ta réponse Gérard,
    En fait je n'ai pas d'exemple précis. Je suis en train de choisir des exercices à faire avec mes 1ereS et je suis tombé sur quelques exos demandant le calcul de la proportion des valeurs se trouvant dans ces différents intervalles pour des séries statistiques données. Et comme je n'en voyais pas bien l’intérêt et ce qu'on peux en déduire, j'ai un peu regardé sur internet et je suis tombé sur ces valeurs habituellement constatées, d'où mon interrogation; mais d'où est-ce que tout ça sort (toujours finalement pour répondre à ma question initiale, en quoi ça nous aide à étudier une série statistique ?).
    Je vais continuer à creuser, mais en fait je ne suis pas sure que ça est le moindre intérêt pour les élèves ce genre d'exercices, on ne peut pas étudier une série statistiques avec des paramètres qu'on ne comprend pas.....
  • Effectivement, Dido,

    c'est de peu d'intérêt, sauf sur des séries très nombreuses. Par contre ça peut permettre de parler du modèle gaussien, central en probabilités, et très utilisé en statistiques (même dans des cas où c'est carrément faux, malheureusement, comme en finance). On peut remplacer par des calculs d'effectifs cumulés entre des valeurs "naturelles".

    Bonne réflexion.
Connectez-vous ou Inscrivez-vous pour répondre.