Variance de moyenne empirique

Excusez moi mais j'ai vraiment besoin de votre aide plus que jamais.
Voila ca fait 1 an que j'ai du mal a comprendre une notion.
C'est le resultat V(sum(Xi/n)de 1 à n)=variance de la population/n.
J'ai vraiment du mal toute les démonstatration se servent des fonctions variance V et esperance E directement.
Est ce que quelqu'un pourrai me démontrer ce resultat en passant juste par le signe somme( sigma)
Des le début par exemple:
V(sum(Xi/n)de 1 à n)= 1/n(puissance ????) sum (sum(Xi/n)de 1 à n - moyenne de la pop)² de 1 à n

je connais meme pas la puissance de n, est ce n ? n puissance n car la probabilité d'avoir X1=x X2=x ....Xn=x est 1/n * 1/n * 1/n ....
est cela ?
Pourais je s'il vous plait avoir une démonstration développé et détaillé de ce résultat.
Meme avec l'implication que les Xi sont indépendantes.
«1

Réponses

  • SVP aidez moi.j'ai vraiment trop de mal.
  • Il va falloir que tu sois beaucoup plus claire que ça dans la description de ton problème...j'ai strictement rien compris à ce que tu nous demandes dsl :/
  • En fait ce que je demande c'est d'écrire la formule V(Xn)
    avec Xn la variable aléatoire qui représente la moyenne empirique (d'échantillon).
    En fait je ne connais pas la définition de la variance pour des sommes de variables aléatoires.
    J'ai déjà demandé ça à mon prof il ne m'a pas non plus expliqué ... :-(
    SVP j'ai besoin de comprendre cela.
    Juste me dire ce que c'est que V(Xn).
    Merci
  • et bien si $\bar{X}_n = \displaystyle{\frac{1}{n}\sum\limits_{i=1}^{n}X_n}$, la moyenne empirique de n variables aléatoires indépendantes et identiquement distribuées, tu as $\mathbb{E}[\bar{X}_n] = \mathbb{E}[X_1]$ et $Var[\bar{X}_n] = \frac{1}{n}Var[X_1]$...
  • Voila c'est exactement ce que je voulais qu'on utilise pas.
    Les fonction V et E
    Je veux pouvoir ecrire ces 2 termes avec que des sommes et pondérés par les probabilités de chaque réalisation.
    Comme cela je souhaite une fois la formule marqué avec les réalisations, arriver à démontrer

    $Var[\bar{X}_n] = \frac{1}{n}Var[X_1]$

    Mais non pas grace au au propriété de la variance directement avec la fonction variance mais avec la formules complexes avec les sommes des réalisations pondérés
    Merci d'avance
  • pourquoi faire compliqué quand on peut faire simple en fait... :s
  • En fait, c'est dû au fait que je n'arrive pas à sauter des états quand je ne comprends pas le sujet à 100% et donc là le fait de trouver cette formule et d'arriver par ce biais au résultat m'aiderait vraiment à la compréhension du sujet et à la modélisation de la logique par rapport à cette formule dans ma tête.
    Si quelqu'un savait écrire cette formule, je lui en serais vraiment énormément et sincèrement reconnaissant.
  • ben c'est juste que, lorsque les v.a. sont indépendantes, la variance de la somme est la somme des variances...
  • Cela je le sais en effet.
    Mais je veux passer par la formule développée pour le démontrer à ma manière.
    Pour comprendre bien ce que cela signifie.
    En général pour démontrer cela les gens passent par l'autre définition de la variance moyenne pour démontrer cela.
    Et même je ne peux pas me dire que je ne sais pas mettre cette formule sous forme plus développé car cela signifie que je ne comprends pas très bien ce que la définition de la variance et d'avoir cette formule me ferait mieux comprendre la "S"tatistique en général.
    J'ai même du mal à trouver les pondérations des différentes réalisations des $\overline{X}_n = \displaystyle{\frac{1}{n}\sum\limits_{i=1}^{n}X_n}$
    et si je trouve ces pondérations en terme de proba je pourrais "peut"-être marquer la formule pour la variance puis de la réussir à faire sortir un $\frac 1 n$ et obtenir alors la variance des $X_i$ car c'est cela que la formule nous dit.
  • Je ne comprends pas ce que tu appelles "formule développée" ???
  • La formule mais sans utilisation de Var(.) ou E(.)
    Vraiment en utilisant ce que veullent dire la variance et l'ésperence.
    Partir de la base pour trouver ce résultat.
    J'ai la définition de la variance je l'applique à une somme de variables aléatoires (ca deja je sais pas le faire) et je regarde la formule mais sans utiliser V(.) ou E(.) car avec cela je me suprime les probabilités de chaque réalisation (ici je suppose que les realisations sont equiprobables) et je veux regarder chaque donnée.
  • Deja par exemple est ce que:

    $Var[\bar{X}_n] =\mathbb{E}\displaystyle({\frac{1}{n}\sum\limits_{i=1}^{n}X_n} - m)²$

    avec m la moyenne de la population et donc en meme temps la moyenne des ${\frac{1}{n}\sum\limits_{i=1}^{n}X_n}$
  • tu veux dire $\mathbb{E}[X] = \sum_k kP(X = k)$ !?? si oui, ben tu as aussi, et surtout, $\mathbb{E}[f(X)] = \sum_k f(k)P(X = k)$ sous quelques hypothèses que tu trouveras dans n'importe quel bouquin ou pdf de probas...
  • ERRATUM


    Deja par exemple est ce que:

    $Var[\bar{X}_n] =\mathbb{E}\displaystyle({\frac{1}{n}\sum\limits_{i=1}^{n}X_i} - m)²$

    avec m la moyenne de la population et donc en meme temps la moyenne des ${\frac{1}{n}\sum\limits_{i=1}^{n}X_i}$

    ps: Désole je corrige c'est des i et non des n en indices
    ( au moins cela m'aura servi à me familiariser avec le LateX avant de créer ce poste je connaissais pas du tout)
  • oui c'est cela que je veux dire.
    je voudrai utiliser que cette définition pour modéliser le probleme et le résoudre si possible par la suite
  • en faite c'est les $P(X = k)$ qui se transfome si on fait plus la variance d'une variable aléatoire mais de la somme de variable aléatoire en (je crois) $P(\displaystyle{\frac{1}{n}\sum\limits_{i=1}^{n}X_i} = k)$
    Donc en somme la probabilité pour chaque réalisation décroit
    Si $P(X = k)$=1/m
    alors $P(\displaystyle{\frac{1}{n}\sum\limits_{i=1}^{n}X_i}$= k)= $(\frac{1}{m})$^puissance n
  • ouh lalalla je sais pas si c'est qu'il est tard ou quoi :s je comprends pas tout...
    précise un peu !! tes v.a., leur loi ?? espace de probas tout ça...
  • donc on a disont des variables aléatoires indépendantes que l'on somme.
    prenons n valeurs possibles par variable aléatoire.
    Donc quand on calcule l'espérance et la variance de cette va on prend comme pondération pour chaque réalisation de la va X 1/n
    Maintenant supposons que l'on prend 2 fois la va X ( tirage avec remise) donc on les indexe par i i allant de 1 à 2
    la chaque réalisation n'est plus pondéré par 1/n mais 1/n².
    Et cela peut se généraliser pour n va X et non 2.
    C'est de là en faite que je souhaite partir.
    Grâce a cela ecrire la formule avec les sommes.
    Pour deja voir si ce que je pense est bon.
    Et ensuite voir ce qu'implique de factoriser par 1/n vu que si on fait cela par définition on devrait avoir la variance de la population.
  • je suis trop fatigué je vais aller dormir.
    Je tiens a te remercier tu es le seul qui s'occupe de mon probleme et j'espere pouquoi pas avoir des réponses bientot.
  • Bon, si j'ai bien compris, tu as $n$ variables aléatoires $X_i$ indépendantes et toutes à valeurs dans $\{1,\ldots,m\}$, sur lequel elles sont équidistribuées, c'est à dire que $\forall j \in \{1,\ldots,m\}$, $P(X_i = j) = \frac{1}{m}$. Est-ce que c'est bien ça ?
  • Oui tout à fait c'est cela
    (par exemple avoir une population 2 3 5 6 8 dans cette exemple m=5 et jveux prendre des échantillons de taille n et calculer sa variance)
  • la variance de quoi ??
    je t'invite dans un 1er temps à calculer clairement $\mathbb{E}[X_i]$, $\mathbb{E}[X_i^2]$ et en déduire $Var[X_i]$. Ensuite, on essaiera de voir ce qu'on peut faire avec $\bar{X}_n$...
  • Ah tu voulais passer par cette formule ?
    Et pourquoi pas en calculant ma moyenne des différences des réalisations à la moyenne au carré.
    Car intuitivement c'est la 1ere définition de la variance.
    sinon cela ferait
    $\mathbb{E}[X_i]=(2+3+5+6+8)/5=4.8$
    $\mathbb{E}[X_i^2]=(2²+3²+5²+6²+8²)/5=138/5=27.6$
    $Var[X_i]=27.6-(4.8)²=4.56$

    Ensuite si je veux calculer la moyenne de la moyenne par exemple de 2 va $X_i$
    $\mathbb{E}[(X_i+X_j)/2]= ((2+2)/2)+((2+3)/2)+((2+5)/2) +((2+6)/2) +((2+8)/2) +((3+2)/2) + \ldots /5²$
    Je crois que c'est là où je fais une erreur...

    [Corrigé presque ($(X_i+X_i)/2=X_i$ non ?) selon ton indication. AD]
  • je te demandais le cas général... ;)
    $\mathbb{E}[X_i] = \displaystyle{\sum\limits_{j=1}^{m} j P(X_i = j)} = ... $
    $\mathbb{E}[X_i^2] = \displaystyle{\sum\limits_{j=1}^{m} j^2 P(X_i = j)} = ... $
  • $\mathbb{E}[X_i] = \displaystyle{\sum\limits_{j=1}^{n} j P(X_i = j)} = ((2+2+2+2.....+2)/n)+((2+2+2+2....+3)/n)+((2+2+2+2.....+5)/n) +((2+2+2+2+2.....+6)/n) +((2+2+2+2....+8)/n) + \ldots ) /5^n$


    $\mathbb{E}[X_i] = \displaystyle{\sum\limits_{j=1}^{n} j P(X_i = j)} = ((2+2+2+2.....+2)/n)²+((2+2+2+2....+3)/n)²+((2+2+2+2.....+5)/n)² +((2+2+2+2+2.....+6)/n)² +((2+2+2+2....+8)/n)² + \ldots ) /5^n$

    [Oui merci AD c'etait cela , les Xi sont indépendants]
  • je veux pas voir de 2 et 3 :@ le cas général stp ;)
  • Ah désolé j'ai mal compris ce que tu me demandais
    J'ai compris pour le cas general c'est a dire il y a une somme de grandeur n
    En haut ca correspond en faite à la moyenne de la moyenne d'echantillon de taille n et à la moyenne des moyenne au carré d'échantillon toujours de taille n
    Mais est ce que ce que j'ai marqué est bon?

    [désolé AD je te donne encore du travail]
  • pour l'instant, y a pas de n là...;) et puis bon, si tu avais compris le cas général, on serait pas en train de causer depuis hier soir
  • $\mathbb{E}[X_i] = \displaystyle{\sum\limits_{j=1}^{m} j / m } $

    $\mathbb{E}[X_i]² = \displaystyle{\sum\limits_{j=1}^{m} j² / m } $

    C'est cela que tu me demandais?
  • $\mathbb{E}[X_i] = \displaystyle{\sum\limits_{j=1}^{m} j / m } $

    $\mathbb{E}[X_i]² = \displaystyle{\sum\limits_{j=1}^{m} j² / m² } $

    C'est cela que tu me demandais?
  • Désolé le carré du m n'est pas apparu ( je connais vraiment pas le Latex j'essaye d'ecrire en reprenant vos anciens postes et en les modifiant pour donner le resultat)
  • Presque...
    $\mathbb{E}[X_i] = \displaystyle{\frac{1}{m}\sum\limits_{j=1}^{m}j}$

    $\mathbb{E}[X_i]² = \displaystyle{\frac{1}{m}\sum\limits_{j=1}^{m} j²}$
    Le $m$ n'est pas au carré...vois-tu pourquoi ??
    ensuite, il y a juste à calculer ces deux sommes (du moins le résultat est un grand classique...)
    Pour enfin arriver à $\mathbb{E}[X_i] = \frac{m + 1}{2}$ et $Var[X_i] = \frac{m^2 - 1}{12}$, arrives - tu à retrouver cela ?
  • Mais en fait, c'est pas tellement une somme de J allant de 1 à m mais plutôt sommer les différents j qui sont les réalisations possibles de la variable aléatoire et c'est une somme de m réalisations car il y a m réalisations possibles pour X
  • En fait on aurait pu indexer petit x par le j avec x réalisation de X
  • bon lOl je te laisse tripper tout seul dans ton coin ;) si jamais t'arrive à t'en sortir comme ça, fais moi signe...
  • Aaah j'ai compris tu prenais le cas où les réalisations de la va se suivent.
    Comme ça on peut calculer facilement le résultat (oui je connais ce résultat)
    Et oui je vois pour le m qui n'est pas au carré, en fait quand j'ai regardé la formule je ne sais pas pourquoi j'ai cru que le E était compris dans le carré.

    Personne ne peut me dire si ce résultat est bon ?
    $\displaystyle \mathbb{E} \left[ \frac{1}{n}\sum\limits_{i=1}^{n}X_i \right] = \frac 1 {5^n} \left( \frac{x_1+x_1+x_1+x_1+\ldots+x_1)}n + \frac{x_1+x_1+x_1+x_1+ \ldots+x_2} n + \frac{x_1+x_1+x_1+x_1 + \ldots+x_3} n + \right. $
    $\displaystyle \left. \qquad\qquad\qquad + \frac{x_1+x_1+x_1+x_1+x_1+ \ldots+x_4} n + \frac{x_1+x_1+x_1+x_1....+x_5} n + \ldots+ \frac{x_5+x_5+x_5+x_5+ \ldots+x_5} n \right) $
  • non !!! il n'est pas bon
  • Voilà depuis hier en fait c'est cela que je veux savoir entre autre.
    Il est pas bon mais pourquoi ?

    [En fait depuis hier j'essaie de corriger tes "en faite" par "en fait". AD]
  • déjà ils sortent d'où c'est $x_i$ et ce 5 ???
    ce qui est vrai c'est ça : $\displaystyle{\mathbb{E}[\frac{1}{n}\sum\limits_{i=1}^{n} X_i] = \frac{m + 1}{2n}}$ ... je pense pas que ta grosse formule indigeste se ramene à ça ;)
    si tu as un exemple précis où tu connais les valeurs de $m$ et de $n$, il te suffit d'appliquer cette formule là
  • En faite je peux généraliser le 5 en prenant m mais la formule sera encore plus indigeste.
    En faite je connais pas les réalisation de X, ils ne se suivent pas ca peut etre 12 256712 146 ect ect
    donc je place des $x_i$ qui veullent dire la ieme réalisation de $X$ .
    sachant que je ne connais vraiment pas les réalisations je ne peux pas utiliser de formule toute faite.
  • au fait (:p) AD, quel jugement mathématique portes-tu sur cette discussion qui me laisse globalement assez perplexe ??


    [Euh ! Les stats ce n'est pas mon fort... Mais j'ai l'impression que Missmister ne lis pas (avec suffisamment d'attention ?) les réponses qui lui sont faites. ;) AD]
  • mais c'est quoi $X$ ???????? pour l'instant, on a des v.a. $X_i$ équidistribuées sur $\{1,\ldots,m\}$ et $\bar{X}_n$...c'est quoi ce $X$, c'est quoi cette histoire de v.a. qui ne se suivent pas...???
  • En fait ils sont equiprobables mais pas equidistribuées
    $X$ peut prendre m valeurs( dans l'exemple 5 valeurs) avec la meme probabilité .
    Apres rajouter des i c'est pour dire que l'on somme ces differents $X$.
    Peut etre qu'à la place de dire $X$ je devrai dire $X_i$ tu as raison.
  • euh équiprobables et équidistribués a priori ça veut dire la même chose...=)
  • Envoie nous l'énoncé de ton exo stp...ce sera bien plus simple
  • En fait je n'ai pas d'énoncé.
    Je fais cela juste pour le plaisir pas d'énoncé ou de devoir.
    Mais ce que je ne comprends pas c'est que la formule que tu as donnée marche mais seulement si on a des sommes allant d'un certain nombre à un autre, mais qui doivent se suivre non ?
    C'est d'ailleurs pour cela que tu mets somme des j allant de 1 à m.
    Or comme je l'ai dis là, les réalisations des Xi (donc va iid) peuvent prendre des valeurs qui ne sont pas du genre 1 2 3 4 5... m
    mais m valeurs dans R.
    Donc c'est pour cela que je mets somme des x_i avec i allant de 1 à m.
  • aaahhhhhhhhh lOl si $X_i$ peut prendre $m$ valeurs dans $\R$...Effectivement, on ne fait pas du tout ce qu'il faut...il faudrait en savoir un peu plus sur la distribution des $X_i$...
  • Lol on sait compris enfin.
    Bah on sait juste que chaque realisation à la meme probabilité de sortir.
    C'est pour cela que la formule est (super) indigeste en effet elle me rapelle mes cours d'optimisation dans Rn lol.
    Enfaite ce que j'essaye d'écrire c'est une formule général pour tout taille d'échantillon (ici j'ai gardé le m=5 car sinon ca fait vraiment trop compliqué peut etre.).


    [Missmister : Ne peux-tu te relire et corriger tes fautes d'étourderie, avant de cliquer sur "Envoyer" ? AD]

    Lol on s'est compris enfin.
    Bah on sait juste que chaque réalisation à la même probabilité de sortir.
    C'est pour cela que la formule est (super) indigeste en effet, elle me rappelle mes cours d'optimisation dans Rn lol.
    En fait ce que j'essaie d'écrire c'est une formule générale pour toute taille d'échantillon (ici j'ai gardé le m=5 car sinon ça fait vraiment trop compliqué peuttre.).
  • Bon, si on note $\{x_1,\ldots,x_m\} \subset \R$ les $m$ valeurs possibles de $X_i$, tu dis que chaque évènement $\{X_i = x_j\}$ avec $j \in \{1,\ldots,m\}$ a la même probabilité de sortir, donc on en revient à $P(X_i = x_j) = \frac{1}{m}$, comme tout à l'heure...le seul truc en plus, si tu veux être vraiment très précis, c'est qu'apparement tu ne connais pas ces valeurs $x_j$, un moyen de modeliser un "jet" de points aléatoires dans $\R$ est d'utiliser des processus ponctuels...et là, ça devient un peu compliqué (en tout cas pour moi)
  • Voilà tout à fait tu l'as très bien noté.
    Ce n'est pas grave je te remercie déjà infiniment pour tout le temps que tu m'as consacré.
    La question reste tout de même ouverte...
Connectez-vous ou Inscrivez-vous pour répondre.