Distribution d'échantillonale de la moyenne et variance

Lol_a
Modifié (June 2023) dans Statistiques
Bonjour,
je bute sur cet exercice.

Pas de soucis pour la question 1, par contre à la question 2 je trouve des résultats qui ne me paraissent incorrects.
Je retrouve bien $E(\bar X) = \mu$ mais pas $V(\bar X) = \sigma^2/2$.
Je trouve $V(\bar X) = 3.4125$ et $\sigma^2=10.8$. Je ne comprends pas d'où provient un tel décalage.
Pour calculer $V(\bar X) = \sigma^2/2$, j'ai pris la moyenne de chaque échantillon, ce qui m'a donné une série statistique dont j'ai ensuite calculé la moyenne et la variance.
Est-ce bien ce qu'il fallait faire ? Comment retrouver le résultat sans calculer la variance de la série des moyenne des échantillons ?
Merci d'avance.

Réponses

  • gerard0
    Modifié (June 2023)
    Bonjour.
    Je ne sais pas trop quelle est l'idée de l'auteur du sujet. Comme bizarrement il a pris un tirage de couples de valeurs, la moyenne devrait être un couple (moyenne des premiers tirages, moyenne des seconds).
    Sinon, tirer avec remise 25 couples revient à tirer avec remise 50 valeurs.
    Cordialement. 
  • gerard0
    Modifié (June 2023)
    Ah, finalement, j'ai compris. Il faut dire que les échantillons de 2, ce n'est pas trop la pratique des statisticiens :p
    Je n'avais pas vu non plus qu'il s'agit d'un exercice purement théorique, pas d'un tirage réel.
  • gerard0
    Modifié (June 2023)
    J'ai repris les calculs, la variance de la série de 25 moyennes de 2 valeurs est bien 5,4.
    Cordialement.
  • Lol_a
    Modifié (June 2023)
    Bonjour,
    effectivement je me rends compte que j'ai considéré les échantillons sans remise et non avec. C'est rassurant ! 
    Merci.
    Y a-t-il une formule pour les échantillons sans remise ?
  • Probablement à partir de la loi hypergéométrique, mais je n'ai jamais étudié le sujet.
  • gebrane
    Modifié (June 2023)
    Lol_a a dit
    Y a-t-il une formule pour les échantillons sans remise ?
    Oui
    Le 😄 Farceur


  • gerard0
    Modifié (June 2023)
    Attention Gebrane,
    tes tableaux supposent $n$ "grand", typiquement de l'ordre de la centaine (*); ce sont des lois asymptotiques. L'exemple de l'exercice de cours de Lol_a montre bien que $\bar X$ suit une loi discrète.
    Je pense que Lol_a attend des formules sur les cas élémentaires.
    Cordialement.
    (*) beaucoup de gens se simplifient la vie en commençant dès que n atteint 30. Tout dépend de la précision attendue.
  • Dans la formule. Oublier l'approximation normale.  Retenir uniquement la formule de la variabce de $\bar X $. Je me rappelle que je l avais démontré de facon elementaire. Je ne sais pas si je peux reproduire le raisonnement. @NicoLeProf ?
    Le 😄 Farceur


  • NicoLeProf
    Modifié (June 2023)
    Oui gebrane? Tu veux que je fasse des probas?
    Bof, j'ai assez donné pour l'agreg déjà et je ne sais pas ce que tu veux que je fasse ici. Je préfère être sollicité uniquement sur des thèmes d'algèbre et de géométrie (arithmétique aussi évidemment) en ce moment.  :D;)
  • Boom!. Je vais refaire les calculs et les proposer sous forme d un exercice si l'op est partant.
    Le 😄 Farceur


  • Vassillia
    Modifié (June 2023)
    Bonjour, juste pour le fun, je fais la démonstration version proba (si @GaBuZoMeu passe par là, il vous en fera une autre plus algébrique et plus courte)

    Dans une population de taille $N$, chaque individu peut prendre les valeurs $v_k$ pour $k=1,2,...,m$ et on notera $\mu$ la moyenne et $\sigma^2$ la variance dans la population.
    Soit $n_k$ le nombre de fois où la valeur $v_k$ apparaît dans la population, de sorte que $P(X=v_k)=n_k/N$

    On utilise l'estimateur classique sur un échantillon de taille $n$ c'est à dire $\overline{X}=\dfrac{\sum_{i=1}^n X_i}{n}$
    On a donc $Var(\overline{X})=\dfrac{1}{n^2}\sum_{i=1}^n\sum_{j=1}^n cov(X_i,X_j)$
    $=\dfrac{1}{n^2} (\sum_{i=1}^n Var(X_i) + \sum_{i=1}^n \sum_{j\neq i} cov(X_i,X_j))$
    $=\dfrac{1}{n^2} (n \sigma^2 + \sum_{i=1}^n \sum_{j\neq i} cov(X_i,X_j))$
    $=\dfrac{\sigma^2}{n} + \dfrac{1}{n^2}\sum_{i=1}^n \sum_{j\neq i} cov(X_i,X_j)$

    1er cas
    Les $X_i$ sont indépendantes car le tirage est avec remise donc on a $cov(X_i,X_j)=0$ si $i\neq j$
    $Var(\overline{X})=\dfrac{\sigma^2}{n}$

    2ème cas
    Les $X_i$ ne sont pas indépendantes car le tirage est sans remise donc on a $cov(X_i,X_j)=E(X_iX_j)-E(X_i)E(X_j)=E(X_iX_j)-\mu^2$ et $E(X_iX_j)=\sum_{k=1}^m\sum_{l=1}^m v_k v_l P(X_i=v_k \cap X_j=v_l)$

    Il faut séparer le cas $k=l$ donc on va utiliser les probabilités conditionnelles $P(X_i=v_k\cap X_j=v_l)=P(X_i=v_k)P(X_j=v_l|X_i=v_k)$
    $= \dfrac{n_k}{N}\times \dfrac{n_k-1}{N-1}$ si $k=l$ car l'effectif $n_k$ a diminué en même temps que l'effectif de la population
    ou $ = \dfrac{n_k}{N}\times \dfrac{n_l}{N-1}$ si $k\neq l$ car l'effectif de la population a tout de même diminué

    On arrive donc à $E(X_iX_j)=\sum_{k=1}^m v_k^2 \dfrac{n_k}{N}\times \dfrac{n_k-1}{N-1} + \sum_{k=1}^m\sum_{k \neq l} v_k v_l \dfrac{n_k}{N}\times \dfrac{n_l}{N-1}$
    $=\dfrac{1}{N(N-1)}(\sum_{k=1}^m v_k^2n_k^2 - \sum_{k=1}^m v_k^2n_k + \sum_{k=1}^m\sum_{k \neq l} v_k v_l n_k n_l)$
    $=\dfrac{1}{N(N-1)} ((\sum_{k=1}^m v_k n_k)^2-\sum_{k=1}^m v_k^2n_k)$

    Mais on a par définition $E(X_i)=\dfrac{1}{N} \sum_{k=1}^m v_k n_k = \mu$ autrement dit $(\sum_{k=1}^m v_k n_k)^2=N^2\mu^2$
    Et de même $E(X_i^2)=\dfrac{1}{N} \sum_{k=1}^m v_k^2 n_k $ autrement dit $\sum_{k=1}^m v_k^2 n_k=NE(X_i^2)=N(\mu^2+\sigma^2)$

    On remplace tout ça $E(X_iX_j)=\dfrac{1}{N(N-1)}(N^2\mu^2-N(\mu^2+\sigma^2))=\mu^2-\dfrac{\sigma^2}{N-1}$
    pour avoir notre covariance $cov(X_i,X_j)=\mu^2-\dfrac{\sigma^2}{N-1}-\mu^2=-\dfrac{\sigma^2}{N-1}$

    Et enfin pour avoir notre variance
    $Var(\overline{X})=\dfrac{\sigma^2}{n}-\dfrac{1}{n^2}\dfrac{n(n-1)\sigma^2}{N-1} =\dfrac{\sigma^2}{n}(1-\dfrac{n-1}{N-1})=\dfrac{\sigma^2}{n}(\dfrac{N-n}{N-1})$

    Ce facteur $\dfrac{N-n}{N-1}$ s'appelle facteur d'exhaustivité mais lorsque $n$ est petit devant $N$ il est très souvent négligé.

    In mémoriam de tous les professeurs assassinés dans l'exercice de leurs fonctions en 2023, n'oublions jamais les noms de Agnes-Lassalle et Dominique-Bernard qui n'ont pas donné lieu aux mêmes réactions sur ce forum (et merci à GaBuZoMeu)
  • Merci Julia, Je parlais de cette preuve
    Le 😄 Farceur


  • Merci !
Connectez-vous ou Inscrivez-vous pour répondre.