Distribution d'échantillonale de la moyenne et variance
Bonjour,
je bute sur cet exercice.
Pas de soucis pour la question 1, par contre à la question 2 je trouve des résultats qui ne me paraissent incorrects.
Je retrouve bien $E(\bar X) = \mu$ mais pas $V(\bar X) = \sigma^2/2$.
Je trouve $V(\bar X) = 3.4125$ et $\sigma^2=10.8$. Je ne comprends pas d'où provient un tel décalage.
Pour calculer $V(\bar X) = \sigma^2/2$, j'ai pris la moyenne de chaque échantillon, ce qui m'a donné une série statistique dont j'ai ensuite calculé la moyenne et la variance.
Est-ce bien ce qu'il fallait faire ? Comment retrouver le résultat sans calculer la variance de la série des moyenne des échantillons ?
Merci d'avance.
je bute sur cet exercice.
Pas de soucis pour la question 1, par contre à la question 2 je trouve des résultats qui ne me paraissent incorrects.
Je retrouve bien $E(\bar X) = \mu$ mais pas $V(\bar X) = \sigma^2/2$.
Je trouve $V(\bar X) = 3.4125$ et $\sigma^2=10.8$. Je ne comprends pas d'où provient un tel décalage.
Pour calculer $V(\bar X) = \sigma^2/2$, j'ai pris la moyenne de chaque échantillon, ce qui m'a donné une série statistique dont j'ai ensuite calculé la moyenne et la variance.
Est-ce bien ce qu'il fallait faire ? Comment retrouver le résultat sans calculer la variance de la série des moyenne des échantillons ?
Merci d'avance.
Réponses
-
Bonjour.
Je ne sais pas trop quelle est l'idée de l'auteur du sujet. Comme bizarrement il a pris un tirage de couples de valeurs, la moyenne devrait être un couple (moyenne des premiers tirages, moyenne des seconds).
Sinon, tirer avec remise 25 couples revient à tirer avec remise 50 valeurs.
Cordialement. -
Ah, finalement, j'ai compris. Il faut dire que les échantillons de 2, ce n'est pas trop la pratique des statisticiens
Je n'avais pas vu non plus qu'il s'agit d'un exercice purement théorique, pas d'un tirage réel. -
J'ai repris les calculs, la variance de la série de 25 moyennes de 2 valeurs est bien 5,4.
Cordialement. -
Bonjour,
effectivement je me rends compte que j'ai considéré les échantillons sans remise et non avec. C'est rassurant !
Merci.
Y a-t-il une formule pour les échantillons sans remise ? -
Probablement à partir de la loi hypergéométrique, mais je n'ai jamais étudié le sujet.
-
Attention Gebrane,
tes tableaux supposent $n$ "grand", typiquement de l'ordre de la centaine (*); ce sont des lois asymptotiques. L'exemple de l'exercice de cours de Lol_a montre bien que $\bar X$ suit une loi discrète.Je pense que Lol_a attend des formules sur les cas élémentaires.
Cordialement.(*) beaucoup de gens se simplifient la vie en commençant dès que n atteint 30. Tout dépend de la précision attendue. -
Dans la formule. Oublier l'approximation normale. Retenir uniquement la formule de la variabce de $\bar X $. Je me rappelle que je l avais démontré de facon elementaire. Je ne sais pas si je peux reproduire le raisonnement. @NicoLeProf ?Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..
-
Oui gebrane? Tu veux que je fasse des probas?Bof, j'ai assez donné pour l'agreg déjà et je ne sais pas ce que tu veux que je fasse ici. Je préfère être sollicité uniquement sur des thèmes d'algèbre et de géométrie (arithmétique aussi évidemment) en ce moment.Lorsque notre cher Gebrane, le 😄 farceur, intervient dans une question d'algèbre, c'est une véritable joie pour les lecteurs.
-
Boom!. Je vais refaire les calculs et les proposer sous forme d un exercice si l'op est partant.Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..
-
Bonjour, juste pour le fun, je fais la démonstration version proba (si @GaBuZoMeu passe par là, il vous en fera une autre plus algébrique et plus courte)Dans une population de taille $N$, chaque individu peut prendre les valeurs $v_k$ pour $k=1,2,...,m$ et on notera $\mu$ la moyenne et $\sigma^2$ la variance dans la population.Soit $n_k$ le nombre de fois où la valeur $v_k$ apparaît dans la population, de sorte que $P(X=v_k)=n_k/N$
On utilise l'estimateur classique sur un échantillon de taille $n$ c'est à dire $\overline{X}=\dfrac{\sum_{i=1}^n X_i}{n}$
On a donc $Var(\overline{X})=\dfrac{1}{n^2}\sum_{i=1}^n\sum_{j=1}^n cov(X_i,X_j)$
$=\dfrac{1}{n^2} (\sum_{i=1}^n Var(X_i) + \sum_{i=1}^n \sum_{j\neq i} cov(X_i,X_j))$
$=\dfrac{1}{n^2} (n \sigma^2 + \sum_{i=1}^n \sum_{j\neq i} cov(X_i,X_j))$
$=\dfrac{\sigma^2}{n} + \dfrac{1}{n^2}\sum_{i=1}^n \sum_{j\neq i} cov(X_i,X_j)$1er cas
Les $X_i$ sont indépendantes car le tirage est avec remise donc on a $cov(X_i,X_j)=0$ si $i\neq j$$Var(\overline{X})=\dfrac{\sigma^2}{n}$2ème cas
Les $X_i$ ne sont pas indépendantes car le tirage est sans remise donc on a $cov(X_i,X_j)=E(X_iX_j)-E(X_i)E(X_j)=E(X_iX_j)-\mu^2$ et $E(X_iX_j)=\sum_{k=1}^m\sum_{l=1}^m v_k v_l P(X_i=v_k \cap X_j=v_l)$
Il faut séparer le cas $k=l$ donc on va utiliser les probabilités conditionnelles $P(X_i=v_k\cap X_j=v_l)=P(X_i=v_k)P(X_j=v_l|X_i=v_k)$
$= \dfrac{n_k}{N}\times \dfrac{n_k-1}{N-1}$ si $k=l$ car l'effectif $n_k$ a diminué en même temps que l'effectif de la population
ou $ = \dfrac{n_k}{N}\times \dfrac{n_l}{N-1}$ si $k\neq l$ car l'effectif de la population a tout de même diminué
On arrive donc à $E(X_iX_j)=\sum_{k=1}^m v_k^2 \dfrac{n_k}{N}\times \dfrac{n_k-1}{N-1} + \sum_{k=1}^m\sum_{k \neq l} v_k v_l \dfrac{n_k}{N}\times \dfrac{n_l}{N-1}$
$=\dfrac{1}{N(N-1)}(\sum_{k=1}^m v_k^2n_k^2 - \sum_{k=1}^m v_k^2n_k + \sum_{k=1}^m\sum_{k \neq l} v_k v_l n_k n_l)$
$=\dfrac{1}{N(N-1)} ((\sum_{k=1}^m v_k n_k)^2-\sum_{k=1}^m v_k^2n_k)$
Mais on a par définition $E(X_i)=\dfrac{1}{N} \sum_{k=1}^m v_k n_k = \mu$ autrement dit $(\sum_{k=1}^m v_k n_k)^2=N^2\mu^2$
Et de même $E(X_i^2)=\dfrac{1}{N} \sum_{k=1}^m v_k^2 n_k $ autrement dit $\sum_{k=1}^m v_k^2 n_k=NE(X_i^2)=N(\mu^2+\sigma^2)$
On remplace tout ça $E(X_iX_j)=\dfrac{1}{N(N-1)}(N^2\mu^2-N(\mu^2+\sigma^2))=\mu^2-\dfrac{\sigma^2}{N-1}$
pour avoir notre covariance $cov(X_i,X_j)=\mu^2-\dfrac{\sigma^2}{N-1}-\mu^2=-\dfrac{\sigma^2}{N-1}$
Et enfin pour avoir notre variance
$Var(\overline{X})=\dfrac{\sigma^2}{n}-\dfrac{1}{n^2}\dfrac{n(n-1)\sigma^2}{N-1} =\dfrac{\sigma^2}{n}(1-\dfrac{n-1}{N-1})=\dfrac{\sigma^2}{n}(\dfrac{N-n}{N-1})$Ce facteur $\dfrac{N-n}{N-1}$ s'appelle facteur d'exhaustivité mais lorsque $n$ est petit devant $N$ il est très souvent négligé.
La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley) -
Merci Julia, Je parlais de cette preuve
Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs.. -
Merci !
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.4K Toutes les catégories
- 62 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 23 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 84 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 26 Mathématiques et finance
- 342 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres