Variance à calculer en ambiance gaussienne

P.2
P.2
Modifié (March 2023) dans Statistiques
Soient $X_1,\ldots,X_n,\ldots$ indépendantes et de même loi gaussienne $N(0,1).$ Soit
$$A_n=\frac{1}{n}(X_1^2+\cdots+X_n^2), \quad B_n=\frac{1}{n}(X_1^4+\cdots+X_n^4).$$
Il est clair que $Q_n=B_n/A_n^2$ converge presque sûrement vers 3, mais quelle est la variance de $Q_n$ ?

Réponses

  • P.2
    P.2
    Modifié (March 2023)
    Point de solutions à cet amusant exercice d' "Analyse Multivariée" comme on dit en statistique ?
  • Tu connais une solution ? Si oui, tu peux nous donner une piste ?
  • P.2
    P.2
    Modifié (March 2023)
    L'idée est d'observer que $$\frac{1}{X_1^2+\cdots+X_n^2}(X_1^2,\ldots,X_n^2)=(U_1,\ldots,U_n)$$ suit une loi de Dirichlet de paramètres $(1/2,\ldots,1/2)$ et donc $Q_n=n(U_1^2+\cdots+U_n^2).$
  • P.2
    P.2
    Modifié (March 2023)
    Pour éviter que cette question  reste à jamais sans réponse, voici.
    Soit $X_1,\ldots, X_n,\ldots$ indépendantes et de même loi $N(0,1)$ et soit $$A_n=\frac{1}{n}(X_1^2+\cdots+X_n^2),\ B_n=\frac{1}{n}(X_1^4+\cdots+X_n^4).$$ On calcule la variance de $Q_n=B_n/A^2_n.$ Pour cela rappelons la definition d'une loi de Dirichlet $\mathcal{D}(a_0,a_1,\ldots,a_N)$ où $a_0,\ldots,a_N>0.$ On dit que $(U_0,U_1,\cdots,U_N)\sim \mathcal{D}(a_0,a_1,\ldots,a_N)$ si $U_0,\ldots,U_N>0$ et $U_0+\cdots+U_N=1$ et si la densite de $(U_1,\ldots,U_N)$ est $$C(1-u_1-\ldots-u_N)^{a_0-1}u_1^{a_1-1}\ldots u_N^{a_N-1},$$ avec $$\frac{1}{C}=B(a_0,\ldots,a_N)=\frac{\Gamma(a_0)\ldots \Gamma(a_N)}{\Gamma(a_0+\cdots+a_N)}.$$ Il faut savoir que si $Y_0,\ldots,Y_N$ sont des va indépendantes et de densités respectives sur $(0,\infty)$ égales à $b(by_i)^{a_i-1}e^{-by_i}/\Gamma(a_i)$ alors $$ (U_0,\ldots,U_N)=\frac{(Y_0,\ldots,Y_N)}{Y_0+\cdots+Y_N}\sim \mathcal{D}(a_0,a_1,\ldots,a_N).\qquad (*)$$ C'est classique et un peu laborieux à montrer par calcul de Jacobien. De (*) on déduit par exemple que $$(U_0+\cdots+U_k,U_{k+1},\ldots,U_N)\sim \mathcal{D}(a_0+a_1,+\cdots+a_k,a_{k+1},\ldots, a_N)\qquad (**).$$
    Appliquons cela à $Y_i=X_i^2$ qui est une loi du chideux, autrement dit une loi gamma avec $b=2$ et $a_i=1/2.$ Et donc si $U_i=nX_i^2/A_n,$ alors $$Q_n=n(U_1^2+\cdots+U_n^2),$$ alors que $(U_1,\ldots,U_n)\sim \mathcal{D}(1/2,\ldots,1/2).$ D'après (**) on a $$(U_1,U_2+\cdots+U_n)\sim \mathcal{D}(1/2,(n-1)/2),\ (U_1,U_2, U_3+\cdots+U_n)\sim \mathcal{D}(1/2,1/2,(n-2)/2.\qquad (***).$$ On calcule donc $$\mathbb{E}(Q_n)=n^2\mathbb{E}(U_1^2)=n^2\frac{B(2+\frac{1}{2}, \frac{n-1}{2})}{B(\frac{1}{2},\frac{n-1}{2})}=\frac{3n}{n+2}.$$
    Le calcul de $\mathbb{E}(Q_n^2)$ est plus compliqué, il exige les calculs de $\mathbb{E}(U_1^4)$ et de $\mathbb{E}(U_1^2U_2^2)$, toujours en utilisant (***) $$\mathbb{E}(U_1^4)=\frac{B(4+\frac{1}{2}, \frac{n-1}{2})}{B(\frac{1}{2},\frac{n-1}{2})}=\frac{\Gamma(4+\frac{1}{2})}{\Gamma(\frac{1}{2})}\times \frac{\Gamma(4+\frac{n-1}{2})}{\Gamma(\frac{n-1}{2})}=\frac{7\times 5\times 3}{(n+6)(n+4)(n+2)n}$$ $$\mathbb{E}(U_1^2U_2^2)=\frac{B(2+\frac{1}{2}, 2+\frac{1}{2}, \frac{n-2}{2})}{B(\frac{1}{2},\frac{1}{2},\frac{n-2}{2})}=\frac{\Gamma^2(\frac{5}{2})}{\Gamma^2(\frac{1}{2})}\times \frac{\Gamma(\frac{n}{2})}{\Gamma(\frac{n}{2}+4)}=\frac{9}{(n+6)(n+4)(n+2)n}$$ et donc $$\mathbb{E}(Q_n^2)=n^2[n\mathbb{E}(U_1^4)+n(n-1)\mathbb{E}(U_1^2U_2^2)]=\frac{3n^2(3n+32)}{(n+6)(n+4)(n+2)}$$ $$\sigma^2(Q_n)=\mathbb{E}(Q_n^2)-(\mathbb{E}(Q_n))^2=\frac{24n^2(n-1)}{(n+6)(n+4)(n+2)^2}\sim _{n\to \infty}\frac{24}{n}.$$
    Une chose intéressante est que, par un calcul plus facile on a $\sigma^2(B_n)=\frac{87}{n}.$
    Et donc, pour tester si les $X_i$ sont bien $N(0,1),$ et si on a bien $\mathbb{E}(X_i^4)=3,$ on aura un résultat plus précis en considérant $Q_n$ plutôt que $B_n$.
Connectez-vous ou Inscrivez-vous pour répondre.