Certains calculs gaussiens en grande dimension

Georges Abitbol · September 2022

Soit $n \in \mathbb{N}^*$ supposé "grand". Soient $X,Y$ deux gaussiennes standard indépendantes. Soit $x \in \mathbb{R}^n$ et $\delta \in \mathbb{R}^*_+$. On pose $\phi_n(\delta,x) := \mathbb{P}[d(X,x) \leq \delta d(Y,x)]$. Toutes les distances sont euclidiennes.

Je voudrais des informations sur $\phi$.
1) Que vaut $\phi_n(\delta,0)$ ?
2) Que vaut $\lim_{n \to \infty} \lim_{x\to \infty} \phi_n(\delta,x)$ ? Je me dis que ça doit valoir $1$ si $\delta >1$, $0$ si $\delta < 1$, et, pourquoi pas, $\frac{1}{2}$ si $\delta = 1$.
3) L'application $\phi_n(\delta,\cdot)$ ne dépend que de la distance de son argument à l'origine, par symétrie. Soit donc $f_n(\delta,\cdot)$ l'unique fonction telle que pour tout $x$, $f_n(\delta,\Vert x \Vert_2) = \phi_n(\delta,x)$. Est-ce que, pour tout $n$ et tout $\delta$, $f_n(\delta,\cdot)$ est monotone ?

Je n'ai pas vraiment d'idée pour attaquer 2) et 3), et pour 1), c'est des calculs que je n'ose tenter.

Merci par avance !

Calli · September 2022

Salut.
1) $\frac{d(X,0)}{d(Y,0)}$ est de même loi que $\sqrt{Z}$ où $Z$ suit la loi de Fisher $F(n,n)$ (https://fr.wikipedia.org/wiki/Loi_de_Fisher). Or Wikipédia donne la fonction de répartition de $Z$, donc tu peux en déduire $\phi_n(\delta,0)$. Mais j'ai l'impression que ça donne une formule implicite et pas de formule explicite.

Georges Abitbol · September 2022

Ah ben on va voir ! Super, merci !

EDIT : Non parce que si j'ai une idée de l'asymptotique quand $n\to \infty$ de $\phi_n(\delta,0)$, avec juste $\delta$ au voisinage de $1$ c'est déjà pas mal !

Calli · September 2022

2) Le résultat que tu conjectures est vrai même sans la limite sur $n$. Soient $n$ et $\delta <1$. Soit $\varepsilon >0$. Il existe $r>0$ tel que $\mathbb{P}(\|X\| >r)<\varepsilon $. On a : $$\begin{eqnarray*} \phi_{n} (\delta ,x) &\leqslant & \mathbb{P}(\|X\|>r)+\mathbb{P}(\|X\|\leqslant r \text{ et } d(Y,x)\geqslant \delta ^{-1} d(X,x))\\[1mm] &\leqslant & \varepsilon + \mathbb{P}(d(Y,x)\geqslant \delta ^{-1} (\|x\|-r))\\[1mm] &\leqslant & \varepsilon + \mathbb{P}(\|Y\| \geqslant \delta ^{-1} (\|x\|-r)-\|x\|)\\[1mm] &=& \varepsilon + \mathbb{P}(\|Y\| \geqslant (\delta ^{-1} -1)\|x\| -\delta ^{-1} r) \end{eqnarray*}$$Donc \[\limsup _{x\rightarrow \infty } \phi_{n} (\delta ,x) \leqslant \varepsilon + \limsup _{x\rightarrow \infty } \mathbb{P}(\|Y\| \geqslant (\delta ^{-1} -1)\|x\| -\delta ^{-1} r) = \varepsilon .\] Donc $\lim\limits _{x\rightarrow \infty } \phi_{n} (\delta ,x)=0$. Et comme $\phi_{n} (\delta ,x) = 1-\phi_{n} (\delta ^{-1} ,x)$, on a aussi $\lim\limits _{x\rightarrow \infty } \phi_{n} (\delta ,x)=1$ si $\delta >1$.
Enfin, $(\forall x,\varphi_n,(1,x)=\frac12)$ par indépendance : $\varphi(n,1) = 1-\Bbb P(\|X\|\geqslant\|Y\|) = 1-\Bbb P(\|X\|\leqslant\|Y\|) =1- \varphi(n,1)$ car $\Bbb P(\|X\|=\|Y\|)=0$.

Georges Abitbol · September 2022

Oh yeah. Je fais autre chose, je n'ai pas le temps de lire tout de suite, mais super !

P.2 · September 2022

Une solution tardive, un peu differente de celles de Calli, mais utile puisque la question 3 etait sans reponse. Rappelons les questions: Si $X$ et $Y$ sont independantes et de loi $N(0,I_n)$, si $x\in \mathbb{R}^n$ et si $\delta>0$ on considere $$\phi_n(\delta,x)=\Pr(\|X-x\|>\delta\|Y-x\|).$$
1) Calculer $\phi_n(\delta,0)$
2) Limite de $\phi_n(\delta,x)$ si $x\to \infty$
3) En tant que fonction de $\|x\|$ est ce que $ \phi_n(\delta,x)$ est monotone pour tout $n$ et tout $\delta$?

Question 1. Comme $\phi_n(\delta,x)$ ne dépend que de $r=\|x\|,$ sans perte de généralité on suppose $x=re_1$ ou $(e_1,\ldots,e_n)$ est la base de $\mathbb{R}^n$ euclidien canonique. Écrivant $$X=X_1e_1+\tilde{X},\quad Y=Y_1e_1+\tilde{Y},$$ alors $X_1, \tilde{X},Y_1,\tilde{Y}$ sont indépendantes et donc $U_n$ et $V_r$ définies par $$U_n=\delta^2\|\tilde{Y}\|^2-\|\tilde{X}\|^2,\ V_r=2(\delta^2Y_1-X_1)r+(\delta^2-1)r^2$$ sont aussi indépendantes, avec $\phi_n(\delta,x)=\Pr(U_n>V_r)$. Pour la question 1) on rappelle que si $A$ et $B$ sont des va indépendantes de lois gamma de paramètres de forme $a$ et $b$ et même paramètre d’échelle, alors $$\Pr(\frac{A}{B}<c)=\frac{1}{B(a,b)}\int_{0}^{c}\frac{t^{a-1}}{(1+t)^{a+b}}dt..$$ Appliquant cela a $A=\|\tilde{X}\|^2$ et $B=\|\tilde{Y}\|^2$ avec $a=b=(n-1)/2$ on écrit $$\phi_n(\delta,0)=\Pr(U_n>0)=\Pr(\frac{\|\tilde{X}\|^2}{\|\tilde{Y}\|^2}<\delta^2)=\frac{1}{B(\frac{n-1}{2},\frac{n-1}{2})}\int_{0}^{\delta^2}\frac{t^{\frac{n-1}{2}-1}}{(1+t)^{n-1}}dt$$ qui est élémentaire si $n-1$ est pair.

Question 2. Si $r$ n'est pas nul alors $V_r$ est gaussienne de moyenne $mr^2=(\delta^2-1)r^2$ et de variance $\sigma^2r^2=4(\delta^4+1)r^2,$ et donc on l’écrit avec la va $Z\sim N(0,1)$ $$V_r=mr^2+\sigma r\, Z.$$
Par consequent $$\Pr(U_n>V_r)=\Pr(\frac{U_n}{r^2}-\frac{1}{r}\sigma\, Z>m)$$ et donc si $m=\delta^2-1$
$$\liminf_{r\to \infty}\Pr(U_n>V_r)=\Pr(0\geq m)=0.$$
Si $m=\delta^2-1<0$ $$\limsup_{r\to \infty}\Pr(U_n>V_r)=\Pr(0> m)=1.$$
Si $m=0$ alors $\frac{U_n}{r^2}-\frac{1}{r}2\sqrt{2}\, Z$ est symétrique et continue et donc $\Pr(U_n>V_r)=1/2$ pour tout $r.$

Question 3. Réponse. Pour $\delta\neq 1$ et pour $n$ fixe, la fonction $r\mapsto \Pr(U_n>V_r)$ décroit vers 0 si $\delta>1.$ (Le cas $0<\delta<1$ se traite par symétrie, comme observé par Calli). Alors, si $f$ est la densité de $U_n$ on a : $$\Pr(U_n>V_r)=\Pr\left(\frac{U_n-mr^2}{\sigma r}>Z\right)=\int_{-\infty}^{\infty}\Pr\left(\frac{U_n-mr^2}{\sigma r}>Z|U_n=u\right)f(u)du$$ $$=\int_{-\infty}^{\infty}\left(\int_{-\infty}^{\frac{u}{\sigma r}-\frac{m}{\sigma }r}e^{-z^2/2}\frac{dz}{\sqrt{2\pi}}\right)f(u)du$$ et donc $$\frac{d}{dr}\Pr(U_n>V_r)=-\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{\infty}\left(\frac{u}{\sigma r^2}+\frac{m}{\sigma }\right) \exp-\frac{1}{2}\left( \frac{u}{\sigma r}-\frac{m}{\sigma }r \right)^2f(u)du$$
Montrons alors que $$I=\frac{1}{2}\int_{-\infty}^{\infty}ue^{-\frac{1}{2}\frac{u^2}{\sigma^2 r^2}+\frac{mu}{\sigma^2}}f(u)du=\int_{0}^{\infty}u\sinh \left(\frac{mu}{\sigma^2}\right)e^{-\frac{1}{2}\frac{u^2}{\sigma^2 r^2}}(f(u)-f(-u))du$$ est positif. Cela entrainera que $\frac{d}{dr}\Pr(U_n>V_r)$ est négatif et donnera le résultat voulu. Pour montrer que $I$ est positif, il suffit de calculer $f(u) -f(-u)$ et de voir que c'est positif pour tout $u>0.$ Avec $a=(n-1)/2$ comme ci-dessus et $g(x)=(-x)^{a-1}e^{x}1_{(-\infty,0)}(x)$ et $h(y)=y^{a-1}e^{-y/\delta^2}1_{(0,\infty)}(y)$ la densite $2f(2u)$ de $U_n/2$ est proportionnelle à $g*h(u).$ Un calcul assez fastidieux donne alors la formule explicite suivante, où $C$ est une constante positive et pour $u>0$ $$g*h(u)-g*h(-u)=C\left(e^{-u/\delta^2}-e^{-u}\right)\int_0^{\infty}y^{a-1}(y+u)^{a-1}e^{-(\frac{1}{\delta^2}+1)y}dy>0.$$

Certains calculs gaussiens en grande dimension

Réponses

Bonjour!

Catégories

In this Discussion

Qui est en ligne 3