Statistique sur un espace quotient

Bonjour,

J'ai une interrogation sur ce qui m'a l'air d'être de la statistique de base, mais je manque d'intuition statistique pour y répondre.

Soient $E$ un ensemble fini, $F : E \to \R$ une fonction, et $\sim$ une relation d'équivalence telles que $F$ est constante sur les classes d'équivalences de $\sim$. Il existe alors une fonction $\overline{F} : \,  ^{E}/_{\sim} \to \R$ qui « factorise » $F$. Pour un élément $x$ de $E$, on note $[x]$ sa classe dans $ ^{E}/_{\sim}$ et $w([x]) = \frac{\operatorname{Card} [x]}{\operatorname{Card} E}$ le  « poids » de cette classe d'équivalence dans $E$ (autrement dit la probabilité que $X$ soit dans cette classe si $X$ suit une loi uniforme sur $E$).

On veut faire des statistiques sur $F$, par exemple calculer son espérance, ou plus précisement l'espérance $m$ de $F(X)$ où $X$ suit une loi uniforme sur $E$. On peut exprimer cette espérance de deux façons :
\[ m = \frac1{|E|} \sum_{x\in E} F(x) = \sum_{[x] \in ^{E}/_{\sim} } w([x])\overline F([x]) .\]
En pratique, si $E$ est très grand, on ne peut calculer ces sommes mais on peut les estimer en tirant un nombre suffisamment grand d'éléments aléatoires (moyenne empirique).
Question : Est-il plus rapide d'estimer $m$ par une suite $$\hat m_n = \frac1n  \sum_{i=1}^n F(X_i)$$ lorsque $(X_1,\ldots,X_n)$ est un échantillon uniforme sur $E$ ; ou bien par $$\hat \mu_n =  \sum_{i=1}^n w([X_i])\overline F([X_i])$$ lorsque $([X_1],\ldots,[X_n])$ est un échantillon uniforme de $^{E}/_{\sim}$  ?

Dit plus simplement : va-t-on se rapprocher plus vite la moyenne des images de $F$ en tirant aléatoirement des $x$ dans $E$, ou en tirant aléatoirement des classes (de $x$ donnant la même image) dans $ ^{E}/_{\sim}$ ?










Réponses

  • Bonjour,
    Ton $\hat{\mu}_n$ ne converge pas vers $m$ car on ne divise pas par $n$. Mais par contre, on a $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{i} w([X_i]) \overline{F}([X_i])$ qui converge vers $m$.
  • Bibix a dit :
    Bonjour,
    Ton $\hat{\mu}_n$ ne converge pas vers $m$ car on ne divise pas par $n$. Mais par contre, on a $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{i} w([X_i]) \overline{F}([X_i])$ qui converge vers $m$.

    Ah oui en effet, mais je crois qu'il faut diviser non pas par $n$ mais par $\sum_i |[X_i]|$ (imagine que chaque classe fasse 2 éléments, alors ton estimateur converge vers $2m$). La version corrigée est à mon avis :
    $$ \hat{m}_n = \frac{\sum_{i=1}^n |[X_i]| \overline{F}([X_i])}{\sum_{i=1}^n |[X_i]|} $$




  • Désolé, je voulais écrire $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{[X_i]} w([X_i]) \overline{F}([X_i])$, mais bon bref... donc tu confirmes que $\hat{\mu}_n = \frac{\sum_{i=1}^n |[X_i]| \overline{F}([X_i])}{\sum_{i=1}^n |[X_i]|}$ ?


  • Je ne vois pas la différence entre
     $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{i} w([X_i]) \overline{F}([X_i])$
    et
    $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{[X_i]} w([X_i]) \overline{F}([X_i])$.


    Mais à part ça, oui pour moi c'est bien  
    $$ \hat{\mu}_n = \frac{1}{\sum_{i=1}^n |[X_i]|} \sum_{i=1}^n |[X_i]| \overline{F}([X_i]) .$$



Connectez-vous ou Inscrivez-vous pour répondre.