Statistique sur un espace quotient
dans Statistiques
Bonjour,
J'ai une interrogation sur ce qui m'a l'air d'être de la statistique de base, mais je manque d'intuition statistique pour y répondre.
Soient $E$ un ensemble fini, $F : E \to \R$ une fonction, et $\sim$ une relation d'équivalence telles que $F$ est constante sur les classes d'équivalences de $\sim$. Il existe alors une fonction $\overline{F} : \, ^{E}/_{\sim} \to \R$ qui « factorise » $F$. Pour un élément $x$ de $E$, on note $[x]$ sa classe dans $ ^{E}/_{\sim}$ et $w([x]) = \frac{\operatorname{Card} [x]}{\operatorname{Card} E}$ le « poids » de cette classe d'équivalence dans $E$ (autrement dit la probabilité que $X$ soit dans cette classe si $X$ suit une loi uniforme sur $E$).
On veut faire des statistiques sur $F$, par exemple calculer son espérance, ou plus précisement l'espérance $m$ de $F(X)$ où $X$ suit une loi uniforme sur $E$. On peut exprimer cette espérance de deux façons :
\[ m = \frac1{|E|} \sum_{x\in E} F(x) = \sum_{[x] \in ^{E}/_{\sim} } w([x])\overline F([x]) .\]
On veut faire des statistiques sur $F$, par exemple calculer son espérance, ou plus précisement l'espérance $m$ de $F(X)$ où $X$ suit une loi uniforme sur $E$. On peut exprimer cette espérance de deux façons :
\[ m = \frac1{|E|} \sum_{x\in E} F(x) = \sum_{[x] \in ^{E}/_{\sim} } w([x])\overline F([x]) .\]
En pratique, si $E$ est très grand, on ne peut calculer ces sommes mais on peut les estimer en tirant un nombre suffisamment grand d'éléments aléatoires (moyenne empirique).
Question : Est-il plus rapide d'estimer $m$ par une suite $$\hat m_n = \frac1n \sum_{i=1}^n F(X_i)$$ lorsque $(X_1,\ldots,X_n)$ est un échantillon uniforme sur $E$ ; ou bien par $$\hat \mu_n = \sum_{i=1}^n w([X_i])\overline F([X_i])$$ lorsque $([X_1],\ldots,[X_n])$ est un échantillon uniforme de $^{E}/_{\sim}$ ?
Question : Est-il plus rapide d'estimer $m$ par une suite $$\hat m_n = \frac1n \sum_{i=1}^n F(X_i)$$ lorsque $(X_1,\ldots,X_n)$ est un échantillon uniforme sur $E$ ; ou bien par $$\hat \mu_n = \sum_{i=1}^n w([X_i])\overline F([X_i])$$ lorsque $([X_1],\ldots,[X_n])$ est un échantillon uniforme de $^{E}/_{\sim}$ ?
Dit plus simplement : va-t-on se rapprocher plus vite la moyenne des images de $F$ en tirant aléatoirement des $x$ dans $E$, ou en tirant aléatoirement des classes (de $x$ donnant la même image) dans $ ^{E}/_{\sim}$ ?
Réponses
-
Bonjour,Ton $\hat{\mu}_n$ ne converge pas vers $m$ car on ne divise pas par $n$. Mais par contre, on a $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{i} w([X_i]) \overline{F}([X_i])$ qui converge vers $m$.
-
Bibix a dit :Bonjour,Ton $\hat{\mu}_n$ ne converge pas vers $m$ car on ne divise pas par $n$. Mais par contre, on a $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{i} w([X_i]) \overline{F}([X_i])$ qui converge vers $m$.Ah oui en effet, mais je crois qu'il faut diviser non pas par $n$ mais par $\sum_i |[X_i]|$ (imagine que chaque classe fasse 2 éléments, alors ton estimateur converge vers $2m$). La version corrigée est à mon avis :$$ \hat{m}_n = \frac{\sum_{i=1}^n |[X_i]| \overline{F}([X_i])}{\sum_{i=1}^n |[X_i]|} $$
-
Désolé, je voulais écrire $\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{[X_i]} w([X_i]) \overline{F}([X_i])$, mais bon bref... donc tu confirmes que $\hat{\mu}_n = \frac{\sum_{i=1}^n |[X_i]| \overline{F}([X_i])}{\sum_{i=1}^n |[X_i]|}$ ?
-
Je ne vois pas la différence entre
et$\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{i} w([X_i]) \overline{F}([X_i])$$\hat{m}_n = \frac{{\rm Card}(E)}{n} \sum_{[X_i]} w([X_i]) \overline{F}([X_i])$.
Mais à part ça, oui pour moi c'est bien$$ \hat{\mu}_n = \frac{1}{\sum_{i=1}^n |[X_i]|} \sum_{i=1}^n |[X_i]| \overline{F}([X_i]) .$$
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.1K Toutes les catégories
- 58 Collège/Lycée
- 22.1K Algèbre
- 37.5K Analyse
- 6.3K Arithmétique
- 58 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 20 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.7K Géométrie
- 83 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 337 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 801 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres