Majorant d'une variance
Bonjour à tous,
Dernièrement je me suis posé une question dont je n'arrive pas trouver de solution mathématique rigoureuse. Donc voici la question :
Soit $X_n = ( x_1, \cdots , x_n)$ un échantillon, où les $x_i$ suivent une loi Uniforme sur $[0;1]$ et $n \geq 2$.
Comment majorer la variance $V(X)$ indépendamment de l'échantillon en fonction de $n (\geq 2)$. Ce qui peut se reformuler comme suit : on recherche $k_n \in \mathbb{R}^+$ tel que $V(X) \leq k_n$
J'ai trouvé en tatonnant à la main que si je prennais l'échantillon $X_n=(0 , 1 , 0 , 1, \cdots )$ alors j'avais le maximum de ma variance. Intuitivement ça semble cohérent, car en mettant toute la masse de points aux deux extrémités, j'aurais bien une distance moyenne entre eux la plus éloigné. Seulement je n'arrive pas à démontrer que cet échantillon donne bien l'a variance max, et encore moins a trouver une formule simple de $k_n$.
Auriez vous quelques pistes...
Dernièrement je me suis posé une question dont je n'arrive pas trouver de solution mathématique rigoureuse. Donc voici la question :
Soit $X_n = ( x_1, \cdots , x_n)$ un échantillon, où les $x_i$ suivent une loi Uniforme sur $[0;1]$ et $n \geq 2$.
Comment majorer la variance $V(X)$ indépendamment de l'échantillon en fonction de $n (\geq 2)$. Ce qui peut se reformuler comme suit : on recherche $k_n \in \mathbb{R}^+$ tel que $V(X) \leq k_n$
J'ai trouvé en tatonnant à la main que si je prennais l'échantillon $X_n=(0 , 1 , 0 , 1, \cdots )$ alors j'avais le maximum de ma variance. Intuitivement ça semble cohérent, car en mettant toute la masse de points aux deux extrémités, j'aurais bien une distance moyenne entre eux la plus éloigné. Seulement je n'arrive pas à démontrer que cet échantillon donne bien l'a variance max, et encore moins a trouver une formule simple de $k_n$.
Auriez vous quelques pistes...
Réponses
-
Salut,
Qu'appelles-tu "variance" de $X_n$ ? Si j'ai bien compris $X_n$ est un vecteur aléatoire... -
Majorer ou minorer ?..
Sinon tu parles de la variance empirique c'est ça ? -
si tu veux majorer la variance empirique, c'est effectivement ce que tu dis: la variance empirique est majoree par celle donnee par la suite $(0,1,0,1,0, \ldots)$. En effet, suppose que le maximum de variance empirique soit atteint pour un vecteur $(x_1, x_2, \ldots, x_n)$. Alors s'il existe deux indices $i_1, i_2$ tels que $0< x_{i_1}, x_{i_2}<1$ alors en remplacant $x_{i_1}$ par $x_{i_1}+\epsilon$ et $x_{i_2}$ par $x_{i_2}-\epsilon$ on garde la meme moyenne et la variance augmente. Cela montre que tous les $x_i$ sont egaux a $0$ ou $1$ a l'exception de peut etre un seul d'entre eux. A partir de la le probleme est facile...
-
Merci pour vos réponses et remarques.
Je parle de la variance empirique définie comme suit : $S_n=\frac{1}{n}\sum_{i=1}^n (x_i-\overline X_n)^2$ où $\overline X_n$ est la moyenne empririque. Je suis conscient que la variance empirique est entachée d'un biais.
Je cherche bien un majorant, d'ailleurs je corrige de ce pas mon message premier.
$X_n$ est pour moi un échantillon, mais je n'arrive pas à voir la différence entre un échantillon et un vecteur aléatoire.:S -
Merci Alek pour ton aide. je vais tacher de finir tout seul.
-
Un échantillon $(x_1, \ldots, x_n)$ est une réalisation d'un vecteur aléatoire $(X_1, \ldots, X_n)$.
On observe $\boxed{x^{\text{obs}}=X(\omega^{\text{act}})}$ avec les notations de Williams: $\omega^{\text{act}}$ est "le $\omega$ effectif" (actual), la variable aléatoire $X$ se réalise en $X(\omega^{\text{act}})}$. -
Juste pour résumer et voir si j'ai compris la différence : un échantillon c'est regarder ce qui s'est effectivement réalisé. Un vecteur aléatoire c'est un ensemble de ce qui peut se réaliser.
un echantillon = (1,2,3,4,5), un vecteur (U[0;100],U[0;100],U[0;100],U[0;100]) -
Non, un vecteur ce n'est pas un ensemble de lois. Relis ton cours de probas ! Un vecteur aléatoire c'est une application mesurable $X \, : \, \Omega \to \R^n$ ; à $\omega \in \Omega$ on associe la réalisation $x=X(\omega) \in \R^n$ (cf. message de Steven). La loi de $X$ c'est une mesure sur $\R^n$, définie par $\mathbb{P}_X(B)=\mathbb{P}(X^{-1}(B))$ pour $B$ borélien de $\R^n$ ; c'est un objet de nature différente de $X$. Et pour finir les lois marginales $U(0,1)$ des composantes de $X$ ne déterminent pas la loi de $X$, il faut rajouter l'indépendance des composantes.
Enfin bref, tout ça pour dire que ton problème n'a en fait rien à voir avec les probas, c'est un problème d'analyse ; tu cherches à trouver le max sur $K=[0,1]^n$ de la fonction $V(x_1,...,x_n)=\frac{1}{n} \sum_{i=1}^n x_i^2 - \left( \frac{1}{n} \sum_{i=1}^n x_i \right)^2$. -
et comme $V$ est convexe en chaque variable, le maximum est atteint en un des coins du cube $[0;1]^n$: on retrouve bien ce qu'on disait. Si on appelle $p$ le nombre de $1$ parmi $x=(x_1,x_2, \ldots, x_n)$ alors $V(x)=\frac{p}{n} - (\frac{p}{n})^2$ qui est maximise pour $p=[\frac{n}{2}]$.
-
Et si on utilise la majoration $var(Y) \leq \frac{(b-a)^2}{4}$ lorsque p.s $a \leq Y \leq b$ ?
-
@Foys : Oui bien vu, reste à voir que la borne sup est atteinte. Je suis un peu dubitatif pour le cas $n$ impair.
Joli alekk le coup de la convexité en chaque variable, j'avais écrit une démo un peu lourde (pour montrer par récurrence sur $k$ que le max est atteint sur une "hyperface" de dimension $n-k$).
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.4K Toutes les catégories
- 62 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 23 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 84 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 26 Mathématiques et finance
- 342 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres