Définition : variable aléatoire...

Bonjour,

1°)J'ai du mal à saisir pourquoi la définition d'une v.a, disons $X$ sur une partie $A$ débute par :

$X^{-1}(A)=\{...\}$

Autrement dit, pourquoi doit-on "passer" par l'application réciproque pour la définition théorique j'entends?


2°)Comment puis-je expliquer le bien-fondé de la loi hyper-géométrique sans passer par la définition?

Je suis à la recherche d'une explication ressemblant "au temps d'attente du premier succès" pour une loi géométrique.

Merci pour vos explications,
Cordialement,

Clotho

Réponses

  • 1) La définition d'une v.a. n'est pas $X^{-1}(A)=\ldots$. C'est plutôt : on appelle v.a. sur $\Omega$ toute application mesurable définie sur $\Omega$ (et à valeur dans un autre espace mesurable).
  • Salut Clotho.

    Pour le 2) :
    * La réponse est dans la question.
    * En fait, tu cherches non pas une vraie justification, mais une présentation un peu intuitive, du style "de nombreuses raisons de petites variations autour de la moyenne, donc je modélise par une loi Normale" ou "loi discrète entière sans mémoire, je pense à la loi de Poisson", non ? Car, par exemple, dans la théorie de l'estimation d'une proportion par échantiillonnage au hasard, la loi hypergéométrique arrive tout naturellement, et sa justification est que c'est sa définition.

    Dans quel domaine veux-tu justifier l'usage de la loi hypergéométrique ?

    Cordialement
  • Bonjour Roger et Gérard,

    1°) Pour Roger : je précise un peu ma question.

    Comment faut-il comprendre la définition suivante :

    Soit $(E,A)$ et $(E',\epsilon)$ deux espaces probabilisables. On appelle variable aléatoire à valeurs dans $E'$ toute application $X$ de $E$ dans $E'$ telle que :
    $$\forall B\in E',\ X^{-1}(B)=\{\omega\in E,\ X(\omega)\in B\}\in A$$
    Ce que je ne saisis pas trop, c'est la nécessité de considérer l'image réciproque d'une partie $B$ de $E$ par l'application $X$.

    2°) Pour Gérard : tout à fait Gérard, je suis à la recherche d'une conception intuitive de cette loi hyper-géométrique pour la faire comprendre à mon étudiante en première année prépa ECE.

    Cordialement,
    Clotho.

    [\verb*=\inE= n'est pas une commande LaTeX (donc pas d'affichage). Il faut écrire \verb*=\in E=. ;) AD
  • Salut Clotho,

    Ce que tu écris après "telle que" c'est juste la définition de l'image réciproque : $X^{-1}(B') = \{ \, \omega \in \Omega \, | \, X(\omega) \in B' \}$. La définition est plutôt :

    "L'application $X$ est mesurable de $(E, \mathcal{A})$ dans $(E', \mathcal{E})$ si et seulement si pour tout $B' \in \mathcal{E}$ on a $X^{-1}(B') \in \mathcal{A}$."

    En short : l'image réciproque d'une partie mesurable est mesurable. Pourquoi demande-t-on ça ? Comme l'a dit roger c'est pour calculer des probas avec $X$. En effet lorsqu'on metune proba $P$ sur $(E,\mathcal{A})$ les seules parties de $E$ dont la proba est définie sont les parties mesurables (les éléments de $\mathcal{A}$).

    Je prends l'exemple d'une v.a. $X$ allant de $(E,\mathcal{A},P)$ dans $\R$ muni de sa tribu borélienne habituelle $\mathcal{B}$. On dit alors que $X$ est une variable aléatoire réelle, on peut la voir comme le tirage d'un nombre au hasard, et peut par exemple s'intéresser à la probabilité que ce nombre soit plus petit qu'un certain nombre $a \in \R$ fixé. Donc on veut donner un sens à $P(X \leq a)$. $P$ est définie sur les parties de $E$ donc on veut interpréter $\{ X \leq a \}$ comme une partie de $E$, et très naturellement on va dire que c'est l'ensemble des $e \in E$ tels que $X(e) \leq a$. Maix cet ensemble n'est autre que $X^{-1}(]-\infty,a])$, et pour lui associer une proba $P(X \leq a)$, on doit s'assurer qu'il est mesurable. Et plus généralement pour un borélien $B$ de $\R$, par définition on va poser $P(X \in B)=P(X^{-1}(B))$ mais pour ça il faut que $X^{-1}(B) \in \mathcal{A}$.

    Concernant la loi hypergéométrique, c'est celle du nombre de succès dans un tirage sans remise, là où la loi binomiale compte le nombre de succès dans un tirage avec remise. Je te renvoie à \lien{http://fr.wikipedia.org/wiki/Loi_hypergéométrique}.
  • Re Egoroff,

    Explications top "as usual" :). Je comprends enfin la définition théorique d'une v.a.

    Merci également pour les précisions sur les boréliens dans l'autre fil en réponse à ma question. C'est une bonne de départ pour moi de comprendre déjà vos explications à ce sujet.

    Cordialement,
    Clotho.
  • Content d'avoir pu t'éclairer :)
  • ergoroff, c'est vrai que c'est bien expliqué
  • Bonjour,

    je me joins a vos felicitations sur la pedagogie d'ergoroff.

    J'aimerais egalement apporter quelques precisions.

    Si on munit un ensemble donne $\Omega$ d'une tribu $\mathcal{F}$, on rend cet espace mesurable : tout sous-ensemble $A\subset \Omega$ tel que $A\in \mathcal{F}$ est dit mesurable et par extension, le couple $(\Omega, \mathcal{F})$ est appele espace mesurable.

    La mesurabilite est une notion fondamentale car c'est grace a elle que l'on peut doter notre espace d'une mesure de probabilite : en effet, quand on regarde la definition d'une mesure de probabilite ($\sigma$-additivite etc...) et celle d'une tribu (complementaire dans la tribu, stabilite par union d'une suite croissante), on se rend compte qu'elles se font echo l'une l'autre et qu'elles sont compatibles.

    Ceci pour pouvoir s'assurer que la mesure de proba sur notre espace permet bien de mesurer TOUS les ensembles de notre espace mesurable : on s'assure ainsi des le depart d'avoir verrouille le contexte et que tous les cas pathologiques qui ne seraient pas mesurables soient ecartes, et notre espace est alors formellement bien construit.
    Le triplet $(\Omega, \mathcal{F}, \mathbb{P})$ est alors appele de facto un espace probabilise.

    Une variable aleatoire est une application entre deux espaces mesurables, mais qui doit etre elle-meme mesurable. La mesurabilite au sens de l'application est definie comme etant la mesurabilite de tout sous-ensemble par l'image reciproque.

    Un point qu'Ergoroff a passe sous silence quand il ecrit $P(X<a)$, c'est qu'il ne s'agit absolument pas des memes mesures de probabilite : on a une probabilite dans l'espace de depart (la probabilite dans $(\Omega, \mathcal{F}, \mathbb{P})$ notee $\mathbb{P}$ qui s'applique sur l'ensemble $\{\omega \in \mathcal{A} \}$) tandis que l'espace d'arrivee $(\mathbb{R}, \mathcal{B}(\mathbb{R}), P_X)$ a sa propre mesure de probabilite notee $P_X$.

    Et c'est justement la propriete de mesurabilite de l'application $X$, qui fait que l'on identifier formellement l'evenement/l'ensemble $\{X < a \}$ dans $(\mathbb{R}, \mathcal{B}(\mathbb{R}))$ a l'evenement $\{\omega \in \mathcal{A} \}$, lui, dans $(\Omega, \mathcal{F})$ par application de la reciproque.

    Autrement dit, du fait de la mesurabilite de l'application $X$, tout se passe comme si on operait un "transfert" de probabilites entre deux espaces mesurables. C'est pour cela que l'on ne fait jamais le distinguo entre la proba $P_X$ mais que l'on travaille directement avec la proba de l'espace de depart $\mathbb{P}$ et que l'on identifie l'evenement $\{X<a\}$ (espace d'arrivee concret et intuitif) a celui, dans l'espace de depart (nettement plus abstrait), $\{\omega \in \mathcal{A} | X(\omega) < a\}$.

    Ceci justifie aussi la distinction fondamentale qui doit etre faite entre les deux ecritures sur l'exemple suivant :

    $$
    \mathbb{E}[X]=\int_{\Omega} X(\omega)d\mathbb{P} = \int_{\mathbb{R}}xdP_{X}
    $$

    et comme sur $\mathbb{R}$, la mesure $P_X$ est absolument continue par rapport a la mesure de Lebesgue, on ecrit egalement

    $$
    \mathbb{E}[X]=\int_{\Omega} X(\omega)d\mathbb{P} = \int_{\mathbb{R}}xdP_{X} = \int_{\mathbb{R}}x\cdot f_X(x)dx
    $$

    avec $f_{X}$ la densite de probabilite de $X$.

    Ainsi, tout evenement identifiable/observable/mesurable/probabilisable dans l'espace d'arrivee ("la face du de est 3") correspond de facon univoque a un sous-ensemble de l'espace de depart lui aussi identifiable/mesurable/probabilisable : on ne perd pas d'information au passage entre les deux espaces.

    Ceci est crucial quand on regarde la tribu comme la quantite d'information disponible/l'ensemble des evenements dont on peut dire s'ils sont realises ou non. Dans le cadre des processus stochastiques, la filtration est une suite de tribus croissantes car l'information s'accumule et se devoile a mesure que l'on progresse dans le temps. Et chaque variable aleatoire est mesurable par rapport a la tribu a cet instant : chaque evenement dont on peut dire s'ils ont ete realises ou non sont contenus dans cette tribu a cet instant la uniquement.


    En conclusion, imposer la propriete de mesurabilite dans la definition d'une variable aeatoire permet de s'assurer que ce que l'on observe "physiquement" est bien un evenement identifiable dans le sens ou l'on peut attribuer une probabilite.

    C'est peut-etre un peu long comme reponse, mais j'espere avoir pu eclairer avec ma modeste contribution.

    See ya'
    vinh
  • Salut vinh,

    Merci pour tes félicitations ! Je te retourne le compliment :), cette explication sur la notion de transfert, souvent mal comprise, est très claire. Et associer "mesurable" avec "observable" et "identifiable" est une bonne manière d'expliquer (surtout pour les filtrations), je note. Effectivement j'avais dans un premier temps laissé de côté l'aspect "mesure image" pour me concentrer sur la mesurabilité mais tes précisions sont indispensables pour approfondir.
Connectez-vous ou Inscrivez-vous pour répondre.