Inégalité de Jensen conditionnelle

Bonjour à tous

Je ne comprends pas une démonstration de l'inégalité de Jensen pour l'espérance conditionnelle, donnée dans un livre de proba et dans ce cours en pdf : https://olivier.garet.xyz/cours/pps/pms-n.pdf à la page 34.


L'auteur fait en sorte de prendre une famille dénombrable de fonctions affines inférieures à la fonction convexe et je ne comprends pas pourquoi.
Je me dis que ça pourrait être pour avoir la mesurabilité du sup de la famille de fonctions affines ?
Pour moi la démo marcherait en prenant la famille de toutes les fonctions affines inférieures, et on conclut de la même façon en prenant les applications tangente à droite ?

Pour conclure la preuve l'auteur utilise un argument de densité avec la continuité, la continuité de la fonction convexe est-elle indispensable pour ce théorème ?
Dans ce pdf https://www.i2m.univ-amu.fr/perso/thierry.gallouet/licence.d/proba.d/poly-proba-8.pdf page 5 l'inégalité de Jensen est énoncée avec une fonction seulement supposée convexe, mais la variable aléatoire est supposée de carré intégrable et d'ailleurs je ne vois pas où cette hypothèse est utilisée dans la démonstration...

Merci pour votre aide !

Edit : j'ai ajouté des captures d'écran

Réponses

  • Quelqu'un a une idée ? :'(

  • Foys
    Modifié (December 2022)
    Soit $I\subseteq \R$ un intervalle et $f:I\to \R$ une fonction convexe. Alors $f$ est la borne supérieure des fonctions affines qui sont inférieures à elle (ceci peut être vu comme un cas particulier d'Hahn-Banach). En effet:
    Le cas où $I=\emptyset$ est vide ou réduit à un élément est trivial; soit désormais $x\in I$. Si $x \in I \cap ]x,+\infty[ \neq \emptyset$ on pose $p^+:= \inf \left \{ \frac{f(y) - f(x)}{y-x} \mid y \in I \cap ]x, +\infty[ \right \}$. Si $]-\infty ,x [ \cap I \neq \emptyset$ on pose $p_-:= \sup \left \{ \frac{f(y) - f(x)}{y-x} \mid y \in I \cap ]-\infty, x[ \right  \}$ (l'un des deux cas se produit forcément si $I$ a au moins deux éléments) Chacune des fonctions $y\mapsto f(x)+(y-x)p^-$ et $y\mapsto f(x)+(y-x)p^+$ minore $f$ et vaut $f(x)$ en $x$ ce qui entraîne le résultat.

    Cela étant soit $(\Omega,\mathcal A,P)$ un espace probabilisé, $X:\Omega \to \R$ une variable aléatoire $\mathcal A$-mesurable et $\mathcal B$ une sous-tribu de $\mathcal A$. Soit $I$ un intervalle tel que $X\in I$ presque sûrement et $f:I\to \R$ convexe. Soit $g:x\mapsto ax+b$ une fonction affine telle que pour tout $t\in I$, $g(t)\leq f(t)$. Alors $$E(f(X) \mid \mathcal B ) \geq E(g(X) \mid \mathcal B ) = E(aX+b\mid \mathcal B ) = aE(X\mid \mathcal B )+b = g\left ( E(X \mid \mathcal B ) \right )$$
    L'inéglité tout à gauche n'est rien d'autre que la croissance de l'espérance conditionnelle. En passant au $\sup$ à l'aide du paragraphe précédent, on obtient $$E(f(X) \mid \mathcal B ) \geq E(g(X) \mid \mathcal B )  \geq \sup \left ( \left \{g\left ( E(X \mid \mathcal B ) \right ) \mid g \text{ affine } \leq f  \right \} \right ) = f\left ( E(X \mid \mathcal B ) \right )$$ ce qui est exactment l'inégalité de Jensen conditionnelle.
     
    EDIT: Effectivement il faut supposer la famille dénombrable pour échanger sup et $E(\cdot | \mathcal B )$). Pour cela, utiliser le résultat précédent (si $I$ est d'intérieur non vide, pour tout $u\in I \cap \Q$ considérer une fonction affine $g_u$ inférieure à $f$, telle que $g_u(u) = f(u)$ et montrer que $f = \sup \{g_u \mid u \in I \cap \Q\} = f$, ensuite pour tout $u\in I\cap \Q$, considérer une partie mesurable $A_u\in \mathcal A$ de probabilité $1$ telle que pour tout $\omega \in A_u$, $ f\left ( E(X \mid \mathcal B ) (\omega )\right ) \geq g_u\left ( E(X \mid \mathcal B ) \right ) (\omega)$ et passer au sup sur $A:= \bigcap_{u\in I \cap \Q} A_u $).





    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • tetsu
    Modifié (December 2022)
    Merci pour ta réponse @Foys !
    En fait je ne vois pas à quelle étape de ta démonstration il faut supposer la famille dénombrable, c'est pour 
    $\sup \left ( \left \{g\left ( E(X \mid \mathcal B ) \right ) \mid g \text{ affine } \leq f  \right \} \right ) = f\left ( E(X \mid \mathcal B ) \right )$ ?
    Selon moi, c'est un cas particulier de
    $\sup \left ( \left \{g \circ h \mid g \text{ affine } \leq f  \right \} \right ) = f\circ h$
    pour toute fonction $h$ à valeurs dans $I$ presque sûrement, et on montre ça point par point.

    Pour la continuité, si $f$ est convexe mais pas continue au bord de l'intervalle $I=[m,M]$, les quantités $p^+(m)$ et $p^-(M)$ seront infinies.
    Si $P(E(X|B)=m)>0$ je ne suis pas sûr que ça fonctionne sans l'hypothèse de continuité. 
    (D'ailleurs je comprends pourquoi dans le 2ème pdf la fonction convexe $\phi$ n'est pas supposée continue, elle est forcément continue puisque définie sur $\mathbb{R}$ !)
Connectez-vous ou Inscrivez-vous pour répondre.