différentiabilité fonction convexe

bonjour

ref. Tosel p17

Il s'agit de démontrer qu'une fonction convexe $f$ sur un ouvert convexe $\Omega$ de $\R^n$ ayant des dérivées partielles (pas forcément continues sinon c'est trivial!) en un point $x_0$ est différentiable en ce point. Il y a un certain nombre d'arguments que je ne comprends pas.

On posera $|x|=|x_1|+...+|x_n|$

$\phi_{a,x}(t)=f(a+tx)$
$I_{a,x}={t\in\R, a+tx\in\Omega}$
On peut, moyennant la soustraction d'une fonction affine supposer que f et ses dérivées partielles sont nulles en $x_0$

on montre facilement que $\phi_{a,x}$ est convexe, donc admet des dérivées à gauche et à droite en 0
pourquoi :

1°)Pourquoi ces dérivées sont elles inférieures à 0 (la piste donnée est $f(x_0+h)\leq o(|h|)$ dont je ne vois pas d'où elle sort)
2°)pourquoi si $\phi_{x_0,h}0$
3°)pour montrer qu'une fonction convexe est presque partout différentiable, donc que les dérivées partielles existent presque partout on utilise le th de Fubini pour montrer que $\phi_{a,x}$ est dérivable pesque partout. QU'est ce que Fubini vient faire la dedans?

Réponses

  • juste pour faire remonter le poste
  • Re-salut $e$,

    Ton problème est très intéressant, je ne connais pas le Tosel mais j'ai bien envie de m'y plonger. Effectivement j'ai un peu de mal à retrouver le $o(|h|)$ même j'ai un petite idée. Juste pour vérifier : les hypothèses spécifient juste que $f$ admet ds dérivées partielles en $x_0$, pas sur un voisinage ? Je pense qu'au point ça suffit mais comme tu parles du continuité tu m'as mis les doute...
  • Bon, une idée pour le 1) : avec l'existence des dérivées partielles on connaît le comportement local de $f$ le long des axes qui partent de $x_0$, et pour extrapoler sur un voisinage plein de $x_0$ on va utiliser la convexité de $x_0$. A cet effet on souhaite écrire un point "proche" de $x_0$, de la forme $x_0 + th$, sous la forme d'une combinaison convexe de points proches de $x_0$ et qui sont sur les axes, donc de la forme $x_0 + s_i e_i$, où $e_i$ est le $i$-ème vecteur de la base canonique de $\R^n$. Une idée naturelle est de considérer les $x_0 + n t h_i e_i$, où les $h_i$ sont les composantes de $h$ dans la base canonique. Alors $x_0 + t h = \sum_{i=1}^n \frac{1}{n} (x_0 + n t h_i e_i)$, l'isobarycentre tout simplement (pourvu que $t$ soit assez petit pour que $n t \in I_{x_0,h}$).


    Revenons à $f$. Par définition des dérivées partielles on a $f(x_0 + n t h_i e_i) = f(x_0) + n t h_i \frac{\partial f}{\partial x_i} + o(|t|)$, donc en moyennant un nombre fini de $o(|t|)$ (revenir aux $\varepsilon$ si le besoin de riguer se fait sentir) et en se souvenant qu'on a supposé $f(x_0)=0$ on obtient
    $\frac{1}{n} \sum f(x_0 + n t h_i e_i) \leq \sum t h_i \frac{\partial f}{\partial x_i} + o(|t|)$. On peut réécrire $\sum t h_i \frac{\partial f}{\partial x_i}$ sous la forme d'un produit scalaire $\nabla f \cdot h$ pour plus de lisibilité. Comme $f$ est convexe on a $f(x_0 + th) = f \left( \sum_{i=1}^n \frac{1}{n} (x_0 + n t h_i e_i) \right) \leq \frac{1}{n} \sum f(x_0 + n t h_i e_i) \leq t \nabla f \cdot h + o(|t|)$. Comme par la deuxième hypothèse on a $\nabla f = 0$ on en déduit $f(x_0 + t h) \leq o(|h|)$...


    Bon, évidemment il manque une minoration de $f$, mais il ne doit pas être trop dur de montrer qu'elle est positive au voisinage de $x_0$. De manière plus inquiétante mon $o(|t|)$ dépend dramatiquement de $h$ (même problème que dans ton post sur la continuité radiale), et j'espère que ce ne sera pas un problème pour la suite...


    Pour ta question 2), tu veux parler de dérivées non ?
  • Merci d'avance au modérateur qui effacera le message précédent...




    Bon, une idée pour le 1) : avec l'existence des dérivées partielles on connaît le comportement local de $f$ le long des axes qui partent de $x_0$, et pour extrapoler sur un voisinage plein de $x_0$ on va utiliser la convexité de $x_0$. A cet effet on souhaite écrire un point "proche" de $x_0$, de la forme $x_0 + th$, sous la forme d'une combinaison convexe de points proches de $x_0$ et qui sont sur les axes, donc de la forme $x_0 + s_i e_i$, où $e_i$ est le $i$-ème vecteur de la base canonique de $\R^n$. Une idée naturelle est de considérer les $x_0 + n t h_i e_i$, où les $h_i$ sont les composantes de $h$ dans la base canonique. Alors $x_0 + t h = \sum_{i=1}^n \frac{1}{n} (x_0 + n t h_i e_i)$, l'isobarycentre tout simplement (pourvu que $t$ soit assez petit pour que $n t \in I_{x_0,h}$).


    Revenons à $f$. Par définition des dérivées partielles on a $f(x_0 + n t h_i e_i) = f(x_0) + n t h_i \frac{\partial f}{\partial x_i} + o(|t|)$, donc en moyennant un nombre fini de $o(|t|)$ (revenir aux $\varepsilon$ si le besoin de riguer se fait sentir) et en se souvenant qu'on a supposé $f(x_0)=0$ on obtient
    $\frac{1}{n} \sum f(x_0 + n t h_i e_i) = \sum t h_i \frac{\partial f}{\partial x_i} + o(|t|)$. On peut réécrire $\sum t h_i \frac{\partial f}{\partial x_i}$ sous la forme d'un produit scalaire $\nabla f \cdot h$ pour plus de lisibilité. Comme $f$ est convexe on a $f(x_0 + th) = f \left( \sum_{i=1}^n \frac{1}{n} (x_0 + n t h_i e_i) \right) \leq \frac{1}{n} \sum f(x_0 + n t h_i e_i) \leq t \nabla f \cdot h + o(|t|)$. Comme par la deuxième hypothèse on a $\nabla f = 0$ on en déduit $f(x_0 + t h) \leq o(|t|)$...


    Bon, évidemment il manque une minoration de $f$, mais il ne doit pas être trop dur de montrer qu'elle est positive au voisinage de $x_0$. De manière plus inquiétante mon $o(|t|)$ dépend dramatiquement de $h$ (même problème que dans ton post sur la continuité radiale), et j'espère que ce ne sera pas un problème pour la suite...


    Pour ta question 2), tu veux parler de dérivées non ?
  • Je continue...


    Une fois montré que $f(x_0 + th) \leq o(|t|)$ (1), on utilise à nouveau la convexité de $f$ pour écrire $0 = 2 f(x_0) \leq f(x_0+th) + f(x_0 - th)$ d'où $f(x_0 + th) \geq - f(x_0-th) \geq - o(|t|)$ d'après l'inégalité (1) ; d'où finalement $f(x_0 + th)=o(|t|)$.


    Pour en déduire que $\varphi_{x_0,h}$ est dérivable en $0$ et de dérivée nulle, il suffit d'écrire $\varphi_{x_0,h}(t)=f(x_0+th)=o(|t|)=0.t + o(|t|)$ d'où $\varphi'_{x_0,h}(0)=0$ par identification avec la définition de la dérivée (unicité du développement limité).


    En relisant l'énoncé je m'aperçois qu'il demande simplement l'inégalité $f(x_0+th) \leq o(|t|)$ (tu m'accordes que c'est équivalent à $f(x_0+h)=o(|h|)$ si $h$ tend vers $0$ au lieu d'être fixé). Comment en déduit-on que les dérivées à gauche $L_g(h)$ et à droite $L_d(h)$ de $\varphi_{x_0,h}$ en $0$ sont négatives ? Par exemple, pour $t$ positif on a par définition de la dérivée à droite : $f(x_0 + th) = L_d(h) t + o(|t|)$ ; en soustrayant l'inégalité (1) à cette équation on obtient $0 \geq L_d(h) t + o(|t|)$ ce qui impose clairement $L_d(h) \leq 0$. De même pour $L_g(h)$.


    Enfin, en ce qui concerne ta question 2), je pense que c'est "si $L_g(h) < 0$ alors $L_d(-h) > 0$" qu'il faut lire. En écrivant pour $t > 0$ petit : $f(x_0 + t(-h)) = f(x_0 + (-t)h)$, avec $-t < 0$, on comprend assez vite que justement $L_g(h)=-L_d(-h)$, d'où le résultat.
Connectez-vous ou Inscrivez-vous pour répondre.