Lecture zen
Intuition Bien noter que le résultat de complétude vaut aussi pour \(L^\infty\).
Des résultats classiques dans les espaces \({\cal L}^p\) et et les espaces \(L^p\).
Des résultats classiques dans les espaces \({\cal L}^p\) et et les espaces \(L^p\).
Espaces \({\cal L}^p\) et espaces \(L^p\)
Les propriétés des espaces \(L^p\) sont fondamentales dans de nombreux secteurs de l’analyse et donc nous utiliserons abondamment le symbole \(\Arrowvert\) dans cette section pour souligner des applications: par exemple, en statistique, en approximation de fonctions et en apprentissage, on cherche des fonctions \(\hat f\) ressemblant à une fonction \(f\). Dans le cas de statistiques ou d’apprentissage, \(\hat f\) n’est en général pas construit à partir de \(f\) directement, mais à partir de données \(x_1,\dots,x_n\) et de leurs images par \(f\), \(y_1=f(x_1),y_2=f(x_2),\dots,y_n=f(x_n)\), possiblement bruitées. Pour certains algorithmes, on montre par exemple des convergence dans \(L^p\) de \(\hat f\) vers \(f\) pour toute \(f\) mesurable, et ce presque sûrement en les couples \((x_i,y_i)\) s’ils sont aléatoires simples; cette propriété est appelée consistance universelle de l’algorithme d’apprentissage. Une autre application possible des espaces \(L^p\) est le débruitage (par exemple d’une image) par la convolution. La convolution est ses propriétés de convergence sont un point fondamental. L’analyse de Fourier est aussi une grande consommatrice d’espaces \(L^2\); cet aspect fera l’objet d’une partie spécifique (chapitre [fourier]).
Dans le cas de l’approximation de fonctions, on dispose en général de \(f\), mais il est par exemple long à calculer, et on cherche donc un substitut à \(f\) précis et rapide à calculer. De nombreux cas intermédiaires existent: parfois on cherche à déterminer les \(x_i\) pour que les couples \((x_i,y_i=f(x_i))\) soit les plus informatifs possibles. Le choix de la valeur de \(p\) est important: \(p=1\) conduit à une appproximation plus stable vis à vis des niveaux de bruits (dans le sens où une médiane est plus stable qu’une moyenne), \(p=\infty\) est un cadre robuste en particulier souhaitable pour l’approximation de fonctions telle qu’utilisée dans le principe de Bellman (on pourra consulter par exemple le livre de Bertsekas et Tsitsiklis, Neurodynamic programming, Athena Publishing, 1996).
On peut noter l’essort de l’approximation de fonctions pour des pseudo-normes plus originales, par exemple \(f\mapsto \int \min(|f-\epsilon|,0)\), dite norme \(L^1\) \(\epsilon\)-insensible (qui n’est en fait pas une norme, puisque des fonctions non-nulles ont une « norme » nulle), dont l’étude est un domaine de recherche; le lecteur intéressé peut par exemple étudier la notion de fat-shattering dimension (Antony et Bartlett, Theoretical Foundations of Neural Networks, 1999, et la vaste littérature consacrée aux SVMs, dites « séparateurs à vaste marge »).
Quelques résultats utiles
(Nombres conjugués). On dit que deux réels \(p\) et \(q\) sont conjugués si ils sont tous les deux dans \([1,\infty]\) et si \[\frac1p+\frac1q=1\]
Pour \(\alpha \in ]0,1[\) et \((u,v) \in (\mathbb{R}^+)^2\) on a \(u^\alpha.v^{1-\alpha} \leq \alpha.u + (1-\alpha).v\)
On suppose \(u\) et \(v\) non nuls (sinon le résultat est évident). On passe alors au \(\ln\) et le résultat est directement une conséquence de la concavité de \(\ln\).
Ce résultat est donc un exemple d’application de la convexité. Il sert notamment à établir le résultat suivant, dont les applications sont multiples:
(Inégalités de Hölder). Soient \(f\) et \(g\) deux fonctions mesurables de \(X\) dans \(\overline{\mathbb{R}^+}\), et soient \(p\) et \(q\) deux réels \(\in ]1,\infty[\) conjugués, alors \[\int f.g \leq (\int f^p)^{\frac1p}.(\int g^q)^{\frac1q}\]
\(\bullet\)Posons \(F=(\int f^p)^{\frac1p}\) et \(G=(\int g^q)^{\frac1q}\).
\(\bullet\)En intégrant on obtient \[\frac1{FG} \int fg \leq \frac1p + \frac1q = 1,\] ce qui achève la preuve.
\(\bullet\)On peut supposer sans perte de généralité \(F\) et \(G\) finis et non nuls.
\(\bullet\)Posons \(u=(\frac{f(x)}F)^p\), \(v=(\frac{g(x)}G)^q\), \(\alpha=\frac1p\), on a \(1-\alpha=\frac1q\), et donc en appliquant le lemme [lemcon] on obtient \[\frac{f(x).g(x)}{FG} \leq \frac1p \frac{f(x)^p}{F^p}+ \frac1q \frac{g(x)^q}{G^q}\]
Les applications sont notamment: l’inégalité de Schwartz ci-dessous, l’inégalité de Minkovski [minkowski], le théorème [lpdual] (dualité dans les espaces \(L^p\)), les partie [llp] et [ldeux] et le théorème [truc] (propriétés et cas particuliers des \(L^p\)), le théorème [fm] (densité de fonctions à support compact).
(Inégalité de Schwartz). Soient \(f\) et \(g\) deux fonctions mesurables de \(X\) dans \(\overline{\mathbb{R}}\), alors \[\int |f.g| \leq \sqrt{\int f^2}.\sqrt{\int g^2}\]
Spécialisation du théorème [holder] dans le cas \(p=q=2\).
(Inégalité de Minkowski). Soit \(p\in ]1,+\infty[\), et soient \(f\) et \(g\) des fonctions mesurables de \(X\) dans \([0,+\infty]\).
Alors \[\left(\int(f+g)^p\right)^{\frac1p} \leq (\int f^p)^{\frac1p} +
(\int g^p)^{\frac1p}\]
\(\bullet\)Si \((\int(f+g)^p)^{\frac1p}\) est infinie, alors par convexité de \(x \mapsto x^p\), on peut écrire \[\left(\frac{f+g}2\right)^p \leq \frac{f^p+g^p}2,\] et donc déduire que l’inégalité annoncée est vraie.
\(\bullet\)On additionne et on obtient l’inégalité annoncée, en remarquant que \[(p-1)q=p.\]
\(\bullet\)On suppose maintenant que \((\int(f+g)^p)^{\frac1p}\) est finie.
\(\bullet\)On considère \(q\) conjugué à \(p\).
\(\bullet\)Alors par le théorème [holder], on peut écrire les deux inégalités suivantes: \[\int f.(f+g)^{p-1} \leq (\int f^p)^{\frac1p}.(\int (f+g)^{(p-1).q})^{\frac1q}\] \[\int g.(f+g)^{p-1} \leq (\int g^p)^{\frac1p}.(\int (f+g)^{(p-1).q})^{\frac1q}\]
Espaces \({\cal L}^p\) et \(L^p\)
On se donne \(p \in [1,+\infty]\). On note bien que \(p\) peut être \(+\infty\).
Normes \(N_p\)
(Normes \(N_p\)). Si \(p\in [1,+\infty[\) alors on note \(N_p\) l’application qui à une fonction \(f\) de \(X\) dans \(\overline{\mathbb{R}}\) ou de \(X\) dans \(\mathbb{C}\) associe \((\int |f|^p)^{\frac1p}\).
Une famille \((x_i)_{i \in I}\) de nombres complexes est sommable de somme \(x\) si pour tout \(\epsilon\) il existe \(J \subset I\) finie telle que pour tout \(K\) fini telle que \(J
\subset K \subset I\) on ait \(|x-\sum_{i \in K} x_i| \leq \epsilon\).
On appelle majorant essentiel d’une fonction \(f\) tout \(M\) dans \((0,+\infty]\) tel que \(|f(x)| \leq M\) pour presque tout \(x\).
Si \(p=+\infty\) alors on note \(N_\infty\) l’application qui à une fonction \(f\) de \(X\) dans \(\overline{\mathbb{R}}\) ou de \(X\) dans \(\mathbb{C}\) associe la borne \(\inf\) des majorants essentiels de \(f\). \(N_\infty(f)\) est appelée borne supérieure essentielle de \(f\).
On dit qu’une fonction est essentiellement bornée si \(N_\infty(f)\) est fini.
On note \({\cal L}^p(X,\mu)\) ou \({\cal L}^p(X)\) lorsqu’il n’y a pas ambiguité l’ensemble des fonctions \(f\) mesurables de \((X,\mu)\) dans \(\mathbb{R}\) telles que \(N^p(f)\) est fini.
Pour la relation \({\cal R}\) définie par \[f {\cal R}g \iff f(x)=g(x) \mbox{ presque partout}\] on note \(L^p(X,\mu)\) ou \(L^p(X)\) l’ensemble des classes d’équivalence de l’ensemble des applications de \(X\) dans \(\mathbb{R}\) contenant au moins une fonction de \({\cal L}^p(X,\mu)\).
On définit de même \({\cal L}^p_\mathbb{C}(X,\mu)\), \(L^p_\mathbb{C}(X,\mu)\), \({\cal L}^p_\mathbb{C}(X)\) et \(L^p_\mathbb{C}(X)\), en considérant des fonctions à valeur dans \(\mathbb{C}\).
On note \(l^p(X)\) l’espace \(L_\mathbb{C}(X,\mu)={\cal L}_\mathbb{C}(X,\mu)\) avec \(\mu\) la mesure du dénombrement (il y a identité entre \(L(\mathbb{N})\) et \({\cal L}(\mathbb{N})\) car le seul ensemble négligeable est l’ensemble vide).
On note \(l^p\) l’espace \(L^p_\mathbb{C}(\mathbb{N},\mu)={\cal L}^p_\mathbb{C}(\mathbb{N},\mu)=L^p_\mathbb{C}(\mathbb{N})={\cal L}^p_\mathbb{C}(\mathbb{N})\), avec \(\mu\) la mesure du dénombrement.
Intuition Pourquoi quotienter par la relation « être égales presque partout » ? D’une part parce que cela permet d’identifier des choses très proches, mais aussi parce que cela permet d’avoir un espace normé; sans quotienter, de nombreuses fonctions, dont la « norme » est nulle, ne seraient pas nulles; donc ce ne serait pas là une norme en bonne et due forme. On va pouvoir grâce au passage au quotient avoir un espace normé, dont on va montrer diverses bonnes propriétés (et en particulier le fait que c’est un Banach, cf plus bas).
On note que la borne supérieure essentielle d’une fonction est le plus petit majorant essentiel de cette fonction.
\(N_p\) est une semi-norme sur \({\cal L}^p(X)\) et une norme sur \(L^p(X)\).
Si \(p\) est fini, \(l^p(X)\) est l’ensemble des applications des \(f\) de \(X\) dans \(\mathbb{C}\) telles que la famille \((|f(x)|^p)_{x \in X}\) soit sommable. \(l^\infty(X)\) est l’ensemble des applications bornées de \(X\) dans \(\mathbb{C}\).
Théorèmes sur les \(L^p\)
(Convergence dominée de Lebesgue dans \(L^p\)). On suppose ici \(p \neq +\infty\).
Soit une suite \((f_n)\) de fonctions mesurables, telle que \[f_n(x) \to f(x) \mbox{ pour presque tout }x\] \[\exists g \in L^p / \forall (x,n) |f_n(x)| \leq g(x)\] alors la classe de \(f\) appartient à \(L^p\) et \(f_n\) tend vers \(f\) pour \(N^p\).
Il suffit d’appliquer le théorème de convergence dominée à \(f_n^p\), avec \(g^p\) et \(f\).
Il est à noter que la « réciproque » du théorème de convergence dominée (voir théorème [convdom] et les remarques qui suivent) est vraie aussi dans \(L^p\).
(Contre-exemple avec \(p=+\infty\)). Il suffit de considérer \(f_n = \chi_{[n,+\infty[}\) pour avoir toutes les hypothèses vérifiées sans que la conclusion soit juste.
(Théorème de Fischer-Riesz). Les espaces \(L^p\) sont des espaces de Banach, pour \(p \in [1,+\infty]\).
Voir la partie [llp].
\(\bullet\)Il faut et il suffit de montrer la complétude. Tout d’abord on considère le cas \(p=\infty\).
\(\bullet\)On s’attaque maintenant au cas \(p\neq \infty\). Soit une série \(\sum f_n\) de fonctions mesurables normalement convergente pour la norme \(L^p\). On montre qu’elle converge. On note \(g(x)=\sum_{n\geq 1} | f_n(x)|\in [0,\infty]\) et \(g_k(x)=\sum_{n=1}^k |f_n(x)|\). Par le théorème de convergence monotone [convmon], \[\int g^p = \lim_{k\to \infty} \int (\underbrace{\sum_{n=1}^k
|f_n(x)|}_{=g_k(x)})^p=\lim_{k\to \infty} N_p(f_1+f_2+\dots+f_k)^p\] \[\leq \lim_{k\to \infty} \left[
N_p(f_1)+N_p(f_2)+\dots+N_p(f_k)\right]^p\] (car \(N_p\) est une norme) \[=(\sum_{n=1}^\infty N_p(f_n))^{p}\] et cette quantité est finie par hypothèse. On a donc \(g\in L^p\), et par suite \(g\) est fini presque partout: il existe un ensemble négligeable sur le complémentaire duquel \(g\) est fini. Sur ce même complémentaire (« presque » égal à \(X\)) la série des \(f_n\) est donc absolument convergente et donc convergente par complétude de \(\mathbb{R}\) ou de \(\mathbb{C}\). Ainsi, \(F_k=\sum_{n=1}^k f_n\) converge presque partout vers une fonction \(F\) et il est clair que pour tout \(k\), \(|F_k|\leq g\) (presque partout) où \(g\in L^p\). On déduit alors du théorème de convergence dominée de Lebesgue [domlp] dans \(L^p\) que \(F \in L^p\) et que \(F_n \to F\) dans \(L^p\).
Nous allons utiliser la caractérisation de la complétude pour les espaces normés selon laquelle un espace normé est complet si et seulement si toute série normalement convergence est convergente. On considère une série \(\sum f_n\) normalement convergente pour \(N_\infty\). On montre qu’elle converge. Quitte à remplacer \(f_i\) par une fonction de la même classe, on peut supposer \(f_i\) bornée par \(N_{\infty}(f_i)\) (ou tout majorant essentiel de \(|f_i|\)). On a alors pour tout élément \(x\) de \(X\): \(\sum_i |f_i(x)|\leq \sum_i N_{\infty}(f_i)<\infty\) donc par complétude de \(\mathbb{R}\) (ou \(\mathbb{C}\)) la série \(\sum_i f_i(x)\) converge vers un nombre que l’on notera \(f(x)\). On conclut en considérant le reste \(\sum_{i=n+1}^\infty N_\infty(f_i)\) pour avoir la convergence de \(S_n=\sum_{i=1}^n f_i\) vers \(f\) pour \(N_{\infty}\).
Pour \(p \in [1,+\infty]\), si \(X\) est de mesure finie, alors \(L^{p'}(X) \subset L^p(X)\) pour tout \(p' \geq p\) (éventuellement \(p'\) infini).
Pas dur, en séparant \(X\) en l’ensemble des points où \(|f|>1\) et en l’ensemble des points où \(|f|\leq 1\).
Intuition Remarque importante ! Comme le signale la remarque qui suit le théorème [lpcosc], l’espace \(L^p(\mathbb{R}^n)\) s’exprime en fait comme le complété de l’ensemble des fonctions continues (ou \(C^\infty\)) à support compact pour la distance associée à la norme \({\parallel} . {\parallel}_p\), si \(p<\infty\). Ce résultat n’est pas valable pour \(p=\infty\); ici l’adhérence serait simplement l’ensemble des applications continues qui, pour tout \(\epsilon>0\), sont inférieures à \(\epsilon\)1 en dehors d’un certain compact \(K_\epsilon\). On parle de fonctions qui « tendent vers \(0\) à l’infini ».
La démonstration suivante, difficile, est directement extraite et simplifiée (quitte à renforcer légèrement les hypothèses - le résultat général inclut en fait \(X\) union dénombrable de parties de mesure finie) du livre de W. Rudin, Analyse réelle et complexe. On se réfèrera au très utile livre de W. Rudin pour plus d’informations.
Soit \(p\in [1,\infty[\), \(\mu\) mesure positive finie sur \(X\), \(\phi\) forme linéaire continue (à valeurs dans \(\mathbb{C}\)) sur \(L^p(X)\). Soit \(q\) tel que \(\frac 1p + \frac 1q=1\). Alors il existe un unique \(g\) (presque partout) 2 \(L^q\), tel que \[\begin{aligned}
\phi(f)=\int_X fg d\mu \end{aligned}\] pour toute \(f\) fonction \(L^p\) et on a alors \[{\parallel}\phi {\parallel}= {\parallel}
g {\parallel}_q =\sqrt[q]{ \int |g|^q}\]
Ce théorème, qui existe sous un grand nombre de formes, est appelé théorème de représentation de Riesz, énonce exactement un isomorphisme entre \(L^q\) et \((L^p)'\) (dual topologique de \(L^p\)). Il faut bien noter que \(L^p\) signifie \(L^p(\mu)\) et \(L^q\) signifie \(L^q(\mu)\).
L’unicité découle facilement du fait que si \(g\) et \(g'\) sont deux fonctions vérifiant la propriété [eq1r], alors pour tout \(E\) mesurable, l’intégrale sur \(E\) de \(g-g'\) est nulle; donc en particulier pour \(E\) égal à l’ensemble des \(x\) pour lesquels (respectivement) \(Re(g(x))>Re(g'(x))\), \(Re(g(x))<Re(g'(x))\), \(Im(g(x))>Im(g'(x))\), \(Im(g(x))<Im(g'(x))\).
L’existence est beaucoup plus laborieuse à prouver:
\(\bullet\)Le cas \(\phi=0\) est trivial. Par la suite nous supposerons donc \(\phi\) non nulle.
\(\bullet\)Montrons tout d’abord l’existence d’une certaine fonction \(g\) telle que \(\phi(f)=\int fg\) pour toute \(f\in L^\infty(\mu)\). Cela se fait comme suit:
\(\bullet\)Il reste donc maintenant à montrer que \(g\) est \(L^q\) et que \({\parallel}\phi {\parallel}\geq {\parallel}g {\parallel}_q\); on pourra alors conclure que l’égalité [eq1r] est bien vérifiée en notant que \(L^\infty\) est dense dans \(L^p\). Pour se convaincre de ce dernier point, il suffit de remarquer que par convergence dominée, toute fonction \(f\) de \(L^p\) est limite de la suite des fonctions \(f.\chi_{F_n}\), où \(F_n\) est l’ensemble \(\{x ; |f(x)|\leq n\}\).
\(\bullet\)On traite tout d’abord le cas \(p=1\). On se donne \(E\) mesurable; alors \[|\int_E g d\mu| \leq {\parallel}\phi {\parallel}{\parallel}\chi_E {\parallel}_1={\parallel}\phi {\parallel}\mu(E)\] Donc par le lemme [lmlpdual] ci-dessous, \({\parallel}g {\parallel}_\infty \leq {\parallel}\phi {\parallel}\). On a donc d’une pierre deux résultats: \(g\) est \(L^\infty\), et \({\parallel} \phi {\parallel}\geq {\parallel}g{\parallel}_\infty\).
\(\bullet\)Il reste donc à traiter le cas \(p>1\). Cela se fait en considérant \(\alpha\) telle que \(\alpha g = |g|\) et \(\alpha\) de module constant égal à \(1\). Ceci est un exercice classique et peu difficile. Ensuite:
Supposons \(X\) de mesure \(\mu(X)\) fini, \(g\) appartenant à \(L^1(\mu)\), \(S\) fermé de \(\mathbb{C}\). Alors si pour tout \(E\) mesurable de mesure \(>0\) la moyenne sur \(E\) de \(g\) (i.e. \(\frac1{\mu(E)}\int_E g(x)\)) appartient à \(S\), alors \(g\) prend ses valeurs dans \(S\) presque partout.
\(\bullet\)Considérons \(\mathbb{D}\) un disque fermé dans le complémentaire de \(\Delta\).
\(\bullet\)Montrons donc \(\mu(E)=0\). Pour cela supposons, pour arriver à une contradiction, \(\mu(E)>0\). Alors, en posant \(\alpha\) le centre de \(\mathbb{D}\) et \(r\) son rayon, \[|\frac1{\mu(E)}\int_E (g-\alpha) | =|\frac1{\mu(E)}\int_E (g-\alpha)|\] \[\leq \frac 1{\mu(E)} \int_E (g-\alpha) \leq r\] Or \(\frac1{\mu(E)}\int_E g\) est censé appartenir à \(S\), d’où contradiction.
\(\bullet\)Il suffit de montrer que \(\mu(E)=0\) avec \(E=g^{-1}(\mathbb{D})\); en effet, le complémentaire de \(S\) étant (comme tout ouvert) union dénombrable de disques fermés, on aura alors \(g^{-1}(\mathbb{D})\) union dénombrables d’ensembles de mesure nulle, donc \(g^{-1}(\mathbb{D})\) de mesure nulle.
Zoologie des espaces \(L^p\)
On va juste ici introduire un peu de vocabulaire, comme le cas des suites, et l’important cas du \(L^2\) qui sert tant en analyse de Fourier.
Espace \({l}^p\)
Pour \(p<\infty\), on note \({l}^p\) l’espace \(L^p_\mathbb{C}(\mathbb{N},\mu)={\cal L}^p_\mathbb{C}(\mathbb{N},\mu)=L^p_\mathbb{C}(\mathbb{N})={\cal L}^p_\mathbb{C}(\mathbb{N})\), avec \(\mu\) la mesure du dénombrement. Il s’agit donc de l’espace des suites \((x_i)\) telles que \(\sum |x_i|^p\) est fini.
La norme \(N_p\) est la suivante: \[N_p(x)={\parallel}x {\parallel}= (\sum |x_i|^p)^{1/p}.\]
L’inégalité de Hölder [holder] se traduit quant à elle par \[N_1(z) \leq N_p(x).N_q(y)\] si \(p\) et \(q\) sont conjugués et si \(z_i=x_i.y_i\).
On note enfin \({l}^{\infty}\) l’espace des suites bornées.
Espace \(L^2\)
\(\boxcircle\) Généralités
\(2\) est conjugué à lui-même, d’où le cas particulier. Le produit de deux fonctions de \(L^2\) est intégrable (par l’inégalité de Hölder [holder]), et \(\int |fg| \leq\sqrt{(\int |f|^2)}\sqrt{(\int |g|^2)}\)
\(\boxcircle\) Espaces préhilbertiens \(L^2\) et \(L^2_\mathbb{C}\)
(produit scalaire euclidien usuel). Le produit scalaire euclidien usuel sur \(L^2(X)\) est égal à \((f,g) \mapsto <f|g>=\int f .g d\mu.\)
Ce produit scalaire hermitien fait de \(L^2_\mathbb{C}(X)\) un espace hilbertien complexe.
Ce produit scalaire euclidien fait de \(L^2(X)\) un espace hilbertien réel. Le produit scalaire hermitien usuel sur \(L^2_\mathbb{C}(X)\) est égal à \((f,g) \mapsto <f|g>=\int \overline f .g d\mu\).
\(\boxcircle\) Espace de Hilbert \(L^2\) et \(L^2_\mathbb{C}\)
\(L^2\) et \(L^2_\mathbb{C}\) sont préhilbertiens et complets, donc ce sont des espaces de Hilbert. Ceci sera abondamment utilisé dans la partie [fourier] sur les séries de Fourier. Par ailleurs, le théorème [lpdual] a une application immédiate ici: soit \(\mu\) mesure positive finie sur \(X\), \(\phi\) forme linéaire bornée (à valeurs dans \(\mathbb{C}\)) sur \(L^2(X)\). Alors il existe un unique \(g\) (presque partout) 3 \(L^2\), tel que pour tout \(f\) \(L^2\) \[\phi(f)=\int_X fg d\mu\nonumber\quad\] \[\mbox{et on a alors}{\parallel}\phi {\parallel}= {\parallel}g {\parallel}_2 =\sqrt[2] {\int |g|^2}.\]
Bibliographie
Barre utilisateur
[ID: 18] [Date de publication: 9 mars 2021 22:37] [Catégorie(s): Le cours d'agrégation ] [ Nombre commentaires: 0] [nombre d'éditeurs: 1 ] [Editeur(s): Emmanuel Vieillard-Baron ] [nombre d'auteurs: 5 ] [Auteur(s): Christophe Antonini Olivier Teytaud Pierre Borgnat Annie Chateau Edouard Lebeau ]Commentaires sur le cours
Documents à télécharger
L'article complet