image
Des outils puissants d’approximation des fonctions.

Approximation de fonctions

L’approximation de fonction est un exemple de mathématiques riches d’applications. Typiquement, quand chercher les extrema d’une fonction est trop long car la fonction est longue à calculer, on peut chercher les extrema d’une fonction approchée; c’est là le principe de la méthode de Newton (qui approche une fonction par le polynôme de degré 2 qui lui est tangent), et plus généralement des modèles approchés (on trouvera plus facilement ’surrogate models’ sur internet), qui utilisent des approximateurs dits universels, i.e. capables d’approcher globalement toute fonction « raisonnable », alors que les polynômes de degré 2 n’approche que localement les fonctions régulières (par développement de Taylor). On peut aussi citer l’apprentissage supervisé à partir d’exemples aléatoires simples (indépendants identiquement distribués), grand consommateur de petits espaces de fonctions (ayant de meilleures propriétés statistiques) en approximant des grands. Mais on verra aussi de nombreuses applications internes aux mathématiques, comme le lemme d’Urysohn ou le cube de Hilbert.

Topologie et approximation de fonctions caractéristiques

On trouvera ici des lemmes qui seront des outils utiles pour les démonstrations ultérieures. On peut se référer au livre « analyse réelle et complexe » de Rudin.

Intercaler des ouverts relativement compacts entre un ouvert et un compact

Soit \(X\) un espace séparé localement compact, \(U\) un ouvert de \(X\), et \(K\) un ensemble compact inclus dans \(U\). Alors il existe un ouvert \(V\) de \(X\) relativement compact 1 tel que \[K \subset V \subset \overline V \subset U.\]

\(\bullet\)Construisons tout d’abord \(W\) ouvert contenant \(K\), avec \(\overline V\) compact

– Soit \(K_x\) un voisinage compact de \(x\), pour \(x\in K\)

– Soit \(V_x\) l’intérieur de \(K_x\)

– Les \(V_x\) recouvrent \(K\), on peut donc en extraire un recouvrement fini \(\cup_{x\in I} V_x\)

– la réunion \(W\) des \(V_x\), pour \(x\) dans \(I\), convient.

\(\bullet\)Si \(U=X\), \(V=W\) convient.

\(\bullet\)Sinon, soit \(F\) le complémentaire de \(U\). Bien entendu, \(F\) est fermé.

\(\bullet\)Pour \(x\) dans \(F\) définissons \(T_x\) ouvert contenant \(K\) avec \(x\not \in T_x\). Un tel ouvert existe, par le théorème [sepacomp].

\(\bullet\)Définissons alors \[K_x=\overline T_x \cap F \cap \overline W\] (voir figure [constr]).

\(\bullet\)L’intersection des \(K_x\) pour \(x\) dans \(F\) est vide, car chaque \(x\) de \(F\) n’appartient pas à \(T_x\), donc pas à \(\cap_y T_y\).

\(\bullet\)Les \(K_x\) sont fermés dans un compact \(\overline W\). Donc par la propriété [intfin], on peut en extraire une sous-famille \((K_x)_{x\in J}\) finie telle que l’intersection soit vide.

\(\bullet\)Alors \(V=\cap_{x\in J} T_x \cap W\) convient; c’est une intersection finie d’ouverts donc c’est un ouvert, c’est une intersection d’ensembles contenant \(K\) donc \(V\) contient \(K\), et \[({\overline V}\cap F)\subset \cap_{x\in J} {\overline T}_x \cap {\overline W}\cap F=\emptyset\] d’où \({\overline V}\subset U\) (rappelons qu’un fermé d’un compact est compact, voir corollaire [part1]).
image

Construction de \(K_x\) pour \(x\in F\).

Séparation d’un compact et d’un fermé

(Lemme d’Urysohn).
Soit \(X\) un espace topologique séparé localement compact, \(U\) un ouvert de \(X\), \(K\) un compact de \(X\) inclus dans \(U\). Alors il existe une fonction \(f\) continue de \(X\) dans \([0,1]\) telle que \[\begin{aligned} x \in K \to f(x)&=1\newline x \not \in U \to f(x)&=0 \end{aligned}\]
Ne pas utiliser un théorème difficile dans un cas simple: dans le cas d’un espace métrique, la fonction qui à \(x\) associe \(\frac{d(x,X\setminus U)}{d(x,X\setminus U)+d(x,K)}\) convient.
Dans le cas de \(\mathbb{R}^n\), on trouvera une preuve plus simple avec le théorème [urysohn2] (utilisant la convolution). En outre, la fonction construite sera \(C^\infty\).

Intuition Cela revient à avoir un compact, un fermé disjoint du compact, et à définir une fonction continue égale à \(1\) sur le compact et à \(0\) sur le fermé.

\(\bullet\)Par le lemme [pourury] (appliqué deux fois), construisons \(V_0\) et \(V_1\) deux ouverts relativement compacts 2 tels que \[K\subset V_0 \subset \overline V_0 \subset V_1 \subset \overline V_1 \subset U\]

\(\bullet\)Soit \(q_0,...,q_n,...\) une bijection de \(\mathbb{N}\) sur \(\mathbb{Q}\cap [0,1]\), avec \(q_0=0\) et \(q_1=1\).

\(\bullet\)Supposons construits \((V_{q_i})\) pour \(i\in \{0,1,...n\}\) des ouverts relativement compacts tels que \(q_i<q_j\) implique \(\c V_{q_i} \subset V_{q_j}\) pour \(i\) et \(j\) dans \(\{0,1,...n\}\).

\(\bullet\)Alors le lemme [pourury] permet de construire \(V_{q_{n+1}}\).

\(\bullet\)On construit ainsi une famille de fermés indexés par les éléments de \(Ratio=\mathbb{Q}\cap [0,1]\), avec \(q<p \Rightarrow \c V_q \subset V_p\).

\(\bullet\)Définissons alors, pour \(q \in Ratio\), \(f_q=(1-q)\chi_{V_q}\), et \(g_q=q\chi_{\overline V_q} + (1-q)\) (voir figure [graphes]),

\(\bullet\)puis \(f=sup_{q\in Ratio} f_q\), et \(g=\inf_{q\in Ratio} g_q\).

\(\bullet\)Nous avons donc, par la proposition [semicont], \(f\) semi-continue inférieurement et \(g\) semi-continue supérieurement.

image

Graphe de \(f_p\) (à gauche) et \(g_p\) (à droite).

\(\bullet\)Il est clair que \(\chi_K \leq g\) et \(\chi_U \geq f\).

\(\bullet\)On a même clairement \(f=g=1\) sur \(K\) et \(f=g=0\) hors de \(U\).

\(\bullet\)Il suffit de montrer (par la proposition [semicont]) que \(f=g\); ainsi \(f\), semi-continue à la fois supérieurement et inférieurement, sera continue.

\(\bullet\)Supposons que \(f(x)>g(x)\).

– Alors \(\exists p,q\in Ratio\) tels que \[f_p(x) > g_q(x)\]

– Donc \(x \not \in V_q\), \(x \in V_p\), et donc \(q<p\)

– Par contre (voir figure [graphes]) \(1-p > 1-q\); ce qui est contradictoire avec \(q<p\).

\(\bullet\)Supposons maintenant que \(f(x)<g(x)\).

– Alors on peut trouver \((p,q)\in Ratio^2\) tels que \[f(x) < 1-p < 1-q < g(x)\]

– Alors par définition du sup et de l’inf: \[f_p(x)<1-p < 1-q < g_q(x)\]

– On en déduit alors \(x\not \in V_p\) et \(x\in V_q\), ce qui implique \(p<q\), et contredit \(1-p<1-q\).
On trouvera par exemple une application dans la partie [ch] sur le cube de Hilbert. D’autres versions de lemmes d’Urysohn (voir lemme [urysohn2]) auront d’autres applications.

Approximation d’un ensemble mesurable par une fonction \(C^\infty\)

Soit \(E\) un ensemble mesurable de mesure finie de \(\mathbb{R}^n\), et soit \(\epsilon>0\).

Alors il existe une fonction \(f\) \(C^\infty\) telle que \[\chi_E \leq f \leq \chi_{V_{2\epsilon}(E)}\]

avec \(V_{t}(E)\) l’ensemble des éléments à distance \(<t\) de \(E\).

\(\bullet\)Soit \(E\) un tel ensemble.

\(\bullet\)Définissons \[f_n=\chi_{V_{1/n}(E)}*\rho_{1/n},\] avec \(\rho_{1/n}\) la fonction définie par le corollaire [hyperfonction] (de support inclus dans \(B(0,1/n)\) et d’intégrale \(1\), et en outre de classe \(C^\infty\)).

\(\bullet\)\(f_n\) est bien définie et \(L^1\), car \(\rho_{1/n}\) et \(\chi_{V_{1/n}(E)}\) sont \(L^1\) (voir propriété [cpmm] du produit de convolution).

\(\bullet\)\(f_n\) est \(C^\infty\), par la propriété [popof].

\(\bullet\)Tout d’abord on remarque que \(\chi_E \leq f_n\)

En effet, si \(x\in E\), alors \(f_n(x)\) est l’intégrale de \(\rho_{1/n}\) sur une boule de rayon \(\epsilon\) (sur cette boule en effet \(\chi_{V_{1/n}(E)}\) vaut \(1\) - l’intégrale de \(f_n\) y est donc égale à l’intégrale de \(\rho_{1/n}\), donc \(1\)).

\(\bullet\)Ensuite \(f_n \leq \chi_{V_{2\epsilon}(E)}\) pour \(n\) assez grand.

– on le montre tout d’abord pour \(\chi_{V_{2\epsilon}(E)}(x)=0\). Pour cela, si \(\chi_{V_{2\epsilon}(E)}(x)=0\), on note que \(d(x,E) > 3\epsilon/2\), alors si \(1/n\leq \epsilon\), \[\begin{aligned} f_n(x)&=\int \chi_{V_{1/n}(E)}(x-y)\rho(y)d\mu(y)\newline &=\int_{{\parallel}y {\parallel}\leq 1/n} \chi_{V_{1/n}}(x-y)\rho_{1/n}(y)d\mu(y)=0 \end{aligned}\]

\(f\) est par ailleurs toujours inférieure à \(1\). D’où le résultat, en choisissant \(f=f_n\) pour \(n\) assez grand.

Lemme d’Urysohn dans \(\mathbb{R}^n\)

Il s’agit ici d’une version dans \(\mathbb{R}^n\) du lemme d’Urysohn. On trouvera une version beaucoup plus générale (espace localement compact séparé) avec le lemme [urysohn]. Mais pour des applications de la vie de tous les jours, ce théorème suffit, et peut même s’avérer plus puissant, puisqu’il fournit une fonction \(C^\infty\) et non simplement une fonction continue.

(Lemme d’Urysohn, deuxième version).
Soit \(K\) un compact de \(\mathbb{R}^n\), \(\Omega\) un ouvert de \(\mathbb{R}^n\) contenant \(K\), alors il existe une fonction \(f\) \(C^\infty\) à support compact telle que \(\chi_K \leq f \leq \chi_\Omega\).

Intuition Il est plus élégant de se passer d’invoquer un tel théorème lorsque l’on peut construire manuellement une solution élégante. Notamment on peut construire manuellement une fonction \(C^\infty\) de \(\mathbb{R}^N\) dans \(\mathbb{R}\) comprise entre \(\chi_{\overline B(0,n)}\) et \(\chi_{\c B(0,n+1)}\). En effet, définissons \[\begin{aligned} f_{|B(0,1)}(x)&=e^{-\frac{1}{1-{\parallel}x {\parallel}^2}}\newline f_{|B(0,1)^c}(x)&=0 \end{aligned}\] Cette fonction est \(C^\infty\), comme expliqué en [boulecinfini], et \(>0\) sur \(B(0,1)\).

On définit alors \(F_n(x)=\int_{B(x,n)} f(t)d\mu(t)\) (\(\mu\) étant la mesure de Lebesgue).

\(F_n\) est \(C^\infty\), comme on s’en convainc en dérivant sous le signe \(\int\) l’expression suivante (équivalente par un simple changement de variable) \(F_n(x)=\int_{B(0,n)} f(x+t)d\mu(t)\) (voir théorème [condersom]). Attention, pour appliquer le théorème de dérivation sous le signe somme, il faut bien voir que chaque dérivée \(D^\nu f\) est majorée par une fonction \(L^1\), ce qui n’est pas difficile en l’occurence, puisque toutes les dérivées \(D^\nu f\) sont continues à support compact.

Il est ensuite évident que \(F_n\) est strictement \(>0\) sur \(B(0,n)\), nulle sur \(B(0,n+1)^c\), et comprise entre \(0\) et \(1\) partout.

On construit de même, pour \(\Omega\) ouvert contenant la boule unité fermée, en considérant \(F_n(x/n)\) pour \(n\) assez grand, une fonction égale à \(1\) sur \(\overline B(0,1)\), et nulle en dehors de \(\Omega\).

Il existe une autre manière de procéder : si \(0<r_1<r_2\), on définit \(\psi(t)=ce^{-\frac{1}{(t-r_1)(r_2-t)}}\) si \(t\in[r_1,r_2]\) et \(\psi(t)=0\) sinon. La fonction \(\psi\) est \(C^\infty\) sur \(\mathbb{R}^+\). On choisit alors \(c\) telle que \(\int_{r_1}^{r_2}\psi=1\), puis on pose \[\forall x\in\mathbb{R}^n,\qquad \varphi(x)=1-\int_0^{{\parallel}x{\parallel}}\psi(t)\,dt\] La fonction \(\varphi\) est alors \(C^\infty\) sur \(\mathbb{R}^n\) (il n’y a pas de problème en \(0\) car \(\varphi\) est constante au voisinage de ce point), et l’on a \[\varphi(x)=1\hbox{ si }x\in\bar{B}(0,r_1)\qquad\hbox{ et }\qquad \varphi(x)=1\hbox{ si }x\not\in\bar{B}(0,r_2),\] et l’on a \(0\leq\varphi\leq 1\) sur \(\mathbb{R}^n\).

On aurait pu utiliser ce résultat pour démontrer le théorème [t807] d’une autre manière ; on trouvera des applications avec les théorèmes [cksc] (densité des fonctions \(C^k\) à support compact dans l’espace des fonctions \(C^k\)), [lpcosc] (idem dans \(L^p\)) et [partition] (partitions de l’unité).

\(\bullet\)Il faut tout d’abord se rappeler que la distance entre un compact et un fermé disjoints est toujours \(>0\) (en effet la distance au fermé est continue, par la proposition [continuitedistance], et donc son minimum est atteint sur le compact).

\(\bullet\)Ensuite on applique le lemme [neko].

Partition \(C^\infty\) de l’unité

(Partition \(C^\infty\) de l’unité).

Soit \(K\) un compact inclus dans \(\mathbb{R}^n\), inclus dans la réunion des \(\Omega_i\) pour \(i\in [1,p]\), avec \(\Omega_i\) ouvert.

Alors il existe \(f_1\), ..., \(f_p\) des applications \(C^\infty\) telles que le support de \(f_i\) soit inclus dans \(\Omega_i\) pour tout \(i\in[1,p]\), avec \[\chi_K \leq \sum_{i\in [1,p]} f_i \leq 1\]

\(\bullet\)On considère la famille \((B_i)_{i\in I}\) des boules \(B\) telles qu’il existe \(i\in [1,p]\) tel que \(B \subset \Omega_i\) 3. Étant donné \(i\) dans \(I\) on note \(Num(i)\) un entier tel que \(B_i\subset \Omega_{Num(i)}\).

\(\bullet\)Puisque \(K\) est compact, et puisque \(K\) est (clairement!) inclus dans la réunion des \((B_i)_{i\in I}\), on se restreint à une réunion finie \((B_i)_{i\in J}\), recouvrant \(K\).

\(\bullet\)Commençons par prouver le théorème, sans se préoccuper de la contrainte \(\sum_i f_i \leq 1\).

\(\bullet\)Pour cela, définissons \(Ury_i\), pour \(i\in J\), une fonction \(C^\infty\) à valeurs dans \([0,1]\), égale à \(1\) sur \(B_i\) et nulle en dehors de \(\Omega_{Num(i)}\). Cela se fait par le lemme d’Urysohn, version [urysohn2], ou éventuellement par la remarque qui suit le dit lemme, qui montre que dans ce cas particulier on peut se passer du résultat général.

\(\bullet\)On définit maintenant \(MetaUry_i\), pour \(i\in [1,p]\), la somme des \(Ury_j\), pour \(j\in J\) et \(Num(j)=i\).

\(\bullet\)Il est clair, comme annoncé plus haut, que la famille \((MetaUry_i)_i\), vérifie le théorème énoncé, à ceci près que la somme n’est pas nécessairement inférieure ou égale à \(1\).

\(\bullet\)On se donne maintenant une fonction \(f\) \(C^\infty\) comprise entre \(\chi_K\) et \(\chi_{V_\epsilon(K)}\) 4, avec \(\epsilon\) inférieur au double de la distance du compact au fermé \(F\) défini par: \[F=\{x/ \sum_{i\in[1,p]} MetaUry_i(x)=0\}\]

\(\bullet\)On définit alors \(f_i\) pour \(i\in [1,p]\) par \(f_i(x)=\frac{g_i(x) f(x)}{\sum_{j=1}^n g_j(x)}\) si \(x\in F^c\), et \(f_i=0\) sinon.

\(\bullet\)On vérifie facilement que la famille ainsi construire convient.
Les applications \(C^\infty\) de l’unité servent dès que l’on veut remplacer une fonction par une approximation qui lui ressemble mais en plus régulier. En particulier, on peut citer la convolution.

Approximation de fonctions continues

(Théorème de Stone).

On se donne \(K\) un compact, et \(A\) une sous-algèbre unitaire de l’algèbre \(C^0(K,\mathbb{R})\) des fonctions continues à valeurs réelles sur \(\mathbb{K}\), munie de la norme \(f \mapsto {\parallel}f {\parallel}_\infty = sup_{x\in K} |f(x)|\).

On suppose que \(A\) sépare les points de \(K\), c’est-à-dire qu’étant donnés \(x\) et \(y\) dans \(K\) avec \(y\neq x\), il existe \(f\) dans \(A\) tel que \(f(x) \neq f(y)\).

Alors \(A\) est dense dans \(C^0(K,\mathbb{R})\).

\(\bullet\)On montre tout d’abord que \(x \mapsto \sqrt{x}\) définie sur \([0,1]\) est dans l’adhérence de l’ensemble des polynômes, pour la norme \({\parallel}. {\parallel}_\infty\). Pour cela on considère le développement en série entière de \(x \mapsto \sqrt{1-x}\); qui est bien défini sur \([0,1[\). Le problème est le développement de \(x\mapsto \sqrt{1-x}\) en \(1\).

La série de ce développement converge en 1 (la série est alternée), donc par le théorème [contaubord] la fonction \(\sqrt{1-x}\) étant continue, elle vaut son développement en série entière sur tout l’intervalle \([0,1]\) ; et il y a convergence uniforme sur \(\displaystyle [0,1]\) (corollaire de la preuve du théorème [contaubord]).

Il ne reste plus qu’à composer par \(t\mapsto 1-t\) pour avoir le résultat désiré: \(x \mapsto \sqrt x\) est approchable uniformément par des polynômes sur \([0,1]\). \(x\mapsto \sqrt{x}\) est donc bien dans l’adhérence de l’ensemble des polynômes pour la norme \(||.||_\infty\).

\(\bullet\)Montrons maintenant que si \(f\) est dans \(A\), alors \(|f|\) est dans l’adhérence de \(A\). On se donne \(racine_n(t)\) le \(n\)-ième polynôme d’une suite de polynômes tendant vers \(\sqrt{t}\) sur \([0,1]\). On suppose \(f\) comprise entre \(-1\) et \(1\) (on peut se ramener à ce cas-là en divisant \(f\) par une constante suffisamment grande - on utilise ici le fait que \(A\) est unitaire (et donc contient les constantes)). Alors on constate que \[\underbrace{racine_n(f.f)}_{\in A} \to |f| \mbox{\ uniformément (i.e. pour la norme ${\parallel}.{\parallel}_\infty$)}\] \(\bullet\)On note maintenant que si \(n\) fonctions \(f_1,...,f_n\) sont dans \(A\), alors \(max \{f_1,f_2,...,f_n\}\) (resp. \(min \{f_1,f_2,...,f_n\}\)) est dans l’adhérence de \(A\); en effet on peut toujours exprimer le max (resp. le min) d’un ensemble fini de fonctions \(f_i\) par des sommes et différences finies des \(f_i\) et de \(|f_i|\) (or \(|f_i|\) est dans l’adhérence de \(A\) par le point ci-dessus).

\(\bullet\)On note maintenant qu’étant donnés deux points \(x\) et \(y\) distincts de \([0,1]\) et deux réels \(X\) et \(Y\), il existe une application \(f\) dans \(A\) telle que \(f(x)=X\) et \(f(y)=Y\). Cela est facile en rappelant que \(A\) contient les constantes (puisqu’elle est unitaire) et que \(A\) sépare les points.

\(\bullet\)On se donne maintenant une fonction \(f\) dans \(C^0(K,\mathbb{R})\), \(\epsilon>0\) et \(x\) dans \(K\). On cherche à montrer qu’il existe \(g\) dans l’adhérence de \(A\) telle que \(g(x)=f(x)\) et \(g(t)<f(t)+\epsilon\) pour tout \(t\) dans \(K\).

Pour cela on considère, en utilisant le démontré ci-dessus, pour tout \(t\) dans \(K\) une fonction \(f_t\) de \(A\) égale à \(f\) en \(x\) et inférieure à \(x+\epsilon/2\) en \(t\). On considère alors pout tout \(t\) dans \(K\) l’ouvert \(U_t\) sur lequel \(f_t\) est inférieure à \(f+\epsilon\); les \(U_t\) recouvrent \(K\) et on peut donc en extraire un recouvrement fini \(U=\cup_{t\in E} U_t\), avec \(E\) fini. Il ne reste alors qu’à considérer la fonction \(min\) des fonctions \(f_t\) pour \(t\in E\), et on a bien une fonction comme souhaitée.

\(\bullet\)Maintenant on se donne une fonction \(f\) dans \(C^0(K,\mathbb{R})\), et on cherche à montrer que l’on peut approcher \(f\) uniformément par des fonctions de \(A\); on aura ainsi conclu le théorème.

Pour cela, on se donne \(\epsilon\), et on associe à tout \(t\) dans \(K\) une fonction \(g_t\) égale à \(f\) en \(t\), inférieure à \(f+\epsilon\) (grâce au ci-dessus). On peut alors associer à tout \(t\) un ouvert \(V_t\) tel que \(g_t>f-\epsilon\) sur \(V_t\). On peut alors prendre pour fonction \(g\) le \(max\) des \(g_t\) pour \(t \in F\), avec \(F\) fini tel que l’union des \(V_t\) (pour \(t\in F\)) soit \(K\), et on a bien \(f-g < \epsilon\).

Un corollaire important est la densité de l’ensemble des polynômes trigonométriques dans l’ensembles des fonctions \(2\pi\)-périodiques continues. Un autre corollaire notoire est le suivant:

(Théorème de Weierstrass).
L’ensemble des polynômes sur un compact \(K\) de \(\mathbb{R}\) et à coefficients dans \(\mathbb{R}\) est dense dans l’ensemble des fonctions continues de \(K\) dans \(\mathbb{R}\), pour la norme uniforme \({\parallel}.{\parallel}_\infty\).
C’est un corollaire immédiat du théorème de Stone ci-dessus.

Il existe une autre preuve du théorème de Weierstrass, basée sur des arguments de probabilité. Précisément, ce corollaire ci-dessus est aussi un corollaire du théorème ci-dessous.

Soit \(f\) une application continue de \([0,1]\) dans \(\mathbb{R}\).

On définit \(B_n(x)=\sum_{k=0}^n C_n^kf(\frac kn) x^k(1-x)^{n-k}\), \(n\)-ième polynôme de Bernstein associé à \(f\).

Alors la suite \(B_n\) converge uniformément vers \(f\).

On remarque que \(B_n(x)\) est précisément l’espérance de \(f(\frac Xn)\), avec \(X\) suivant une loi binomiale \(B(n,x)\).

On utilise alors le module de continuité \(w(f,\delta)\) défini par \[w(f,\delta)=sup_{|x-y|<\delta} |f(x)-f(y)|\] il est bien à valeurs dans \(\mathbb{R}\) car \(f\) est continue sur un compact, donc uniformément continue, et ainsi \(\displaystyle \lim_{\delta\to 0^+} w(f,\delta)=0\).

Notons \(M=sup |f|\).

Alors \(|f(x)-B_n(x)|\leq\) \[w(f,\delta) P(|\frac Xn -x|\leq \delta)+M\ P(\frac Xn -x\geq \delta)+M\ P(\frac Xn-x\leq -\delta)\] \[\leq w(f,\delta) + 2M\ \frac1{n^2\delta^2} Var(X)\] (grâce à l’inégalité de Tchebytchev [tcheb]) \[\leq w(f,\delta) + \frac{M}{2n\delta^2} \to 0 \mbox{\ quand\ } n\to \infty,\] d’où le résultat.
Attention! Le théorème n’est valable que dans le cas des fonctions continues de \(K\subset \mathbb{R}\) dans \(\mathbb{R}\); par exemple si l’on considère l’ensemble des fonctions continues de \(K \subset \mathbb{C}\) dans \(\mathbb{C}\), on constate que l’on ne peut pas approcher \(f:z \mapsto \overline z\) du disque unité fermé dans le disque unité fermé par un polynôme, car \[\int_0^{2\pi} f(e^{i\theta}).e^{i\theta}d\theta=2\pi\] et donc si on suppose que la suite de polynômes \(P_n\) tend uniformément vers \(z \mapsto \overline z\), la suite d’intégrales ci-dessous tend vers \(2\pi\): \[\int_0^{2\pi} P_n(e^{i\theta}).e^{i\theta}d\theta\] Or toutes les intégrales de cette suite sont nulles (considérer l’intégrale monôme par monôme pour s’en convaincre!).

Pour que tout s’arrange, il faudrait des polynômes en \(z\) ET \(\overline z\). Voyons cela:

(Stone, version complexe).

On se donne \(A\) une sous-algèbre unitaire de l’ensemble des fonctions continues de \(K\) un compact à valeurs dans \(\mathbb{C}\), stable par passage au conjugué et séparant les points de \(K\).

Alors \(A\) est dense dans \(C^0(K,\mathbb{C})\) pour la norme \({\parallel}. {\parallel}_\infty\).

\(\bullet\)\(Re\ f=(f+\overline f)/2\) et \(Im\ f=(f-\overline f)/2i\); or \(A\) est stable par passage au conjugué, donc les parties réelles et imaginaires de fonctions de \(A\) sont dans \(A\).

\(\bullet\)la sous-algèbre des fonctions réelles de \(A\) sépare les points. En effet, soit \(x\) et \(y\) distincts, il existe une fonction \(f\) qui sépare \(x\) et \(y\); soit la partie réelle de \(f\) les sépare, soit la partie imaginaire de \(f\) les sépare. Dans les deux cas on a bien ce qu’on veut, à savoir une fonction réelle de \(A\) qui les sépare : c’est \(Re\ f\) ou \(Im\ f\)..

\(\bullet\)en appliquant le théorème dans le cas réel, on peut donc conclure en approchant séparément la partie réelle et la partie imaginaire.
L’hypothèse sur la stabilité de \(A\) par passage au conjugué est indispensable! En effet, sans cette hypothèse on trouve un contre-exemple en considérant l’algèbre \(\mathbb{C}[x]\); l’application du disque unité fermé dans lui-même, définie par \(z \mapsto \overline z\) n’est pas holomorphe, et donc ne peut être dans l’adhérence de \(\mathbb{C}[x]\) (rappel: une limite uniforme de fonctions holomorphes est holomorphe, et on vient de voir une autre preuve du fait que \(z\mapsto\bar{z}\) n’est pas limite uniforme de polynômes sur \(\bar{D}\)).

Approximation de fonctions mesurables

(Lusin).

Soit \(f\) une application mesurable de \(\mathbb{R}^n\) dans \(\mathbb{C}\), dont le support est inclus dans \(E\) de mesure finie. Alors pour tout \(\epsilon>0\) il existe \(g\) continue de \(\mathbb{R}^n\) dans \(\mathbb{C}\) telle que:

\(\bullet\)\(\mu(\{x / f(x) \neq g(x)\}) < \epsilon\)

\(\bullet\)\(sup |g(x)| \leq sup |f(x)|\)

Intuition L’hypothèse « support inclus dans \(E\) de mesure finie » peut être oubliée. En effet, en résumé, on peut considérer les \(g_i=f_{|U_i}\) pour \(i\) dans \(\mathbb{N}\), avec \(U_i\) boule de centre \(0\) et de rayon \(i\); alors on peut « approcher » \(g_i\) par \(h_i\) égale à \(g_i\) sauf sur un ensemble de mesure \(<\frac{\epsilon}{2^{i+1}}\), et avec \(\sup |h_i|\leq \sup |g_i|\). En « recollant » les \(h_i\) on arrive à une fonction proche de \(f\).

\(\bullet\)On laisse de côté la fonction nulle.

\(\bullet\)Premier cas: \(0 \leq f \leq 1\) et \(E\) compact, \(\sup \ f=1\).

– Donnons nous \(\epsilon>0\)

\(f\) est limite croissante d’une série croissante de fonctions simples \((s_n)\), égales à des combinaisons linéaires de fonctions caractéristiques d’ensembles mesurables; notons \((E_n)\) ces ensembles mesurables (comme expliqué pendant la preuve de la proposition [simtopos]).

– On considère \(R\) suffisamment grand pour que \(E \subset B(0,R)\).

– Pour tout \(n\) on se donne \(K_n\) un compact et \(\Omega_n\) un ouvert inclus dans \(B(0,R)\) avec \(K_n \subset E_n \subset \Omega_n \subset B(0,R)\), et \(\mu(\Omega_n-K_n)<\epsilon.2^{-n}\) (possible grâce au théorème [fondaleb], définissant la mesure de Lebesgue).

– Grâce au lemme d’Urysohn [urysohn] ou [urysohn2], on se donne une fonction \(f_n\) telle que \(\chi_{K_n} \leq f_n \leq \chi_{\Omega_n}\).

– Il ne reste plus qu’à sommer \(g(x)=\sum_{n\in\mathbb{N}} \frac{f_n}{2^n}\).

\(g\) est continue, comme somme convergeant normalement d’une série de fonctions continues (proposition [limcon]).

– Sur le complémentaire de la réunion des \(\Omega_n\setminus K_n\), \(f=g\). Cette réunion est de mesure \(\leq\epsilon\)

– On a bien \(|g|\leq \sup\ f\), puisque chaque \(f_n\) est majorée par \(1\).

D’où le résultat dans le cadre qu’on s’était donné, i.e. \(0 \leq f < 1\) et \(E\) compact.

\(\bullet\)Passons au cas d’une fonction \(f\) telle que \(0 \leq f \leq 1\), sans hypothèse de compacité sur \(E\).

– Donnons nous \(\epsilon>0\)

– Il existe un compact \(K\) tel que la mesure de \(E\setminus K\) soit inférieur à \(\epsilon\).

– On peut donc travailler sur la restriction de \(f\) à \(K\) pour construire \(g\), et on a encore le résultat désiré.

\(\bullet\)Passons maintenant au cas d’une fonction \(f\) bornée.

– En considérant \(f^+\) et \(f^-\) 5, et en multipliant par une constante pertinente pour se ramener à des fonctions à valeurs dans \([0,1]\), on a aussi le résultat désiré.

\(\bullet\)On peut maintenant considérer le cas le plus général.

– Considérons \[A_m=\{x\in \mathbb{R}^n ; |f(x)|>m \}.\] \(A_0\) est de mesure finie; on peut donc appliquer la proposition [rafale] pour conclure que la mesure des \(A_m\) tend vers \[\mu(\cap_m A_m)=\mu(\emptyset)=0 \quad \text{quand}\quad m\to \infty.\]

– On se donne donc \(m\) tel que \(\mu(A_m)<\epsilon\).

– On peut donc appliquer le résultat partiel ci-dessus à la fonction \(f.\chi_{A_m^c}\) (fonction produit de \(f\) par la fonction caractéristique du complémentaire de \(A_m\), c’est-à-dire fonction égale à \(f\) sur le complémentaire de \(A_m\) et à \(0\) partout ailleurs).

D’où le résultat.

Approximation de fonctions mesurables bornées

Soit \(f\) une application mesurable bornée de \(\mathbb{R}^n\) dans \(\mathbb{C}\), dont le support est inclus dans \(E\) de mesure finie. Alors \(f\) est limite simple presque partout d’une suite de fonctions \(g_n\) continues et bornées (par la même borne).
Corollaire du théorème de Lusin [lusin]. Détaillons un peu:

\(\bullet\)On peut se donner une suite \((g_m)\) de fonctions continues telles que \(g_m\) soit bornée par la même borne que \(f\) et telles que \(g_m\) soit égale à \(f\) sauf sur un ensemble \(E_m\) de mesure au plus \(2^{-m}\), par le théorème de Lusin [lusin].

\(\bullet\)\(\cap_{m\geq 0} \cup_{p\geq m} E_p\) est de mesure nulle (résultat facile à prouver directement, ou découlant du premier lemme de Borel-Cantelli [bc1]).

\(\bullet\)On vient précisément d’écrire le résultat.

Dans les espaces \(C^k\) ou \(L^p\)

Pour connaitre la topologie usuelle sur \(C^k(\mathbb{R}^n)\), on consultera la partie [ckorn].

Densité des fonctions \(C^k\) à support compact dans \(C^k(\mathbb{R}^n)\)

L’ensemble des fonctions \(C^k(\mathbb{R}^n,\mathbb{R})\) à support compact est dense dans \(C^k(\mathbb{R}^n,\mathbb{R})\).
On se donne une fonction \(bulbe\) \(C^\infty\) telle que \[\chi_{\overline B(0,1)} \leq bulbe \leq \chi_{\overline B(0,2)},\] grâce au lemme [urysohn2].

On définit \[bulbe_n(x)=bulbe(x/n)\]

Il est clair que quelle que soit la fonction \(f\) dans \(C^k(\mathbb{R}^n)\), \(f.bulbe_{n+1}\) est égale à \(f\) sur la boule de rayon \(n\) et de centre \(0\). Tout compact étant inclus dans une telle boule, la convergence de \(f.bulbe_{n+1}\) vers \(f\) est uniforme sur tout compact. La démonstration pour les dérivées (nécessaire pour la convergence dans \(C^k\)) est laissée au lecteur.

Densité de l’ensemble des fonctions continues à support compact dans \(L^p(\mathbb{R}^n)\)

L’ensemble des fonctions continues à support compact de \(L^p(\mathbb{R}^n)\) est dense dans \(L^p(\mathbb{R}^n)\), pour \(p\neq \infty\).

\(\bullet\)Donnons-nous \(f\) dans \(L^p(\mathbb{R}^n)\).

\(\bullet\)On cherche (il suffit de trouver) une fonction continue \(g\) à support compact telle que \({\parallel}f-g{\parallel}_p < \epsilon\).

\(\bullet\)Il suffit pour cela d’appliquer le théorème de Lusin [lusin].

Intuition D’une part \(L^p\) est complet, d’autre part l’ensemble des fonctions continues à support compact est dense dans \(L^p\). On en déduit donc que \(L^p(\mathbb{R}^n)\) est le complété de l’ensemble des fonctions continues à support compact pour la norme de \(L^p\).

Densité de l’ensemble des fonctions \(C^\infty\) à support compact dans \(C^k(\mathbb{R}^n)\)

Pour tout \(k\) dans \(\mathbb{N}\), \(C_c^\infty(\mathbb{R}^n)\)6 est dense dans \(C^k(\mathbb{R}^n)\).

\(\bullet\)Grâce au théorème [cksc] (densité des fonctions \(C^k\) à support compact dans l’ensemble des fonctions \(C^k\)), il suffit de montrer que \(C_c^\infty(\mathbb{R}^n)\) est dense dans \(C_c^k(\mathbb{R}^n)\)7. Il faut bien noter qu’il n’est pas suffisant de montrer le résultat pour \(k=0\) et de conclure en argumentant que \(C^k(\mathbb{R}^n)\) est inclus dans \(C^0(\mathbb{R}^n)\). En effet, le résultat pour une valeur donnée de \(k\) concerne la distance pour \(C^k(\mathbb{R}^n)\).

\(\bullet\)Pour cela on fixe \(n \in \mathbb{N}\), \(k\in \mathbb{N}\), \(f\) dans \(C_c^k(\mathbb{R}^n)\).

\(\bullet\)On va utiliser les fonctions \(\rho\) et \(\rho_\epsilon\) définie dans le corollaire [hyperfonction] et la proposition [superfonction]. Rappelons que pour tout \(\epsilon>0\), \(\forall x\in\mathbb{R}^n,\ \rho_\epsilon(x)=\epsilon^{-n}\rho(\frac{x}{\epsilon})\).

\(\bullet\)On définit alors \((f_m)\) l’application \(f*\rho_{1/m}\). On va montrer que la suite \(f_m\) converge uniformément sur tout compact vers \(f\), et qu’il en est de même des dérivées8.

\(\bullet\)Calculons: \[(f_m-f)(x)=\int (f(x-y)-f(x))\rho_{1/m}(y)d\mu(y)\] \[=m^n \int \rho(my)(f(x-y)-f(x))dy\] \[\begin{aligned} =\int \rho(z) (f(x-\frac{1}{m}.z)-f(x)) dz\end{aligned}\] (avec le changement de variable \(z=m\,y\))

\(\bullet\)\(f\) étant continue à support compact, elle est uniformément continue (voir théorème de Heine [heine]).

\(\bullet\)Donc la quantité [tituacan] tend vers \(0\), l’intégrale de \(\rho\) étant bornée, uniformément en \(x\).

\(\bullet\)On en déduit que \(f_m \to f\) uniformément.

\(\bullet\)Pour généraliser au cas des dérivées de \(f_m\) et de \(f\), et pour justifier que \(f_m\) est bien \(C^\infty\), il suffit d’appliquer le théorème de dérivation d’une convolution [popof].

Densité de l’ensemble des fonctions \(C^\infty\) à support compact dans \(L^p(\mathbb{R}^n)\)

L’ensemble des fonctions \(C^\infty\) à support compact de \(\mathbb{R}^n\) dans \(\mathbb{R}\) est dense dans \(L^p(\mathbb{R}^n)\), pour \(p<\infty\).

Notons qu’une démonstration alternative, utilisant le lemme d’Urysohn [urysohn2] est possible.

\(\bullet\)En vertu du théorème [lpcosc], il suffit de montrer que l’ensemble des fonctions \(C^\infty\) à support compact de \(\mathbb{R}^n\) dans \(\mathbb{R}\) est dense dans \(L^p_c(\mathbb{R}^n)\)9\(\cap C^0(\mathbb{R}^n,\mathbb{R})\), pour \(p<\infty\).

\(\bullet\)On se donne donc une fonction \(f\) dans \(L^p_c(\mathbb{R}^n)\), pour \(p<\infty\).

\(\bullet\)On va utiliser les fonctions \(\rho\) et \(\rho_\epsilon\) définies dans le corollaire [hyperfonction] et la proposition [superfonction].

\(\bullet\)On définit alors \((f_m)\) l’application \(f*\rho_{1/m}\).

\(\bullet\)On pose maintenant \(q\) tel que \(1/p+1/q=1\), \(q\) est le conjugué de \(p\).

\(\bullet\)Il ne reste plus qu’à calculer : \[|(f_m-f)(x)|\leq \int \rho(z) | f(x-z/m) -f(x) | d\mu(z)\] \[\leq\int \rho(z)^{1/q} \rho(z)^{1/p} | f(x-z/m) -f(x) | d\mu(z)\] \[\leq\left(\int (\rho(z)^{1/q})^q\right) d\mu(z))^{1/q} \left(\int (\rho(z)^{1/p})|f(x-z/m)-f(x)|\right)^p d\mu(z))^{1/p}\]

par l’inégalité de Hölder (théorème [holder]), et donc \[|(f_m-f)(x)|\leq \left(\int \rho(z)d\mu(z) \right)^{1/q} \left(\int \rho(z) |f(x-z/m)-f(x)|^p d\mu(z)\right)^{1/p}\]

\(\bullet\)On déduit du calcul précédent, puisque \(\int \rho=1\) par la proposition [superfonction]: \[N^p(f_m-f)^p \leq \int (\int \rho(z) | f(x-z/n) - f(x) |^p d\mu(z)) d\mu(x)\] \[\leq \int \rho(z) \int |f(x- z/n)-f(x)|^p d\mu(x) d\mu(z)\] (par le théorème de Fubini [fubini]) \[\leq \int \rho(z) \underbrace{{\parallel}f(.-z/n)-f(.) {\parallel}_p^p}_{\to 0 \mbox{ (justifié ci-dessous)}} d\mu(z)\] \[\to 0\] par le théorème de convergence dominée de Lebesgue [domlp], puisqu’on a convergence simple vers \(0\), et convergence dominée par \(z\mapsto \rho(z)2^p{\parallel}f {\parallel}_p\) qui est bien une fonction \(L^1\).

\(\bullet\)Le fait qu’étant donné \(z\), \({\parallel}f(.-z/n)-f(.) {\parallel}_p \to 0\), est clair dans le cas où \(f\) est continue, puisqu’alors \(f\) est uniformément continue (support compact), et qu’on intègre \(f(.-z/n)-f(.)\) sur un domaine borné (à \(z\) donné).

\(\bullet\)Sinon \(f\) s’exprime de toute façon comme limite dans \(L^p\) de fonctions continues à support compact (par le théorème [lpcosc]); donc il suffit d’appliquer l’inégalité triangulaire.

  1. 1  C’est-à-dire d’adhérence (dans \(X\)) compacte.
  2. 2  Relativement compacts = d’adhérences compactes.
  3. 3  \(\exists i \in [1,p]\) tel que \(B \subset \Omega_i\) et pas \(B \subset \cup_{i\in [1,p]} \Omega_i\)!
  4. 4  \(V_\epsilon(K)\), dit \(\epsilon\)-voisinage de \(K\), est l’ensemble des points situés à une distance \(<\epsilon\) de \(K\).
  5. 5  \(f^+(x)=max(f(x),0)\), \(f^-(x)=max(-f(x),0)\)
  6. 6  Ensemble des fonctions \(C^\infty\) à support compact de \(\mathbb{R}^n\) dans \(\mathbb{R}\).
  7. 7  Ensembles des fonctions \(C^k\) à support compact.
  8. [ckorn].8  Ce qui est caractéristique de la convergence pour la topologie usuelle de \(C^k\), voir
  9. 9  Ensemble des fonctions de \(L^p\) à support compact.

Bibliographie


    Barre utilisateur

    [ID: 20] [Date de publication: 9 mars 2021 22:58] [Catégorie(s): Le cours d'agrégation ] [ Nombre commentaires: 0] [nombre d'éditeurs: 1 ] [Editeur(s): Emmanuel Vieillard-Baron ] [nombre d'auteurs: 5 ] [Auteur(s): Christophe Antonini Olivier Teytaud Pierre Borgnat Annie Chateau Edouard Lebeau ]




    Commentaires sur le cours

    Documents à télécharger

    L'article complet