Image
Bases de la théorie de la mesure et de l’intégration.

Intégration

On présente ici la théorie et la pratique de l’intégration. Pour ce qui est de la pratique, les sections [laonintegre2] et [laonintegre] sont utiles; on peut aussi s’exercer à retrouver toutes les formules classiques par soi-même (voir le formulaire).

On présentera respectivement les \(\sigma\)-algèbres et les mesures ([rahan1]), les \(\pi\)-systèmes et d-systèmes ([rahan2]); on pourra alors en particulier étudier le cas étonnant des parties non-mesurables ([rahan3]). Après quelques exercices, on passera alors aux fonctions mesurables ([rahan5]), aux suites de fonctions mesurables ([rahan6]), à la convergence dominée ([rahan7]). On se rapprochera alors de la pratique avec l’intégration dans les espaces produits et le changement de variable ([rahan8]). La comparaison entre mesurabilité au sens des boréliens et mesurabilité au sens de Lebesgue ([rahan9]) est importante pour être précis sur son vocabulaire.

On conclura alors par l’important cas des fonctions définies par des intégrales ([rahan10]) et un peu de zoologie ([rahan11]).

\(\sigma\)-algèbre, mesure

Les \(\sigma\)-algèbres sont nécessaires à la bonne définition de l’intégrale de Lebesgue dont nous verrons les avantages plus loin. Les boréliens, les lebesguiens, forment deux \(\sigma\)-algèbres l’une dans l’autre, la deuxième nettement plus vaste et permettant donc d’intégrer beaucoup plus de choses. Les boréliens sont néanmoins nécessaires, en tant que base de la construction des lebesguiens.

Définitions, généralités

Soit \(X\) un ensemble, \({\cal A}\in {\cal P}(x)\).

(Algèbre).
\({\cal A}\) est une algèbre (on dit aussi parfois clan) si elle vérifie:

\(\bullet\)\(X \in {\cal A}\);

\(\bullet\)Stabilité par union finie;

\(\bullet\)Stabilité par passage au complémentaire.
(Propriétés).
\(\bullet\)\(\emptyset \in {\cal A}\);

\(\bullet\)Stabilité par intersection finie;

\(\bullet\)Stabilité par différence;

\(\bullet\)Une intersection quelconque d’algèbres est une algèbre.

En fait une algèbre est stable par n’importe quelle suite finie d’opérations sur les ensembles.
a) \(\{\emptyset,X\}\)

b) \({\cal P}(X)\)

c) \(\{A \subset X | A \mbox{ fini ou cofini }\}\)

d) \(\{A \subset X | A \mbox{ ou } A^c \mbox{ au plus dénombrable}\}\)

e) \(X,E \subset X\); \(\{ A ; A \subset E \lor X - E \subset A\}\)

f) \(X,E \subset X\); \(\{E \subset A \lor A \cap E = \emptyset\}\)
(\(\sigma\)-algèbre).
\({\cal A}\) est une \(\sigma\)-algèbre (ou tribu) si elle vérifie:

\(\bullet\)\(X \in {\cal A}\);

\(\bullet\)stabilité par union dénombrable;

\(\bullet\)stabilité par passage au complémentaire.
\(\bullet\)\(\emptyset \in {\cal A}\)

\(\bullet\)stabilité par intersection dénombrable.

\(\bullet\)Une \(\sigma\)-algèbre est une algèbre.

\(\bullet\)stabilité par différence.

\(\bullet\)L’image réciproque d’une tribu par une application est une tribu.

\(\bullet\)Étant donné une tribu \({\cal A}\) sur \(X\), et une application \(f\) de \(X\) dans \(Y\), alors l’ensemble des \(U \subset Y\) tels que \(f^{-1}(U)\) appartient à \({\cal A}\) est une tribu sur \(Y\).

\(\bullet\)Une intersection quelconque de tribus est une tribu.

En fait une \(\sigma\)-algèbre est stable par n’importe quelle suite dénombrable d’opérations sur les ensembles.

Notez que l’ensemble des parties mesurables au sens de Riemann d’un segment \([a,b]\) est un clan, mais pas une tribu, puisque certaines parties dénombrables ne sont pas Riemann-mesurables (par exemple l’ensemble des rationnels).

(Espace mesurable).
\((X,{\cal A})\) est un espace mesurable si \({\cal A}\) est une tribu sur \(X\)

Une partie de \(X\) est dite \({\cal A}\)-mesurable si elle appartient à \({\cal A}\).

Dans les exemples plus haut, tous sont des \(\sigma\)-algèbres, sauf c), à moins que \(X\) ne soit fini.

\(\sigma\)-algèbre engendrée

Afin de pouvoir définir la notion de \(\sigma\)-algèbre engendrée, nous avons besoin d’un petit lemme (évident!):

Si \((A_\alpha)\) famille d’algèbres (resp. de \(\sigma\)-algèbres) sur un ensemble \(X\), alors \(\cap A_\alpha\) est une algèbre (resp. une \(\sigma\)-algèbre) sur \(X\).
(algèbre engendrée par \({\cal M}\)).
\(X\) un ensemble, \({\cal M}\subset {\cal P}(X)\) famille de parties de \(X\), l’algèbre engendrée par \({\cal M}\) (resp. la \(\sigma\)-algèbre engendrée par \({\cal M}\)) est l’intersection de toutes les algèbres (resp. \(\sigma\)-algèbres ) contenant \({\cal M}\). \(X\) un ensemble, la \(\sigma\)-algèbre engendrée par une famille de fonctions de \(X\) vers des espaces mesurables est la \(\sigma\)-algèbre engendrée par les images réciproques d’ensembles mesurables par ces fonctions.

C’est bien une algèbre (resp. \(\sigma\)-algèbre ) et c’est la plus petite qui contienne \({\cal M}\).

Intuition la \(\sigma\)-algèbre engendré par l’image réciproque d’une famille \({\cal F}\) de sous-ensembles de \(F\) par une application \(f:E\to F\) est l’image réciproque de la \(\sigma\)-algèbre engendrée par \({\cal F}\).

(Exemple fondamental).
Soit \(X\) muni d’une topologie \({\cal T}\); la \(\sigma\)-algèbre engendrée par \({\cal T}\) s’appelle la \(\sigma\)-algèbre borélienne. Ses éléments sont appelés les boréliens.

Dans \(\mathbb{R}\) ou \(\mathbb{R}^n\), c’est la plus petite \(\sigma\)-algèbre contenant les boules ouvertes. C’est aussi la plus petite \(\sigma\)-algèbre contenant les boules fermées. On verra plus loin avec les \(\Pi\)-systèmes qu’on peut passer par plus simple qu’une \(\sigma\)-algèbre pour spécifier une mesure.

La \(\sigma\)-algèbre engendrée par une base d’ouverts est la \(\sigma\)-algèbre engendrée par la topologie; donc lorsqu’un ensemble engendre une topologie, il engendre aussi les boréliens.

Les ensembles suivants engendrent les boréliens de \(\mathbb{R}\):

\(\bullet\)les ouverts \(\bullet\)Les intervalles ouverts bornés
\(\bullet\)les fermés \(\bullet\)les intervalles fermés bornés
\(\bullet\)les intervalles ouverts \(\bullet\)Les \([a,b[\) avec \((a,b) \in \mathbb{R}^2\)
\(\bullet\)les intervalles fermés \(\bullet\)Les \(]a,+\infty[\)
\(\bullet\)Les \([a,+\infty[\)

Les ensembles suivants engendrent les boréliens de \(\overline{\mathbb{R}}\):

\(\bullet\)Les \([a,+\infty]\)

\(\bullet\)Les \(]a,+\infty]\)

\(\bullet\)Les \([-\infty,a[\)

\(\bullet\)Les \([-\infty,a]\)

Les ensembles suivants engendrent les boréliens de \(\mathbb{R}^n\):

\(\bullet\)Les ouverts

\(\bullet\)Les pavés ouverts

\(\bullet\)Les boules ouvertes

\(\bullet\)Les bandes ouvertes: \(\{\mathbb{R}^{i-1} \times ]a,b[ \times \mathbb{R}^{n-i}\}\)

\(\bullet\)Les pavés compacts

\(\bullet\)Les bandes fermées: \(\{\mathbb{R}^{i-1} \times [a,b] \times \mathbb{R}^{n-i}\}\)

\(\bullet\)Les bandes comme suit: \(\{\mathbb{R}^{i-1} \times ]a,b] \times \mathbb{R}^{n-i}\}\)

\(\bullet\)Ou les ensembles de la forme suivante: \(\{\mathbb{R}^{i-1} \times ]a,+\infty[ \times \mathbb{R}^{n-i}\}\)
On munit \(\overline{\mathbb{R}}\) d’une distance comme suit: \[d(x,y)=|arctan x -arctan y|\] avec \(arctan(\infty)=\pi/2\) et \(arctan(-\infty)=-\pi/2\). Les boréliens pour cette distance sont engendrés par les \(\lbrace]a,+\infty],a\in \mathbb{R}]\). Toute suite monotone dans \(\overline{\mathbb{R}}\) admet une limite, et toute suite dans \(\overline{\mathbb{R}}\) admet une valeur d’adhérence.

Mesures

(Mesure).
Étant donné \((X,{\cal A})\) mesurable, on appelle mesure une application \(\mu:{\cal A}\rightarrow [0,+\infty]\) telle que:

\(\bullet\)\(\mu(\emptyset)=0\)

\(\bullet\)Si les \(A_i\) sont disjoints, en quantité au plus dénombrable, alors \(\mu(\cup A_i)=\sum \mu(A_i)\) (\(\sigma\) additivité)

\((X,{\cal A},\mu)\) est appelé espace mesuré.

Étant donné \((X,{\cal A})\) mesurable, on appelle mesure complexe une application \(\mu:{\cal A}\rightarrow \mathbb{C}\) telle que:

\(\bullet\)\(\mu(\emptyset)=0\)

\(\bullet\)Si les \(A_i\) sont disjoints, en quantité au plus dénombrable, alors \(\mu(\cup A_i)=\sum \mu(A_i)\) (\(\sigma\) additivité) quel que soit l’ordre de la sommation - c’est-à-dire que la somme est absolument convergente.

On notera bien qu’une mesure peut prendre \(+\infty\) pour valeur, et pas une mesure complexe. Une mesure complexe n’est pas un cas particulier de mesure, et une mesure n’est pas un cas particulier de mesure complexe. On note aussi que dans le cas des mesures complexes, le deuxième \(\bullet\) de la définition suffit à imposer le premier (pas dans le cas réel, à cause de la possibilité \(+\infty\)).
(Propriété vraie presque partout).
Une propriété \(P\) est dite vraie presque partout si l’ensemble des éléments pour lesquels elle est fausse est inclus dans un ensemble de mesure nulle. Une partie est dite négligeable si elle est incluse dans une partie de mesure nulle, c’est-à-dire si sa fonction caractéristique est nulle presque partout. Un espace mesuré est dit complet si tout ensemble négligeable est mesurable (et donc de mesure \(0\)).
Un ensemble négligeable n’est pas nécessairement mesurable, en tout cas pour les boréliens! C’est même pour cela que l’on définira les Lebesguiens, qui seront « insensibles » aux ensembles négligeables, grâce au théorème ci-dessous. Attention, ne pas confondre la complétude d’un espace mesuré et la complétude de la topologie de cet espace, même lorsqu’il est à la fois topologique et mesuré!

Notons qu’une réunion dénombrable d’ensembles négligeables est négligeable.

(Propriétés).
\(\bullet\)\(\mu\) est finiment additive (outre qu’elle est \(\sigma\)-additive)

\(\bullet\)\(\mu\) est croissante (\(\overline{\mathbb{R}}\) muni de l’ordre usuel, les ensembles mesurables munis de l’inclusion)

\(\bullet\)La mesure d’une union dénombrable est inférieure ou égale à la somme des mesures.

\(\bullet\)Avec \(A\) et \(B\) \({\cal A}\)-mesurables, \(\mu(A \cup B) \leq \mu(A) + \mu(B)\)

\(\bullet\)\(\mu(U_{i \leq n} F_i \leq \sum_{1 \leq i \leq n} \mu(F_i)\), avec \(F_i\) \({\cal A}\)-mesurable.

\(\bullet\)Si \(\mu(X)\) est finie, alors \(\mu(A \cup B)=\mu(A)+\mu(B)-\mu(A\cap B)\)

\(\bullet\ \) Formule d’inclusion exclusion; avec \(F_i \in {\cal A}\), on a \(\mu(\cup_{i \leq n} F_i)=\sum_{i \leq n} \mu(F_i) - \sum_{1 \leq i<j\leq n} \mu(F_i \cap F_j) + \sum_{1\leq i<j<k\leq n} \mu(F_i \cap F_j \cap F_k) ... + (-1)^{n-1}\mu(\cap_{1\leq i\leq n} F_i)\)
\(\bullet\)\((X,{\cal P}(X))\) mesurable

Mesure de dénombrement

\(\mu({\cal A})=card(A)\) si \(A\) fini

\(\mu({\cal A})=+\infty\) sinon

\(\bullet\)\((X,{\cal P}(X))\), soit \(a\in X\), on appelle mesure de Dirac en \(a\) la fonction \(\delta_a\) telle que pour toute partie \(A\) incluse dans \(X\), \(\delta_a(A)=1\) si \(a\in A\) et \(0\) sinon.
Toute espace mesuré \((X,{\cal A},\mu)\) peut être remplacé par un espace mesuré \((X,\overline {\cal A}, \overline \mu)\) complet, avec \({\cal A}\subset \overline {\cal A}\) et \(\overline \mu_{|{\cal A}}=\mu\). On peut même garantir que tout ensemble \(C\) contenant \(A\) et inclus dans \(B\) avec \((A,B) \in {\cal A}^2\) et \(B-A\) négligeable appartient à \(\overline {\cal A}\).
On considère l’ensemble des parties \(C\) décrites dans le théorème ; on vérifie facilement qu’il s’agit bien d’une \(\sigma\)-algèbre . Ensuite on montre que l’on peut définir la mesure de \(C\) comme égale à la mesure de \(A\), et que la définition est bien correcte.
(Lebesguiens).
La tribu obtenue à partir de la tribu des boréliens en appliquant le théorème [lebesg] s’appelle tribu des lebesguiens. Les éléments de cette tribu sont appelés les lebesguiens. On dit qu’un ensemble est Lebesgue-mesurable si c’est un lebesguien.

Nous avons utilisé dans cette définition le fait que la tribu des lebesguiens est bien uniquement définie. Les ensembles négligeables qui ne sont pas mesurables au sens de Borel (ceux qui sont absents de la tribu borélienne) sont tous mesurables au sens de Lebesgue.

(Théorème fondamental).
Il existe une unique mesure sur \(\mathbb{R}\) muni des boréliens classiques telle que \(\mu([a,b])=b-a\) pour \(b>a\). \(\mu\) s’appelle mesure de Lebesgue sur \(\mathbb{R}\).

Il existe une unique mesure sur \(\mathbb{R}^n\) muni des boréliens classiques telle que \(\mu(\Pi_i [a_i,b_i])=\Pi_i (b_i-a_i)\) pour \(b_i>a_i\). \(\mu\) s’appelle mesure de Lebesgue sur \(\mathbb{R}^n\).

On appelle encore mesure de Lebesgue l’extension de cette mesure sur \(\mathbb{R}^n\) muni des lebesguiens. La mesure de Lebesgue vérifie en outre les propriétés suivantes:

\(\bullet\)Sur \(\mathbb{R}\), à une constante de proportionnalité près, c’est la seule mesure sur les boréliens invariante par translations et finie sur les intervalles bornés.

\(\bullet\)Tout ensemble au plus dénombrable est de mesure nulle.

\(\bullet\)Étant donné \(E\) une partie Lebesgue-mesurable (un lebesguien), la mesure de \(E\) est égale à l’\(\inf\) des mesures des parties ouvertes contenant \(E\).

\(\bullet\)Étant donné \(E\) une partie Lebesgue-mesurable, la mesure de \(E\) est égale au \(sup\) des mesures des parties compactes inclues dans \(E\).
Admise.

On note donc que les lebesguiens sont approchés « par au-dessus » par les ouverts et « par en dessous » par les compacts. Cela est loin d’être évident et il convient d’être précis.

Par exemple, \(\mathbb{Q}\) est Lebesguien (alors que, de manière intéressante, la fonction caractéristique de \(\mathbb{Q}\) n’est pas Riemann-intégrable, ce qui fournit un intérêt aux Lebesguiens et à l’intégrale de Lebesgue). \(\mathbb{Q}\) peut être approximé « par au dessus » par des ouverts. Cela semble très étonnant, mais on peut même le voir concrètement en considérant, pour tout \(n\), l’union des \(B(x_i,(1/n)^i)\) pour \((x_i)_{i\in \mathbb{N}}\) une suite parcourant les rationnels. On a bien ainsi recouvert les rationnels par ces boules ouvertes, et l’union de toutes ces boules a une mesure finie qui tend vers \(0\) à mesure que \(n\) tend vers l’infini.

maintenant, pour bien voir les risques, l’exemple de la mesure de Lebesgue sur \([0,1]\), et raisonnons un peu trop vite. Soit \(E\) un Lebesguien, par exemple \(\mathbb{Q}\cap [0,1]\). On le recouvre par un ouvert de mesure \(0<\epsilon<1\). Cet ouvert de \([0,1]\) a un nombre dénombrable de composantes connexes, comme tout ouvert de \(\mathbb{R}\) (ou de \(\mathbb{R}^n\) d’ailleurs). Prenons son complémentaire, de mesure donc \(1-\epsilon\), et disons (trop vite!) qu’il a aussi une quantité dénombrable de composantes connexes. Prenons son intérieur; on a l’impression de ne pas changer la mesure, puisque l’on enlève simplement un nombre dénombrable de points, donc un ensemble de mesure nulle, et d’avoir ainsi construit un ouvert, de mesure \(1-\epsilon\), inclu dans les irrationnels de \([0,1]\). On sent bien une contradiction, liée au fait que les irrationnels ne contiennent pas d’ouvert puisque les rationnels sont denses dans \([0,1]\)! Le problème provient du fait, un peu étonnant au premier abord, que le complémentaire d’un sous-ensemble de \([0,1]\) qui a un nombre dénombrable de composantes connexes peut avoir une quantité non-dénombrable de composantes connexes. Cela est en particulier le cas des rationnels, qui sont en quantité dénombrable, alors que les irrationels ne sont pas dénombrables.

On a vu au passage avec cette discussion que les lebesguiens ne peuvent certainement pas être approximés « par en dessous » par des ouverts, i.e. qu’il ne faut pas exprimer la mesure d’un Lebesguien comme le supremum de la mesure des ouverts qu’il contient.

Réciproquement, le fait qu’un lebesguien est le supremum des mesures des parties compactes qu’il contient est tout à fait étonnant au premier abord. Prenons les irrationnels de \([0,1]\) encore. Quel compact ne contenant que des irrationels est inclus dans \([0,1]\) et mesure au moins \(1-\epsilon\) ? Et bien c’est le complémentaire des boules ci-dessus définies! Ce compact est bien étrange d’aspect, mais il est bien fermé comme complémentaire d’un ouvert, et de mesure plus grande que \(1-\epsilon\) si \(n\) est assez grand. On pourra voir la section [rahan11] pour plus d’informations.

\((X,{\cal A},\mu)\) espace mesuré, \(\forall i \in \mathbb{N}\ A_i \in {\cal A}\).

i) Si \(A_i \subset A_{i+1}\), alors \(\mu( \cup_{i \in \mathbb{N}} A_i)=lim_{i \rightarrow + \infty} \mu(A_i)\)

ii) Si \(A_{i+1} \subset A_i\) et si \(\mu(A_0) < + \infty\) alors \(\mu(\cap A_i)=lim_{i \rightarrow +\infty} \mu(A_i)\)

ne pas oublier la seconde condition pour la deuxième assertion; contre-exemple avec \(A_i=[i,+\infty[\).
i) Notons \(B_0=A_0\), \(B_i=A_i-A_{i-1}\), la suite est facile.

ii) Notons tout d’abord que \(\mu(D-C)=\mu(D)-\mu(C)\) si \(C \subset D\) et \(\mu(D)<+\infty\).

Ensuite notons \(B_i=A_{i-1}-A_i\)

Alors \(\cap A_i = A_0 \setminus \cup B_k\) devient \(\mu(\cap A_i)=\mu(A_0)-\mu(\cup B_k)=\mu(A_0) - \sum [\mu(A_{k-1})-\mu(A_k)]\).
(mesure finie ou \(\sigma\) -finie).
\((X,{\cal A},\mu)\) mesuré, \(\mu\) est finie si \(\mu(X)<+\infty\).

\((X,{\cal A},\mu)\) mesuré, \(\mu\) est \(\sigma\)-finie si \(\exists ((X_k)_{k\in \mathbb{N}} \in {\cal A}^\mathbb{N}) ; \cup_k X_k=X \land \mu(X_k)<\infty\)

Donc \((\mathbb{R},{\cal B}(\mathbb{R}),\mu)\) avec \(\mu\) la mesure de Lebesgue est \(\sigma\)-finie car \(\mathbb{R}=\cup_{k \in \mathbb{N}} ]-k,k[\).

De même, la mesure de comptage sur ensemble dénombrable \(X\), muni de la tribu \(P(X)\), est \(\sigma\)-finie.

Si \(\mu(X)=1\) alors \(\mu\) est appelée une mesure de probabilité.

\(\Pi\)-systèmes, d-systèmes, et théorème de Carathéodory

Nous allons définir ici des classes plus simples que les \(\sigma\)-algèbres, nommément les \(\Pi\)-systèmes et les algèbres, et montrer (i) que deux mesures coïncidant sur un \(\Pi\)-système coïncide sur la \(\sigma\)-algèbre qu’il engendre (ii) qu’une fonction \(\sigma\)-additive sur une algèbre s’étend en une mesure sur la \(\sigma\)-algèbre engendrée. Cela nous fournira ainsi des outils pour définir des mesures, ou pour montrer l’identité de deux mesures.

(\(\Pi\)-systèmes).
Un \(\Pi\)-système sur \(X\) est un sous-ensemble de \(P(X)\) stable par intersections finies.
(d-système, alias classe monotone).
\(D\) est un d-système (on dit aussi une classe monotone si

\(\bullet\)\(S \in D\)

\(\bullet\)\(D\) est stable par soustraction (\(A\in D\), \(B\in D\), alors \(A \cap B^c \in D\)).

\(\bullet\)\(D\) est stable par réunion dénombrable croissante
Une intersection de d-systèmes est un d-système.
(d-système engendré).
On appelle d-système engendré par un ensemble de parties de \(X\) l’intersection de tous les d-systèmes contenant \(X\).
Un ensemble inclus dans \(P(X)\) est une \(\sigma\)-algèbre si et seulement si c’est un \(\Pi\)-système et un d-système.
(Lemme de Dynkin).
Soit \(I\) un \(\Pi\)-système, alors la \(\sigma\)-algèbre engendrée par \(I\), notée \(\sigma(I)\), est égale au d-système engendré par \(I\).
Pour le prouver il suffit de montrer que \(d(I)\) est un \(\Pi\) système, vu la proposition [sapd]. Pour cela on montre tout d’abord que le sous-ensemble \(D_1\) de \(d(I)\) constitué des éléments de \(d(I)\) dont l’intersection avec tout élément de \(I\) appartient à \(d(I)\), est égal à \(d(I)\). Le raisonnement est le suivant:

\(\bullet\)\(d(I) \subset D_1\) car:

\(I \subset D_1\)

\(D_1\) est un \(\Pi\)-système

\(\bullet\)\(D_1 \subset d(I)\) trivialement

On montre ensuite que le sous-ensemble \(D_2\) de \(d(I)\) constitué des éléments de \(d(I)\) dont l’intersection avec tout élément de \(d(I)\) appartient à \(d(I)\), est égal à \(d(I)\); en effet:

\(\bullet\)\(d(I) \subset D_2\) car

\(I \subset D_2\) car \(D_1=d(I)\)

\(D_2\) est un d-système

\(\bullet\)\(D_2 \subset d(I)\) trivialement

Or \(d(I)=D_2\) est exactement l’énoncé du fait que \(d(I)\) est un \(\Pi\)-système.
\(\bullet\)Soit \(\mu_1\) et \(\mu_2\) deux mesures sur \((X,{\cal A})\) coïncidant sur un \(\Pi\)-système engendrant \({\cal A}\) et telles que \(\mu_1(X)<+\infty\) et \(\mu_2(X)<+\infty\). Alors \(\mu_1\) et \(\mu_2\) sont égales.

\(\bullet\)La même propriété est vraie si \(X\) est de mesure \(\sigma\)-finie pour \(\mu_1\) et \(\mu_2\).

On verra une application avec le théorème [applidyn2] quant aux mesures-produits.
On considère le d-système des \(F\) tels que \(\mu_1(F)=\mu_2(F)\). Il contient un \(\Pi\)-système, donc il ne reste qu’à conclure via le lemme [dyn].
(Théorème de Carathéodory).
Soit \({\cal A}\) la \(\sigma\)-algèbre engendrée par \({\cal B}\) une algèbre, et \(\mu\) \(\sigma\)-additive de \({\cal B}\) dans \([0,+\infty]\). alors il existe une mesure \(\mu'\) sur \({\cal A}\) dont la restriction à \({\cal B}\) est \(\mu\). Si \(\mu(X)<+\infty\), alors cette extension est unique.
L’existence est ici admise. L’unicité résulte simplement de [dyn2].
(Transport).
Soit \(\mu\) une mesure sur un espace mesurable \(X\), et \(f\) une fonction mesurable de \(X\) dans \(Y\) un autre espace mesurable; alors l’application qui à une partie mesurable \(E\) de \(Y\) associe \(\mu(f^{-1}(E))\) est une mesure sur \(Y\). On note \(\mu^f\) cette mesure.
Facile.
(Propriétés de \(\mu_f\):).
\(\bullet\)Si \(Y=\mathbb{R}^n\) muni des boréliens, alors si \(\mu\) est positive on a \[\int_{\mathbb{R}^d} \phi d\mu^f = \int_X \phi \circ f\ d\mu\] \(\bullet\)Si \(Y=\mathbb{R}^n\) et si \(\mu\) est à valeurs quelconques, alors \(\phi\) est \(L^1\) pour \(\mu^f\) si et seulement si \(\phi \circ f\) est \(L^1\) pour \(\mu\), et on a alors l’égalité \[\int_{\mathbb{R}^d} \phi d\mu^f = \int_X \phi \circ f\ d\mu\]

Parties non mesurables

On va ici très brièvement évoquer des théorèmes étonnants sur ce que l’on peut faire avec des parties non mesurables. Notons bien que l’existence de parties non-mesurables s’obtient par l’axiome du choix, et que l’on peut préférer ne pas se munir de l’axiome du choix, et ajouter l’axiome de Solovay selon lequel toutes les parties de \(\mathbb{R}\) sont mesurables, ce qui évidemment rend caduques les résultats qui suivent.

(Banach et Tarski).
\(\bullet\)Il existe un ensemble \(F\) inclus dans la sphère unité \(S^2\) de \(\mathbb{R}^3\) tel que pour tout \(k\geq 3\) (éventuellement \(k=\infty\)), \(S^2\) est la réunion disjointe de \(k\) images de \(F\) par des rotations. Façon amusante de constater qu’on ne peut pas mesurer n’importe quoi... Ce théorème montre surtout qu’il n’existe pas sur \(\mathbb{R}^3\) de mesure invariante par isométrie pour laquelle toutes les parties soient mesurables. La démonstration nécessite l’axiome du choix. \(\bullet\)On peut même aller plus loin et étant donné \(A\) et \(B\) d’intérieurs non vides de \(\mathbb{R}^3\), on peut décomposer \(A\) en une réunion finie de parties \(A_i\), et \(B\) en une réunion de parties \(B_i\), chaque \(B_i\) étant l’image de \(A_i\) par une isométrie affine.

Exercices sur les \(\sigma\)-algèbres et les mesures

Soit \({\cal A}\subset P(E)\). Supposons \(E \in {\cal A}\) et \({\cal A}\) stable par soustraction. Montrer que \({\cal A}\) est une algèbre.
Il suffit de vérifier que \(E\) et \(\emptyset\) sont dans \({\cal A}\), que l’on a bien stabilité par passage au complémentaire, et stabilité par union de deux éléments car \(E-(E-A-B)=A\cup B\).
Soit \({\cal A}\subset P(E)\). Supposons \(E \in {\cal A}\), \({\cal A}\) stable par passage au complémentaire, et stable par union disjointe. Montrer que \({\cal A}\) n’est pas nécessairement une \(\sigma\)-algèbre .
Considérer l’ensemble des parties de cardinal pair de \(\{a,b,c,d\}\).
Montrer que la réunion d’une suite croissante de \(\sigma\)-algèbres n’est pas nécessairement une \(\sigma\)-algèbre .
Le premier point est laissé au lecteur. Considérer les \(\sigma\)-algèbres sur \(\mathbb{N}\) engendrées respectivement par \(\{\{1\}\}\), \(\{ \{1\}, \{2\} \}\), \(\{ \{1\}, \{2\}, \{3\} \}\); la réunion n’est pas une \(\sigma\)-algèbre car par exemple l’ensemble des entiers pairs n’en fait pas partie.

Fonctions mesurables

(Fonction mesurable).
Étant donné \((X,{\cal A})\) et \((Y,{\cal B})\) des espaces mesurables, \(f:X\rightarrow Y\) est dite mesurable si \(\forall B \in {\cal B},\ f^{-1}(B) \in {\cal A}\). On définit parfois aussi la notion de fonction mesurable d’un espace mesurable vers un espace topologique; la condition est alors le fait que l’image réciproque d’un ouvert soit une partie mesurable.

Si \(Y\) est topologique et qu’on n’a rien précisé, la tribu \({\cal B}\) est celle des boréliens.

La fonction caractéristique d’un ensemble est mesurable si et seulement si l’ensemble est mesurable.

On trouve parfois une autre définition: lorsque les boréliens et les lebesguiens sont définis, une fonction est parfois dite mesurable lorsque la préimage (l’image inverse) de tout borélien est un lebesguien. Nous n’utiliserons pas cette définition, qui induit beaucoup d’erreurs; avec cette définition alternative, la composée de deux fonctions mesurables n’est pas nécessairement mesurable.

Avec les conditions de la définition, si \({\cal B}\) est la \(\sigma\)-algèbre engendrée par \({\cal M}\), alors \(f\) est mesurable si et seulement \(\forall {\cal B}\in {\cal M}, \ f^{-1}(B) \in {\cal A}\).
Le sens \(\rightarrow\) est trivial. Pour le sens \(\leftarrow\), considérons l’ensemble des \(B \in {\cal B}\) tels que \(f^{-1}(B) \in {\cal A}\). C’est une \(\sigma\)-algèbre de \(Y\), d’où le résultat.
\(\bullet\)Soit \(f:(X,{\cal A}) \rightarrow Y\) avec \(Y\) topologique. \(f\) est mesurable si et seulement si \(\forall U \mbox{ ouvert }, f^{-1}(U) \in {\cal A}\)
\(\bullet\)Soit \(f_k:(X,{\cal A}) \rightarrow \overline{\mathbb{R}} \mbox{ ou } [0,+\infty]\) mesurable alors la fonction \(f\) qui à \(x\) associe \(sup_k f_k(x)\) est mesurable.
Le premier point est clair.

Pour le second on considère \(f^{-1}(]a,+\infty])= \{ x ; sup \{f_k(x)\}>a\}\)

\(= \{ x ; \exists k \in \mathbb{N}f_k(x)>a \} = \cup_{k\in \mathbb{N}} \{x ; f_k(x)>a\}\)

\(= \cup f_k^{-1}(]a,+\infty[)\) qui appartient à \({\cal A}\) car \(f_k\) est mesurable et \({\cal A}\) est une \(\sigma\)-algèbre .
La composée de deux fonctions mesurables est mesurable.

(voir la discussion au début de la section [rahan5] pour voir les définitions non-standards pour lesquelles cette propriété n’est plus vraie)

Si \(f\) est mesurable de \(X\) dans \(\mathbb{C}\) ou \(\mathbb{R}\), alors \(Re(f)\), \(Im(f)\), \(|f|\) sont mesurables.
Soient \(Y\) et \(Z\) deux espaces topologiques à base dénombrable d’ouvert. Soient \(f\) mesurable de \(X\) dans \(Y\) et \(g\) mesurable de \(X\) dans \(Z\). Alors \((f,g) : X \rightarrow Y \times Z\) est mesurable pour la topologie produit.
\(\bullet\)\(f\) et \(g\) mesurables de \((X,{\cal A})\) dans \(\mathbb{R}\) ou \(\mathbb{C}\), alors \(f+g\), \(f-g\), \(fg\), \(f/g\) (\(g\) ne s’annulant pas), sont mesurables.

\(\bullet\)\(f\) de \((X,{\cal A})\) dans \(\mathbb{C}\) est mesurable si et seulement si sa partie réelle et sa partie imaginaire sont mesurables.

\(\bullet\)\(f\) de \((X,{\cal A})\) dans \(\mathbb{C}\) est mesurable si et seulement si la fonction \(|f|\) et la fonction \(x \mapsto arg(f(x))\) sont mesurables

\(\bullet\)\(f\) de \((X,{\cal A})\) dans \(\mathbb{R}\) ou \(\overline{\mathbb{R}}\) est mesurable si et seulement si \(f^+\) et \(f^-\) sont mesurables.

Suites de fonctions mesurables

Soit \((X,{\cal A})\) un espace mesuré, \(f_k\) mesurable de \(X\) dans \(Y\) métrique, telle que pour tout \(x\) \(f_k(x) \rightarrow f(x)\). Alors \(f\) est mesurable.
Soit \(U\) un ouvert de \(Y\), et \(U_n\) l’ensemble des \(u\) tels que \(d(u,Y \setminus U)> 1/n\), et soit \(F_n\) l’ensemble des \(u\) tels que \(d(u,Y \setminus U) \geq 1/n\).

On montre facilement que \(U_n\) est ouvert et que \(F_n\) est fermé.

L’union des \(U_n\) est \(U\) car \(U\) est ouvert.

L’union des \(F_n\) est donc \(U\) aussi. (voir figure [limmes]) \[\begin{aligned} & & f^{-1}(U)\\ &=&\cup_n f^{-1}(U_n)\\ &=&\cup_n \{u ; lim_{k \rightarrow +\infty} f_k(u) \in U_n\}\\ &\subset&\cup_n \{u ; \exists K , k \geq K \rightarrow f_k(u) \in U_n \}\end{aligned}\] car \(U_n\) est un ouvert.

\(\subset V=\cup_n \cup_K \cap_{k\geq K} f_k^{-1}(U_n) \in {\cal A}\).

Notons maintenant que \(V\) est inclus dans \(\cup_n \cup_K \cap_{k \geq K} f_k^{-1}(F_n)\).

SI \(u \in \cup_K \cap_{k \geq K} f_k^{-1}(F_n)\) alors \(\exists K / \forall k \geq K, f_k(u) \in F_n\), donc \(f(u) \in F_n\) car \(F_n\) est fermé
donc \(V \subset \cup_n f^{-1}(F_n) = f^{-1}(\cup F_n)= f^{-1}(F_n)=f^{-1}(U)\) donc \(f^{-1}(U) = V \in {\cal A}\), donc \(f\) est mesurable.
Image

Illustration de la preuve de la mesurabilité de la limite simple d’une suite de fonctions mesurables.

\(f_k\) suite de fonctions mesurables de \((X,{\cal A})\) dans \([0,+\infty]\) ou \(\overline{\mathbb{R}}\), alors \(lim_{n \rightarrow +\infty} sup_{k\geq n} f_k\) et \(lim_{n \rightarrow +\infty} \inf_{k\geq n} f_k\) existent et sont mesurables.
Rappelons simplement qu’une suite monotone a nécessairement une limite dans \(\overline{\mathbb{R}}\).
Si pour tout \(n\in \mathbb{N}\) \(f_n\) est mesurable de \(X\) dans \(\overline{\mathbb{R}}\), alors \(sup_{n \in \mathbb{N}} f_n\) est mesurable.
Même remarque.

Intégration - théorème de convergence dominée de Lebesgue

On va voir ici un grand intérêt de l’intégrale de Lebesgue: beaucoup de choses dont on a envie qu’elles soient vraies sont vraies. Aussi, on peut intégrer beaucoup de choses: autant des fonctions caractéristiques non-Riemann intégrales existent de toute évidence (la fonction caractéristique de \(\mathbb{Q}\)!), autant l’existence d’ensembles non lebesguiens est dépendante de l’axiome du choix, conduit à des théorèmes étranges comme les théorèmes de Banach et Tarski, et peut être supprimée en ajoutant l’axiome de Solovay en lieu et place de l’axiome du choix. On se donne \((X,{\cal A},\mu)\) un espace mesuré.

Fonctions étagées et fonctions simples

On définit l’intégrale de Lebesgue d’abord sur des fonctions simples (sens formel ci-dessous), avant de la prolonger sur des espaces de fonctions beaucoup plus grands.

\(\boxcircle\) Définitions et généralités

(étagée).
Une fonction est dite étagée si elle ne prend qu’un nombre fini de valeurs. Une fonction simple est une application \(s\) de \(X\) dans \([0,\infty[\) mesurable et étagée.

Si \(s\) est simple, \(\alpha_1\),...,\(\alpha_n\) ses valeurs, \(A_i=\{x;s(x)=\alpha_i\}=s^{-1}(\{\alpha_i\})\), alors \(s=\sum_i \alpha_i 1_{|A_i}\).

Notons que les \(A_i\) sont des boréliens, en tant qu’image inverse de borélien, pour peu que la fonction \(s\) soit mesurable.

L’écriture de \(s\) est unique si on a:

\(\bullet\)\(\alpha_i \neq \alpha_j\) si \(i \neq j\)

\(\bullet\)\(A_i \neq \emptyset\)

\(\bullet\)\(A_i \cap A_j= \emptyset\) si \(i \neq j\)

\(\bullet\)\(\cup_i A_i=X\)

Si \(f\) est une fonction mesurable de \(X\) dans \([0,+\infty[\), alors il existe une suite croissante \(s_n\) de fonctions simples qui converge simplement vers \(f\).
Étant donné \(n\in \mathbb{N}\), on considére les segments \(S_i=[\frac{i}{2^n},\frac{i+1}{2^n}[\), pour \(i\) variant de \(0\) à \(n2^n\). Il suffit alors de considérer la somme \(f_n\) des \(\frac{i}{2^n}\chi_{f^{-1}(S_i)}\) pour \(i\) dans \([0,n2^n]\).

Pour la suite de notre propos, on devra utiliser une multiplication dans \([0,+\infty[\), prolongeant la multiplication usuelle, et vérifiant \(0.\infty=0\). Attention, ce produit n’est pas continu.

\(\boxcircle\) Intégration des fonctions simples

(intégrale).
\(s=\sum \alpha_i 1_{|A_i}\) avec la condition d’unicité donnée ci-dessus, alors on appelle intégrale sur \(E \in {\cal A}\) de \(s\) pour la mesure \(\mu\) \[% % \int_E s.d\mu= \sum \alpha_i \mu(A_i \cap E)\]
Supposons \(s\) et \(t\) deux fonctions simples vérifiant les conditions d’unicité. Alors:

\(\bullet\)Si \(s \leq t\), alors \(\int_E s d\mu \leq \int_E t d\mu\)

\(\bullet\)additivité: \(\int_E (s+t)d\mu = \int_E s d\mu + \int_E t d\mu\)

\(\bullet\)\(c < +\infty\) \(\rightarrow\)\(\int c.s d\mu = c \int s d\mu\)

Fonctions positives

On va parler ici d’intégrale, en utilisant la mesurabilité au sens de Lebesgue, mais il ne s’agit pas de l’intégrale au sens de Lebesgue, qui ne sera pas définie que sur les fonctions positives mesurables, mais pas non plus sur toutes les fonctions positives mesurables! En toute rigueur d’ailleurs l’intégrale de Lebesgue n’est pas définie pour une fonction ayant des valeurs \(\infty\) (même si l’abus de langage est courant)!
(intégrale).
\(f:(X,{\cal A}) \rightarrow [0,+\infty]\) mesurable On appelle intégrale de \(f\) sur \(E\) de \(f\) pour \(\mu\) \[% % \int_E f d\mu = sup_{s \leq f} \int_E s.d\mu\]
Si \(f\) est simple, alors cette définition coïncide avec la précédente.

La notation \(\int_E f d\mu\) désigne \(\int f.\chi_E.d\mu\).

(Propriétés, avec \(f\) et \(g\) positives mesurables:).
\(\bullet\)\(\int f+g=\int f + \int g\)

\(\bullet\)\(f \leq g \rightarrow \int f \leq \int g\)

\(\bullet\)\(\int |a|.f=|a| \int f\)
(Théorème de convergence monotone).

Soit \(f_n\) une suite croissante de fonctions mesurables positives.

Alors \(f=sup f_n\) est mesurable et \(\int f = lim\ \int f_n\).

On parle aussi de théorème de Beppo-Levi.

On procède par étapes comme suit: \(\bullet\)Notons d’abord que \(f\) est mesurable d’après la proposition [canard716].

\(\bullet\)On montre que \(\int f_n\) est croisante; notons \(F\) sa limite (éventuellement infinie).

\(\bullet\)\(F \leq \int f\) par passage à la limite.

L’autre inégalité est un peu plus difficile et est illustrée par la figure [conmon].

\(\bullet\)On considère une fonction simple \(\leq f\), notée \(s\), et un réel \(a<1\).

\(\bullet\)On considère \(E_n\) l’ensemble des \(x\) tels que \(a.s(x)\leq f_n(x)\).

\(\bullet\)\(\int_{E_n} a.s \leq \int_{E_n} f_n \leq \int_X f_n \leq F\).

\(\bullet\)La réunion croissante des \(E_n\) est \(X\), et la réunion est dénombrable; donc \(\int_{E_n} s\) \(\rightarrow\)\(\int_X s\).

\(\bullet\)Par passage au \(sup\) (en \(a\) et \(s\) à la fois) on a \(\int f \leq F\).
Image

Les ensembles \(E_n\) sur lesquels \(f_n\) dépasse la fonction simple multipliée par \(a<1\) ont pour réunion \(X\) et sont en quantité dénombrable.

On trouvera de multiples applications à ce théorèmes, citons le lemme de Fatou [fatou], le théorème justifiant la définition des mesures images [mesimage], le théorème importantissime de la convergence dominée de Lebesgue [convdom], le théorème de Fubini [fubini]. Cela servira aussi en probabilités, avec la proposition [delphine], la proposition [derien], les résultats sur les variables aléatoires indépendantes [independance]. Par ailleurs, on utilisera ce résultat aussi pour montrer que les espaces \(L^p\) sont des Banach, voir corollaire [lppanar]. On peut aussi voir le théorème [lpdual] (théorème de représentation de Riesz).
On prendra garde à ne pas utiliser des arguments plus lourds (notamment la convergence dominée de Lebesgue) quand un résultat plus simple comme celui-ci suffit.
Considérons pour tout \(n\in\mathbb{N}\) une fonction \(f_n\) mesurable positive, \(\int \sum f_n = \sum \int f_n\).
(Lemme de Fatou).
Avec \(f_n\) de \(X\) vers \([0,+\infty]\) mesurable, on a \(\int liminf\ f_n \leq liminf \int f_n\).
Il suffit de définir \(g_k=\inf_{n\geq k} f_n\); \(g_k\) est croissante; donc par le théorème de convergence monotone \(\int liminf\ f_n = lim \int g_n=liminf \int g_n \leq liminf \ \int f_n\).
Pour toute fonction \(f\) mesurable de \(X\) dans \([0,+\infty]\), la fonction \(\nu\) qui à un borélien \(E\) associe \(\int_E f(x).d\mu\) est une mesure sur \(X\). En outre pour toute fonction \(g\) mesurable de \(X\) dans \([0,+\infty]\), \(\int g.d\nu=\int f.g.d\mu\).
Il est facile de voir que \(\nu\) est une mesure avec les outils que l’on s’est donnés plus haut. La suite est un peu plus laborieuse, mais se résout en utilisant le théorème de convergence monotone.

Le cas général

(Fonction intégrable).
Une fonction \(f\) de \(X\) dans \(\mathbb{C}\) est dite intégrable si elle est mesurable et si \(\int |f|\) est finie. On note \({\cal L}^1(X,\mathbb{C})\) l’ensemble des fonctions intégrables de \(X\) dans \(\mathbb{C}\), et \({\cal L}^1(X,\mathbb{R})\) l’ensemble des fonctions intégrables de \(X\) dans \(\mathbb{R}\). \({\cal L}^1(X)\) tout court désigne généralement \({\cal L}^1(X,\mathbb{R})\) (voir selon le contexte).

\({\cal L}^1(X)\) est un \(\mathbb{C}\)-espace vectoriel (on le munit de l’addition et de la multiplication par un scalaire). L’application qui à une fonction associe son intégrale est une forme linéaire sur cet espace vectoriel.

\({\cal L}^1(X)\) est un \(\mathbb{R}\)-espace vectoriel (on le munit de l’addition et de la multiplication par un scalaire). L’application qui à une fonction associe son intégrale est une forme linéaire sur cet espace vectoriel.

Notez que l’intégrabilité dépend de la mesure, alors que la mesurabilité ne dépend que de l’espace mesurable.

(Intégrale (au sens de Lebesgue) d’une fonction intégrable).
Étant donné \(f\) une fonction intégrable de \(X\) dans \(\mathbb{R}\), on appelle intégrale de \(f\) et on note \(\int f\) le réel \(\int f^+ - \int f^-\). Étant donné \(f=g+i.h\) une fonction intégrable de \(X\) dans \(\mathbb{C}\), on appelle intégrale de \(f\) et on note \(\int f\) le complexe \(\int g+i.\int h\).
On notera bien que cette définition ne permet de définir d’intégrale que lorsque \(\int |f|\) est finie. Ainsi l’intégrale d’une fonction mesurable à valeurs dans \([0,+\infty]\) est toujours définie mais la fonction n’est pas nécessairement intégrable (l’intégrale pouvant être infinie). Et dans le cas d’une fonction Riemann-intégrable on doit résister à la tentation d’utiliser une Lebesgue-intégrale d’une fonction non Lebesgue-intégrable, puisque l’intégrale de Lebesgue n’est définie que dans le cadre de fonctions intégrables (au sens de Lebesgue). Voir la discussion après la définition [d728].

On notera aussi que l’intégrale de Riemann n’est pas sans certains avantages: elle permet de mieux traiter certaines intégrales généralisées (les intégrales valant \(+\infty\) ou \(-\infty\)) et aussi d’intégrer dans des espaces de Banach, puisqu’elle ne requiert pas de mesure.

Ainsi, \(x\mapsto\frac{\sin x}{x}\) n’est pas Lebesgue-intégrable sur \(]0,+\infty[\), mais son intégrale généralisée \(\int_0^{+\infty}\frac{\sin x}{x}\,dx\) converge (au sens de Riemann), comme on peut le prouver par une intégration par parties (théorème [ipp]).

(Propriétés).
\(\bullet\)Si \(f\) est intégrable alors \(|f|\) est intégrable et \(| \int f | \leq \int |f|\).

\(\bullet\)Une fonction inférieure en module à une fonction \(g\) intégrable, est intégrable.

\(\bullet\)Si deux fonctions \(f\) et \(g\) sont intégrables et à valeurs dans \(\mathbb{R}\) et si \(f \leq g\) alors \(\int f \leq \int g\).
(Intégrale sur une partie mesurable).
Soit \(E\) une partie mesurable de \(X\), et \(f\) de \(X\) dans \(\mathbb{R}\) ou \(\mathbb{C}\), alors \(f\) est dite intégrable sur \(E\) si \(f.\chi_E\) est intégrable, avec \(\chi_E\) la fonction caractéristique de \(E\). On définit alors \(\int_E f=\int f.\chi_E\).

On peut vérifier que \(\int_E f=\int f_{|E}\).

Exemple important d’intégrale: Considérons \(\mathbb{N}\) muni de la mesure du dénombrement \(\mu(E)=|E|\). Si \((u_n)\) est une suite réelle ou complexe, dire que \((u_n)\) est sommable équivaut à dire que la fonction \(n\mapsto u_n\) est une fonction intégrable sur \((\mathbb{N},\mu)\), et alors les nombres \(\sum_{n=0}^\infty u_n=\lim_{N\to+\infty}\sum_{n=0}^N u_n\) et \(\int_\mathbb{N}u_n\,d\mu(n)\) définissent la même quantité, i.e. sont égaux. On voit donc ici une application immédiate de la convergence dominée de Lebesgue.

L’ensemble des parties de \(\mathbb{N}\) est une \(\sigma\)-algèbre sur \(\mathbb{N}\). On peut munir l’espace mesurable ainsi défini d’une mesure \(\mu\) telle que \(\mu(A)=card(A)\) si \(A\) est fini et \(\mu(A)=+\infty\) sinon.

On se donne alors une fonction \(f\) de \(\mathbb{N}\) dans \([0,+\infty[\), c’est-à-dire une suite de réels positifs.

Cette fonction est évidemment mesurable.

peut alors considérer les fonctions \(f.\chi_{[[0,n]]}\); la suite de ces fonctions converge vers \(f\), donc par le théorème de convergence monotone, l’intégrale de \(f\) sur \(\mathbb{N}\) est la limite pour \(\mathbb{N}\) tendant vers \(+\infty\) de l’intégrale de \(f.\chi_{[[0,n]]}\). \(f.\chi_{[[0,n]]}\) étant une fonction étagée, son intégrale est facile à calculer; il s’agit de la somme des \(f(i)\) pour \(i\in [0,n]\).

On peut retrouver ainsi divers résultats classiques du calcul de séries, par exemple le changement d’ordre des termes dans une série absolument convergente. On peut aussi considérer le cas des séries complexes.

Par contre, on ne peut rien faire au niveau des séries non-absolument convergentes.

\(\bullet\)Une fonction mesurable de \(X\) dans \([0,+\infty]\) est d’intégrale nulle si et seulement si elle est nulle presque partout.

\(\bullet\)Si une fonction mesurable de \(X\) dans \([0,+\infty]\) est d’intégrale finie alors elle est finie presque partout.

\(\bullet\)\(f\) mesurable de \(X\) dans \(\mathbb{C}\); alors \(|\int f| \leq \int |f|\), et si \(|\int f|=\int |f|\), alors il existe \(a\) tel que \(f=a.|f|\) presque partout.

\(\bullet\)Le premier point est facile, il suffit de considérer les ensembles sur lesquels \(f\) est supérieure à \(1/n\), et leur réunion dénombrable.

\(\bullet\)Considérer l’ensemble des \(x\) tels que \(f(x)=+\infty\) et sa mesure.

\(\bullet\)Considérer l’argument de l’intégrale de \(f\), et la fonction \(a.f\) avec \(a\) un complexe de module \(1\) tel que \(\int a.f \in \mathbb{R}^+\). La suite est facile.

On peut considérer différentes structures à l’intérieur de l’espace vectoriel \({\cal F}\) des fonctions de \(X\) dans \(\mathbb{R}\):

\(\bullet\)Le sous-espace vectoriel des fonctions mesurables.

\(\bullet\)Le sous-espace vectoriel des fonctions intégrables.

\(\bullet\)Le sous-espace vectoriel des fonctions nulles presque partout.

La dernière propriété permet notamment de définir un espace quotient de l’espace des fonctions, par la relation d’équivalence \({\cal R}\) définie par \(f {\cal R}g \iff f(x)=g(x) \mbox{ presque partout }\). On considère alors l’espace constitué par les classes contenant au moins une fonction intégrable. La forme linéaire qui à \(f\) associe son intégrale induit une forme linéaire sur cet espace quotient (notez que deux fonctions intégrables appartenant à la même classe ont même intégrale). On peut normer cet espace par la norme suivante: \[\parallel f \parallel_1 = \int |f|\] La forme linéaire qui à \(f\) associe son intégrale est continue pour cette norme, et de norme \(\leq 1\), c’est-à-dire que \(|\int f| \leq \parallel f \parallel_1 = \int |f|\). Dans la plupart des cas, c’est-à-dire dès qu’il existe une partie de mesure finie non nulle, cette norme est \(1\) (la fonction caractéristique d’une telle partie vérifie le cas d’égalité de l’inégalité ci-dessus).

(\(L^1\)).
On note \(L^1\) le sous-espace des classes contenant au moins une fonction intégrable ainsi normé (ne pas confondre avec \({\cal L}^1\)). Cette notation dépend du contexte; formellement il faudrait préciser par \(L^1(X,Y)\) le domaine \(X\) et le codomaine \(Y\) (ce dernier étant généralement \(\mathbb{C}\) ou \(\mathbb{R}\)).

Théoriquement il n’est pas possible d’écrire \(\parallel f \parallel_1\) pour une fonction de \(X\) dans \([0,+\infty]\), \(+\infty\) inclus; néanmoins on verra souvent cette notation pour \(\int |f|\). On se permettra ainsi de parler de la classe d’une fonction dont l’intégrale est finie, même s’il s’agit par exemple d’une fonction à valeurs dans \([0,+\infty]\).

On assimilera souvent une fonction et sa classe, l’intégrale d’une fonction et l’intégrale d’une fonction intégrable de sa classe, etc.

Fonctions vectorielles

Une fonction vectorielle est une fonction de \(X\) dans \(\mathbb{R}^n\).

(rectangle mesurable).
Une fonction vectorielle est dite intégrable si toutes ses composantes sont intégrables. Son intégrale est alors le vecteur dont chaque coordonnée est l’intégrale de la coordonnée correspondante de \(f\).
Une fonction vectorielle est intégrable si et seulement si elle est mesurable et sa norme est intégrable (indépendamment du choix de cette norme).
On majore chaque composante par la norme multipliée par une certaine constante, et réciproquement; le résultat est ensuite facile.

Théorème de la convergence dominée de Lebesgue. Corollaires

(Théorème de la convergence dominée de Lebesgue).
Soit \(f_n\) de \(X\) dans \(\mathbb{C}\) pour tout \(n \in \mathbb{N}\).

Hypothèses:

\(\bullet\)\(f_n\) mesurable.

\(\bullet\)Pour presque tout \(x\), \(f_n(x)\) converge.

\(\bullet\)Il existe une fonction \(g\) intégrable de \(X\) dans \([0,+\infty]\) majorant toutes les fonctions \(|f_n|\).

Alors:

\(\bullet\)une certaine fonction \(f\) est limite simple des \(f_n\); cette fonction est intégrable.

\(\bullet\)\(\int | f-f_n |\) \(\rightarrow\)\(0\) (convergence \(L^1\) de \(f_n\) vers \(f\)).

\(\bullet\)\(\int f_n \rightarrow \int f\) pour \(n\) \(\rightarrow\)\(+\infty\)
On passe par les étapes suivantes: \(\bullet\)Tout d’abord le cas d’une suite de fonctions monotone tendant vers la fonction nulle (démonstration en utilisant le théorème de convergence monotone).

\(\bullet\)Ensuite suite de fonctions tendant vers la fonction nulle (on se ramène au cas précédent en considérant \(g_n(x)=sup_{k \geq n} f_k(x)\).

\(\bullet\)Ensuite le cas général se traite en considérant \(f-f_n\), majorée par \(2.g\).

\(\bullet\)L’assertion \(\int f_n \rightarrow \int f\) pour \(n\) \(\rightarrow\)\(+\infty\) découle simplement du fait que \(| \int a - \int b | \leq \int |a-b|\).
On utilisera ce résultat très souvent, citons par exemple le corollaire ci-dessous, le théorème [consom] de continuité sous le signe intégral, le théorème [corint] de dérivation sous le signe intégral, le lemme de Scheffé [schef], le résultat de densité [fm], le contre-exemple du paragraphe [nonmetrique], le théorème de Doob [doob], la caractérisation des fonctions de répartition [p1176].

On peut noter une forme de réciproque: si \(u_n\to u\) dans \(L^p\), alors une sous-suite de \(k\mapsto u_{n_k}\) tend vers \(u\) presque partout et il existe une fonction \(g\) dans \(L^p\) telle que \(|u_{n_k}|\leq |g|\) presque partout.

Soit une suite de fonctions \(f_n\) intégrables de \(X\) dans \(\mathbb{C}\), telle que \(\sum \parallel f \parallel_1\) converge.

\(\bullet\)Alors pour presque tout \(x\) on a \(\sum_n f_n(x)\) convergente de somme \(f(x)\).

\(\bullet\)En outre \(f\) est intégrable et \(\int f = \sum_n \int f_n\).

\(\bullet\)La suite \(\sum_{i=0}^n f_i\) converge vers \(f\) dans \(L^1\).
On considère \(g(x)=\sum_n |f_n(x)|\). Par le théorème de convergence monotone, \(\int g = \sum \int |f_n|\). On peut donc définir \(h(x)\) comme limite des fonctions \(h_n(x)=\sum_{i=0}^n f_i(x)\). On a \(|h(x)| \leq g(x)\); par le théorème de convergence dominée, l’intégrale de \(f\) est égale à la limite de l’intégrale des \(h_n\), donc à la limite de la somme des \(\int f_i\) pour \(i\in [0,n]\) et la dernière assertion découle de la convergence dans \(L^1\) du théorème de convergence dominée.
Les espaces vectoriels normés \(L^1\) et \(L^1(\mathbb{C})\) sont complets.
Un espace vectoriel normé est complet si et seulement si toute série normalement convergente est convergente; donc d’après le corollaire précédent, \(L^1\) et \(L^1(\mathbb{C})\) sont complets.
Soit \(Y\) un espace métrique et \(f: X \times Y \rightarrow \mathbb{C}\) une application telle que :

\(\bullet\)pour tout \(y\) l’application qui à \(x\) associe \(f(x,y)\) est intégrable

\(\bullet\)pour tout \(x\) appartenant à \(X-N\) avec \(N\) négligeable, l’application qui à \(y\) associe \(f(x,y)\) est continue

\(\bullet\)il existe \(g\) intégrale de \(X\) dans \(\mathbb{R}^+\) telle que pour tous \(x\) et \(y\) \(|f(x,y)|\leq g(x)\).

Alors l’application qui à \(y\) associe \(\int f(x,y).dx\) est continue.
On considère une suite \(y_n\) tendant vers \(y\), la continuité séquentielle impliquant la continuité dans un espace métrique. Il suffit d’appliquer le théorème de convergence dominée à la suite des fonctions de la forme \(x \mapsto f(x,y_n)\).
Soit \(Y\) un intervalle ouvert de \(\mathbb{R}\) et \(f: X \times Y \rightarrow \mathbb{C}\) une application telle que :

\(\bullet\)pour tout \(y\) l’application qui à \(x\) associe \(f(x,y)\) est intégrable;

\(\bullet\)pour \(x \in X-N\), avec \(N\) négligeable, l’application qui à \(y\) associe \(f(x,y)\) est dérivable de dérivée \(f_2'(x,y)\);

\(\bullet\)pour une certain fonction \(g\) positive \(L^1\), pour tout \(y\), \(|f_2'(x,y)| \leq g(x)\).

Alors pour tout \(y\), la fonction \(x \mapsto f_2'(x,y)\) est intégrable et la fonction qui à \(y\) associe \(\int f(x,y).dx\) est dérivable, de dérivée \(\int f_2'(x,y).dx\).
On considère \(y_n\) une suite tendant vers \(y\).

On définit \(k_n(x)=\frac{f(x,y_n)-f(x,y)}{y_n-y}\). Pour tout \(n\), \(k_n\) est intégrable.

D’après l’inégalité des accroissements finis, \(|k_n(x)|\) est majoré par le sup de \(|f_2'(x,.)|\) à son tour majoré par \(g(x)\). On peut donc appliquer le théorème de convergence dominée, et déduire le résultat.
(Lemme de Scheffé).
Supposons que \(f_n\) soit une suite de fonctions \({\cal L}^1\) de \((S,\mu)\) dans \(\mathbb{R}\), et supposons que pour presque tout \(x\) \(f_n(x) \to f(x)\) quand \(n \to +\infty\). Alors \[\int |f_n|.d\mu \to \int |f|.d\mu\] \[\mbox{si et seulement si }\int |f_n-f|.d\mu \to 0\]
La partie « si » est triviale; voyons maintenant la partie « et seulement si ».

On montre d’abord le résultat pour des fonctions positives.

On suppose donc que \(\int f_n(x).d\mu(x) \to \int f(x).d\mu(x)\). Notons \(g_n=f_n-f\), et \(g_n^+\) et \(g_n^-\) les parties positives et négatives de \(g_n\). Alors:

\(\bullet\)\(g_n^+(x)\to 0\) et \(\int g_n^-(x) \to 0\) presque partout.

\(\bullet\)\(g_n^- \leq f\), donc par le théorème de convergence dominée \(\int g_n^-(x).d\mu(x) \to 0\).

\(\bullet\)Par ailleurs \(\int g_n^+(x) = \int f_n(x).d\mu(x) - \int f(x).d\mu(x) - \int g_n^-(x).d\mu(x)\) qui tend donc vers \(0\).

\(\bullet\)On peut donc déduire par les deux points précédents que \(\int g_n.d\mu(x) \to 0\).

\(\bullet\)On a donc prouvé le résultat pour des fonctions positives.

\(\bullet\)On passe au cas général. \(\int |f_n(x)|.d\mu(x) \to \int |f(x)|.d\mu(x)\) signifie que \(\int f_n^+(x).d\mu(x)+\int f_n^-(x).d\mu(x) \to \int f^+(x).d\mu(x)+\int f^-(x).d\mu(x)\).

\(\bullet\)Le lemme de Fatou implique que \(\int liminf\ f_n^+.d\mu \leq liminf\ \int f_n^+ d\mu\) et \(\int liminf\ f_n^-.d\mu \leq liminf\ \int f_n^- d\mu\) et donc pour \(n\) assez grand \(\int f_n^+(x).d\mu(x)+\int f_n^-(x).d\mu(x) \geq \int f^+(x).d\mu(x)+\int f^-(x).d\mu(x)\).

\(\bullet\)Les résultats des deux points précédents permettent de conclure que \[\int f_n^+(x).d\mu(x) \to \int f^+(x).d\mu(x)\] \[\mbox{et }\int f_n^-(x).d\mu(x) \to \int f^-(x).d\mu(x)\] \(\bullet\)Il ne reste plus qu’à appliquer le résultat dans le cas des fonctions positives.

Intégration dans les espaces produits. Changement de variable

On rappelle qu’une tribu ou \(\sigma\)-algèbre sur \(E\) est un sous-ensemble de \(P(E)\), contenant \(E\), stable par passage au complémentaire et par union dénombrable (et du même coup par intersection dénombrable).

On rappelle aussi qu’un clan ou algèbre sur \(E\) est un sous-ensemble de \(P(E)\) stable par passage au complémentaire et par union finie (et du même coup par intersection finie).

On se donne \(X\) et \(Y\) deux espaces mesurables, munis respectivement de la tribu \({\cal X}\) et de la tribu \({\cal Y}\).

Un ensemble \(A\times B\) est dit rectangle mesurable de \(X\times Y\) si \(A \in {\cal X}\) et \(B\in {\cal Y}\).

On appelle tribu produit ou \(\sigma\)-algèbre produit de \({\cal X}\) et \({\cal Y}\) et on note \({\cal X} \otimes {\cal Y}\) la tribu engendré par les rectangles mesurables. Ce sera la \(\sigma\)-algèbre par défaut par la suite; un ensemble mesurable de \(X \times Y\) est en particulier un élément de cette \(\sigma\)-algèbre .

Un sous-ensemble de \(X \times Y\) est dit ensemble élémentaire si il est réunion finie de rectangles mesurables.

Étant donné \(E\) inclus dans \(X \times Y\) et \(x \in X\), on appelle première coupe suivant \(x\) de \(E\) l’ensemble des \(y\) dans \(Y\) tels que \((x,y) \in E\).

Étant donné \(E\) inclus dans \(X \times Y\) et \(y \in Y\), on appelle deuxième coupe suivant \(y\) de \(E\) l’ensemble des \(x\) dans \(X\) tels que \((x,y) \in E\).

Étant donné \(\mu_X\) et \(\mu_Y\) des mesures sur \((X,{\cal X})\) et \((Y,{\cal Y})\) respectivement on appelle mesure produit de \(\mu_X\) et \(\mu_Y\) une mesure sur \((X\times Y, {\cal X}\otimes {\cal Y})\) telle que la mesure d’un rectangle mesurable \(A \times B\) soit \(\mu_X(A) . \mu_Y(B)\).
\(\bullet\)L’ensemble des ensembles élémentaires est un clan.

\(\bullet\)Un ensemble élémentaire peut sécrire comme réunion disjointe d’un nombre fini de rectangles mesurables.

\(\bullet\)La première coupe suivant \(x\) d’un ensemble mesurable de \({\cal X}\otimes {\cal Y}\) est mesurable.

\(\bullet\)La deuxième coupe suivant \(y\) d’un ensemble mesurable de \({\cal X}\otimes {\cal Y}\) est mesurable.

\(\bullet\)Pour \(E\) mesurable de \(X \times Y\), si on se donne deux mesures sur \(X\) et \(Y\) qui soient \(\sigma\)-finies, l’application de \(X\) dans \(\mathbb{R}\) qui à \(x\) associe la mesure de la première coupe suivant \(x\) de \(E\) est mesurable
Les deux premiers sont faciles.

Le troisième est plus délicat:

– Soit \(E\) dans \({\cal X}\otimes {\cal Y}\) et \(x\) dans \(X\).

– Si \(E\) est un rectangle mesurable le résultat est clair.

– Il suffit donc de montrer que l’ensembles des \(F\) dans \({\cal X}\otimes {\cal Y}\) tels que la coupe suivant \(x\) de \(F\) est mesurable est une tribu, ce qui est facile. Le 4ème est équivalent au précédent.

Le cinquième est ici admis.
Étant donnés \((X,{\cal X},\mu_X)\) et \((Y,{\cal Y},\mu_Y)\) deux espaces mesurés de mesures \(\sigma\)-finies, il existe une et une seule mesure produit de \(\mu_X\) et \(\mu_Y\). Cette mesure produit est en outre \(\sigma\)-finie. On la note \(\mu_X \otimes \mu_Y\).
On définit \(\mu(E)=\int_y \mu(E_y)\) avec \(E_y\) la deuxième coupe suivant \(y\) de \(E\).

On montre facilement qu’il s’agit bien d’une mesure, en utilisant le cinquième de la proposition précédente.

Il est clair qu’elle vérifie l’hypothèse sur la mesure des rectangles élémentaires.

Si deux mesures vérifient les propriétés demandées, alors elles coïncident sur le \(\Pi\)-système des rectangles mesurables, en outre les rectangles mesurables engendrent la tribu produit, et cette tribu produit est de mesure \(\sigma\)-finie (facile).

On peut alors appliquer le lemme [dyn2], en l’étendant, ce qui est aisé, au cas des mesures \(\sigma\)-finies.
Soit \(\mu\) la mesure produit ainsi définie; alors \[\mu(E)=\int_y \mu(E_y)=\int_x \mu(E_x)\]
La première égalité est directement issue de la preuve ci-dessus; la seconde est due à l’unicité de la solution et à la symétrie du problème.
Pour qu’un ensemble \(E\) de \((X\times Y)\) soit négligeable pour \({\cal X} \otimes {\cal Y}\), il suffit que presque toutes les coupes premières de \(E\) soient négligeables (pareil avec les coupes secondes).
Un tel ensemble est négligeable si et seulement si sa fonction caractéristique est d’intégrale nulle, c’est-à-dire si sa coupe est d’intégrale nulle presque partout.
La tribu des boréliens sur \(\mathbb{R}^{p+q}\) est la tribu produit des deux tribus de boréliens de \(\mathbb{R}^p\) et de \(\mathbb{R}^q\) (produit au sens des \(\sigma\)-algèbres et pas produit cartésien). La mesure de Lebesgue sur \(\mathbb{R}^{p+q}\) est le produit de la mesure de Lebesgue sur \(\mathbb{R}^p\) et de la mesure de Lebesgue sur \(\mathbb{R}^q\).
\(\bullet\)On procède par double inclusion.

– tout d’abord soit un pavé ouvert de \(\mathbb{R}^{p+q}\); il appartient bien à la tribu produit de \(\mathbb{R}^p\) par \(\mathbb{R}^q\) car c’est un rectangle mesurable. Or un ouvert de \(\mathbb{R}^{p+q}\) est une réunion dénombrable de pavés ouverts (par exemple les pavés ouvert de coordonnées rationnelles inclus dans ce pavé). Donc les ouverts de \(\mathbb{R}^{p+q}\) sont bien des mesurables pour la tribu produit, et donc les boréliens étant engendrés par les ouverts, ils sont eux-mêmes inclus dans la tribu produit.

– Soit un rectangle mesurable de \(\mathbb{R}^p \times \mathbb{R}^q\); il s’écrit \(X \times Y\), et donc \((X \times \mathbb{R}^q) \cap (\mathbb{R}^p \times Y)\), avec \(X\) et \(Y\) mesurables. \(X\) mesurable implique \(X \times \mathbb{R}^q\) mesurable, car \(X\) appartient à la \(\sigma\)-algèbre engendrée par les ouverts, et donc \(X \times \mathbb{R}^q\) appartient à la \(\sigma\)-algèbre engendrée par les ouverts de \(\mathbb{R}^{p+q}\).

\(\bullet\)Il suffit de considérer l’unicité de la mesure sur \(\mathbb{R}^n\) vérifiant le fait que la mesure d’un pavé soit bien le produit des longueurs.
Cette propriété (la première du corollaire ci-dessus) est valable pour les boréliens MAIS pas pour les lebesguiens.

Le théorème qui suit est un théorème fondamental en théorie de l’intégration.

(Fubini).
On suppose \((X,{\cal X},\mu_X)\) et \((Y,{\cal Y},\mu_Y)\) des espaces mesurés de mesures \(\sigma\)-finies. Soit \(f\) mesurable de \((X\times Y,{\cal X}\otimes {\cal Y},\mu_X \otimes \mu_Y)\) dans \(\overline{\mathbb{R}}\).

Alors:

\(\bullet\)pour tout \(x\in X\) l’application \(f_{2,x} : y\mapsto f(x,y)\) est mesurable sur \((Y,{\cal Y})\).

\(\bullet\)pour tout \(y\in Y\) l’application \(f_{1,y} : x\mapsto f(x,y)\) est mesurable sur \((X,{\cal X})\).

\(\bullet\)si \(f\) est positive, alors \(y\mapsto \int_X f_{1,y}(x).dx\) est mesurable positive, et \[\int_Y ( \int_X f_{1,y}(x).dx ).dy = \int_{X \times Y} f.dz\] \(\bullet\)si \(f\) est positive, alors \(x\mapsto \int_Y f_{2,x}(y).dy\) est mesurable positive. et \[\int_X ( \int_Y f_{2,x}(y).dy ).dx = \int_{X \times Y} f.dz\] \(\bullet\)si \(f\) est intégrable, alors pour presque tout \(x\), \(f_{2,x}\) est intégrable, et \(x\mapsto \int_Y f_{2,x}(y).dy\) est définie presque partout et intégrable, et on a \[\int_X ( \int_Y f_{1,x}(y).dy ).dx = \int_{X \times Y} f.dz\] \(\bullet\)si \(f\) est intégrable, alors pour presque tout \(y\), \(f_{1,y}\) est intégrable, et \(y\mapsto \int_X f_{1,y}(x).dx\) est définie presque partout et intégrable, et on a \[\int_Y ( \int_X f_{1,y}(x).dx ).dy = \int_{X \times Y} f.dz\]

On remarque bien sûr qu’un sur deux est équivalent au précédent.

\(\bullet\)(pareil pour le second ) : Soit \(U\) un ouvert; \(f_{2,x}^{-1}(U)\) est égal à la seconde section de \(f^{-1}(U)\) en \(y\), qui est mesurable d’après l’une des propriétés vues ci-dessus.

\(\bullet\)(pareil pour le quatrième ) : on le montre tout d’abord pour une fonction caractéristique d’une partie mesurable de \((X\times Y,{\cal X}\otimes {\cal Y})\), puis pour une fonction simple, par combinaison linéaire,puis pour une fonction mesurable positive, en utilisant le théorème de convergence monotone et le fait que toute fonction mesurable positive est limite de fonctions simples.

\(\bullet\)(pareil pour le sixième ) : Il suffit d’appliquer le cas positif à la partie positive et la partie négative d’une fonction donnée.
Ce théorème sert dans beaucoup beaucoup de situations. Citons: – le lemme [prorunge], utile pour le théorème de Runge.

– de nombreuses choses sur le produit de convolution, voir le théorème [cpmm], dans la partie [produitdeconvolution].

– quelques propriétés de la transformée de Fourier, voir par exemple la proposition [profou].

– le théorème [fm], d’approximation de fonctions \(L^p\) par des fonctions \(C^\infty\) à support compact.

– certaines propriétés de variables aléatoires multidimensionnelles, cf la définition [fubapp].
Si \(f\) de \(X\times Y\) dans \(\overline{\mathbb{R}}\) est intégrable ou mesurable positive, alors \[\int_Y \int_X f(x,y).dx.dy = \int_X \int_Y f(x,y).dy.dx\]
Bien noter qu’il n’est pas suffisant que l’une de ces deux expressions soit bien définie pour que le résultat soit vrai, ni même que les deux expressions soient bien définies!

On donne ci-dessous, sans démonstration (voir [CAR] pour une preuve complète) la formule du changement de variable dans \(\mathbb{R}^n\):

(Changement de variable).
Si \(K\) est un compact inclus dans \(U\) ouvert de \(\mathbb{R}^n\), si \(\phi\) est un \(C^1\)-difféomorphisme de \(U\) sur \(U'\) ouvert de \(\mathbb{R}^n\), si \(f\) est continue, alors \[\int_{\phi(K)} f=\int_K (f\circ \phi) J\phi\] avec \(J\phi\) le jacobien de \(\phi\).
Par exemple, cela servira à montrer la commutativité du produit de convolution.

Mesurabilité et mesurabilité au sens de Lebesgue

On a vu que la tribu des boréliens sur \(\mathbb{R}^n\) pouvait être complétée en une autre tribu telle que toute partie comprise (au sens de l’inclusion) entre deux boréliens de même mesure soit mesurable; cette tribu étant appelée la tribu des lebesguiens. En utilisant cette nouvelle tribu, on a une nouvelle notion de mesurabilité.

(Propriétés relatives de ces deux notions:).
\(\bullet\)Une fonction \(f\) est mesurable au sens de Lebesgue si et seulement si il existe une fonction \(g\) mesurable (au sens des boréliens) égale à \(f\) presque partout

\(\bullet\)Alors que la tribu des boréliens sur \(\mathbb{R}^{n+p}\) est égale au produit (au sens des tribus) de la tribu des boréliens sur \(\mathbb{R}^n\) par celle des boréliens sur \(\mathbb{R}^p\), la même propriété n’est plus vraie pour les lebesguiens.

\(\bullet\)Quel que soit le cadre, on pourra construire des non boréliens. L’existence de non-Lebesguiens, elle, est beaucoup plus discutable (cf section [rahan7]).

Fonctions définies par des intégrales

Les fonctions définies par des intégrales seront capitales pour les applications suivantes:

– Le produit de convolution (voir la partie [produitdeconvolution]) (avec pour conséquence de nombreux résultats de densité).

– L’analyse de Fourier (voir partie [fourier]).

– Les indices de chemins (voir définition [defind]), et donc toute la construction menant au théorème de Cauchy [cocon].

– Le théorème de Brouwer [brouwer], lorsqu’on le prouve en utilisant la formule de Stokes, voir par exemple le livre « Calcul différentiel et géométrie », de D. Leborgne, Presses universitaires de France, 1982.

– La fonction gamma \(x \mapsto \int_0^\infty t^{x-1}e^{-t}dt\) (permettant d’ailleurs le calcul de l’aire de la sphère unité en dimension \(n\)), que l’on trouvera par exemple dans le livre [ZQ].

On peut citer comme autre résultat que ceux qui suivent sur les fonctions de ce type le théorème de Fubini, [fubini].

Continuité, dérivabilité sous le signe \(\int\)

Les résultats ci-dessous sont rappelés ici par souci encyclopédique, afin de regrouper les résultats s’appliquant aux fonctions définies par une intégrale.

Soit \(X\) un espace muni d’une mesure \(\mu\) sur une tribu \({\cal T}\) de \(X\).

Soit \((E,d)\) un espace métrique.

On se donne \(f\) une application de \(E\times X \to \mathbb{C}\), et on définit \(F(t)=\int_X f(t,x) dx\) (intégrale pour la mesure \(\mu\), notée souvent aussi \(\int_X f(t,x) d\mu(x)\)).

Hypothèses Conclusion

width0pt height48pt depth42pt

Pour tout \(t\), l’application \(x\mapsto f(t,x)\) est mesurable

Pour presque tout \(x\), la fonction \(t\mapsto f(t,x)\) est continue en \(T\)

Il existe \(g\) \(L^1\) telle que pour tout \(t\) et presque tout \(x\), \(|f(t,x)|\leq g(x)\)

width0pt height53pt depth48pt

Pour tout \(t\), l’application \(x\mapsto f(t,x)\) est mesurable

Pour presque tout \(x\), la fonction \(t\mapsto f(t,x)\) est continue sur \(E\)

Pour tout compact \(K\) de \(E\), il existe \(g\) \(L^1\) telle que pour tout \(t\) dans \(K\) et presque tout \(x\), \(|f(t,x)|\leq g(x)\).

@ >p(- 2) * >p(- 2) * @ Hypothèses & Conclusion

width0pt height60pt depth56pt

\(E\) est un ouvert de \(\mathbb{R}\) ou de \(\mathbb{C}\)

Pour presque tout \(t\), \(x\mapsto f(t,x)\) est \(L^1\)

Il existe \(N\) négligeable tel que pour tout \(x\not\in N\), la fonction \(t\mapsto f(t,x)\) est dérivable (resp. \(C^1\) ).

Pour tout compact \(K\) de \(E\) il existe une fonction \(g\) \(L^1\) telle que pour tout \(t\) dans \(K\) et tout \(x\not\in N\) \(|\frac{\delta f}{\delta t}(t,x) | \leq g(x)\).

1

&
&
width0pt height75pt depth42pt

est un ouvert de \(\mathbb{R}\) ou un ouvert de \(\mathbb{C}\).

Pour presque tout \(t\), la fonction \(x\mapsto f(t,x)\) est \(L^1\)

Il existe \(N\) négligeable tel que pour tout \(x\not\in N\), la fonction \(t\mapsto f(t,x)\) est \(C^k\).

Pour tout compact \(K\) de \(E\) et tout \(j\in[1,k]\), il existe une fonction \(g\) \(L^1\) telle que pour tout \(t\) dans \(K\) et tout \(x\not\in N\), \(|\frac{\delta^j f}{\delta t^j}(t,x)| \leq g(x)\). &
&

Le théorème [holsom] est un exemple d’application.
Le premier théorème de continuité a été prouvé plus haut; voir théorème [consom].

Le second découle du fait que pour montrer la continuité en un point, il suffit de montrer la continuité séquentielle en ce point; on se donne alors une suite tendant vers ce point, et on considère l’ensemble \(K\) des points de cette suite, plus la limite en question.

\(K\) est séparé parce qu’inclus dans un métrique.

\(K\) est compact, car étant donné un recouvrement ouvert de ce compact, on extrait un ouvert contenant la limite, il y a un nombre fini de points en dehors de cet ouvert, et ainsi on extrait un recouvrement fini.

On peut donc appliquer le théorème précédent à \(K\), et on a le résultat souhaité.

Les théorèmes sur la dérivabilité découlent du corollaire [corint].

Fonctions holomorphes sous le signe \(\int\)

Soit \(\Omega\) un ouvert de \(\mathbb{C}\) et \(f\) de \(\Omega \times X\) dans \(\mathbb{C}\), avec \(X\) un espace muni d’une \(\sigma\)-algèbre \({\cal T}\) et \(\mu\) une mesure sur \((X,{\cal T})\).

On définit la fonction \(F(z)=\int_X f(z,x)dx\).

Hypothèses requises:

\(\bullet\)Pour tout \(z\), la fonction \(x\mapsto f(z,x)\) est \(L^1\).

\(\bullet\)Il existe \(N\) négligeable tel que pour tout \(x\not \in N\), la fonction \(z\mapsto f(z,x)\) appartient à \(H(\Omega)\).

\(\bullet\)Pour tout compact \(K\) de \(\Omega\), il existe \(g\) \(L^1\) sur \(K\) telle que pour tout \(z\) dans \(K\) et pour tout \(x\not\in N\), \(|f(z,x))|\leq g(x)\).

Alors:

\(\bullet\)\(F(z)\) est défini pour tout \(z\) de \(\Omega\)

\(\bullet\)\(F\) est holomorphe

\(\bullet\)\(F'(z)=\int_X \frac{\delta f}{\delta z}(z,x) dx\)

Montrons tout d’abord que:

pour tout compact \(K\) de \(\Omega\), il existe \(h\) \(L^1\) sur \(K\) telle que pour tout \(z\) dans \(K\) et pour tout \(x\not\in N\), \(|\frac{\delta f}{\delta z}(z,x))|\leq h(x)\).

Pour montrer ce résultat:

\(\bullet\)Soit \(K\) un compact de \(\Omega\).

\(\bullet\)Soit \(K_\delta\) l’ensemble des \(z\) dans \(\mathbb{C}\) tels que la distance de \(z\) à \(K\) soit \(\leq \epsilon\) 2.

\(\bullet\)L’application qui à \(z\) associe la distance de \(z\) à \(K\) est continue.

\(\bullet\)\(K_\delta\) est borné, et fermé comme image réciproque d’un fermé par une fonction continue; \(K_\delta\) est donc compact.

\(\bullet\)Pour tout \(z\) dans \(K\) le cercle \(S(z,\delta)\) de centre \(z\) et de rayon \(\delta\) est inclus dans \(K_\delta\).

\(\bullet\)On choisit \(\delta\) suffisamment petit pour que \(K_\delta\) soit inclus dans \(\Omega\) ( c’est possible car sinon on construit une suite dans \(K_{1/n} \cap \mathbb{C}\setminus \Omega\), on se plonge dans le compact \(K_1\), on considère une limite de suite extraite, elle n’est pas dans \(\Omega\) mais elle est dans \(K\), d’où contradiction)

\(\bullet\)D’après le théorème [forcau], pour \(z'\) dans le disque de centre \(z\) et de rayon \(\delta\), \[f(z',x)=\frac1{2i\Pi}\int_0^1 \frac{f(z+\delta e^{2i\Pi u},x)}{\delta e^{2i\Pi u}-z'}du\]

Les hypothèses du théorème de dérivation sous le signe intégral [condersom] étant vérifiées, on en déduit: \[\frac{\delta f}{\delta z}(z,x)=\frac{1}{2i\Pi} \int_0^1 \frac{f(z+\delta e^{2i\Pi u},x)}{(\delta e^{2i\Pi u}-z)^2}du\] \[\mbox{Et donc }\frac{\delta f}{\delta z}(z,x)\leq \frac{sup_{K_\delta} f(.,x)}{\delta^2}\] \[\mbox{Et donc par hypothèse }|\frac{\delta f}{\delta z}(z,x)| \leq \frac1{\delta} g(x)\]

La fonction \(h\) égale à \(\frac1{\delta^2}g\) convient donc pour le résultat que l’on voulait montrer, à savoir:

pour tout compact \(K\) de \(\Omega\), il existe \(h\) \(L^1\) sur \(K\) telle que pour tout \(z\) dans \(K\) et pour tout \(x\not\in N\), \(|\frac{\delta f}{\delta z}(z,x))|\leq h(x)\).

Alors, on peut conclure en appliquant le théorème de dérivation sous le signe intégral [condersom] précédent que :

\(\bullet\)\(F(z)\) est définie pour tout \(z\);

\(\bullet\)\(F\) est holomorphe;

\(\bullet\)\(F'(z)=\int_X \frac{\delta f}{\delta z}(z,x) dx\).

Zoologie de la mesure

On parlera ici un peu plus de mesures complexes, et on utilisera des recouvrements par des boules pour approcher un ouvert quelconque par des boules fermés incluses dans cet ouvert à un ensemble négligeable près (mais bien sûr, cela ne marchera pas pour tout mesurable, comme discuté après le théorème [fondaleb] sur le mesure de Lebesgue).

Approfondissements sur les mesures complexes

(variation totale de \(\mu\)).
Étant donné \(\mu\) une mesure complexe sur \(X\), on appelle variation totale de \(\mu\) ou mesure de la variation totale de \(\mu\) et on note \(|\mu|\) l’application de l’ensemble des parties mesurables de \(X\) dans \([0,+\infty]\) qui à \(E\) mesurable associe \(sup\ \sum_i |\mu(E_i)|\), le \(sup\) étant pris sur l’ensemble des partitions de \(X\) en familles dénombrables \((E_i)_{i\in \mathbb{N}}\).
\(|\mu|\) est une mesure.
\(\bullet\)Il est clair que \(|\mu|(\emptyset)=0\).

\(\bullet\)Soit maintenant \((E_i)_{i\in I}\) avec \(I\) dénombrable une partition de \(E\). On va chercher à montrer que \(|\mu|(E)=\sum_i |\mu|(E_i)\).

– Montrons tout d’abord que \(|\mu|(E)\geq \sum_i |\mu|(E_i)\). Pour cela on se donne \(\epsilon>0\), et on considère, pour tout \(i\) dans \(I\), une partition \(F_{i,j}\) de \(E_i\) avec \(\sum_j |\mu(F_{i,j})| \geq (1-\epsilon).|\mu|(E_i)\) (on peut trouver une telle partition, par définition de \(|\mu|\)). On a alors \(\sum_i (1-\epsilon)|\mu|(E_i) \leq \sum_{i,j} |\mu(F_{i,j})| \leq \sum_i |\mu|(E_i) \leq |\mu|(E)\). En faisant tendre \(\epsilon\) vers \(0\) on obtient l’inégalité attendue.

– Montrons maintenant que \(|\mu|(E)\leq \sum_i |\mu|(E_i)\). Considérons une partition \(F_j\) de \(E\). Si on réussit à montrer que la somme des \(|\mu(F_j)|\) est inférieure ou égale à la somme des \(|\mu|(E_i)\), on aura gagné, car ces deux sommes sont alors égale par symétrie, et valent donc \(|\mu(E)|\), qui est le sup d’un singleton. On considère alors \(G_{i,j}=E_i\cap F_j\). Les \(G_{i,j}\) forment une nouvelle partition de \(E\). Par définition de \(|\mu|\) on sait que \(|\mu|(E_i) \geq \sum_j |\mu(G_{i,j})|\). En sommant sur \(I\) on obtient \[\sum_i |\mu|(E_i) \geq \sum_{i,j} |\mu(G_{i,j})|\geq \sum_j \sum_i |\mu(G_{i,j})|\geq \sum_j |\mu(F_j)|\]

Le résultat est ainsi prouvé.

Notons que pour prouver ce résultat on utilise allègrement les permutations de sommes infinies à termes positifs.

Presque recouvrement d’un ouvert de \(\mathbb{R}^n\) par des petites boules

Soit \((x_i,r_i)_{i\in Boules}\), avec les \(x_i\) dans \(\mathbb{R}^n\), et les \(r_i\) tels que \(0<r_i<\Delta<+\infty\).

Alors il existe \(Boules'\) un sous-ensemble dénombrable de \(Boules\) tel que \[\cup_{i\in Boules} \overline B(x_i,r_i) \subset \cup_{i\in Boules'} \overline B(x_i,5r_i)\] \[\mbox{et }(i,j) \in Boules'^2 \land i\neq j \Rightarrow B(x_i,r_i)\cap B(x_j,r_j)=\emptyset\]

(c’est-à-dire que les boules de \(Boules'\) sont disjointes, et que si on multiplie leurs rayons par \(5\) on recouvre tout ce que l’on recouvrait avec \(Boules\).

Par commodité, on identifiera le couple \((x,r)\) et la boule fermée \(\overline B(x,r)\).

\(\bullet\)On définit \(Boules_k\) pour \(k\geq 1\) l’ensemble des \(i \in Boules\) tels que \(r_i\in [\frac{D}{2^k},\frac{D}{2^{k-1}}]\). C’est-à-dire que l’on regroupe les boules par taille, les plus grosses d’abord.

\(\bullet\)On définit \(BellesBoules_1\) comme un ensemble maximal de boules disjointes dans \(Boules_1\). Cela peut se faire grâce au lemme de Zorn (voir lemme [zorn]).

\(\bullet\)On définit ensuite \(BellesBoules_k\) et \(Genantes_k\) par récurrence.

\(\bullet\)\(Genantes_k\) est le sous-ensemble de \(Boules_k\) des boules qui intersectent la réunion des boules de la réunion des \(BellesBoules_{i}\) pour \(1\leq i<n\).

\(\bullet\)\(BellesBoules_k\) est la réunion de \(BellesBoules_{k-1}\) et d’un ensemble maximal de boules disjointes parmi \(Boules_k\setminus Genantes_k\).

\(\bullet\)Il est clair que \(BellesBoules_k\) est un ensemble de boules de diamètre minoré par une constante \(>0\).

\(\bullet\)On montre maintenant que \(BellesBoules_k\) est un ensemble dénombrable de boules:

– Le nombre de boules de \(BellesBoules_k\) incluses dans \([-i,i]^n\) est fini, puisque le volume d’une boule est minoré par une constante \(>0\) et qu’il y a un volume fini dans \([-i,i]^n\) (rappelons que les boules sont disjointes).

– Donc \(BellesBoules_k\) est dénombrable.

\(\bullet\)On définit maintenant \(BellesBoules\) (tout court, sans indice!) comme la réunion des \(BellesBoules_k\). Il s’agit d’une famille de boules disjointes (facile, on prend deux boules, soit elles appartiennent à un même \(BellesBoules_k\) (auquel cas elles sont disjointes), soit l’une appartient à \(BellesBoules_k\) et l’autre à ).

\(\bullet\)\(BellesBoules\) est une réunion dénombrable d’ensembles dénombrables, et est donc dénombrable.

\(\bullet\)Il reste maintenant à prouver ce que l’on cherchait à prouver, c’est-à-dire que la famille \(BellesBoules\) convient, c’est-à-dire que si l’on multiplie leurs rayons par \(5\), les boules de \(BellesBoules\) remplissent au moins tout l’espace rempli par \(Boules\).

\(\bullet\)Soit \(x\) appartenant à une boule de \(Boules\).

\(\bullet\)Soit \(B\) une boule de \(Boules\) à laquelle appartient \(x\).

\(\bullet\)Soit \(n\) tel que \(B\in Boules_k\).

\(\bullet\)Par définition de \(BellesBoules_k\), la famille \[\{B\} \cup BellesBoules_k \cup BellesBoules_{k-1} \cup BellesBoules_{k-2} ... \cup BellesBoules_1\] n’est pas une famille de boules disjointes.

\(\bullet\)Il existe donc une boule \(B'\) dans un des \(BellesBoules_i\) pour \(i\leq n\) qui intersecte \(B\).

\(\bullet\)En multipliant le rayon de \(B'\) par \(5\), on recouvre donc \(B\)...
Soit \(U\) un ouvert de \(\mathbb{R}^n\), et \(\delta\) un réel \(>0\). Alors il existe une famille dénombrable de boules fermées disjointes de diamètre \(<\delta\), toutes incluses dans \(U\), qui recouvrent \(U\) à part sur un ensemble de mesure de Lebesgue nulle.
\(\bullet\)On considère les intersections de \(U\) avec les couronnes ouvertes de centre \(0\) et comprises entre les sphères de rayon \(n\) et \(n+1\).

\(\bullet\)Il est clair que les intersections en question sont ouvertes, bornées.

\(\bullet\)Il est donc clair que si l’on résout la question dans le cas d’un ouvert borné, par réunion dénombrable, on aura résolu la question.

\(\bullet\)Soit donc un tel \(U\), ouvert borné.

\(\bullet\)On considère l’ensemble des boules fermées de diamètre \(<\delta\) incluses dans \(U\).

\(\bullet\)On considère maintenant la famille \({\cal B}_1\) dénombrable construite suivant la proposition précédente; c’est-à-dire qu’en multipliant le rayon des boules par \(5\) on recouvre tout \(U\).

\(\bullet\)Le volume de \({\cal B}_1\) est au moins \(\frac{1}{5^n}\) fois le volume de \(U\).

\(\bullet\)On réitère sur le complémentaire de \({\cal B}_1\) dans \(U\); on construit ainsi \({\cal B}_2\).

\(\bullet\)On continue sur le complémentaire de \({\cal B}_1 \cup {\cal B}_2 \cup ... \cup {\cal B}_k\) pour construire \({\cal B}_{k+1}\).

\(\bullet\)On considère maintenant \({\cal B}\) la réunions des \({\cal B}_k\); cette famille est dénombrable, et son complémentaire dans \(U\) est de volume inférieur à \((1-1/5^n)^i\) pour tout \(i\), et donc de volume nul, ce qui clôt la démonstration.

  1. 1  Attention ! Dans le cas d’un ouvert de \(\mathbb{C}\), on parle de dérivabilité au sens complexe, et pas de différentiabilité en voyant \(\mathbb{C}\) comme un -espace vectoriel !
  2. 2  Il ne s’agit pas d’un \(\epsilon\) voisinage, on a pris \(\leq\) et non \(<\).

Bibliographie

  • [CAR] H. Cartan, Calcul différentiel, Hermann, 1977.

  • [ZQ] C. Zuily, H. Queffélec, Eléments d’analyse pour l’intégration, Masson, 1995.


Barre utilisateur

[ID: 31] [Date de publication: 14 mars 2021 21:39] [Catégorie(s): Le cours d'agrégation ] [ Nombre commentaires: 0] [nombre d'éditeurs: 1 ] [Editeur(s): Emmanuel Vieillard-Baron ] [nombre d'auteurs: 5 ] [Auteur(s): Christophe Antonini Olivier Teytaud Pierre Borgnat Annie Chateau Edouard Lebeau ]




Commentaires sur le cours

Documents à télécharger

L'article complet