Développement théorie de la mesure

Bonjour,

Je donne des TDs de théorie de la mesure et d'intégration, et j'ai beaucoup de questions concernant la définition de tribus qui semble "sortie du chapeau". Au fil du temps, pour motiver un peu ces définitions, j'ai pris l'habitude de raconter la petite histoire suivante : on veut définir une application qui associe un nombre réel positif aux parties d'un ensemble E. On peut a priori considérer considérer toutes les parties de E, mais dans un cas simple comme celui de R, cela ne permet pas de définir d'application "mesure" raisonnable (à ce moment de l'histoire, je parle très rapidement de l'ensemble de Vittali et du paradoxe de Banach-Tarski). L'ensemble P(R) est ainsi en fait trop gros pour pouvoir y définir des mesures raisonnables. On cherche donc à restreindre l'ensemble de définition de nos futures mesures. Or on veut imposer que nos mesures soient additives et donc notre ensemble de définition doit au moins être stable par réunion. A ce stade de l'histoire, je donne un petit exercice sur les familles sommables dans lequel ils montrent que pour que la somme d'une famille sommable indexée par un ensemble quelconque existe dans R, il faut que le support de sommation soit dénombrable. Le bon compromis (entre réunion finie et quelconque) est donc la stabilité par réunion dénombrable.

En fait je me rends compte que je ne sais pas d'où je tire cette histoire : j'ai l'impression de faire du rafistolage pour rendre natuerl quelque chose qui ne l'est pas nécessairement. J'aimerais donc savoir si le cheminement que je propose est historiquement le bon et si ce sont réellement ces considérations qui ont mené à la définition moderne de tribu.

Bien à vous,
Ram

Réponses

  • gerard0
    Modifié (October 2022)
    Bonjour.
    [édit : Je ne sais pourquoi j'ai imaginé que tu parlais des probas. Désolé ! ]
    La notion de tribu est apparue d'abord dans la théorie de la mesure, liée au développement de l'intégration. Kolmogorov ne fait que la réutiliser. D'ailleurs, son axiomatique n'est que très peu utilisée pendant des années, et ne devient populaire qu'après 1950.
    Donc pour l'origine, il faut plutôt aller chercher du côté de Lebesgue et Borel. La page "tribu" de Wikipédia donne d'ailleurs de bons renseignements.
    Cordialement.
  • rebellin
    Modifié (October 2022)
    Pour motiver la notion de tribu, on pourrait peut-être utiliser l'idée suivante.
    On se donne une suite $(\omega_n)$ de variables aléatoires de loi de Bernoulli de paramètre $p=1/2.$ On écrit ensuite en base 2
    \[\omega=0,\overline{\omega_1\omega_2\omega_3\cdots}\] Autrement dit, $\omega_1$ est le chiffre des dixièmes de $\omega,$ $\omega_2$ celui des centièmes, etc. On s'intéresse ensuite à la moyenne de Cesàro :
    \[M_n=\frac{\omega_1+\omega_2+\cdots +\omega_n}{n}.\] Il est naturel de s'intéresser à $M_n$ et à sa limite, avec des questions du style
    "Quelle est la probabilité qu'il y ait une proportion égale de 0 et de 1 dans le développement dyadique d'un réel ?"
    Or l'événement "$(M_n)$ converge" s'écrit
    \[\cap_{p\in\mathbb{N}^*}\cup_{n\in\mathbb{N}^*}\cap_{r\geq n}\cap_{q\geq r}\left\{\left|M_q-M_r\right|<\frac{1}{p}\right\}.\]
    Et là, on a besoin de toutes les opérations ensemblistes sur les tribus...
  • Je ne sais pas si ta présentation est historique mais en tout cas elle me semble naturelle et je pense que c'est le plus important pour enseigner une nouvelle notion!
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • MrJ
    MrJ
    Modifié (October 2022)
    Por ma part, j’en vois les choses de la manière suivante. 
    1) Lorsque l’on travaille sur un univers fini $\Omega$, un événement est simplement une partie de $\Omega$.
    2) Cette définition reste valable sans problème pour la théorie si $\Omega$ est dénombrable.
    3) Les problèmes apparaissent lorsqu’on a un univers $\Omega$ qui est est indénombrable. Par exemple, il me semble que la mesure de Lebesgue sur $[0,1]$ ne peut pas s’étendre à toutes les parties de $[0,1]$. En fait, j’ai appris récemment, dans une discussion sur le forum, que c’est un peu plus compliqué que ça : on se retrouve dans un problème indécidable. Je vais essayer de retrouver la discussion.
  • Renart
    Modifié (October 2022)
    MrJ : Est-ce que tu parles du modèle de Solovay
    Ramufasa : Je n'ai pas de réponses à tes questions historiques, mais voilà ce que je me donne à moi même comme arguments pour justifier la définition de tribu d'un point de vue "géométrique" : on considère la mesure comme une façon de mesurer des longueurs, aires, volumes etc. Il s'agit d'opinions personnelles, je ne prétends pas détenir la vérité.
    Quelques résultats mathématiques  pour commencer.
    -Les ensembles de Vitali montrent qu'il n'existe pas de mesure $\sigma$-additive et invariante par translation et définie sur $\mathfrak P(\R)$.
    -Le paradoxe de von Neumann montre qu'il n'existe pas de mesure finiment additive, invariante par l'action de $SL_2(\R)$ sur $\mathfrak P(\R^2)$.
    -Le paradoxe de Banach Tarski montre qu'il n'existe pas de mesure finiment additive, invariante par isométries sur $\mathfrak P(\R^3)$.
    -Il existe des mesures finiment additives, invariantes par les isométries sur $\mathfrak P(\R)$ et $\mathfrak P(\R^2)$.
    -En un certain sens, sans axiome du choix tous les ensembles sont mesurables (cf. modèle de Solovay).
    On voit donc qu'on a des soucis, le rêve d'étendre la notion d'aire à une large classe d'ensembles ne se fera pas sans compromis. Je vois plusieurs concessions possibles :
    1) Restreindre l'ensemble de définition de nos mesures pour se limiter à une classe raisonnable d'ensembles.
    2) Restreindre les propriétés des mesures et demander uniquement l'additivité finie.
    3) Restreindre les propriétés des mesures et abandonner l'invariance par isométrie.
    4) Restreindre la possibilité de créer des ensembles pathologiques et renoncer à l'axiome du choix.
    L'option 4) n'est pas terrible, elle demande d'abandonner l'axiome du choix dans sa plus grande généralité et, si je comprends bien, repose sur un axiome supplémentaire d’existence d'un certain cardinal. D'un point de vue géométrique, l'option 3) n'est pas vraiment envisageable. Reste les options 1 et 2, on peut essayer de peser le pour et le contre de ces options. Pour l'option 2) on ne gagne pas tant que ça puisque dès la dimension 3 les paradoxes à la Banach-Tarski arrivent et on ne gagne de toute façon que la mesurabilité d'ensemble pathologiques. On perd en revanche beaucoup en sacrifiant la $\sigma$-additivité, par exemple on perd la continuité des mesures le long des suites monotones, qui est employée depuis Archimède pour calculer des aires. Pour l'option 1) et bien c'est le monde dans le quel on vit actuellement, avec des tribus. On ne perd au final pas grand chose, il y aura des ensembles pathologiques non mesurables mais à moins d'être spécialiste de certains domaines on ne les rencontre quasiment pas et la $\sigma$-additivité rend énormément de services. Pour ce qui est des calculs de volumes ou d'intégrales on a la contrainte technique des tribus au moment de la construction de la mesure et de l'intégrale mais une fois ce stade passé on ne les vois plus tant que ça et c'est assez indolore.
    Et les proba dans tout ça ? Si les tribus n'apparaissent plus trop à l'utilisation de l'intégrale de Lebesgue il y a un endroit où elles sont omniprésentes : les proba. La notion de tribu filtrée par exemple n'est alors plus une contrainte mais un outil. On peut donc se demander pourquoi la notion de tribu est apparue au départ mais le plus important est sans doute de savoir pourquoi cette notion perdure. Et selon moi elle perdure parce qu'en plus d'être un moindre mal (nécessaire) cette notion est utile, ce qui me laisse penser que c'est effectivement la bonne définition/façon de faire. 
  • MrJ
    MrJ
    Modifié (October 2022)
    Je n’ai pas réussi à retrouver la discussion précédente, mais en fouillant, je me suis souvenu qu’on m’avait cité le théorème d’Ulam : https://fr.wikipedia.org/wiki/Théorème_d'Ulam

    En adaptant ça démonstration, on en déduit que la mesure de Lebesgue sur $[0,1]$ ne peut pas s’étendre à la tribu $\mathcal{P}([0,1])$ en entier. Cependant, le théorème d’Ulam suppose une version faible de l’hypothèse du continu.

    D’un autre côté, j’ai trouvé le lien ci-dessous où @Corto indique que sur $\R$ ou $\R^2$, on peut étendre la mesure de Lebesgue (Édit : mais on perd la $\sigma$-additivité, donc c’est la même chose que mentionné par Renart dans son message précédent) à toutes les parties : 
    https://les-mathematiques.net/vanilla/index.php?p=discussion/1840186#Comment_1840186
    La motivation que je donne à mes étudiants pour introduire les tribus a du plomb dans l’aile (si on ne suppose pas l’hypothèse du continu)…

    @Renart : Merci pour le lien sur le modèle de Solovay que je n’avais jamais vu. On apprend tous les jours sur ce forum.
  • Foys
    Modifié (October 2022)
    Une motivation d'introduire les tribus serait qu'il n'y a aucune raison a priori pour que les volumes (aires, mesures etc) soient définis pour toutes les parties de $\R^3$.
    La modélisation de l'espace physique ambiant par $\R^3$ a des limites, une quantité ne peut vraiment être ponctuelle (cf débats sur "le point a-t-il un volume nul") et toutes les parties du $\R^3$ mathématique ne possèdent pas de contrepartie physique, d'autre part remplacer $\mathcal P (\R^3)$ par "l'ensemble des parties qui peuvent physiquement exister" introduirait un grand nombre de problèmes pratiques et conceptuels (on ne saurait même pas de quoi on parle en fait).
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Un truc qui m’avait bien plu, c’est un exercice (un peu long) de Foys : soit $A$ un ensemble de parties d’un ensemble, qui est stable par intersections finies. On considère le plus petit sous-espace vectoriel réel $V$ stable par limites simples contenant les indicatrices d’éléments de $A$ et les constantes. Alors $V$ est l’espace des fonctions à valeurs réelles, mesurables pour la tribu engendrée par $A$. On peut aussi enlever « stable par intersections finies » et remplacer « sous-espace vectoriel » par « sous-algèbre ».

    Je trouve que ça vaut le coup de le méditer !
  • Renart
    Modifié (October 2022)
    @MrJ : Attention les prolongements évoqués par Corto ne sont pas des mesures au sens usuel puisqu'elles ne vérifient pas l'hypothèse d'additivité dénombrable mais seulement d'additivité finie. L'intérêt des tribus reste entier puisque, comme expliqué dans mon premier message, la continuité de long des suites monotones est vraiment importante.
  • Héhéhé
    Modifié (October 2022)
    Dans mon cours de probabilités, je commence par parler d'une situation où on fait une suite (infinie) de lancers d'une pièce. En général, tout le monde s'accorde à dire qu'on a envie de dire que $A_n$ "faire Pile au lancer $n$" est un évènement.

    Ensuite je leur faire écrire des situations comme "on fait une infinité de Pile", "on fait au moins un Pile", etc. avec des unions et des intersections dénombrables à partir des $A_i$, donc là on constate qu'on a envie qu'une intersection ou une union dénombrable d'évènements soit encore un évènement. Idem pour le passage au complémentaire.

    Cela conduit naturellement à la notion de tribu.
  • Héhéhé : Sauf que dans le cas dénombrable, une tribu peut toujours être vue comme $\mathcal{P}(\Omega)$ pour un certain $\Omega.$ Tant qu'on fait des probabilités "discrètes", faut-il réellement introduire cette notion ? 
  • Héhéhé
    Modifié (October 2022)
    Non, ça ne marche pas même pour faire des probabilités discrètes. Si tu t'en tiens à avoir $\Omega$ dénombrable, tu ne peux pas en général construire une suite infinie de variables aléatoires indépendantes (même pour des variables aléatoires finies!).

    Par exemple pour reprendre l'exemple du lancer de pièce, ça serait une suite de variables aléatoires indépendantes suivant toute la loi de Bernoulli de paramètre 1/2 qui sont finies. C'est pas très dur de se convaincre que ça impose à $\Omega$ d'être au moins aussi gros que les suites infinies de 0 et de 1, ensemble qui n'est pas dénombrable.
  • Pour modéliser une infinité de pile ou face, on se place sur l'espace $\{0,1\}^{\mathbb{N}}$, ce n'est pas dénombrable.
  • Je me suis mal exprimé. Je voulais parler du support de la variable aléatoire. Si $X(\Omega)$ est au plus dénombrable, il n'est pas réellement nécessaire de placer une tribu au départ et imposer une condition de mesurabilité. 
  • Oui enfin avec une seule variable aléatoire on est vite limité...
  • MrJ
    MrJ
    Modifié (October 2022)
    @Renart. Merci pour cette précision que j’avais loupée ! Je me disais justement qu’il y avait une incompatibilité entre le théorème d’Ulam, ce que j’avais compris du message de Corto et l’indécidabilité de l’hypothèse du continu, mais je ne trouvais pas d’où venait l’erreur.
  • MrJ
    MrJ
    Modifié (October 2022)
    Je n’arrive pas à trouver une réponse claire : sait-on si la mesure de Lebesgue peut s’étendre en une mesure à la tribu $\mathcal{P}(\R)$, ou si ce problème est indécidable ?

    Il me semble que :
    - Si un tel prolongement existe, il ne sera plus invariant par translation, mais ça ne veut pas dire qu’il n’existe pas.
    - Sous l’hypothèse du continu, le théorème d’Ulam implique la non existence de ce prolongement. Mais que peut-on dire sans l’hypothèse du continu ?
  • Ce problème est indécidable (en supposant la cohérence d'hypothèses de grands cardinaux).
    En effet, d'une part, comme tu l'as dit, Ulam a montré que l'hypothèse du continu implique la non-existence d'un tel prolongement.
    D'autre part, Solovay (dans l'article Real-valued measurable cardinals) a montré que l'existence d'un tel prolongement est équi-cohérente avec l'existence d'un cardinal mesurable.
  • Merci pour ta réponse claire !
  • Poirot
    Modifié (October 2022)
    Une précision sur les prolongements de la mesure de Lebesgue : il existe des modèles de $\mathsf{ZF}$ où $\mathbb R$ est réunion dénombrable d'ensembles dénombrables (dans un tel modèle, l'axiome du choix dénombrable est en particulier faux). Il est alors clair que, dans un tel modèle, la mesure de Lebesgue n'est même pas $\sigma$-additive, bien que celle-ci soit définie sur tout $\mathcal P(\mathbb R) = \mathcal B(\mathbb R)$ et reste invariante par translation.
Connectez-vous ou Inscrivez-vous pour répondre.