Paradoxe du zugzwang

Voici un petit paradoxe pour ceux qui ont du temps à perdre ce dimanche :
Vous avez en face de vous deux portes (droite et gauche). Vous savez que derrière l'une des deux portes, il y a $k$ fois le trésor qu'on peut trouver derrière l'autre porte (avec $k > 1$). Après avoir ouvert une porte, vous pouvez choisir entre prendre le trésor ou condamner cette porte (donc renoncer au trésor) pour ouvrir l'autre (et pouvoir prendre le trésor correspondant). La question est : Quelle porte choisissez-vous d'ouvrir ? 

Si vous ouvrez la porte de gauche, elle contient un trésor d'une valeur de $x$. Ainsi, l'espérance de gain en choisissant de condamner cette porte est $\frac{(k x) + \frac{x}{k}}{2} > x$ donc si vous êtes rationnel, vous allez forcément choisir de la condamner et d'ouvrir l'autre porte.

Si vous ouvrez la porte de droite, rebelotte...

Ainsi, vous allez forcément faire le mauvais choix au début quoi qu'il arrive.

Je connais une solution du paradoxe mais c'est vraiment surprenant a priori :D

Réponses

  • JLapin
    Modifié (6 Oct)
    Ton $x$ décrit un ensemble de mesure infinie : c'est un peu embêtant pour la suite de ton raisonnement et pour la traduction mathématique du problème :)
  • Le choix étant symétrique, ce même choix n'a pas d'importance.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • C'est un paradoxe assez classique.
    On ne peut pas modéliser correctement le problème posé ici, car il n'y a pas assez d'information. Dans une version simplifiée les sommes possibles sont tous les $2^n$ avec $n\in \Z$ et on sait que l'on a $2^n$ et $2^{n+1}$ respectivement derrière les deux portes. Le problème étant qu'on ne connait pas la loi de ce $n$ donc l'énoncé est incomplet. Généralement cela supposerait que $n$ suive une loi uniforme ce qui est impossible ici puisque ça n'existe pas sur $\Z$. Dès que l'on met une loi sur $n$ le paradoxe s'envole.



  • J'appelle S et kS les sommes cachées. Dans la même expression ton $x$ remplace un coup S et un coup kS.
    Si je ne change pas de porte, l'espérance est S(1+k)/2, si je change de porte, espérance est encore S(1+k)/2.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Foys
    Modifié (6 Oct)
    "Comment le referais-je un milliard de fois d'affilée?" (en se posant cette question, on voit qu'il manque quelque chose).
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Je reformule encore ce que j'ai dit plus haut: dans le calcul d'espérance de Bibix, il fait le raccourci suivant: si je change de porte, j'ai une chance sur 2 d'avoir k fois plus et une chance sur 2 d'avoir k fois moins. Sauf que ce n'est pas k fois moins du même x, d'où la faute.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • J'espérais que ça parlait d'échecs !! Sinon, la remarque de Soc, me semble très pertinente.
    Comme me l'a appris ma maîtresse de CE2, tata Suzanne, dite Susu, $\{l,é,o\} \cap \{t,o,t,o\}=\{o\}$
  • Bibix
    Modifié (6 Oct)
    Ok @Renart connait la même solution que moi. Ben du coup, modifions un peu l'énoncé. Soit $\varepsilon \in ]0, \frac{1}{2}[$, on répartit le trésor $X$ de la première porte avec $\mathbb{P}(X = k^{-i}) = \left(\frac{\sqrt{k+1}+\sqrt{k-3}}{2\sqrt{k+1}}\right)^{i} \frac{\sqrt{k+1}-\sqrt{k-3}}{2 \sqrt{k+1}}$, le trésor prenant ses valeurs dans $\{k^i \mid i \leq 0\}$. Cette fois, la porte de trésor maximal est généreuse, on a $k \geq \frac{3+(1-2\varepsilon)^2}{1-(1-2\varepsilon)^2}$. 

    Alors pour tout $i \geq 1$, on a (pour $Y$ le trésor derrière la porte qu'on n'a pas choisi au début) $$a_i = \mathbb{P}(Y=k^{-(i-1)} \mid X = k^{-i}) = \frac{\mathbb{P}(Y = k^{-(i-1)})}{\mathbb{P}(X = k^{-i})} \mathbb{P}(X = k^{-i} \mid Y = k^{-(i-1)}) = \frac{\mathbb{P}(Y = k^{-(i-1)})}{\mathbb{P}(X = k^{-i})} \left(1-\mathbb{P}(Y = k^{-(i-2)} \mid X = k^{-(i-1)})\right).$$ Du coup, on a $$a_i = \frac{\sqrt{k+1}+\sqrt{k-3}}{2\sqrt{k+1}} \left(1 - a_{i+1}\right).$$ Mais l'espérance de gain est $$(k x) a_i + \frac{x}{k} (1-a_i) = \left(a_i \frac{k^2-1}{k} + \frac{1}{k}\right) x > x.$$ En effet, on a $a_i = -\sum_{k = 1}^i (-\lambda)^k$ (obtenu par récurrence car $a_0 = 0$) avec $\lambda = \frac{\sqrt{k+1}+\sqrt{k-3}}{2\sqrt{k+1}} < 1$ donc $a_i \geq \lambda-\lambda^2>\frac{1}{k+1}$ ce qui donne bien que l'espérance est strictement supérieure à $x$.

    Ainsi, la probabilité qu'on fasse le bon choix initialement est $\mathbb{P}(X=1) \leq \varepsilon$ avec $\varepsilon$ qui peut être arbitrairement petit.
  • Bonjour
    $\pi$ ou $\sqrt 2$ euro, ça n'existe pas.
    $x$ et $kx$ sont des multiples entiers de $\epsilon$, la plus petite valeur d'une pièce de monnaie.
    $k$ est donc rationnel; soit $k=n/d$ irréductible.
    J'ouvre une quelconque porte. Je découvre $T$ entier, valeur d'un des deux trésors.
    Si $kT$ est non-entier (alors, derrière l'autre porte, il n'y a pas $kT$, donc il y a $T/k$), je prends assurément le trésor $T$.
    Si $T/k$ est non-entier (alors, derrière l'autre porte, il n'y a pas $T/k$, donc il y a $kT$), je dédaigne assurément le trésor $T$.
    Si et $kT$ et $T/k$ sont entiers, j'hésite d'abord:
    En ce dernier cas, $T$ est un multiple par un entier $T_0$ de l'entier $nd$. SPDG $T_0=1$.
    J'ai donc trouvé $T=nd$ derrière ma porte. Derrière l'autre il y a $n^2$ ou $d^2$. Je choisis donc de dédaigner $nd$ car 
    $n^2-nd\geq nd-d^2$.
    En espérant être dans le sujet.
    Cordialement
    Paul

  • @bibix: Je ne comprends pas ton message. En revanche le mien est assez simple et du coup je suis curieux de savoir ce qui ne te convient pas dans mon explication.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • @Soc, je viens d'ouvrir une porte, je vois que derrière cette porte il y a 17centimes.
    Donc je connais x. 
    Et l'autre porte cache soit 34centimes, soit 8,5centimes.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Jusque là je suis d'accord. Et la suite?
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Bibix
    Modifié (6 Oct)
    @Soc En soi, tu as raison mais Renart a juste été un peu plus précis. Il y a un cas dans lequel mon estimation est bonne, c'est juste que ce cas est impossible même si c'est celui auquel on pense intuitivement car on y est habitué. Avec mon deuxième message, je montre que même si le choix des deux portes est symétrique, la probabilité qu'on regrette ce choix a posteriori peut être arbitrairement proche de $1$ (en faisant varier le gain potentiel d'ouverture de la deuxième porte). Cela peut paraître paradoxal mais c'est vrai (et ce n'est pas si absurde quand on y réfléchit).
  • Je ne comprends pas comment tu peux calculer l'espérance de gain de changer de porte en envisageant une seule porte. Les cas où il y a k fois plus et k fois moins ne sont pas dans la même expérience aléatoire.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Bibix
    Modifié (6 Oct)
    C'est un peu comme Monty Hall. On ouvre une porte et on réévalue nos gains. C'est pour cela que ça paraît bizarre, le cerveau est complètement à l'ouest sur ces notions. Si on le fait rigoureusement, ça peut donner ça : 

    $X_0$ est un trésor qui suit $\mathbb{P}(X_0 = k^i) = (1-\varepsilon)^i \varepsilon$ avec $k > \frac{1}{1-\varepsilon}$ et $\varepsilon < \frac{1}{2}$ et $i \geq 0$. On a ensuite un autre trésor $X_1 = k X_0$. Ensuite, on a une attribution préalable qui va attribuer $1$ ou $0$ à la porte $1$ qu'on note $I$. On prend $\mathbb{P}(I = 0) = \mathbb{P}(I = 1) = \frac{1}{2}$ pour que le choix soit symétrique entre les deux portes. Alors on a par les probas totales pour tout $i \geq 1$, $$\mathbb{P}(X_I = k^i) = \frac{1}{2}\left(\mathbb{P}(X_0 = k^i) + \mathbb{P}(X_0 = k^{i-1})\right) = \frac{(2-\varepsilon)\varepsilon}{2} (1-\varepsilon)^{i-1}, (*)$$ avec le cas particulier $\mathbb{P}(X_I = 1) = \frac{\varepsilon}{2}$. Ainsi, on obtient avec Bayes $$a_i = \mathbb{P}(X_{1-I} = k^{i+1} \mid X_I = k^i) = \frac{\mathbb{P}(X_{1-I} = k^{i+1})}{\mathbb{P}(X_I = k^i)} \mathbb{P}(X_{I} = k^{i} \mid X_{1-I} = k^{i+1}),$$
    or $\mathbb{P}(X_{I} = k^{i} \mid X_{1-I} = k^{i+1}) = 1 - \mathbb{P}(X_{I} = k^{i+2} \mid X_{1-I} = k^{i+1}) = 1 - a_{i+1}$ donc finalement, on a pour tout $i \geq 0$, $$a_i = \frac{\mathbb{P}(X_{1-I} = k^{i+1})}{\mathbb{P}(X_I = k^i)} (1-a_{i+1}).$$ Si tu fais le calcul avec $(*)$ et le cas particulier, tu obtiens normalement pour tout $i \geq 1$, $$a_1 = 1 - \frac{a_0}{1+\lambda} = \frac{\lambda}{1+\lambda}, a_{i+1} = 1 - \lambda^{-1} a_i,$$ avec $\lambda = 1 - \varepsilon$ et $a_0 = 1 > \frac{1}{k+1}$. Avec une récurrence facile, on a pour tout $i \geq 1$, $a_i = a_1 = \frac{\lambda}{1+\lambda} > \frac{1}{k+1}$ (car si on simplifie, c'est équivalent à $\lambda > \frac{1}{k}$). Du coup, l'espérance de gain sur $X_I = x$ est $$a_i (k x) + \frac{x}{k}(1-a_i) = x+\frac{k-1}{k}\left((k+1) a_i - 1\right) > x.$$
    Donc si on choisit la porte $1$, on va forcément regretter notre choix. Idem pour la porte $2$. La réponse de @Renart ne marche donc plus dans ce cas.
  • Bibix
    Modifié (6 Oct)
    @Soc Ah d'accord, j'avais compris différemment ton message. On ne sait pas laquelle des deux portes a $k$ fois le trésor de l'autre porte donc du coup, mon calcul de l'espérance (qui est en fait conditionnelle) est juste. En supposant le principe du "tout est uniformément réparti", l'espérance de gain si on ouvre l'autre porte sachant que l'on a trouvé $x$ en ouvrant la première porte, c'est $\mathbb{E}[X_{1-I} \mid X_I = x] = \frac{kx + \frac{x}{k}}{2}$. Le problème, c'est que c'est infini.
  • Je pense que l'explication de Renart est très claire. 
    L'arbitre a déterminé une somme $S$, comment, on ne sait pas, et c'est tout le problème. Il a réparti cette somme en 2 parts, $A=\dfrac{S}{1+k}$ et $B=\dfrac{kS}{1+k}$
    On va supposer $k$ pas trop proche de $1$, sinon ça n'a aucun intérêt. Disons $k=5$ par exemple, une valeur volontairement grande.
    J'ouvre une porte et je vois un certain montant $M$.
    Et là, la question que je me pose, c'est est-ce que le montant total est $6 M$ ou $\frac {6M}{5}$. Et là, on n'est plus en maths, on est en psychologie.
    Est-ce que l'arbitre était prêt à donner $5 M$ via ce jeu ?  Si je gagne $M$, est-ce que ça va améliorer ma vie... ou bien je préfère tenter de gagner plus etc etc...
    Si je sais que la somme totale $S$ initiale a été déterminée par tel processus, qui donne un nombre avec telle espérance connue et tel écart-type connu, alors on revient dans le domaine des maths.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Georges Abitbol
    Modifié (6 Oct)
    Mais c’est pas du tout ça, la solution du « paradoxe »…

    Qui a dit que les sommes derrière les portes étaient aléatoires ? Le problème est très bien posé. Il faut trouver une stratégie qui, pour tout $x$, si on ouvre une porte au hasard uniformément parmi les deux, qu’on voit $y$ (qui est donc $x$ ou $kx$), on applique la stratégie à $y$, ce qui nous dit de changer de porte ou non, et qu’alors l’espérance de gain est strictement supérieure à $x$.

    Voici une solution.

    C’est une stratégie aléatoire. Soit $Z$ une variable aléatoire dont la loi charge tout intervalle non trivial. On ouvre une porte, on voit $y$. Si $Z>y$, on ouvre l’autre porte, et sinon on garde $y$. Exercice : ça marche.

    ÉDIT : En fait, je crois que je n’avais pas compris de quel paradoxe vous parliez… Mais alors, prenons un milliard d’individus qui jouent au même jeu avec les mêmes portes et les mêmes trésors. La moitié d’entre eux, on les force à garder la même porte, et les autres, on les force à changer. Ben, chaque moitié gagne en moyenne la moyenne des deux trésors… Bref, où y a-t-il un paradoxe ?

  • Je ne comprends rien à l'énoncé... pourquoi tu dis "rebelote" alors qu'une porte est condamnée? 
  • Georges Abitbol
    Modifié (7 Oct)
    J’interprète l’énoncé comme ça : 

    Alice choisit un réel $x$. Derrière une porte, elle met $x$, derrière l’autre, elle met $kx$. Bob arrive, choisit une porte, voit $y$, et il a le droit de garder $y$ ou de renoncer à $y$ et de prendre ce qu’il y a derrière l’autre porte.

    Bob tient le raisonnement suivant : « si je change de porte, j’aurai $\frac{y}{k}$ ou $ky$. Comme j’aime bien mettre des probabilités là où il n’y en a pas et que je crois que les probabilités sont subjectives, je considère, quoi que cela veuille dire, qu’il y a probabilité $\frac{1}{2}$ pour que je gagne $\frac{y}{k}$ en changeant, et probabilité $\frac{1}{2}$ pour que je gagne $ky$ en changeant. En moyenne, je suis strictement gagnant en changeant. Donc il faut que je change ». Bob réfléchit et se dit « mais en fait, ceci est vrai quel que soit $y$ ! En fait, même pas besoin d’ouvrir une porte, j’ai toujours intérêt à en changer ! Mais alors, cela ne s’arrête jamais, les probabilités m’indiquant de constamment changer de stratégie sans que je puisse arrêter mon choix ».

    Peux-tu trouver l’erreur de raisonnement de Bob ?

    PS : de vrais morceaux d’anti-bayésianisme se cachent dans ce post.
  • David Madore en parle sur son blog.
  • Soc
    Soc
    Modifié (7 Oct)
    Dans son blog, son exemple n'est pas très heureux car de fait la politique de l'enfant unique a entrainé une partie de la population à se débarrasser des bébés filles pour que l'enfant en question soit un garçon, la proportion a donc été effectivement modifiée.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Soc
    Soc
    Modifié (7 Oct)
    Pour clarifier ces histoires de portes:
    Dans le problème de Mountyhall, il n'y a ni paradoxe, ni difficulté. Quand on change de porte on transforme un porte perdante en porte gagnante, et réciproquement, d'où des probabilités immédiates de $2/3$ et $1/3$.
    Dans le problème présent, sans changer de porte, l'espérance de gain est de $(S+kS)/2$ et en changeant de porte de $(kS+S)/2$, ce qui est plutôt rassurant.
    D'où vient alors l'incompréhension profonde avec @bibix: il présente un résultat d'espérance de gain de $x(k+1/k)/2$ sans donner le détail des calculs. J’interprète alors son calcul comme le fait de se dire que l'on a autant de chance d'avoir $k$ fois plus que $k$ fois moins en changeant de porte. d'où le $x(k+1/k)/2$. Ce raisonnement est faux car, en reprenant les notations précédentes, dans un cas c'est $k$ fois moins que $kS$ et dans l'autre $k$ fois plus que $S$, ce n'est pas le même $x$. On peut formuler l'objection autrement en disant que l'on compare deux expériences aléatoires différentes (celle où l'on aurait $S=x$ et celle où $S=x/k$).
    En fait je pense que Bibix obtient son $x(k+1/k)/2$ autrement d'où l'incompréhension. Cela dit il n'est pas possible en l'état de calculer une espérance de gain sachant $x$. Si j'ai bien compris ce qu'il propose, il décide arbitrairement qu'il y aurait maintenant une loi (arbitraire elle aussi) de répartition du $S$, et calcule alors en fonction de cette loi l'espérance de gain. On est alors quand même très loin de l'énoncé original, dans lequel il n'y a aucun paradoxe.

    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Renart
    Modifié (7 Oct)
    J'avoue que je ne comprend pas bien les réponses de toute le monde ici... Je ne comprend pas les réponses de bibix qui ferait que ma réponse "ne marche pas" et je ne vois pas le lien entre le billet de blog de GA et le paradoxe de bibix. Le "paradoxe" que je connais et auquel j'ai répondu est le suivant.

    Vous avez deux portes ($A$ et $B$) devant vous, l'une avec une somme $x$ et l'autre avec une somme $2x$. La porte $A$ et la porte $B$ ont toutes les deux la même probabilité de mener au gros lot.  Vous devez ouvrir une des deux portes puis décider si vous prenez la somme de la porte que vous venez d'ouvrir ou la somme cachée derrière l'autre porte. Évidemment vous n'avez aucune connaissance de la valeur de $x$, qui peut varier de façon aléatoire d'une fois sur l'autre.

    Supposons que vous ouvriez $A$, vous tombez sur une somme $y$. Il y a une chance sur deux que $y=x$ et une chance sur deux que $y=2x$. Vous avez alors deux choix possibles, soit changer de porte soit garder la porte $A$. Si vous gardez la porte $A$ vous gagnez $y$. Si vous changez de porte vous gagnez en moyenne $\frac{y}{4}+\frac{2y}{2} = \frac{5y}{4}>y$. On en conclut donc que, quelle que soit la valeur derrière la porte $A$ il est plus rentable de changer et de prendre $B$.

    En échangeant $A$ et $B$ dans le raisonnement précédent on voit que si l'on commence par prendre $B$ il vaut mieux ensuite changer et ouvrir $A$.
    À vous de juger où ce situe le paradoxe. Mais intuitivement on sent bien que "toujours ouvrir $A$ puis toujours changer pour $B$" ne devrait pas être une meilleure stratégie que "toujours ouvrir $A$ puis toujours garder $A$" puisque les espérances de chaque portes sont a priori égales.

    Ce soucis s'envole dès que l'on formalise proprement toutes les données du problème. Il faut notamment mettre une loi de probabilité sur la valeur de $x$ et, dès que l'on fait cela, on voit que le calcul de l'espérance change. Notamment il est fautif de supposer que, si l'on trouve $y$ derrière la porte $A$ alors $2y$ se trouve derrière $B$ avec probabilité $1/2$ et ce quel que soit la valeur de $y$. Cela supposerait que la loi de $x$ vérifie $\mathbb P_x(a)=\mathbb P_x(2a)$ pour tout réel $a$, ce qui n'est vérifié que par $\mathbb P_x=\delta_0$.

    Typiquement si $x \in \{2^k | k\in [0;19]\cap \N\}$ et suit une loi uniforme. Si l'on trouve $2^{20}$ derrière la porte $A$ alors l'espérance de gain en changeant de porte est $2^{19}$, soit beaucoup moins que $2^{20}$ en gardant cette porte. Ce "phénomène de bord" suffit à compenser exactement tous les gains de la stratégie "changer de porte" lorsque $y<2^{20}$ et, en prenant la moyenne sur toutes les valeurs de $x$ on retrouve une espérance égale pour la stratégie "toujours changer de porte" et la stratégie "toujours garder la même porte".
  • Georges Abitbol
    Modifié (7 Oct)
    Évidemment vous n'avez aucune connaissance de la valeur de $x$, qui peut varier de façon aléatoire d'une fois sur l'autre.
    Ce n’est pas ce que l’énoncé dit. Le réel $x$ n’est pas supposé être aléatoire dans l’énoncé de départ.

    Au cas où ce n’était pas clair dans mes posts précédents, « ma résolution » du « paradoxe » consiste à mettre en doute l’affirmation « si vous changez de porte, vous gagnez en moyenne blabla » dans le post ci-dessus.

    Je m’aperçois que j’ai posté le lien sans dire où il fallait regarder : il faut lire sous « Des choix, des choix, et encore des choix ».
  • Renart
    Modifié (7 Oct)
    Ce n’est pas ce que l’énoncé dit.

    L'énoncé de départ est flou. Je pense que les divers quiproquo du fil le prouvent. C'est pour ça, et parce que mon interprétation du problème de bibix est subjective, que j'ai essayé de retranscrire le paradoxe que je connais et auquel j'ai répondu ;)

    PS : merci pour la précision sur où regarder dans le lien. Je vois maintenant le lien !  Et je ne vois a priori pas pourquoi ce serait le même problème que celui de bibix qui fait intervenir une espérance de gain dépendant de la valeur trouvée derrière la porte. Mais je n'y ais pas beaucoup réfléchi non plus.

  • @Georges Abitbol Merci pour cette stratégie étonnante dans le lien. Ce n'est pas le première fois que je suis bluffé par ce type de stratégie. Je crois qu'il faudra que j'en recroise encore quelques unes avant d'arriver à en produire!
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Il n'empêche que j'ai montré un cas parfaitement modélisé mathématiquement dans lequel le théorème de Bayes mène à une contradiction apparente (quel que soit le choix qu'on fait, on va le regretter si on cherche à maximiser l'espérance de gain alors que l'espérance a priori est la même). C'est dû à quelque-chose de très connu, notamment des bayésiens et qui n'a pas été mentionné par les experts du forum dans ce fil. Après, apparemment j'ai une très mauvaise conaissance des statistiques et de la science en général, je me souviens d'un fil dans lequel je m'étais fait enguirlander pour mon manque d'intuition en la matière.
  • Georges Abitbol
    Modifié (8 Oct)
    Qu’est-ce qui n’a pas été mentionné ? C’est qui, les experts ? 

    Et j’avoue que je n’ai pas compris ta première réponse, (Bibix). C’est quoi la première porte ?

    Et la formalisation correcte, c’est quoi ? Voici mes deux propositions :

    Il s’agit de jeux où Bob gagne s’il devine le plus grand des deux nombres choisis par Alice, et « gagne stochastiquement » s’il gagne avec probabilité strictement supérieure à $\frac{1}{2}$.

    1) Sans trésor aléatoire, sans stratégie aléatoire
    Bob choisit une application $f$ de $\mathbb{R}_+$ vers $\{garder, changer\}$. Puis Alice choisit $x\in \mathbb{R}_+$. Puis elle tire à pile ou face, et si pile, elle annonce $x$ à Bob, et si face, elle annonce $kx$ à Bob. Bob, voyant $y$, regarde $f(y)$, et garde ou change en fonction.

    2) Sans trésor aléatoire, avec stratégie aléatoire
    Bob choisit une loi de probabilité sur les fonctions $\mathbb{R}_+$ vers $\{garder, changer\}$. Alice choisit $x\in \mathbb{R}_+$. Puis elle tire à pile ou face, et si pile, elle annonce $x$ à Bob, et si face, elle annonce $kx$ à Bob. Bob, de son côté, choisit, indépendamment du lancer de pièce d’Alice, une fonction $F$ aléatoire distribuée selon la loi qu’il a annoncée. Bob, voyant $y$, regarde $F(y)$, et garde ou change en fonction.

    3) et 4) Avec trésor aléatoire
    Pareil que $1)$ et $2)$, mais Alice doit choisir $x$ selon une loi de probabilité, et ce, de manière indépendante de son lancer de pièce et du choix aléatoire éventuel de la stratégie de Bob.

    Et ma façon de comprendre le paradoxe, c’est qu’il n’est qu’en fait une démonstration erronée du fait que la stratégie (pour Bob) « toujours changer » gagne stochastiquement (fait qui est faux dans 1) et 2) et qui dépend probablement de la loi que prend Alice dans 3) et 4)).

  • Les "experts", c'est Soc, lourrran, gerard0, toi, etc... . Mais il ne faut évidemment pas le prendre à la lettre.

    La première porte, c'est la porte de gauche. Mais on peut prendre n'importe laquelle des deux vu que les choix sont symétriques.

    Concernant tes propositions, 1) et 2) ne sont pas formalisées correctement car tu n'expliques pas comment fais Alice pour choisir $x$ (c'est tout l'objet de la première variante que j'ai présenté). Si Bob sait quel $x$ est choisi par Alice (ce que tu sembles attribuer à tes deux premières proposition) alors c'est vrai que c'est un peu ridicule mais c'est HS. Du point de vue de Bob, le choix du trésor minimal par Alice est toujours aléatoire dans ce que j'ai considéré.

    Tu écris que la dominance stochastique de la stratégie "toujours changer" dépend probablement de la loi du choix d'Alice. C'est ça qui est contre-intuitif (et qui constitue en fait le paradoxe). Il existe des lois de choix du trésor minimal telles que les espérances de gain a priori sont les même (le rapport vaut $1$) mais les espérances a posteriori du premier choix de Bob sont différentes (le rapport est uniformément minoré par un truc $> 1$).

    Je crois que tu avais écrit dans un précédent fil que tu avais lu le bouquin de Cox/Jaynes donc tu dois forcément connaitre ce qui n'a pas été mentionné.
  • Georges Abitbol
    Modifié (9 Oct)
    Coucou, pardon pour mon ton des autres fois. Je tiens à annoncer, pour que les choses soient bien claires, que j'ai été un peu biaisé dans mon approche par le fait que je n'aime pas la "philosophie bayésienne", que je comprends comme "accorder du crédit au concept de probabilités subjectives" (purement d'un point de vue épistémologico-logico-mathématique, parce que je ne peux pas nier les succès des statistiques bayésiennes). J'espère que je n'ai pas lancé de dispute.

    Il n'y a rien à expliquer pour le choix d'Alice : elle fait comme elle veut. Comme aux échecs. En tout cas, dans l'énoncé que tu proposes au début du fil, tu ne dis pas que le trésor est aléatoire, donc je considère que c'est Alice qui choisit ce qu'il y a derrière les portes, et c'est un des problèmes que je vois : souvent, des personnes ont le réflexe de considérer que tout ce sur quoi elles ne savent rien est forcément aléatoire. Je pense que c'est une grosse erreur. Par exemple, je considère le problème de "je parle à ma voisine, elle me dit qu'un de ses enfants est une fille qui joue au foot, quelle est la probabilité que l'autre enfant soit une fille ?" mal posé, à moins que la réponse attendue soit "$1$ ou $0$ en fonction de si l'autre enfant est une fille ou non".

    Dans mes formulations 1) et 2), peu importe que Bob connaisse ce qu'Alice choisit pour $x$, parce qu'il a annoncé ses stratégies plus tôt dans le jeu (en particulier, s'il "utilisait l'information de $x$", il tricherait puisqu'il violerait les promesses qu'il a faites). J'ai bien écrit que Bob joue $f(y)$ avec $f$ stratégie décidée et annoncée avant qu'Alice n'annonce $x$, et $y$ le contenu de la porte que Bob ouvre. On note qu'Alice a le droit, elle, de choisir (si elle le peut, bien sûr) un $x$ qui fasse échouer la stratégie de Bob (et ce que je trouve joli dans 2), c'est qu'elle ne peut pas).

    Du point de vue de Bob
    C'est justement ce genre de phrase que je n'aime pas. Je ne sais pas ce que ça veut dire. Ou plutôt, je crois que je sais ce que ça veut dire, mais je me dis "pourquoi s'intéresser à un raisonnement erroné que fait un personnage imaginaire ?".


    espérance a priori [...] espérances a posteriori
    Pareil qu'avant.


    Je crois que tu avais écrit dans un précédent fil que tu avais lu le bouquin de Cox/Jaynes
    Si j'ai dit ça, j'ai un peu menti. J'en ai lu un bout (le bouquin de Jaynes, The Logic of Science) et j'ai trouvé le contenu ridicule et pompeux (rien que le titre), alors j'ai arrêté.

  • @bibix: Je ne me pense pas comme expert de quoi que ce soit et je n'ai pas de doute sur le fait que mes compétences mathématiques sont bien inférieures aux tiennes. Il n'en demeure pas moins que je ne crois pas avoir dit de bêtise dans ce fil.
    je partage tout à fait l'avis de @Georges Abitbol:, il n'y a dans l'énoncé aucune raison de vouloir introduire de l'aléatoire pour la valeur du trésor. Si on le fait alors effectivement l'exercice devient plus complexe, et donc sans doute plus intéressant pour toi; mais c'est un détournement de l'exercice en question.
    Pour ce qui est de l'intuition qui nous trompe, en probabilité comme ailleurs il est souvent utile de donner aux paramètres des valeurs extrêmes pour voir ce qu'il se passe. Par exemple, avec 1000 portes au lieu de 3 dans le Mountyhall, cela devient beaucoup plus clair. Dans le cas présent si on veut mettre de l'aléatoire sur la valeur du trésor, pourquoi pas 1% de placer A et 99% de placer B. Cela suffit à comprendre qu'une loi influence clairement le taux de succès de la stratégie. On peut ensuite alors s'intéresser à la façon dont la loi influence le succès et c'est là que tes calculs (savants) interviennent. Mais parler de paradoxe ici, c'est de l'abus de confiance ; )
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Je tiens à annoncer, pour que les choses soient bien claires, que j'ai été un peu biaisé dans mon approche par le fait que je n'aime pas la "philosophie bayésienne", que je comprends comme "accorder du crédit au concept de probabilités subjectives" (purement d'un point de vue épistémologico-logico-mathématique, parce que je ne peux pas nier les succès des statistiques bayésiennes).
    Ce n'est pas que ça, il y a plusieurs types de philosophies bayésiennes (probas objectives, cohérence, etc...) mais j'avoue que je penche plutôt de ce côté-là donc ça explique peut-être le quiproquo.

    Il n'y a rien à expliquer pour le choix d'Alice : elle fait comme elle veut. Comme aux échecs. En tout cas, dans l'énoncé que tu proposes au début du fil, tu ne dis pas que le trésor est aléatoire, donc je considère que c'est Alice qui choisit ce qu'il y a derrière les portes
    Aux échecs, quand les joueurs font plusieurs parties, on peut voir apparaître une distribution sur les premiers coups. Des joueurs peuvent avoir des distributions complètement différentes. Si Alice fait comme elle veut, alors c'est potentiellement aléatoire sauf précisé autrement. Je pense vraiment que tu comprends de travers en supposant que le choix d'Alice est $x = g(f)$ ce qui n'est absolument pas suggéré par mon énoncé de départ (c'est quand même assez tordu de supposer cela). Mais comme tu l'as expliqué, dans ce cas-là, il n'y a aucun paradoxe car c'est déterministe. Du coup, c'est juste une réponse moins complète que celle de Renart au final.

    souvent, des personnes ont le réflexe de considérer que tout ce sur quoi elles ne savent rien est forcément aléatoire. Je pense que c'est une grosse erreur. Par exemple, je considère le problème de "je parle à ma voisine, elle me dit qu'un de ses enfants est une fille qui joue au foot, quelle est la probabilité que l'autre enfant soit une fille ?" mal posé, à moins que la réponse attendue soit "$1$ ou $0$ en fonction de si l'autre enfant est une fille ou non".
    Mais c'est à ça que sert l'aléatoire ! Les probabilités ne sont qu'une conséquence naturelle de la déduction dans l'incertain. Si tu supposes qu'en apportant de l'information supplémentaire, on obtient un raffinement local des probabilités et que la probabilité de l'évènement contraire de $A$ ne dépend que de la probabilité de $A$, tu retrouves la théorie de la mesure, le théorème de Bayes et tout ce qui a été développé en probas. Ce n'est que ça !

    Si tu lances un dé sans regarder la face visible et que tu considère le problème "quelle est la probabilité que la face visible sur le dé en ce moment soit $6$ sachant que ce n'est pas $4$ ?", tu pourrais dire de la même manière que c'est mal posé à moins que la réponse attendue soit "$1$ ou $0$ en fonction de si la face visible sur le dé soit $6$ ou non".

    Soc a dit :
    je ne crois pas avoir dit de bêtise dans ce fil [...]
    Dans le cas présent si on veut mettre de l'aléatoire sur la valeur du trésor, pourquoi pas 1% de placer A et 99% de placer B. Cela suffit à comprendre qu'une loi influence clairement le taux de succès de la stratégie. On peut ensuite alors s'intéresser à la façon dont la loi influence le succès et c'est là que tes calculs (savants) interviennent. Mais parler de paradoxe ici, c'est de l'abus de confiance ; )
    La stratégie "Toujours changer de porte" ne peut pas être stochastiquement dominante. C'est le principe du paradoxe. En effet, si jamais on a $\mathbb{E}[X_{1-I} \mid X_I] > X_I$ alors on obtient (ce n'est pas trivial mais c'est vrai) $\mathbb{E}[\mathbb{E}[X_{1-I} \mid X_I]] > \mathbb{E}[X_I]$ or $\mathbb{E}[\mathbb{E}[X_{1-I} \mid X_I]] = \mathbb{E}[X_{1-I}]$ et $I$ suit la même loi que $1-I$ car les choix sont symétriques donc comme tout est positif, on obtiendrait intuitivement de $\mathbb{E}[X_{1-I}] > \mathbb{E}[X_I]$ que $1 > 1$. C'est une contradiction donc ZFC est incohérente. Tu vois le paradoxe maintenant ? Le raisonnement précédent est évidemment faux dans le sens où c'est juste la démonstration rigoureuse du fait que la stratégie ne peut pas être dominante. Mais pourtant, j'ai montré que c'était le cas avec mes calculs "savants" et ma loi géométrique, non ? Moi je sais pourquoi ce n'est pas le cas, mais je suis surpris que ça n'étonne personne. Est-ce que tout le monde a compris directement le problème ? Si c'est le cas, c'est impressionnant.
  • Foys
    Modifié (11 Oct)
    @bibix a écrit:
    C'est une contradiction donc ZFC est incohérente. Tu vois le paradoxe maintenant ? L

    Les arguments qui chiffrent des forces magiques affectant la réalité ("la force qui pousse le flop à contenir un roi se met à valoir 30% au moment où mon adversaire me dévoile un as de sa main") en se basant sur des symétries apparentes d'événements ou autres ne font pas partie de ZF(C) et ne se formalisent jamais directement dedans. Il n'y a donc pas de telle contradiction.


    Si problème il y a, il convient d'aller d'abord chercher sa source dans le domaine qui le provoque (en l'espèce le "bayésianisme").

    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • il y a plusieurs types de philosophies bayésiennes (probas objectives, cohérence, etc...)

    Si tu as une référence en tête, je veux bien.

    Aux échecs, quand on les joueurs font plusieurs parties, on peut voir apparaître une distribution sur les premiers coups.

    Que veux-tu dire par là ? Je ne vois qu'une façon d'interpréter ça, qui est fausse, et c'est la suivante : pour tout vrai joueur d'échecs jouant une infinité de parties avec les blancs, si, pour tout $n$, $x_n$ est son premier coup, alors la suite des distributions empiriques $\left( \frac{1}{N}\sum^{N-1}_{n=0} \delta_{x_n}\right)_{N \in \mathbb{N}}$ converge vers une loi de probabilité sur l'ensemble des coups. Ceci est évidemment faux : pour cela, prendre n'importe quelle suite $(a_n)_n \in \{0,1\}^\mathbb{N}$ telle que $\liminf_N \frac{1}{N}\sum^{n-1}_{n=0} a_n = 0$ et $\limsup_N \frac{1}{N}\sum^{n-1}_{n=0} a_n = 1$ (par exemple, je pense que $(0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1...)$ convient où chaque nombre est répété une factorielle de fois - $1!$ zéro, $2!$ uns, $3!$ zéros, $4!$ uns, etc.). Disons qu'à la $n$-ème partie, je joue e4 si $a_n = 0$ et d4 si $a_n = 1$ (c'est un algorithme que je pourrais exécuter, si j'étais immortel). Alors la suite des lois empiriques de mes premiers coups ne converge pas.

    Je pense vraiment que tu comprends de travers en supposant que le choix d'Alice est $x = g(f)$ [...]

    Je ne suppose pas ça du tout. Il n'y a pas de $g$ dans ma phrase. Alice peut jouer ce qu'elle veut. En fait, en la faisant jouer après la déclaration de la stratégie de Bob, je donne un avantage à Alice (puisqu'elle peut essayer de jouer un $x$ qui fait capoter la stratégie de Bob). Le truc que je trouve intéressant et contre-intuitif, dans cette histoire, c'est que dans la variante 2), Alice ne PEUT pas jouer de $x$ qui fasse capoter la moitié des stratégies de Bob : chacun de ses coups perd contre strictement plus de la moitié des stratégies possibles de Bob.

    Mais c'est à ça que sert l'aléatoire !

    Ben, justement, c'est une hypothèse énormément forte que de supposer que notre adversaire joue de manière aléatoire ! Ca dit que si on jouait une infinité de parties simultanément (en parallèle et sans communication entre les parties), je sais que (à moins que la stratégie de l'adversaire soit une mesure de Dirac sur l'ensemble des stratégies) mon adversaire doit se forcer à jouer certaines stratégies une infinité de fois (en fait, dans la bonne proportion) pour respecter les prescriptions de la loi des grands nombres. C'est énormément contraindre ses choix ! En plus, c'est galère pour lui, puisqu'il ne sait pas ce que joue ses clones. De manière mathématique, dans un jeu où les coups sont des $0$ et des $1$, supposer que l'adversaire est aléatoire, c'est lui imposer de jouer (dans une infinité de parties) une famille des premiers coups appartenant au sous ensemble de $\{0,1\}^\mathbb{N}$ formé des trucs qui ont la bonne fréquence limite de $0$ et de $1$. Alors que si on ne suppose rien, il peut jouer n'importe quel élément de cet ensemble.
    L'aléatoire, c'est une sorte de "privation" de liberté.

    Les probabilités ne sont qu'une conséquence naturelle de la déduction dans l'incertain. [...] tu retrouves la théorie de la mesure [...]

    Rien compris. Tu peux être plus précis ? Ca me fait penser à des variantes du "dutch book argument" mais je n'ai jamais trouvé de référence mathématique propre. Et puis, plus haut, tu parles de quelque chose "qui n'a pas été mentionné" et que j'aurais lu dans le livre de Jaynes. Je ne sais pas de quoi tu parles.

    Moi je sais pourquoi ce n'est pas le cas, mais je suis surpris que ça n'étonne personne.

    Je n'ai pas compris de quoi tu es surpris. Tu connais le coup de la "fausse" démonstration de $0=1$ qui est en fait un jeu de "trouve la division par $0$ qui est cachée" ? Ben, j'ai l'impression que ton "paradoxe", c'est ça : tu nous racontes un raisonnement pas formalisé dont la conclusion a l'air absurde ; eh bien, tout le monde a vu que la conclusion avait l'air absurde. Que veux-tu de plus ? J'imagine que tu as fait le jeu de "trouver l'erreur" dans le raisonnement et que cette trouvaille t'a satisfait ou satisfaite ; mais moi, je n'ai pas envie de jouer à ce jeu, parce que pour l'instant, le "faux" raisonnement n'est pas assez propre pour je puisse pointer un endroit précis qui ne me plaît pas : je trouve que tout le raisonnement est une erreur (à commencer par la supposition qu'Alice joue aléatoirement) ! D'ailleurs je n'arrive pas à bien comprendre les hypothèses de ton message, celui qui commence par "Ok Renart connaît la même solution que moi". Si tu veux bien le réécrire en formulant clairement tes hypothèses, cela m'intéresse.
    Et puis, quand tu dis que "toi, tu sais" j'ai l'impression que tu sous-entends que tu voulais dire quelque chose que tu n'as pas encore dit. C'est le cas ou pas ?

Connectez-vous ou Inscrivez-vous pour répondre.