Fréquences et probabilités

Bonjour,
Un sac opaque contient $100$ boules, indiscernables au toucher. Chaque boule a la même probabilité d'être tirée. Les boules sont vertes, rouges ou bleues, mais on ne sait pas combien il y en a de chaque couleur.
On tire une boule et on note sa couleur, puis on la remet dans le sac et on recommence. Après $n$ tirages on note $v_n$ la fréquence des boules vertes, $r_n$ la fréquence des rouges et $b_n$ celle des bleues. Soient $V_n$, $R_n$ et $B_n$ les entiers les plus proches de respectivement $100v_n$, $100r_n$ et $100b_n$.
Quelle est la probabilité $p_n$ que le sac contienne effectivement $V_n$ boules vertes, $R_n$ boules rouges et $B_n$ boules bleues ?

Réponses

  • Dom
    Dom
    Modifié (March 2023)
    Bonjour,
    une remarque : un entier le plus proche d’une fréquence, c’est soit $0$, soit $1$. Est-ce cela que tu as voulu écrire ? Ou bien est-ce l’entier le plus proche de cent fois la fréquence ?
    Cordialement
    Dom
  • Oui ok, j'ai mal formulé. Je voulais parler de cent fois la fréquence bien sûr. Je corrige.
  • Ludwig
    Modifié (March 2023)
    J'imagine que le nombre de façons d'écrire $100$ sous la forme d'une somme de trois entiers non nuls intervient dans le résultat ? C'est-à-dire $C_{99}^{2}=4851$ façons. Ou $5050$ si on considère qu'il peut y avoir une seule couleur, ou deux.
  • Dom
    Dom
    Modifié (March 2023)
    Oui. Attention toutefois, il n’est pas garanti que la somme des trois entiers soit 100. 
    Pour trois fréquences d’un tiers, par exemple…

    Mes faibles connaissances me feraient utiliser l’inégalité de Bienaymé-Tchebychev
  • Ludwig
    Modifié (March 2023)
    Aïe oui, par exemple des fréquences de $0.333$, $0.333$ et $0.334$. Bon : on prend les entiers correspondants aux deux écarts les plus petits, et on prend le troisième pour que la somme fasse $100$. Mais de toute façon cela ne doit pas changer la tête du résultat final.
    Si on écrit $p_n=1-\epsilon_n$ en première approximation, intuitivement, vous mettriez quoi pour epsilon ? Je verrais bien le produit des écarts.
  • Quel serait ton espace probabilisé?
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Alain24
    Modifié (March 2023)
    Bonjour, en 1976 en terminale au lycée Emmanuel Mounier   j'ai appris le contenu du lien qui suit
  • Alain24
    Modifié (March 2023)
    On appelle $V,R,B$ les variables aléatoires respectivement égales au nombre de boules vertes, bleues, rouges tirées après $n$ tirages.
    On appelle $v,r,b$ les nombres entiers de boules vertes, bleues, rouges.
    A chaque tirage la probabilité de choisir une boule verte, bleue, rouge est v/100, r/100, b/100.
    On fait n tirages et on appelle $v(n),r(n),b(n)$ les nombres de boules vertes, bleues, rouges tirées.
    Tirer $v(n)$ boules vertes c'est dans un mot de n lettres composé avec les lettres V,R,B trouver $v(n)$ lettres V : il y a $C^v(n)_n$ façons de le faire et par substitution $C^r(n)_n$ et $C^b(n)_n$ façons de tirer $r(n)$ lettres rouges et $b(n)$ lettres bleues dans un mot de $n$ lettres.
    Puisqu'il y a $n$ tirages on a l'égalité $v(n)+r(n)+b(n)=n$.
    Ma montre qui avance de 3 minutes indique qu'il est midi, je reprendrai après la pause déjeuner !
  • Foys
    Modifié (March 2023)
    Ludwig a dit :
    Bonjour,
    Un sac opaque contient $100$ boules, indiscernables au toucher. Chaque boule a la même probabilité d'être tirée. Les boules sont vertes, rouges ou bleues, mais on ne sait pas combien il y en a de chaque couleur.
    On tire une boule et on note sa couleur, puis on la remet dans le sac et on recommence. Après $n$ tirages on note $v_n$ la fréquence des boules vertes, $r_n$ la fréquence des rouges et $b_n$ celle des bleues. Soient $V_n$, $R_n$ et $B_n$ les entiers les plus proches de respectivement $100v_n$, $100r_n$ et $100b_n$.
    Quelle est la probabilité $p_n$ que le sac contienne effectivement $V_n$ boules vertes, $R_n$ boules rouges et $B_n$ boules bleues ?
    Est-ce que les probabilités sont des forces invisibles magiques influençant la réalité, dont on mesurerait ou calculerait l'intensité à l'occasion? ("après avoir vu une boule sur deux verte, je pense que la force qui amène la boule à être verte vaut 50%"). Sinon, ces questions n'ont aucun sens.
    Les statistiques fournissent une approche et des réponses de nature différente ($\frac {v_n} n$ est un estimateur sans biais du nombre de boules vertes).
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • gerard0
    Modifié (March 2023)
    Effectivement, il y a un questionnement de probabilité sur une situation non probabiliste (le nombre de boules de chaque couleur est fixé au départ, donc déterministe).
    On peut évidemment transformer l'énoncé pour en faire un énoncé cohérent, mais évidemment, la réponse dépendra de cette transformation.
    Cordialement.
  • Dom
    Dom
    Modifié (March 2023)
    Je n’ai pas compris les objections. 
    N’est-ce pas un exercice classique de probabilité dans le thème « fluctuation d’échantillonnage » ?
  • Alain24
    Modifié (March 2023)
    Plutôt que de vous donner la recette des épinards, lesquels sont verts, aux oeufs durs de poules dans leurs nids
    N'auriez-vous pas envie, par le plus grand des hasards, que je vous écrivis  les formules de Bayes, par Nathalie!
    Eh bien si oui ouvrez le lien car voici le https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_Bayes eh oui
  • On peut demander: " Si tu as tel mélange de départ, quelle est la probabilité d'obtenir la même proportion en 100 tirages?"
    En revanche demander "Quelle est la probabilité d'avoir tel mélange au départ?" demande d'avoir défini un espace probabilisé entre les différents mélanges possibles.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Dom
    Dom
    Modifié (March 2023)
    Si j’ai bien compris : on n’a pas bien défini formellement l’espace. Ok. Je suis le premier à dire ça en général (il faut être explicite). Mais est-ce la seule réticence ou autre chose m’échappe ?
    Cela m’évoque les exercices sur les sondages, non ?
  • C'est une réticence assez forte! Soit on a bien cette répartition au départ et la probabilité que ce soit la bonne est 1. Soit on n'est pas dans cette répartition au départ et nos calculs correspondent à un cas qui n'existe pas et sont donc vides de sens.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Vassillia
    Modifié (March 2023)
    Bonjour Dom,
    En fait, c'est la différence entre intervalle de fluctuation et intervalle de confiance.
    Pour un intervalle de fluctuation, on veut prédire la moyenne que l'on aura dans un échantillon aléatoire à partir d'une population connue. On suppose donc connue la moyenne théorique et avec la loi de probabilités, on fait fièrement nos calculs pour obtenir un intervalle qui a 95% de chances de contenir la moyenne que l'on va observer lors de notre prochaine expérimentation.
    Pour un intervalle de confiance, on veut inférer la moyenne que l'on a dans la population à partir d'un échantillon. On peut utiliser la moyenne obtenue sur l'échantillon comme valeur prise par la variable aléatoire "estimateur sans biais et convergent" pour calculer un intervalle. Cela nous donne une méthode pour calculer des intervalles de manière à ce que 95% des intervalles construits de cette façon contiennent la moyenne théorique.
    Mais l'intervalle en question, soit il contient la moyenne théorique, soit il ne la contient pas, il n'y a pas de hasard à ce sujet, on ne peut même pas dire qu'il a 95% de chances de contenir la moyenne théorique. D'ailleurs si on recommence à partir d'un autre échantillon, on aura, à priori, un autre intervalle. Je sais bien qu'on le voit dire partout mais on ne devrait pas.
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • gerard0
    Modifié (March 2023)
    Bonjour Dom
    Ce n'est pas qu'on n'a pas défini l'espace probabilisé, c'est qu'il n'y en a pas. Si on a obtenu $V_n=25,\ R_n =50, B_n=25$, la question "quelle est la probabilité qu'il y ait dans le sac 25 boules vertes, 50 rouges et 25 bleues" n'a pas de sens. Même en rajoutant un "sachant que ..." puisque le nombre de boules vertes est non aléatoire.
    C'est la confusion classique entre possible et probable. Le deuxième étant très souvent utilisé à la place du premier dans le langage courant. Mais ici, on est en maths.
    Cordialement.
  • Le nombre de boules de chaque couleur est fixé à l'avance en effet, donc non aléatoire. Mais prendre une de ces boules dans le sac est bien une expérience aléatoire non ? Puisqu'on ne peut pas prévoir son résultat (vert, rouge ou bleu). Pourquoi ne pourrait-on pas définir l'univers $\Omega$ comme l'ensemble des triplets d'entiers naturels $(v,r,b)$ tels que $v+r+b=100$ ? Avec des issues équiprobables. La répétition de l'expérience nous donne un tel triplet et qui est bien obtenu de manière aléatoire.
  • Attention, tu mixes 2 notations. 
    L'univers est effectivement l'ensemble des triplets $(v,r,b)$ tels que $v+r+b=100$, et tous ces triplets sont équiprobables. Ce n'est pas dit explicitement dans l'énoncé, mais c'est évident que c'est comme ça qu'il faut le voir. 
    On tire $n$ boules avec remise, et $n$ n'est pas forcément égal à $100$ (dans les 2 derniers messages, on a pris le cas particulier n=100, qui peut apporter un peu de confusion, c'est pour ça que j'alertais). 
    On demande alors : parmi les 5050 triplets (v,b,r) possibles, lequel est le plus probable (on admet que c'est celui obtenu en faisant une règle de 3, ou en tout cas, on s'intéresse uniquement à celui-ci), et quelle est la probabilité que le triplet initial soit effectivement celui-ci.
    Si on a tiré 4 boules et qu'on a trouvé V=1, R=2, B=1 ou si on a tiré 4000 boules et qu'on a trouvé V=1000, R=2000, B=1000, les proportions sont les mêmes, mais ce n'est pas du tout la même chose.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • On pourrait aussi considérer que chaque boule est peinte de façon équiprobable entre v, r et b, et l'on obtient une autre probabilité tout aussi plausible.
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • gerard0
    Modifié (March 2023)
    Ce qui est aléatoire, c'est le tirage, pas le nombre de boules qu'il y avait dans le sac. Même si ce nombre est inconnu. 
    À noter. C'est vraiment une idée (mal foutue) pour un exercice, car avec le tirage sans remise des 100 boules, on sait ce qu'il y a dans le sac.
  • Vassillia
    Modifié (March 2023)
    Je ne suis pas sûre de vous comprendre. Le nombre de boules de chaque couleur étant fixé dans l'urne, les triplets d'entiers naturels que l'on peut obtenir par la répétition de l'expérience "tirage d'une boule" ne sont certainement pas équiprobables.
    Par contre si pour construire l'urne de départ, on apprend qu'un triplet a été choisi de manière équiprobable et que l'urne a été remplie pour correspondre à ce résultat alors là, d'accord, on peut jouer (pardon mais ce n'était pas du tout évident pour moi)
    En effet, on peut sous chaque hypothèse de triplet dans l'urne, calculer la probabilité qu'on observe ce qu'on a observé. Puis par un petit coup de théorème Bayes, recalculer la probabilité d'avoir chaque triplet dans l'urne sachant l'observation.
    On vient de réinventer les stats baysiennes qui ajuste la loi de départ à chaque nouvelle observation.
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • J’avais compris qu’on la remettait. 
    En fait, si la rédaction fait défaut, je parviens à comprendre l’énoncé « voulu ». 
  • gerard0
    Modifié (March 2023)
    Attention, suivant la façon de procéder, tirage de triplets, ou tirage de boules, ou tirage de nombre de boules, on peut ne pas avoir les même situations. Pour faire de cet exercice un exercice de probas, il faut un énoncé plus sérieux, sans doute assez long; et la résolution, qui utilisera des probas conditionnées par les répartitions initiales (*) me semble assez difficile à traiter. Il y a un sacré nombre de triplets possibles !!
    Cordialement.
    (*) pas vraiment des stats bayésiennes, puisque les modèles ne changent pas. Même si la formule utilisée est appelée, dans certains documents, "formule de Bayes" (et souvent "formule des probabilités totales").
  • Vassillia
    Modifié (March 2023)
    Je suis d'accord mais c'est un peu le principe des stats bayésiennes tout de même. Tout comme toi, je sens venir un exercice hyper lourd si on veut lui donner un sens en proba mais ce n'est pas infaisable sur le papier.
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • Pomme de terre
    Modifié (March 2023)
    À la lecture de l'énoncé initial, je comprends que la composition du sac est décrite par un certain triplet $(r,v,b)$ d'entiers positifs tels que $r + v + b = 100$. On effectue $n$ tirages i.i.d. selon la loi discrète $\frac{r}{100} \delta_R + \frac{v}{100}\delta_V + \frac{b}{100}\delta_B$.

    Dans ce contexte, on doit pouvoir déterminer à l'aide du théorème de Cramér un réel $I(r,v,b) > 0$ tel que :
    $$\lim_{n\to +\infty} \frac 1n \ln(1 - p_n) = - I(r,v,b).$$
     
    Autrement dit : $p_n = 1 - e^{-I(r,v,b)n + o(n)}$. Est-ce le genre de chose que tu cherches @Ludwig ?
  • Oui @Pomme de terre, cela m'irait très bien. À ceci près que ton réel $I>0$ dépend du triplet de départ.. qui n'est pas connu. 
    Deux petites choses (pas plus car vous m'avez un peu embrouillé.. :smile: :
    - il s'agit bien d'un tirage avec remise ;
    - d'accord @Vassillia, les triplets obtenus par répétition de l'expérience "tirage d'une boule" ne sont pas équiprobables.
  • Évidemment que $I$ dépend de $(r,v,b)$... Tu vois bien que $(100,0,0)$ et $(50,50,0)$ ne donneront pas pareil, non ?
  • @Ludwig: Pour tenter de reformuler l'objection plus clairement, quand tu demandes "Quelle est la probabilité que le sac de départ contienne Bn/Vn/Rn?" c'est que tu considères qu'il existe différentes répartitions possibles et que tu attribues à chacune d'elles une probabilité; ainsi tu cherches la probabilité conditionnelle d'avoir la répartition Bn/Rn/Vn sachant que l'on a obtenu ce tirage aléatoire de n boules. Dans le cas contraire il n'y a pas de probabilité à calculer "de contenir effectivement Bn/Rn/Vn".
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • D'accord avec la première partie de ton message @Soc. Et la probabilité de chacune de ces répartitions initiales possibles est la même, c'est-à-dire $1/5050$. 
    Je dirais bien que le comportement asymptotique des fréquences observées ne dépend pas du triplet $(r,v,b)$ de départ : le hasard est le même pour tout le monde, on retrouvera les mêmes lois, qu'il y ait $12$ rouges, $5$ vertes, $83$ bleues, ou bien $34$ rouges, $33$ vertes et $33$ bleues. Pour chaque fréquence la loi décrivant l'écart à la limite sera la même. 
  • Foys
    Modifié (March 2023)
    Imaginons la situation suivante: avant le tirage l'organisateur du jeu tire au hasard la composition de l'urne selon la règle suivante:
    - Dans 33% des cas l'urne contient 80 boules rouges, 10 boules vertes, 10 boules bleues.
    - Dans 33% des cas l'urne contient 10 boules rouges, 80 boules vertes, 10 boules bleues.
    - Dans 33% des cas l'urne contient 10 boules rouges, 10 boules vertes, 80 boules bleues.
    Enfin dans les 1% des cas restants l'organisateur tire 3 nombres (r,v,b) équiprobables parmi les triplets d'entiers dont la somme vaut 100 et fournit le nombre de boules correspondants.
    La composition de l'urne est inconnue du joueur et il tire (indépendamment de ce qu'a fait l'organisateur) 15 boules avec remise. Il trouve 5 boules de chaque couleur. Quelle est alors la probabilité que l'urne soit (presque) équilibrée (i.e. chaque boule est présente en au moins 30 exemplaires) ?
    Tout ça pour dire que la probabilité conditionnelle dont il est question au début du fil dépend en fait de comment le contenu de l'urne est constitué (selon quelle loi probabiliste lorsqu'on est dans une situation raisonnablement modélisable). P(la composition de l'urne est ceci | ce que j'ai observé) n'a aucun sens dans l'absolu
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Ludwig
    Modifié (March 2023)
    D'accord et merci @Foys
    Je suis curieux de voir la tête des $I(r,v,b)$ dans la formule de @Pomme de terre
    Bonne journée.


  • Soc
    Soc
    Modifié (March 2023)
    Foys a dit :
     P(la composition de l'urne est ceci | ce que j'ai observé) n'a aucun sens dans l'absolu
    Yapuka expliquer cela aux statisticiens, ou pour le moins à ceux qui utilisent les résultats statistiques :)
    The fish doesnt think. The Fish doesnt think because the fish knows. Everything. - Goran Bregovic
  • Foys
    Modifié (March 2023)
    Soc
    Ça n'est pas ce qu'ils font.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • C'est à cause de ce genre de croyance (la probabilité conditionnelle naturelle et la "philosophie bayésienne") que les tempêtes dans un verre d'eau comme le "jeu de Monty Hall" peuvent encore enfumer autant de gens.
    Les probabilités sont une vue de l'esprit. Il y a les mathématiques de la théorie de la mesure et il y a les fréquences empiriques dans le monde réel et les moyens de les prédire dans certains cas. Le reste relève de la discussion byzantine pure et dure.
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Le rôle du mathématicien est aussi de reformuler un problème d’un non professionnel pour qu’il puisse y répondre. 
    Ici c’est, dans un langage courant, « avec 100 tirages avec remise, dans quelles mesures puis-je me dire que (45;30;25) est le contenu de l’urne ? ». 
    Et en effet, « quelle est la probabilité ? » est une manière maladroite de poser la question.
    Rappelons qu’heureusement que des mathématiciens professionnels n’ont pas toujours répondu « mal posé, pas de sens, circulez » à n’importe quelle question. 
  • Vassillia
    Modifié (March 2023)
    Je ne pense pas que Foys se fâcherait avec les statisticiens, en tout cas je suis d'accord avec lui sur le fait que cela n'a aucun sens dans l'absolu.
    Mais dans la vraie vie, on n'hésite pas à choisir une loi de proba de manière arbitraire puis à la faire évoluer par la suite sachant les observations obtenues ou à rejeter la loi initiale si l’expérimentation est considérée trop improbable sous cette hypothèse.
    Par contre, je ne suis pas d'accord sur le reste, le problème "monty hall" vient justement du fait que les gens qui se trompent n'ont pas intégré la "philosophie bayésienne". Il y a équiprobabilité entre les portes initialement mais le choix du présentateur apporte une nouvelle information qui doit être prise en compte pour réévaluer cette équiprobabilité.
    Petite remarque au passage, en stats bayésienne, on calcule bel et bien des intervalles de crédibilité sur la distribution de probabilité à posteriori qui est obtenue en intégrant des informations à priori. Donc leur interprétation est qu'on obtient un intervalle qui a 95% de chances de contenir la moyenne théorique d'après les connaissances obtenues jusque là (il peut bien sûr être amené à changer en rajoutant une expérience ultérieure qui se servirait de la distribution de probabilité à posteriori comme information à priori). Cette interprétation n'est pas valable avec l'intervalle de confiance en stats fréquentistes même si elle est communément admise.

    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • Ludwig
    Modifié (March 2023)
    Intéressant ce sujet des probabilités conditionnelles et de la philosophie sous-jacente. J'ai fait une rapide recherche internet pour me documenter. J'ai très vite survolé ces documents car je n'ai pas le temps, j'espères avoir visé juste ! Je les poste ici. Vous vous y connaissez davantage et avez d'autres références ? Je suis preneur.
    Les fondements philosophiques du concept de probabilité, X. De Scheemaakere 2015
    Remarques philosophiques sur l’essai de Bayes en vue de résoudre un problème de la doctrine des chances, Jean-Pierre Clero 1986
    Un cours entier de l'Université de Genève : Probabilités et Statistique, Y. Velenik 2017
    Et, pourquoi pas : Inférence bayésienne, simplicité et probabilité a priori du théisme. Mickaël Mugneret 2010
    Puisqu'il s'agit, aussi, de croyances.
  • gerard0
    Modifié (March 2023)
    En complément de ce que dit Foys, il est surprenant comme de nombreux mathématiciens, utilisateurs des maths et formateurs en mathématiques sont bloqués pas l'usage fait du mot probabilité, peut-être croyant "qu'il y a toujours un calcul qu'on peut faire", oubliant que sans définition précise de l'épreuve probabiliste, il n'y a ni univers, ni loi de probabilité.
    Et c'est le cas dans toutes les situations déterministes.
    Les statisticiens, après avoir fortement épuré les a-priori de ce genre, ont fini par obtenir des résultats utilisables, du genre "intervalle de confiance", "estimations", "tests d'hypothèses", toutes notions délicates. Et ne se posent que des questions modélisables par les outils des probas. Pour eux, "j'ai rencontré 20 personnes, dont 15 disent oui à ma question" ne relève que des stats descriptives, concernant la population des 20 personnes. Et la question "quelle est la probabilité que la 21-ième que je vais rencontrer dise oui" n'a pas de sens. Ils sont les premiers à demander d'avoir un échantillon représentatif (pris au hasard dans l'ensemble de la population) et à refuser les échantillons biaisés (les 20 que j'ai rencontrés, 100% des gagnants ont tenté leur chance,..). Puis à faire très attention à leurs interprétations.
    Bien sûr, on rencontre des gens qui surinterprètent, qui utilisent les schémas bayésiens y compris dans des situations déterministes, et obtiennent des "probabilités à postériori" qui ne sont que des indices de confiance. Mais les probabilistes et statisticiens rejettent cette façon de faire. Il n'y a d'ailleurs pas de théorie de "probas bayésienne" qui sorte du schéma traditionnel, seulement un habillage sémantique.
    Cordialement.
  • gerard0
    Modifié (March 2023)
    Un exercice exemple :
    "Un meurtre vient d'être commis, la police a arrêté un suspect et pense qu'il a de fortes chances qu'il soit le coupable. On constate que l'assassin est porteur d'une maladie rare, de fréquence 1% dans la population. Le suspect en souffre, de combien cela augmente-t-il la probabilité qu'il soit l'assassin ?"
  • Vassillia
    Modifié (March 2023)
    Je ne vois pas où tu veux en venir avec ton exercice gerard0 car il est bien évident qu'on ne peut rien en déduire dans ce cas et je suis bien d'accord qu'on voit un peu n'importe quoi en stats dans les médias (et même parfois à la fac). Il n’empêche qu'il y a vraiment des stats bayésienne et que ce n'est pas du tout rejeté par la communauté scientifique, la tendance va plutôt dans ce sens d'ailleurs de par mon prisme (c'est peut-être différent ailleurs).
    Il y a des cours de master à ce sujet et il commence même à y avoir une initiation (très basique évidemment) chez les étudiants en médecine dans certaines facs où des vrais biostatisticiens ont repris les cours.
    Pour n'en citer qu'une, je prends une étude à plus de 40000 personnes qui a prouvé l'efficacité d'un vaccin contre le covid publié dans un des plus grands journaux médicaux https://www.nejm.org/doi/full/10.1056/NEJMoa2034577
    Tu ne pourras pas dire que ce sont des petits rigolos, ils calculent un intervalle de crédibilité en utilisant le modèle bayésien beta-binomiale justement car les tests d'hypothèse à l'ancienne posent de plus en plus question sur le fait que ce n'est pas le meilleur moyen d'obtenir de la connaissance.
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
  • gerard0
    Modifié (March 2023)
    Tu le dis bien "un intervalle de crédibilité".
    Et une étude sur 40 000 personnes ne relève évidemment pas des méthodes anciennes de traitement des données, généralement inapplicables (les tests sont tous significatifs, par exemple). Les méthodes bayésiennes sont une partie des stats classiques, partie de plus en plus utilisées pour des situations différentes des situations du début du vingtième siècle. Ne pas confondre avec les interprétations bayésiennes des probas.
    Cordialement.
  • Foys
    Modifié (March 2023)
    Vassillia a dit :
     Cette interprétation n'est pas valable avec l'intervalle de confiance en stats fréquentistes même si elle est communément admise.
    Il est possible de modéliser de façon raisonnable la pratique des statisticiens (fréquentistes) dans son ensemble et de démontrer dans ce cadre qu'asymptotiquement (avec très forte probabilité), 95% au moins des régions de confiance à 95% livrées par cette profession sont corrects sous l'hypothèse qu'elles ont été construites dans les règles de l'art. C'est un corollaire (lourd à formuler mais direct) de l'inégalité de Hoeffding: voir cette vieille discussion: https://les-mathematiques.net/vanilla/index.php?p=/discussion/comment/1270823/#Comment_1270823
    Une fonction est un ensemble $f$ de couples tel que pour tous $x,y,z$, si $(x,y)\in f$ et $(x,z)\in f$ alors $y = z$.
  • Vassillia
    Modifié (March 2023)
    Je suis d'accord, c'est ce que j'ai évoqué plus haut en parlant d'"une méthode pour calculer des intervalles de manière à ce que 95% des intervalles construits de cette façon contiennent la moyenne théorique"
    Mais tu m'accorderas, je pense, qu'on voit très très souvent que c'est l'intervalle qui a 95% de chances de contenir la moyenne théorique. Et du coup, c'est embêtant quand on doit parler des intervalles de crédibilité, même grossièrement.
    PS : merci pour le lien vers cette discussion
    La philosophie nous enseigne à douter de ce qui nous paraît évident. La propagande, au contraire, nous enseigne à accepter pour évident ce dont il serait raisonnable de douter. (Aldous Huxley)
Connectez-vous ou Inscrivez-vous pour répondre.