Tests médicaux et formule de Bayes

Bonjour,
Je m'interroge sur l'intérêt de la formule de Bayes dans les applications aux tests médicaux (ou autres).
J'interviens en enseignement scientifique en terminale où l'un des thèmes est la formule de Bayes et ses applications.
Ce que j'en ai compris est que les caractéristiques d'un test sont la spécificité et la sensibilité; et l'efficacité d'un test passe par les notions de valeur prédictive positive et valeur prédictive négative. Les VPP et VPN peuvent être déterminées à l'aide de la formule de Bayes; de la spécificité et de la sensibilité du test ainsi que de la prévalence de la maladie.
Ce qui me dérange est le fait suivant : en pratique on choisit un échantillon représentatif de la population totale (n: nombre d'individus dans l'échantillon, a nombre de malades et b=n-a). On estime alors la prévalence de la maladie par a/n puis la sensibilité par le taux de vrais positifs parmi les malades de l'échantillon et la spécificité par le taux des vrais négatifs parmi les non malades de l'échantillon. Lorsque l'on fait cela, la formule de Bayes n'a juste aucun intérêt car la VPP est alors estimée par la proportion des vrais positifs parmi les positifs de l'échantillon et la VPN est estimée par la proportion des vrais négatifs parmi les négatifs de l'échantillon.
En clair, quel est l'intérêt de parler de la formule de Bayes aux élèves alors que les VPP et VPN s'obtiennent très simplement à partir du tableau de contingence de la même façon que l'on obtient la spécificité et la sensibilité. Je ne sais pas si ma question est claire.

Réponses

  • Bonjour.

    Ta question est claire, et tout à fait logique. la formule de Bayes intervient ensuite, quand on s'interroge sur le cas d'un individu testé positif : Est-il malade, ou seulement faux positif ?
    Une autre de ses utilités est que la prévalence peut d'établir autrement que par le calcul sur l'échantillon (si la prévalence est faible, l'échantillon sera constitué de deux sortes d'individus : des malades sûrs, et des non malades à peu près sûrs. Et en pratique, c'est quasiment toujours ainsi qu'on travaille.

    Cordialement
  • Oui j'ai bien compris que la formule de Bayes permettait d'inverser le conditionnement.
    Mais appliquer la formule de Bayes ou calculer la proportion des vrais positifs parmi les positifs de l'échantillon revient au même (donne le même résultat lorsque la sensibilité et la spécificité ont été calculés sur l'échantillon).
  • Mais appliquer la formule de Bayes ou calculer la proportion des vrais positifs parmi les positifs de l'échantillon revient au même
    Bonjour,

    J'ai peut-être raté des détails, mais a priori, tous les calculs justes de $x$ donnent la même valeur pour $x$.

    La formule de Bayes confronte explicitement les taux de vrai/faux positifs du test à la prévalence de la maladie.

    C'est tout. Après, on a le droit de faire des pauses dans le calcul :
    écrire le numérateur d'une part,
    le dénominateur, avec son addition d'autre part,
    et le multiplicateur en troisième part.
    Puis mettre le tout ensemble.

    Que chacun(e) fasse comme il lui semble le plus confortable et le mieux adapté à ses élèves et sa pédagogie.
  • Personnellement, j'ai fait des dizaines ou des centaines d'applications de ces règles (en exercice, ou dans la vraie vie), avant d'apprendre le nom de Bayes.
    Quand on les enseigne en disant 'Formules de Bayes', ça donne un sentiment de complexité, alors que ce n'est que du bon sens paysan.
    Savoir que ces formules sont connues sous le nom de Bayes, c'est utile uniquement pour les retrouver via Google.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • En fait, ce que les probabilistes appellent "formule de [large]B[/large]ayes" n'est pas l'inversion de la formule des probas conditionnelles, mais son application au cas des systèmes complets d'événements : Si $(A_i)i=1,\ldots,n$ est une partition de l'univers (aucun n'étant vide), alors si B est un événement de probabilité non nulle :
    $$P_B(A_j) = \frac{P_{A_j}(B) P(A_j)}{\sum\limits_{i=1}^n P_{A_i}(B) P(A_i)}.

    $$ Cordialement.

    [Thomas Bayes (1702-1761) prend toujours une majuscule. AD]
Connectez-vous ou Inscrivez-vous pour répondre.