Échantillonnage et proportion infime

dans Statistiques
Bonsoir à tous,
une question toute bête, existe-t-il des méthodes pour effecteur des échantillonnages portant sur des proportions infimes ?
Ma question est bien évidemment liée à l'actualité, imaginons qu'une affection touche 1 personne sur 1 million et que suite à une vaccination on constate que cette proportion est multipliée par 3 sur un échantillon de quelques millions. Dans quelle mesure peut-on considérer que cet écart est significatif ?
D'un point de vue naïf, si je considère un bête intervalle de confiance, je me retrouve avec une marge d'erreur de l'ordre de $10^{-3}$ et aurais donc tendance à considérer cet écart comme non significatif.
Et je vois du coup assez mal comment on peut analyser un tel échantillonnage. Même avec un échantillon de taille $10^9$ on se retrouve avec une marge d'erreur bien plus grande que la proportion observée...
Bonne soirée
F.
une question toute bête, existe-t-il des méthodes pour effecteur des échantillonnages portant sur des proportions infimes ?
Ma question est bien évidemment liée à l'actualité, imaginons qu'une affection touche 1 personne sur 1 million et que suite à une vaccination on constate que cette proportion est multipliée par 3 sur un échantillon de quelques millions. Dans quelle mesure peut-on considérer que cet écart est significatif ?
D'un point de vue naïf, si je considère un bête intervalle de confiance, je me retrouve avec une marge d'erreur de l'ordre de $10^{-3}$ et aurais donc tendance à considérer cet écart comme non significatif.
Et je vois du coup assez mal comment on peut analyser un tel échantillonnage. Même avec un échantillon de taille $10^9$ on se retrouve avec une marge d'erreur bien plus grande que la proportion observée...
Bonne soirée
F.
Réponses
-
Si tu as $10^6$ patients dans ton échantillon, et que ta maladie vient avec proba $p = 10^{-6}$, alors le nombre de malades suit la loi de Poisson $P(1)$. Effectivement, c'est un peu délicat impossible d'écarter l'hypothèse nulle dans ce cas là si tu as obtenu 2 malades, car voici la fonction de répartition de $P(1)$
0. 1. 2. 3. 4. 5. 6. 0.3679 0.7358 0.9197 0.981 0.9963 0.9994 0.9999
Tu avais 8% 26.5% de chances d'avoir 2 malades sans que la vaccination ait changé quoi que ce soit.
Par contre, si tu as 3 malades, c'est quand même presque net (moins de 2% 8% de chances !)
Maintenant, si tu as $10^7$ patients dans ton échantillon, et toujours $p=10^{-6}$, on a la loi de Poisson $P(10)$, dont la variance est $\sqrt{10} = 3$.
Donc si tu as 20 patients malades dans ton échantillon, tu es à plus de 3 écarts-type de la valeur attendue : il n'y avait que 0,16% 0,35% de chances d'en avoir autant !
-- Corrigé, j'avais mal lu mes fonctions de répartition ! -
En fait, ce qu'il faut bien comprendre, c'est que la variance pour la loi binomiale $B(n,p)$ est $np(1-p)$, donc si $p$ est petit, il ne faut pas la majorer par $\frac{n}{4}$, mais par $np$, qui est bien plus petit, donc ça donne des intervalles de fluctuation moins catastrophiques.
-
Bien vu Marsup !
-
Merci pour cette intéressant réponse...du coup, je comprends mieux pourquoi cette loi s'appelle loi des évènements rares ;-)
Bonne soirée
F.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.6K Toutes les catégories
- 64 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 26 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 86 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 29 Mathématiques et finance
- 343 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.4K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres