Majoration gaussienne des coefs binomiaux
Bonjour,
Est-ce qu'il existe $C,v>0$ et $n_0\in\Bbb N^*$ tels que : $\forall n\geqslant n_0,\ \forall k\in[\![0,n]\!], \ \displaystyle 2^{-n} \binom{n}{k} \leqslant \frac{C}{\sqrt n} \exp\Big(-\frac1{nv}\big(k-\frac{n}2\big)^2 \Big)$ ?
Et je suis intéressé par les valeurs explicites de $C$, $v$ et $n_0$.
Merci d'avance.
Est-ce qu'il existe $C,v>0$ et $n_0\in\Bbb N^*$ tels que : $\forall n\geqslant n_0,\ \forall k\in[\![0,n]\!], \ \displaystyle 2^{-n} \binom{n}{k} \leqslant \frac{C}{\sqrt n} \exp\Big(-\frac1{nv}\big(k-\frac{n}2\big)^2 \Big)$ ?
Et je suis intéressé par les valeurs explicites de $C$, $v$ et $n_0$.
Merci d'avance.
Réponses
-
L'inégalité de Chernoff implique que, pour tout $n \geqslant 0$ et tout $0 \leqslant k \leqslant \frac{n}{2}$
$$\sum_{j=0}^k {n \choose j} \leqslant 2^n \exp \left\lbrace - \frac{1}{n} \left ( k - \frac{n}{2} \right)^2 \right\rbrace.$$
Ce n'est pas aussi précis que ce que tu demandes, mais on est dans la même veine. -
Merci noix de totos ! L'inégalité $\displaystyle {n \choose k} \leqslant 2^n \exp \Big(- \frac{1}{n} \big( k - \frac{n}{2} \big)^2 \Big)$ s'avère suffisante pour ce que je voulais faire. Fil résolu. :-)
-
De rien.
Et que voulais-tu faire exactement ? -
Je me suis posé la question suivante : « Si deux organismes se partageaient le dépouillement d'une élection, chacun dépouillant la moitié tirée au sort des bulletins, quel écart entre leurs résultats annoncés peut-on accepter sans suspecter une fraude ou une erreur ? ». Je voulais pouvoir dire des choses du style : « La probabilité que les deux résultats soient distants de plus de 1 point est inférieure à 1/1000, donc si ça arrive, c'est suspect et il vaut mieux recompter les bulletins pour vérifier ».
$\def\e{\varepsilon}$Du coup, j'ai $N$ électeurs en tout, $n=\frac{N}2$ électeurs dans chaque groupe de bulletins (on suppose $N$ pair), $R$ électeurs en tout ont voté pour le candidat Dupont et $R_i$ électeurs du groupe $i$ ont voté pour Dupont ($i\in\{1,2\}$). Je note aussi $T=\frac{R}{N}$ le score national de Dupont et $T_i = \frac{R_i}n$ son score dans le groupe $i$. Ainsi, $N,n,R,T$ sont des constantes déterministes et $R_i,T_i$ sont des variables aléatoires.
Pour répondre à ma question, il me suffit d'estimer $\Bbb P(|T_i-T|>\e)$. Or $$
\forall i\in\{1,2\}, \forall r \in[\![0,n]\!], \qquad \Bbb P(R_i=r) = \binom{N}{n}^{-1} \binom{R}{r} \binom{N-R}{n-r}
$$ donc $$\begin{eqnarray*}
\Bbb P(|T_i-T|>\e)
&=& \binom{N}{n}^{-1} \sum_{\substack{ r\in[\![0,n]\!],\\ |r-nT|>n\e}} \binom{R}{r} \binom{N-R}{n-r} \\
&\leqslant& \binom{N}{n}^{-1} 2^N \sum_{ |r-nT|>n\e} \exp\left\{ -\frac1R \Big(r-\frac{R}2\Big)^2 - \frac1{N-R} \Big(n-r-\frac{N-R}2 \Big)^2 \right\}\\[1mm]
&=& \binom{N}{n}^{-1} 2^N \sum_{ |r-nT|>n\e} \exp\left\{ -\frac{(r-nT)^2}{NT(1-T)} - N \Big(\frac{n}N -\frac12\Big)^2 \right\}\\[1mm]
&\leqslant& \binom{N}{n}^{-1} 2^N \cdot 2\int_{n\e}^\infty \exp\Big( -\frac{4u^2}{N} \Big) \,{\rm d}u \qquad\qquad\text{car } \, T(1-T)\leqslant \frac14\\[1mm]
&\leqslant& (1+\underset{N\to\infty}o (1)) \sqrt{\frac{\pi N}2} \frac{ e^{-N\e^2} }{2\e} \qquad\qquad\text{car } \int_x^\infty e^{-\alpha u^2}\,{\rm d}u \leqslant \frac{e^{-\alpha x^2}}{2\alpha x}
\end{eqnarray*}$$
puis $$\fbox{$ \Bbb P(|T_1-T_2|>\e) \leqslant (1+o(1)) \sqrt{2\pi N}\,\e^{-1} \, \displaystyle e^{-N\e^2/4} $}.$$
Pour la France, $N = 47\,500\,000$ en 2017, donc ça donne :
$$\begin{array}{|c|c|}
\hline
\text{Majorant de } \Bbb P(|T_1-T_2|>\e) & \e \\
\hline
1\,\% & 0{,}133\,\%\\
\hline
10^{-3} & 0{,}140\,\%\\
\hline
10^{-6} & 0{,}159\,\%\\
\hline
10^{-9} & 0{,}176\,\%\\
\hline
\end{array}$$
Dans un premier temps, j'avais fait un calcul de variance et utilisé l'inégalité de Bienaymé-Tchebychev, mais le résultat était moins bon. -
Calli pourquoi la question est résolue ? je ne vois vraiment comment tu passes de
$$ {n \choose k} \leqslant 2^n \exp \Big(- \frac{1}{n} \big( k - \frac{n}{2} \big)^2 \Big)$$ à
$$
\binom{n}{k} \leqslant \frac{C 2^n}{\sqrt n} \exp\Big(-\frac1{n}\big(k-\frac{n}2\big)^2 \Big)
$$ edit envoyé en même tempsLe 😄 Farceur -
Calli : OK.
Effectivement, les inégalités de Chernoff et Hoeffding représentent le cran au-dessus de celles de Markov et Chebyshev.
J'ai trouvé la majoration ci-dessus dans cet article de Quadrature, dans lequel plus généralement on trouve une application de Chernoff pour une majoration de la somme
$$\sum_{j=0}^k {n \choose j} a^{n-j} b^j$$
avec $0 \leqslant k \leqslant \dfrac{nb}{a+b}$.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 163.2K Toutes les catégories
- 9 Collège/Lycée
- 21.9K Algèbre
- 37.1K Analyse
- 6.2K Arithmétique
- 53 Catégories et structures
- 1K Combinatoire et Graphes
- 11 Sciences des données
- 5K Concours et Examens
- 11 CultureMath
- 47 Enseignement à distance
- 2.9K Fondements et Logique
- 10.3K Géométrie
- 63 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 68 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 313 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10K Probabilités, théorie de la mesure
- 773 Shtam
- 4.2K Statistiques
- 3.7K Topologie
- 1.4K Vie du Forum et de ses membres