Nombre de valeurs minimum écart type
dans Statistiques
Bonjour à tous
J'ai une question qui peut paraître triviale mais je n'arrive plus à remettre la main sur l'explication.
Quel est le nombre minimum de valeurs pour que le calcul d'un écart-type ait un sens mathématiquement parlant ?
J'entends par là que j'ai toujours utilisé une population minimum de 3 valeurs, mais Excel est capable de calculer un écart-type sur 2 valeurs. Est-ce que 2 valeurs suffisent d'un point de vue mathématique ? (je ne parle pas du fait si l'échantillon est suffisamment grand pour être représentatif de la population).
Merci pour votre aide
Joe
J'ai une question qui peut paraître triviale mais je n'arrive plus à remettre la main sur l'explication.
Quel est le nombre minimum de valeurs pour que le calcul d'un écart-type ait un sens mathématiquement parlant ?
J'entends par là que j'ai toujours utilisé une population minimum de 3 valeurs, mais Excel est capable de calculer un écart-type sur 2 valeurs. Est-ce que 2 valeurs suffisent d'un point de vue mathématique ? (je ne parle pas du fait si l'échantillon est suffisamment grand pour être représentatif de la population).
Merci pour votre aide

Joe
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
La formule de l'écart type fonctionne aussi pour une seule valeur. Le problème vient avec le calcul de la moyenne pour 0 valeur.
Pour Excel, le calcul de l'écart type est fait par ECARTYPEP. Et il est bien fait pour une seule valeur. La fonction ECARTYPE fait une estimation de l'écart type de la population à partir des valeurs d'un échantillon. Elle divise une somme par n-1 où n est le nombre d'individus de l'échantillon, donc elle coince pour n=1. Mais vouloir estimer la dispersion des valeurs à partir d'une seule valeur est assez peu intelligent.
Cordialement
Il me semblait qu'il y avait un article wikipedia en français, mais je ne le retrouve plus.
Merci pour vos explications. Je ne connaissais pas la subtilité de la correction de Bessel, je vais me renseigner dessus.
Mais je comprends qu'on peut tout à fait calculer un écart-type sur deux valeurs (même si cela a peu de chance d'être réaliste). Quant à le faire sur une seule valeur, cela n'a pas vraiment d'intérêt.
variance descriptive la version $\overline{(x - \bar x)^2}$
variance inférentielle la version corrigée : $\frac{n}{n-1} \cdot \overline{(x - \bar x)^2}$
La question de la représentativité se pose en statistiques inférentielles, mais pas en statistiques descriptives.
ce sont la variance de la population (ou variance de l'échantillon) et la variance estimée (ou variance d'échantillonnage). Il y a plein de noms. Et pas mal de notations : $\sigma$ et $s$, $\sigma_n$ et $\sigma_{n-1}$, par exemple. Tout ça en statistiques. En probabilité, seule la première est utile, mais est calculée différemment (*).
Cordialement.
(*) Même si les formules $E((X-E(X))^2)$ et $E(X^2)-E(X)^2$ sont toujours valides.