Nombre de valeurs minimum écart type

Bonjour à tous
J'ai une question qui peut paraître triviale mais je n'arrive plus à remettre la main sur l'explication.

Quel est le nombre minimum de valeurs pour que le calcul d'un écart-type ait un sens mathématiquement parlant ?

J'entends par là que j'ai toujours utilisé une population minimum de 3 valeurs, mais Excel est capable de calculer un écart-type sur 2 valeurs. Est-ce que 2 valeurs suffisent d'un point de vue mathématique ? (je ne parle pas du fait si l'échantillon est suffisamment grand pour être représentatif de la population).
Merci pour votre aide :)
Joe

Réponses

  • Bonjour.

    La formule de l'écart type fonctionne aussi pour une seule valeur. Le problème vient avec le calcul de la moyenne pour 0 valeur.

    Pour Excel, le calcul de l'écart type est fait par ECARTYPEP. Et il est bien fait pour une seule valeur. La fonction ECARTYPE fait une estimation de l'écart type de la population à partir des valeurs d'un échantillon. Elle divise une somme par n-1 où n est le nombre d'individus de l'échantillon, donc elle coince pour n=1. Mais vouloir estimer la dispersion des valeurs à partir d'une seule valeur est assez peu intelligent.

    Cordialement
  • Les deux versions de l'écart-type dont gerard0 parle, ça s'appelle la correction de Bessel, et effectivement, c'est une belle subtilité des statistiques !

    Il me semblait qu'il y avait un article wikipedia en français, mais je ne le retrouve plus.
  • Bizarrement, ce nom ne renvoie qu'à des articles en anglais. Et effectivement, je ne l'ai pas rencontré dans des manuels de stats en français, qu'i s'étendent beaucoup sur le passage de n à n-1 pour avoir un estimateur sans bais de la variance, quitte à avoir un estimateur biaisé de l'écart type. On utilise aussi, en particulier pour de petits échantillons gaussiens, des estimateurs de l'écart type à partir de l'étendue (max-min) et d'une table (une valeur par taille d'échantillon). Le calcul est simplifié : Une soustraction pour l'étendue, suivie d'une multiplication.
  • Bonjour,
    Merci pour vos explications. Je ne connaissais pas la subtilité de la correction de Bessel, je vais me renseigner dessus.
    Mais je comprends qu'on peut tout à fait calculer un écart-type sur deux valeurs (même si cela a peu de chance d'être réaliste). Quant à le faire sur une seule valeur, cela n'a pas vraiment d'intérêt.
  • Personnellement, j'appelle

    variance descriptive la version $\overline{(x - \bar x)^2}$
    variance inférentielle la version corrigée : $\frac{n}{n-1} \cdot \overline{(x - \bar x)^2}$

    La question de la représentativité se pose en statistiques inférentielles, mais pas en statistiques descriptives.
  • Oui,

    ce sont la variance de la population (ou variance de l'échantillon) et la variance estimée (ou variance d'échantillonnage). Il y a plein de noms. Et pas mal de notations : $\sigma$ et $s$, $\sigma_n$ et $\sigma_{n-1}$, par exemple. Tout ça en statistiques. En probabilité, seule la première est utile, mais est calculée différemment (*).

    Cordialement.

    (*) Même si les formules $E((X-E(X))^2)$ et $E(X^2)-E(X)^2$ sont toujours valides.
Connectez-vous ou Inscrivez-vous pour répondre.