Valeurs égales dans une distribution normale — Les-mathematiques.net The most powerful custom community solution in the world

Valeurs égales dans une distribution normale

Bonjour à tous

Je rencontre un problème lié à la distribution normale. Dans une telle distribution je suis tenté d’accepter la proposition suivante : au sein d’une distribution normale le plus grand nombre d’individus qui partagent une même valeur doit se situer au niveau de la moyenne/médiane/mode. Par exemple : si 30 % est le pourcentage le plus élevé d'individus partageant une même valeur (mettons que 30% mesurent 1.80m) dans une distribution normale, cette valeur doit nécessairement correspondre à la fois la médiane, la moyenne et le mode de la distribution.

Toutefois, je crois me souvenir aussi que :

1- Étant donné que la distribution normale est continue, il est impossible de calculer la densité de probabilité pour une valeur particulière, on ne peut calculer cette dernière que pour un intervalle donné. Cela semble être le cas parce que la nature continue de la distribution fait qu’il existe un nombre infini de valeurs, et que par conséquent la probabilité d’une seule de ses valeurs est 1/+l'infini ce qui tend vers 0.

Mais en même temps je suis tenté de faire le raisonnement suivant :

2- La moyenne et la médiane ne sont pas des valeurs qui correspondent nécessairement à des individus réels dans une distribution (ex : si la moyenne est d'1.5 enfants par femme, il est clair qu'aucune femme n'a 1.5 enfants). Toutefois, le mode est supposément la valeur partagée par le plus grand nombre d’individus dans une distribution. Puisqu’une distribution normale a un mode, elle doit logiquement avoir des individus qui correspondent à ce mode. Aussi, comme la médiane, la moyenne et le mode sont identiques dans une distribution normale, l’implication semble être que si le mode est la valeur partagée par le plus grand nombre d’individus, cela doit aussi être le cas pour la médiane et la moyenne qui doivent alors correspondre à des individus.

Il me semble qu'il y a clairement un conflit entre l’analyse 1 et 2, et je serais tenté de le trancher en faveur du second point pour admettre ma proposition initiale (en gras au début du post). Voilà les raisons qui me viennent à l’esprit mais peut-être ai-je tort étant donné que je connais assez peu les propriétés formelles de la distribution normale (d'où ma demande d'aide).

A- La probabilité d’obtenir une seule valeur tend vers 0 mais n’est pas 0 à strictement parler, donc on peut supposer qu’il y a bien des individus qui correspondent à cette valeur.
B- Comme le second argument suggère qu’il est logiquement nécessaire qu’il y ait des individus correspondant à la moyenne et à la médiane dans une distribution normale, j’ai tendance à penser que la nécessité logique prend le pas sur une probabilité infiniment faible.
C- La première analyse semble plutôt poser un problème technique/épistémique lié à notre incapacité de calculer qu’un problème de principe.

Maintenant je me demande si le mode est véritablement un moment de la distribution normale ou c’est juste quelque chose que l’on ajoute comme ça parce que dans la pratique (lorsqu’on modélise une distribution réelle d’après une distribution normale) mode, médiane et moyenne se recoupent. Je ne suis pas mathématicien alors je suis un peu en peine de répondre à cette question et de savoir si la proposition initiale est correcte voilà pourquoi je me permets de solliciter votre aide :-).

J'espère avoir réussi à être assez clair dans mes formulations, je ne suis pas mathématicien de formation alors certaines de mes formulations risquent de piquer les yeux de certains, je m'en excuse d'avance.
Merci d'avance pour votre aide :-)

Réponses

  • Bonjour.

    Tu te perds en oubliant que la loi Normale varie continument. Et que la probabilité que des valeurs prises par une variable gaussienne (Normale) est nulle.
    Cependant, si on arrondit les valeurs obtenues dans un échantillon gaussien, il arrive que deux arrondis soient égaux et ça arrive plus vers la moyenne qu'ailleurs.

    Ensuite, si tu prends une série statistique, discrète par nature, elle ne sera pas Normale, et des valeurs égales peuvent survenir.

    Attention, le(s) mode(s) pour une variable aléatoire continue est un maximum (relatif ou pas) de la densité. La notion est très différente du mode d'une série statistique.

    Cordialement.
  • [Inutile de reproduire le message précédent. AD]
    gerard0
    Merci pour cette réponse, je me permets d'essayer de reformuler pour voir si j'ai bien compris.

    Donc si je comprends bien le premier point, la distribution normale variant continuement la probabilité d'obtenir une valeur est nulle c'est bien cela ? Donc ma première analyse devrait nécessairement prendre le pas sur la seconde ? Je pensais que mode = médiane = moyenne était une propriété de la distribution normale continue, d'où l'impression de contradiction, mais il me semble votre point sur le mode pour une variable aléatoire vise à résoudre la contradiction. Justement une question à ce propos.

    " Attention, le(s) mode(s) pour une variable aléatoire continue est un maximum (relatif ou pas) de la densité. La notion est très différente du mode d'une série statistique."
    => Pourriez-vous un peu développer la différence entre les deux ? J'avoue que défini comme ça j'ai l'impression que les deux sont similaires. Si le mode est le maximum de la densité, cela n'implique-t-il pas que c'est aussi là où se situent un maximum d'individus ? J'ai l'impression que cela revient au même que dans une série statistique.

    Oui, je me disais aussi que dans une série statistique discrète il est tout à fait possible d'avoir des valeurs égales qui surviennent mais j'essaye vraiment d'en rester à ce que me dirait une loi normale théorique (justement pour contraster entre le cas idéal et l'approximation réelle).
  • Reprenons ta toute première phrase :
    au sein d’une distribution normale le plus grand nombre d’individus qui partagent une même valeur doit se situer au niveau de la moyenne/médiane/mode. Par exemple : si 30 % est le pourcentage le plus élevé d'individus partageant une même valeur (mettons que 30% mesurent 1.80m) dans une distribution normale, cette valeur doit nécessairement correspondre à la fois la médiane, la moyenne et le mode de la distribution.

    C'est correct.

    Tu prends un exemple, la taille des individus. La taille, c'est une longueur, les valeurs sont des nombres réels. Je ne mesure pas 1m80, je mesure 1m80040534 , mais, par facilité, ou suite à l'imprécision des instruments de mesure,on arrondit à 1m80.
    Et en statistiques, on fait toujours ça. Même si on travaille avec des valeurs continues (et donc en théorie, probabilité nulle d'avoir 2 fois la même valeur), dans les faits, on travaille avec des valeurs discrètes.

    Tu te fais des noeuds dans le cerveau avec ces valeurs 'continues', mais tu as tout bien compris.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
  • Ce qui peut être Normal, c'est une variable aléatoire. Pour une série statistique, on dit parfois qu'elle est Normale si on peut la considérer comme une série approximative de valeurs d'une VA gaussienne. Mais c'est le modèle probabiliste dont on parle.
    Pour une série statistique, les valeurs sont discrètes, on peut parler de la valeur la plus fréquente. Pour une VA discrète on peut parler de la valeur de plus grande probabilité. Pour une VA continue ça n'a pas de sens : toutes les valeurs ont la même proba : 0.

    Cordialement
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!