Représentation en histogramme (amplitudes de classes distinctes)
dans Statistiques
Bonjour à tout le monde, 😀
Comme le message est long, j’en décris l’objet essentiel : histogramme avec des rectangles de largueurs différentes : faut-il laisser l’axe des ordonnées ou l’effacer ?
Comme le message est long, j’en décris l’objet essentiel : histogramme avec des rectangles de largueurs différentes : faut-il laisser l’axe des ordonnées ou l’effacer ?
À la suite d’un échange, je me suis intéressé à cette représentation. Je ne sais pas finalement si elle est très utilisée. Je mets des numéros dans mon message pour cibler précisément si besoin les échanges.
0) Les diagrammes en bâtons sont plutôt faits pour représenter des séries qualitatives ou pour les séries quantitatives dont le phénomène n’est a priori pas continu (pointures de chaussures [entiers ou moitié d’entiers], âge en années [nombres entiers]).
L’axe des abscisses contient les différentes valeurs, et quand c’est qualitatif, l’ordre importe peu.
L’axe des ordonnées contient les effectifs (ou les fréquences).
On lit sur plusieurs documents que les histogrammes représentent essentiellement des séries quantitatives dont le phénomène est continu (taille d’un animal, masse, etc.).
Cela conduit à effectuer « coller des bâtons » et à effectuer des regroupements par classe. Vient alors la question des amplitudes des classes.
1) Lorsque les regroupements par classe ont la même amplitude, ça ressemble beaucoup aux bâtons, sauf qu’on colle bien les rectangles (phénomène continu : l’axe des abscisses est comme la droite réelle) et que l’on peut laisser l’axe des ordonnées gradué avec les effectifs.
On lit ce qui ressemble à un théorème : les hauteurs des rectangles sont proportionnelles aux effectifs (resp. aux fréquences).
2) Lorsque les regroupements par classe n’ont pas la même amplitude, ce sont les aires des rectangles qui doivent [par définition de l’histogramme] être proportionnelles aux effectifs (resp. fréquences).
Je m’amuse alors à regarder des documents ici et là et je m’aperçois que l’on laisse l’axe des ordonnées sur des histogrammes dont les largeurs de rectangle sont distinctes (ce qui signifie des regroupements avec des amplitudes différentes).
3) Je trouve cela très peu pertinent puisqu’alors « la hauteur » du rectangle n’a aucun rapport (« visuel ») avec l’ordonnée correspondante.
En effet, on devrait selon moi plutôt colorier un élément d’aire [en général un carreau ou quelques uns pris sur le quadrillage] en guise de légende pour indiquer les effectifs (resp. fréquences).
4) Dans certains documents on introduit d’autres grandeurs comme « densité de fréquence ».
Cela ressemble ensuite à une cuisine de chiffres et de tableaux.
Mes interrogations :
a) je cherche des histogrammes dans la presse ou autres médias avec des amplitudes distinctes (différentes largeurs des rectangles).
b) dans lesdits histogrammes, l’auteur a-t-il conservé l’axe des ordonnées ? N’est-ce pas maladroit ?
c) je ne sais pas où chercher une source qui parlerait de cela [la maladresse ou la mise en garde de laisser l’axe des ordonnées sur le graphique].
a) je cherche des histogrammes dans la presse ou autres médias avec des amplitudes distinctes (différentes largeurs des rectangles).
b) dans lesdits histogrammes, l’auteur a-t-il conservé l’axe des ordonnées ? N’est-ce pas maladroit ?
c) je ne sais pas où chercher une source qui parlerait de cela [la maladresse ou la mise en garde de laisser l’axe des ordonnées sur le graphique].
Désolé, mon message est très très long.
Bonne journée à tout le monde.
Dom
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
tu ne réponds pas vraiment au problème, car il n'y a pas a priori "des classes très petites avec chacune un nombre assez grand d'observations". Cependant, l'axe des y a une signification (et même une unité si on veut), qui est la densité de fréquence moyenne (dite "fréquence corrigée"). Et elle peut servir pour comparer à des modèles quand la population est très nombreuse et les classes de tailles comparables.
Si cela t'intéresse @Dom et si le mot didactique ne te fait pas fuir, tu peux lire ce document de l'IREM (Institut de Recherche sur l'Enseignement des Mathématiquse) https://www.univ-irem.fr/corfem/Actes_2007_07.pdf
Tout d'abord, il n'y a pas unanimité puisque certains auteurs de manuel scolaire font le choix d'un axe des ordonnées absent avec une unité représentée à l’aide d’une surface.
Mais selon les auteurs de ce document, il est dommage de ne pas questionner les élèves et les enseignants sur la signification que l'on peut donner à l'axe des ordonnées, c'est à dire une densité de fréquence (fréquence par unité des valeurs de la variable) qui peut servir à l'introduction de densité de probabilités plus tard.
Non, non, ni « didactique », ni « pédagogie » ne me font fuir. Je vais regarder cela avec intérêt.
Dom
En réalité, que les amplitudes des classes soient identiques ou pas, ce sont systématiquement les aires qui doivent être proportionnelles aux effectifs. Le cas des amplitudes identiques n'est qu'un résultat trivial découlant des définitions. Je te laisse le vérifier.
Cela a peut-être même des vertus pédagogiques en compréhension.
Un exemple que j'utilise parfois pour sensibiliser les étudiants aux effets d'échelle : les demandeurs d'emploi selon différentes chaines télé (je ne félicite pas le service public)
-- Schnoebelen, Philippe
Cordialement.
En lisant ce fil, une question ( niveau collège ou lycée) me vient ( puisque on parle d'histogramme) sur le calcul du mode. Normalement la classe modale est la classe qui contient le plus grand effectif corrigé. supposons que notre série statistique classée présente deux classes modales. Est-ce que dans ce cadre "le" mode existe ( en cherchant par interpolation les modes des deux classes modales et de choisir le plus grand en effectif) ou bien on va dire que "le" mode dans ce cas n'a pas de sens.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
je ne crois pas que cela soit vrai.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
La médiane est très utile, on s'en sert même parfois pour corriger la moyenne (séries symétriques avec valeurs aberrantes). Le mode est rarement utile. Et l'usage des séries connues par intervalles diminue (on s'en sert un peu lorsque les valeurs exactes sont sans intérêt, en faisant attention aux limites d'intervalles - dans ce cas, la valeur exacte d'un mode est aussi sans intérêt).
Je confirme mon propos.
Cordialement.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
quel est le rapport ?
(au passage, c’est bien déterministe si l’on procède par interpolation comme cela a été fait …)
1) Peux-tu fournir une définition de ce qu’est une médiane, gebrane ?
2) Peux-tu fournir une définition de ce que sont les quartiles ?
Discuter sur du vide… tu ne sais faire que cela ?
-- Schnoebelen, Philippe
Question pourquoi rendre unique la médiane !? Comme tu sais la médiane est importante car elle est robuste aux valeurs extrêmes ou aberrantes, contrairement à la moyenne qui peut être influencée par celles-ci. De plus, la médiane est également utilisée dans les calculs de probabilités, où elle est définie de manière unique pour une distribution donnée.
Ainsi, l'unicité de la médiane en statistiques descriptives est importante pour se conformer aux calculs de probabilités, où une distribution est caractérisée de manière unique par sa médiane.
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
On ne saura donc jamais.
mode. L’as-tu fournie ? Tu n’as que proposé un « normalement… patati ».
"Tu ne me lis pas donc ! J'ai dit : "Pour le mode, j'avais un doute sur la définition officielle dans le cas d'une série classée bimodale.
Nous connaissons "tous" la définition du mode (par interpolation, voir mon dessin) pour une série classée unimodale. Je me posais la question pour une série bimodale. pourquoi veux-tu que je fournisse une définition ( cas bimodale) que je ne connais pas moi même ?
Gerard, Dans ton dernier message, tu pinailles sur la "normalité d'une distribution" comme si tu n'avais jamais entendu de questions sur "la normalité des données". Mais j'attendais une suite de ta part sur l'utilité ou non du mode après ce que j'ai dit."
"Pour ceux qui nous suivent, nous ne faisons que discuter, mais il n'y a pas de place pour troller."
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique
Citation : Je ne fais plus les maths uniquement le Français et l'info-chimique