Histogramme ; amplitudes différentes

dans Statistiques
Bonjour,
J'ai une question :
Quand on veut représenter un histogramme avec des classes d'amplitudes différentes : par exemple, études des salaires des employés d'une entreprise : de 1500 à 1600, 1600 à 1700, ....2500 à 2600 puis 2600 à 5000 (dernière classe contenant un très très faible pourcentages de salaires).
Je sais que je dois choisir une unité d'aire afin que l'aire de mes rectangles soit proportionnelles aux effectifs.
Mais voilà ma question : suis-je obligée de graduer mon axe des abscisses avec une unité reportée régulièrement?
C'est à dire, si je choisis 1 cm, entre 1500 et 1600, suis je obligée d'en mettre 24 entre 2600 et 5600 ? (ou dois-je seulement faire attention à l'aire de mon rectangle?)
Je sais que l'axe des ordonnées n'est pas à mettre. Mais je ne sais pas si celui des abscisses doit être un axe gradué avec unités régulières.
Merci!
J'ai une question :
Quand on veut représenter un histogramme avec des classes d'amplitudes différentes : par exemple, études des salaires des employés d'une entreprise : de 1500 à 1600, 1600 à 1700, ....2500 à 2600 puis 2600 à 5000 (dernière classe contenant un très très faible pourcentages de salaires).
Je sais que je dois choisir une unité d'aire afin que l'aire de mes rectangles soit proportionnelles aux effectifs.
Mais voilà ma question : suis-je obligée de graduer mon axe des abscisses avec une unité reportée régulièrement?
C'est à dire, si je choisis 1 cm, entre 1500 et 1600, suis je obligée d'en mettre 24 entre 2600 et 5600 ? (ou dois-je seulement faire attention à l'aire de mon rectangle?)
Je sais que l'axe des ordonnées n'est pas à mettre. Mais je ne sais pas si celui des abscisses doit être un axe gradué avec unités régulières.
Merci!
Réponses
-
Bonsoir,
Tu dois graduer ton axe des abscisses pour que le lecteur puisse le lire !
C'est la règle la plus importante.
Graduer de façon régulière me semble le plus simple.
Si tu bricoles la mesure sur l'axe des abscisses, tu vas devoir bricoler de même la forme de tes rectangles et là je te souhaite bien du plaisir.
e.v.Personne n'a raison contre un enfant qui pleure. -
Bonjour.
A priori, l'axe des abscisses représente l'évolution des valeurs du caractère quantitatif continu que tu représentes? Donc les graduations sont effectivement régulières. Ce qui peut poser des problèmes de représentation qaund les classes sont d'amplitudes trop dissemblables. Si c'est seulement la dernière, on pourra choisir de le la représenter qu'en partie (pointillés pour dire que ça continue). Si c'est général, pas de bonne méthode, mais le choix des bornes de classes est assez douteux.
Cordialement.
NB : Il arrive qu'on puisse utiliser une échelle logarithmique sur l'axe des x, ce qui complique le calcul de la hauteur des rectangles. -
par exemple, on veut représenter quatre classes :
à 13, 13 à 14, 14 à 15, 15 à 16
ayant pour effectifs respectifs 80, 120, 180, 20.
Une élève a voulu représenter un carreau = 5.
Du coup,
son premier rectangle entre 12 et 13 était composé de 4 colonnes de 4 carreaux, soit 16 (16*5=80)
son deuxième entre 13 et 14, était composé de 4 colonnes de 6 carreaux, soit 24 (24*5=120)
son troisieme entre 14 et 15 était composé de 4 colonnes de 9 carreaux, soit 36 (36 *5=180)
et le dernier entre 15 et 16, je me demandais s'il n'était pas possible de faire une seule colonne de 4 carreaux (4*5=20)
Je me disais que tant que l'aire des mes rectangles restait proportionnelle aux effectifs, cela pouvait convenir? -
Bonsoir Gérard,
Si tu choisis une échelle logarithmique sur l'axe des abscisses, en choisissant des rectangles,
tu vas modifier la fonction de répartition, non ?
e.v.Personne n'a raison contre un enfant qui pleure. -
Ben .... de 15 à 16, il y a la même différence que de 14 à 15 ou de 13 à 14, non ? Alors pourquoi représenter différemment ?
De plus, ici, les classes sont de même amplitude !!!! -
Ev,
il s'agit bien de représentation. Un exemple, la répartition des exploitations agricoles dans le sud-ouest. Comme il y a nombre de très petites exploitations, de 1 à 2 ha, voire moins (vignerons, horticulteurs, fleuristes) et aussi de très grandes, de plusieurs centaines d'ha, une représentation linéaire n'est pas possible, l'échelle logarithmique permet de représenter ensemble des ordres de grandeurs différents.
Bien évidemment, rien à voir avec la fonction de répartition. Mais même avec une échelle linéaire, le tracé qu'on fait est très conventionnel (seules les valeurs en limites de classes sont sûres).
Cordialement. -
Oui effectivement, mais ma demande était d'ordre général.
Sinon, ici elles sont d'amplitude égale, mais étant donné que la dernière était associée à un effectif bien plus petit, je me demandais si on pouvait faire juste une colonne plutôt que quatre comme les autres.
En fait, je ne cherchais pas un quelconque intérêt mais me demande si cela est possible mathématiquement, car je ne trouve pas de définition rigoureuse par rapport à ça. On parle seulement d'aires des rectangles proportionnelles aux effectifs. Et moi, elles le sont...
Merci en tout cas de vos réponses. -
Nous sommes d'accord, Gérard.
Je voulais simplement signaler qu'en changeant de représentation, on changeait aussi la répartition des (exploitations agricoles).
En effet en prenant des rectangles, ta courbres des fréquences cumulées croissantes est une fonction affine par morceaux.
Quand tu reviens à une échelle régulière, tes droites deviennent des $y = a\ln x + b$.
Ce qui ne veut pas dire que ton hypothèse de répartition à l'intérieur des classes sera plus mauvaise. J'ai envie de dire qu'elle sera meilleure. Mais elle sera différente. On aura bricolé.
Vois-tu ce que je veux dire ?
amicalement,
e.v.Personne n'a raison contre un enfant qui pleure. -
Tout à fait, Ev.
Mais je n'ai jamais tracé de courbe cumulative sur un graphique logarithmique, ça m'aurait paru malsain. le graphique n'était là que pour "voir". Il me semble que les stats descriptives sont faites pour comprendre, et qu'on ne va pas appliquer des règles pour les appliquer, mais parce qu'on veut être compris.
Pour Novice : Même remarque. Si tu fais un graphique "trafiqué", tu feras apparaître ce qui n'existe pas. Ce n'est pas une question de "mathématiques", mais de but. Certains font des graphiques trafiqués pour cacher la réalité.
Rappel : les statistiques descriptives ne sont pas une discipline axiomatisée, mais une utilisation d'outils pour décrire la réalité le plus fidèlement possible.
Cordialement. -
Merci pour vos réponses,
...Mais je ne comprends pas pourquoi "je trafique" la réalité, puisque l'aire de mes rectangles sera proportionnelle aux effectifs.
Ainsi, un rectangle d'une grande aire type 36 carreaux (4*9) sera bien plus petit que celui de 4 carreaux (1*4).
Je ne comprends pas où il y a erreur ou trafic?
Désolée...j'insiste car je vois vraiment pas le problème étant donné la définition de l'histogramme. -
Désolé pour toi, Novice, mais si tu ne comprends pas que la représentation de 4 intervalles de largeur 1 par 3 intervalles de largeur 4 puis le quatrième de largeur 1, fausse la représentation, je ne peux rien pour toi ....
Ajoutons un effet psychologique : la hauteur des rectangles est elle aussi interprétée par le lecteur (effectif relativisé). Même si on a voulu représenter des aires. -
Ok Gérard, désolé, je pensais que ma question était légitime, on était 3 collegues profs de math à se poser la question.
Merci quand même. -
Je ne comprends pas : Vous étiez trois à vous demander si représenter un intervalle des valeurs de la variable à une échelle différente de tous les autres était une bonne chose ? Raisonnablement, on eng.. les élèves quand ils font ça (je ne parle pas d'utiliser une échelle globale non linéaire, mais de ne pas respecter l'échelle qu'on a choisi). Ou alors je n'ai pas compris ...
Je me suis formé aux statistiques avec mes collègues de lycée quand il a fallu en enseigner en BTS vers 1980. Ils avaient alors commencé à en faire pour des interventions en DEUG AES. On a choisi de faire du travail intelligent, c'est à dire que les buts sont prioritaires sur les méthodes. Par exemple, la médiane et les quantiles sont définis de façon globale par leur interprétation (contrairement aux programmes actuels du secondaire); les fréquences sont arrondies pour tenir compte du fait qu'une autre enquête aurait peut-être donné des effectifs très légèrement différents; les représentations servent à représenter le plus fidèlement possible, avec, pour les variables quantitatives continues, une règle d'équirépartition dans la classe explicitée aux élèves et étudiants, faute de connaissance sur la répartition réelle dans la classe; les courbes cumulatives utilisées avec précaution; etc.
Quand j'ai fait les cours de statistiques descriptives à la fac, en AES, j'ai étudié de près des bouquins d'auteurs reconnus, et à ma grande satisfaction, j'ai retrouvé les mêmes usages que ceux que j'avais enseignés.
Donc en stats descriptives, la première chose est d'être très raisonnable, de servir la compréhension.
Cordialement. -
Tres bien, merci.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.5K Toutes les catégories
- 62 Collège/Lycée
- 22.2K Algèbre
- 37.7K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 23 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 86 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 26 Mathématiques et finance
- 342 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.4K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres