Simulation : approximation d'une variable aléatoire X continue par une variable aléatoire Y discrète
Réponses
-
Si ton problème est le suivant.
Peut-on simuler une variable aléatoire à valeurs réelles non bornées, par une variable aléatoire discrete ?
Alors la réponse est oui, en utilisant la fonction de répartition empirique : méthode du bootstrap.
https://fr.wikipedia.org/wiki/Fonction_de_répartition_empirique
Je pourrai détailler si besoin, une fois que j'aurai bien compris ton problème. -
Bonjour.Avec les informations que tu as, tu peux remplacer la borne infinie par une borne finie. Éventuellement très grande. Car la moyenne interdit d'avoir des valeurs infinies. Par exemple avec deux classes, 10 individus dans [0,100[ et 12 dans [100,+oo[ et une moyenne de 200, les 10 contribuent au total des valeurs (200(10+12) = 4400) pour 10*50 = 500. Les 12 représentent donc 3900, ce qui, dans la pire des situation (11 à 100 et 1 plus grand) donnent 11*100+2800 = 3900. Donc tu es sûr que le deuxième intervalle est [100,2800], si la moyenne des 10 est bien 50. Si elle est plus faible, il faudra augmenter 2800; au pire (10 valeurs à 0, 11 à 100), on aura 10*0+11*100+3300 = 4400, et l'intervalle [100, 4400] convient.Par contre, sans information sur la répartition dans les classes, l'hypothèse classique n'est pas "toutes les valeurs au centre de classe", mais "répartition uniforme dans la classe". C'est ce que j'avais pris pour prendre 50 de moyenne pour les 10. Vu ton histogramme, ce n'est pas très réaliste.Cordialement.
-
Merci beaucoup gerard0, c'est effectivement une bonne méthode pour déduire jusqu'où on peut mettre la borne finie pour la dernière tranche, je valide.Pour de la répartition des valeurs à l'intérieur d'une classe [a,b]... Ce que vous me dites en gros, c'est que si on veut tirer 10 valeurs dans [a,b] sans connaitre sa vraie répartition, alors c'est mieux de prendre l'hypothèse uniforme, et de tirer 10 valeurs selon la loi U([a,b]) plutôt que de tirer 10 valeurs fixes égales à (a+b)/2 ?
-
Oui, car si on utilise une statistique par intervalles, c'est que les modalités sont nombreuses et peuvent prendre de très nombreuses valeurs. Donc à priori, plutôt réparties sur l'intervalle que concentrée sur son centre. Dans ton cas, on sent bien qu'une répartition uniforme dans les intervalles trahit une tendance nette à la décroissance, Mais c'est parfois difficile à corriger.C'est pourquoi les statisticiens, maintenant qu'on a des ordinateurs rapides, travaillent autant que possible avec toutes les valeurs, quitte à choisir un modèle adapté pour globaliser.Cordialement.
-
Bonjour Gerard0,
Désolé de relancer ce sujet, mais finalement, je ne pense pas avoir compris ta phrase « Dans ton cas, on sent bien qu'une répartition uniforme dans les intervalles trahit une tendance nette à la décroissance »……qu’est-ce que tu voulais dire par là ?
Quand vous parlez de tendance nette à la décroissance, vous parlez bien de la forme de mon histogramme (à savoir que plus on va vers de grandes valeurs de X, plus elles seront rares) ?
Mais en quoi l’hypothèse d’une répartition uniforme (ou non) au sein des classes trahit cette tendance globale à la décroissance ? Corrigez moi si je me trompe, mais les proportions associées à chaque classe de X sont insensibles à la façon dont sont répartis les valeurs au sein d’une même classe donnée, et donc pour moi la tendance à la décroissance sera conservée.
-
Globalement, oui, mais localement, sur l'intervalle, non.S'il y a 5 valeurs entre 1 et 2, qui sont 1, 1,1, 1,25, 1,4, 1,8, dire qu'on les représente par 5 valeurs 1,5 fausse le résultat.Le choix de la répartition uniforme est en moyenne le moins mauvais choix, mais pas le bon choix.Cordialement.
-
Merci beaucoup, je viens de comprendre votre phrase.
Bonjour!
Catégories
- 165.4K Toutes les catégories
- 62 Collège/Lycée
- 22.2K Algèbre
- 37.6K Analyse
- 6.3K Arithmétique
- 61 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 23 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.8K Géométrie
- 84 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 26 Mathématiques et finance
- 342 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 804 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres