I.i.d dans la vraie vie

Sn
Sn
Modifié (November 2023) dans Statistiques
Bonjour
J'étudie actuellement un cours de statistique. Or, celui-ci s'appuyant principalement sur le théorème centrale limite et donc sur l'hypothèse i.i.d, je me demandais à quel point cette hypothèse était réelle dans la vraie vie. Par là, avez-vous des exemples où cette hypothèse est presque vérifiée ou même vérifiée ? 

Aussi, existe-t-il un moyen de calculer l'erreur de l'hypothèse i.i.d ? Est-ce que c'est la notion de biais qui se rapporte à cette question ?
Bien à vous,

Réponses

  • Bibix
    Modifié (November 2023)
    Bonjour,
    Cette hypothèse est extrêmement difficile à obtenir en pratique mais c'est possible dans certains cas bien spécifiques. Par exemple, si tu veux tirer une population au hasard en France, tu prends une loi uniforme et tu fais une simulation pseudo-aléatoire et dans ce cas, les données seront vraisemblablement i.i.d. . Tu peux tester l'indépendance avec le test du $\chi^2$ par exemple. Il existe aussi des tests statistiques pour tester si deux variables ont la même loi (avec des estimateurs basés sur la divergence KL par exemple, il me semble). Mais pour des données réelles, on n'a en général pas l'indépendance et ça peut même arriver qu'on ait un "distribution shift", un décalage par rapport à la loi pour certains échantillons. L'indépendance n'a rien à voir avec le biais mais l'hypothèse de même loi peut devenir fausse à cause d'un biais, effectivement. Cependant, l'hypothèse de même loi peut être fausse même si le biais est nul. L'hypothèse i.i.d. est très forte en fait.
  • gerard0
    Modifié (November 2023)
    Bonjour.
    "Dans la vraie vie", il n'y a pas de variables aléatoires, de populations infinies, etc.
    Il ne faut pas confondre les statistiques (sujettes à des imprécisions dans le recueil des données) avec les modèles probabilistes utilisés.
    C'est la même chose dans le reste des utilisations des maths; par exemple, si tu achètes 3 kg de pommes de terre à 2,15 € le kg, tu paies 6,45 €, mais tu n'as pas exactement 3 kg, mais, à la précision de la balance près entre 2,995 et 3,005 kg. Mais ça n'a pas d'importance.
    Cependant, les expériences faites sur des "pile ou face" ou jets de dés équilibrés (numéros peints, pas creusés) montrent que sur des milliers d'expérience, le biais ne dépasse pas les effets de l'aléatoire. Même chose pour les création de suites aléatoires de bits par des moyens physiques.
    Pour les biais dus à la non adéquation des modèles, les spécialistes des sondages ont pas mal étudié ça, tu peux voir leurs travaux dans des bouquins de fond sur les méthodes de sondage. D'autres se sont intéressé à la question pour les mesures scientifiques et techniques, comme Michèle Neuilly.
    Cordialement.
  • fredaulycee2
    Modifié (November 2023)
    Salut,
    la question est plutôt dans quel cas peut on considérer que des variables sont i.i.d, un exemple que j'ai vu il y a peu :
    -si tu vends des assurances auto, tu peux considérer que tes sinistres adviennent de façon indépendante, c'est à partir de cette hypothèse que tu calcules le montant de ta prime d'assurance ;
    -si tu vends des assurances de crédits immobiliers, tu peux faire cette même hypothèse.
    Dans le premier cas c'est pour l'instant empiriquement justifié, dans le second cas ça l'était jusque en 2008 et le fameuse crise des subprimes.
    Un autre exemple, qui relève peut-être de la légende urbaine, est le jeu de la française des jeux "tapis vert", les joueurs choisissaient dans un jeu de 32 cartes, une carte de chaque couleur, un tirage au sort façon loto était effectué et le gagnant remportait 2000 fois sa mise. L'hypothèse utilisée pour modéliser ce jeu et calculer l'espérance était que les joueurs effectuent leur choix de manière indépendante... hypothèse justifiée jusque au jour où le tirage façon loto a donné un bon vieux carré d'as...
    Bonne journée
    F.
  • Exact. Et les gains n’étaient pas corrélés aux recettes. Assez dingue quand on y pense. Un des gars du projet ne devait pas être complètement scientifique (sans faire insulte ! c’est une manière de parler). 
  • hx1_210
    Modifié (November 2023)
    C'est une excellente question que je me suis également posée (j'ai fait mes études à l'époque du règne de Jérôme Kerviel).
    Ma réflexion personnelle m'avait amené à la conclusion suivante : les mathématiques connaissent bien le cas iid et mal les cas non iid, et l'on modélise donc à tort des situations clairement non iid (la valeur d'une action) par des situations iid car sur un temps court cela fonctionne et permet de donner une justification scientiste, difficilement contestable par des béotiens (comme les épicycloïdes).
    Je me suis fait d'ailleurs la même réflexion lors des débat enflammé sur l'évidence based médecine lors de la crise covid. Il y a loin de la théorie à la pratique.
    Après je ne suis pas spécialiste sur le sujet. 
    Voici une vidéo de vulgarisation intéressante à ce sujet.
  • Remporter 2000 fois sa mise, c'est un slogan fort, qui a certainement séduit plein de joueurs, même si on a seulement une chance sur 4096 de gagner.
    Je pense que la FdJ a gagné plein d'argent avec ce jeu, même si une fois, sur un tirage, elle en a perdu.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
Connectez-vous ou Inscrivez-vous pour répondre.