Une variable aléatoire simple (et classique ?)

Bonjour
Sur une table je place x=30 piles de y=4 cubes puis 120 fois je choisis une pile au hasard et j'y enlève le cube du dessus. Soit n un entier entre 1 et 120. Soit T_n = le nombre de piles restantes avant la n-ème étape. Quelle est la loi de T_n ? (par exemple la première proba ne valant pas 0 ou 1 est P(T_5=29)=1/30**3 )
C'est si simple que c'est connu, non ? (??)

(notant p_n,q_n,r_n et s_n les probas de tomber sur une pile de 4, 3, 2, 1 cube à la n-ème étape, j'obtiens laborieusement mais facilement des formules de récurrence avec un arbre à 16 branches mais ce maudit nombre T_n est omniprésent dans ces formules.)

Réponses

  • Bionjour,
    Le choix de la pile reste équiprobable entre les piles restantes, quel que soit le nombre de piles restantes et leur hauteur ?
  • Oui : "je choisis une pile au hasard "
  • Salut. Je dirais que la loi est multinomiale ?
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • jkent
    Modifié (3 Feb)
    Non il n'y a pas 'remise'. Dans cet ordre de vocabulaire D = la durée de vie de la première pile qui disparait c'est 4+T où T suit une loi binomiale négative de paramètres 1/30 et 4 (nombre d'échecs avant le 4 -ème succès) [puis pour la deuxième on remplace 1/30 par 1/29 etc ...  1/T_n ? Non !] ; mais ça ne sert à rien car les 30 durées de vie ne sont pas indépendantes. Mon objectif au départ c'était représenter les suites p_n, q_n, r_n et s_n avec Python mais je n'y arrive qu'en simulant cette maudite var aléa T_n.
  • Voici les résultats en PJ.
    Mode de lecture : 
    Après 10 tirages,
    la probabilité d'avoir 0 pile vide est de 0.9933853396982, 
    la probabilité d'avoir 1 pile vide est de 0.006612683989193,
    la probabilité d'avoir 2 piles vides est de 0.000001976312590037
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • gebrane
    Modifié (6 Feb)
    Je reformule le problème 
    Énoncé
    32 boîtes initialement pleines (4 boules chacune). À chaque tirage, on retire une boule d’une boîte choisie uniformément au hasard. ( si la boite est déjà vidée on n'enlève rien bien sûre)
    Soit T_n le nombre de boîtes vidées après n tirages 
    Question donner la loi de T-n 
    effacé  Erreur sur l'interpretation voir message du Gabu
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • Bonjour,
    @gebrane , ta reformulation me paraît fautive sur deux points :
    1) D'où sort ce 32 alors que le problème original concerne 30 piles ?
    2) Selon toi, on aurait toujours à choisir parmi 32 boîtes, vides ou non. Or j'ai expressément posé la question : le choix au hasard se fait parmi les piles restantes. Dans ton histoire de boîtes, il faut donc jeter une boîte dès qu'elle est vide, et ne choisir que parmi les boîtes restantes (non vides).
  • Bonjour Gabu, 
    Pour le 32, c'est mon problème de vison 
    Si j'aurais le temps, je vais chercher une formule générale avec ta formulation ( je crois que lourrran a interprété l'énoncé comme moi vu son calcul de T-10  pour écrire un code )
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • Bonjour,

    > Si j'aurais le temps ...
    Si j'aurais su, j'aurais pas v'nu ...

    Cordialement,
    Rescassol

  • A chaque tirage, s'il reste $n$ boites non vides, chacune de ces $n$ boites a une probabilité $\frac1n$ d'être tirée.
    Du coup, au bout de $120$ tirages, j'ai une probabilité de $1$ d'avoir vidé les $30$ boites. 
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • jkent
    Modifié (5 Feb)
    Merci pour ces réponses.
    lourran stp quel est le code donnant cette sortie ? (les chiffres de la toute fin me surprennent)
    gebrane jolie formule mais comme le dit GaBuZoMeu la probabilité pour une pile, ou une boite,
    d'être choisie n'est 1/30 que durant les 4 premières épreuves. Ensuite c'est 1/T_n, ce qui, je crois,
    embrume le paysage.
    Si ce fil se poursuit, merci svp de respecter les notations x=30, y=4 mais surtout n et T_n du texte de départ.
    Si ce sujet vous semble gratuitement abstrait, demandez à un(e) ami(e) anxieux(se) ou à un(e) pharmacien(ne) de vous décrire le contenu d'une boite de 30 comprimés ('quadrisécables') de Lexomil !
  • Il est commode de considerer l'ensemble comme une chaine de Markov $Y^n=(Y_1^n,Y_2^n,Y_3^n,Y_4^n)$ ou a l'instant $n$ le nombre $Y^n_k$ designe le nombre de piles qui ont $k$ elements. On a evidemment $Y_1^n+2Y_2^n+3Y_3^n+4Y_4^n=120-n$ et $T_n=|Y^n|=Y_1^n+Y_2^n+Y_3^n+Y_4^n$. J'ai prefere imaginer les etats comme un diagramme de Ferrers ou de Young comprenant $Y_4^n$ lignes de 4 carres, en dessous $Y_3^n$ lignes de 3 carres, etc. Mais c'est affaire de gout et n'est pas important.

    En analysant le passage de $Y^n$ a $Y^{n+1}$ je trouve l'esperance conditionnelle suivante, en ecrivant $z^{Y^n}=z_1^{Y_1^n}z_2^{Y_2^n}z_3^{Y_3^n}z_4^{Y_4^n}$:
    $$E(z^{Y^{n+1}}s^{|Y^{n+1}|}|Y^{n})=z^{Y^{n}}s^{|Y^{n}|}\frac{1}{|Y^n|}\left(\frac{Y_1^n}{sz_1}+\frac{Y_2^n}{z_2}+\frac{Y_3^n}{z_3}+\frac{Y_4^n}{z_4}\right).$$ On remarquera la difference de traitement entre $Y_1^n$ et les trois autres puisque ce n'est seulement quand on touche aux piles de 1 que $T_n=|Y^n|$ est modifie.

    Et maintenant on ecrit $f_n(z,s)=E\left(z^{Y^{n}}s^{|Y^{n}|}\right)$ qui en principe donne la loi de $Y^n$. En principe car cette suite de fonctions est definie par la formule de recurrence


    $$f_{n+1}(z,s)=\int_0^s\left(\frac{\partial}{\partial z_1}+\frac{1}{t}\sum_{k=2}^4\frac{\partial}{\partial z_k}\right )f_n(z,t)dt$$ avec comme condition initiale $f_0(z,s)=z_4^{30}s^{30}.$

    J'espere ne pas m'etre trompe.


















  • J'avais fait un premier programme dans un langage très exotique. Je l'ai refait, en golang. Bonne nouvelle, les résultats sont strictement identiques, mais c'est normal, vu que même si je n'avais pas l'autre programme sous les yeux, j'ai repris exactement les mêmes idées, les mêmes astuces.

    Ca manque cruellement de commentaires, mais je peux en ajouter si tu veux.

    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Iourran et P.2
    Merci beaucoup pour vos surprenantes et splendides réponses,
    perspectives de longues lectures et réflexions pour moi   -_-   -_-   -_-
  • La formule analytique est un casse tête.  Bonjour Gabu as tu trouvé une formule?
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • gebrane
    Modifié (6 Feb)
    ok
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • En passant, penser, comme moi au départ de ce fil, à ce problème avec un arbre à 16 branches est une tragique hérésie, comme on va le voir. Je n'ai pas su utiliser les chaines de Markov de P.2 alors j'ai demandé à chat gpt de me traduire le programme Go de Iourran en Python. Il l'a fait en POO dont je ne suis pas fan donc je l'ai un peu modifié puis je l'ai remodifié pour représenter les 4 suites. J'ai mis longtemps à comprendre que ce programme est subtil. Le doc joint, inélégant, permet de vérifier les chiffres qui suivent (qui m'effraient quelque peu).
    En clair effectuer les 120 épreuves c'est parcourir 120 sommets d'un graphe probabiliste orienté qui en compte 46 375.
    Un sommet après l'étape n c'est un 5 uple (a,b,c,d,p_i)= (nb de piles de 1, ... de 2, ...de 3, ...de 4, proba) avec a+2b+3c+4d=120-n et où p_i est la proba d'être sur ce sommet à l'étape n. Le départ est toujours (0,0,0,30,1) et l'avant dernier est (1,0,0,0,1). De chaque sommet on peut joindre au plus 4 sommets (et il y avait au plus 4 sommets précédents possibles). C'est à l'étape 60 qu'on a le plus de nouveaux sommets : 956, on en a le même nombre aux étapes 59 et 61 (950) etc ... (je n'ai pas la preuve mais ça doit être simple). Le principe (Bravo !) de l'algorithme de Iourran est de passer de la liste des sommets de l'étape n à celle de ceux de l'étape n+1 ... sans s'embrouiller ...
    Sur le doc ce sont en fait des 6-uples car il y a aussi au début z=le nombre de piles disparues (ma question initiale mais ça ne sert à rien dans le graphe car z=30-a-b-c-d).

    En passant la formule genre crible de Poincaré qui a disparu du fil était peut être correcte en un certain sens : on peut imaginer qu'il y a toujours 30 cas équiprobables à chaque étape : si on choisit une 'pile vide' on recommence le choix, dans le graphe probabiliste il y a une flèche de plus pour chaque sommet mais les probas de transition sont proportionnelles à celles du précédent modèle, ça ralentit, et surtout ça ralentit de plus en plus !, mais 'il se produit les mêmes événements' et je crois qu'on pourrait adapter l'algorithme de Iourran pour calculer . Bien sûr il y a alors bien plus de 120 étapes ...
    Si le fichier .py ne passe pas je le mettrai en texte.
  • Oups c'est moche, je ne sais pas ce que va devenir l'indentation.
  • Bonjour, il est intéressant si @lourrran soit encore généreux pour donner un code où 'il y a toujours 30 cas équiprobables à chaque étape : si on choisit une 'pile vide' on recommence le choix
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • jkent
    Modifié (13 Feb)
    J'avais oublié : on voit un 'décrochement' à droite des courbes, ce n'est pas une accumulation d'erreurs d'arrondis.
    Alors voilà un ex pour vos élèves (je suis retraité et ne sais plus s'il y a les graphes probas en terminale) : montrer, sans Python bien sûr !, que q_119> q_118. J'ai mis la réponse dans le doc joint (où j'ai vérifié que les indentations sont correctes). De même r_117 > r_118.
    Par ailleurs la symétrie de la courbe rajoutée (f=nouv/1000 qui a son max à f(60)=0,956) est simple.
  • lourrran
    Modifié (13 Feb)
    @gebrane
    Dans le code que j'ai posté, il y a l'instruction nb := 30 - qt1.nb[0]
    Remplaçons là par nb := 30

    Et par ailleurs, dans la fonction main(), on va remplacer le 120 par 130 ou 140 ou  .... n'importe quel nombre au choix ; en effet, avec cette variante, la partie peut durer très longtemps si on est vraiment malchanceux.

    Dans la version Python de jkent, c'est quasiment la même chose :
    remplacer le calc=x[i]/(30-x[0]) par  calc=x[i]/30    
    Et remplacer le 119 de la boucle principale par un autre nombre plus grand, au choix.

    Je n'ai pas testé, il y a peut-être un autre changement à effectuer, mais en relisant rapidement le code, ça devrait être bon.

    @jkent
    Pour ceux (comme moi) qui n'ont pas installé Python sur leur poste, et qui ne peuvent pas visualiser cette courbe, peux tu la poster. Et clarifier un peu ce que représente cette courbe.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • jkent
    Modifié (13 Feb)
    Iourran
    'Dans la version Python de jkent, c'est quasiment la même chose'
    ben oui puisque mon code est une copie du tien,
    en passant re-bravo et re-merci pour la leçon d'algo et de maths,
    j'ai juste remplacé qt1, qt2, qt3 qui m'épuisaient (qt= quantité temporaire ?) ... par des x,y,   u,v ...

    Je considère ce problème résolu,
    'remplacer le calc=x[i]/(30-x[0]) par  calc=x[i]/30' je ne le ferai que si un jour je m'ennuie
    je crois franchement qu'on obtient 'les mêmes courbes' pour les suites p q r s, un peu aplaties,
    on tombe parfois 'à côté',
    de plus en plus aplaties quand n augmente,
    on tombe de plus en plus souvent à côté,
    c'est pas une affinité de rapport constant, 
    bref c'est le même graphe avec pour chaque sommet, dès l'étape 5, une flèche qui revient vers le sommet,
    avec une étiquette de plus en plus grande, vers la fin c'est 29/30).
    Bref si cette version a un intérêt c'est seulement si elle permet de donner une formule explicite, sans récurrence,
    ça j'en sais rien, un morceau de la formule genre crible me semblait disons 'audacieux' (= je veux dire : incompréhensible pour moi).

    'Pour ceux (comme moi) qui n'ont pas installé Python sur leur poste'
    Tu blagues ! Installe vite Python.
    J'ai mis 5 courbes dans le code (mon objectif pour p q r s était : ressemblent elles à ce que j'imagine ? réponse oui,
    à part le décrochement évoqué à 16h 16)
    on pourrait rajouter (T_n), ma question initiale mais j'étais vraiment 'à côté de la plaque', peu distrayante, monotone.

    Cette question m'a énormément amusé, c'est grace à toi que je l'ai comprise, merci !   -_-



  • merci lourrran 
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


  • lourrran
    Modifié (13 Feb)
    @Gebrane
    Mon message précédent était erroné, c'est un peu plus compliqué que cela.
    En pièce jointe la fonction fftraite() adaptée pour ta demande, le reste du programme ne change pas.
    Au bout de 120 tirages, dans cette variante, il reste généralement entre 15 et 20 boites non vides.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • J'ai envisagé une nouvelle version. 
    Ici, on numérote les boules, on répartit aléatoirement les boules dans les 30 boites (4 boules par boite), et on tire dans l'ordre la boule 1, puis la boule 2 etc etc.  (ou encore, c'est strictement pareil au final : quand il reste k boules, chaque boule a une probabilité 1/k d'être tirée). Ca change sensiblement le profil.
    Dans la version originale, après 10 tirages, la probabilité d'avoir encore 0 boite vide était de 99.3% ; avec cette variante, on est encore à 99.92% : en gros, avec cette variante, les boites se vident toutes au même rythme, alors que dans la version originale, certaines peuvent se vider beaucoup plus vite que d'autres.
    En fin de process, l'écart est flagrant. Quand il reste seulement 2 boules, dans la version originale on avait une probabilité 34% qu'elles soient dans la même boite, et cette probabilité tombe à 2.5% dans cette version.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Tres interessant
    Lorsque notre cher Nico, le professeur, intervient dans une question d'analyse, c'est une véritable joie pour les lecteurs..


Connectez-vous ou Inscrivez-vous pour répondre.