Jeu de dé et répétition

Bonjour (je ne suis ni élève ni étudiant ni prof) question en langage naturel.

Je jette p fois un dé à n faces et je note chaque fois la face "sortie" (=numéro qui apparaît) : quelle est la probabilité qu'une face déjà "sortie" "ressorte" au i-ème coup (ce que j'appelle "répétition", r) ?

Évidemment au premier coup, P(r)=0 et au n+1 coup, P(r)=1. Mais entre ces deux extrêmes ? (je voudrais une formule, évidemment, avec p et n). Autre précision : la "répétition" n'est pas unique, éventuellement : dans la séquence 2-3-3-5-6-1-3-7-5-, j'ai trois r (deux de 3 et une de 5). Question subsidiaire : quelle est la moyenne des répétitions sur i coups ?

Je serais ravi si quelqu'un m'aidait car j'ai déjà proposé cette question sur plusieurs forums de maths ou de sciences mais personne ne me répond.
Si c'est une question stupide ou insoluble, veuillez aussi me le dire, ça ne me vexera pas.
Merci !

Réponses

  • Au 2ème lancer, tu as une probabilité 1/n d'avoir une répétition.

    Ca c'est facile.

    Ensuite, tu dis qu'au lancer n+1 , on a P(r)=1.
    Ca aide à comprendre la question.
    En fait, ce qui t'intéresse, ce n'est pas de savoir si le nombre sorti au lancer n° $n+1$ était déjà apparu. Mais de savoir si au cours des $n+1$ premiers lancers il y a eu au moins un doublon. ... Et comme le dé n'a que $n$ faces, tu peux affirmer qu'il y a eu au moins un doublon.

    Pour un dé à $n$ faces, et i lancers , avec le cas général $i \le n$ , quelle est la proba qu'il y ait au moins un doublon ?
    Dans les dénombrements, quand il y a 'au moins', souvent il faut s'intéresser au cas contraire.

    Pour un dé à $n$ faces, et $i$ lancers , avec le cas général $i \le n$ ... quelle est la proba qu'il n'y ait aucun doublon ?
    Si on sait calculer ça, on prendra le complémentaire pour répondre à la question initiale.

    Proba d'aucun doublon :
    $\frac{1}{n}$ si i=2 lancers
    $\frac{1}{n(n-1)}$ si i = 3 lancers
    Et plus généralement
    $\frac{1}{n(n-1) ... (n-i+2)}$ pour i lancers

    Et donc , 1 - ce résultat pour la question initiale.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Bonjour ; je viens de trouver ta réponse seulement maintenant (j'ai du mal avec le forum ; j'ai répondu à une réponse de quelqu'un d'autre probablement en privé - il y a un sens interdit à côté de son pseudo- et je ne sais pas si mes réponses parviennent, bref peu importe). Je crois avoir parfaitement compris ton raisonnement et je crois avoir compris que je me suis encore mal exprimé...
    J'appelle répétition la ressortie d'une face quelle qu'elle soit. Donc, pour prendre un exemple d'un dé à trois faces avec 3 lancers, les seules séquences sans r sont 1-2-3 (sans ordre) : il y en a 2 par face sortie en premier donc 6 sur 27, ce qui fait une proba de 0.78 pour au moins 1 r, et non 0.92 selon ta formule.
    J'ai l'impression que je dis une bêtise quelque part, mais où ?
  • Oui désolé, j'ai écrit n'importe quoi dans les calculs.

    Le calcul simple, c'est de calculer : probabilité qu'il n'y ait pas de répétition. Jusque là, c'était bon. Mais les calculs après sont totalement faux.

    Au 2ème lancer, il ne faut pas ressortir le même n° qu'au premier lancer : Proba = $\frac{n-1}{n}$
    Au 3ème lancer, il y a n-2 tirages favorables, sur les n tirages possibles. Proba combinée = $\frac{n-1}{n} * \frac{n-2}{n} $

    Et si on a i lancers : Proba = $\frac{n-1}{n} * \frac{n-2}{n} * .. * \frac{n-i+1}{n} $
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Merci de ta réponse ; je viens de me réexpliquer avec l'autre interlocuteur en privé, qui ne peut pas traiter mon problème parce qu'il est mal exprimé (il a bien sûr raison, j'ai l'habitude qu'on ne me comprenne pas), alors je suis fatigué, je reviendrai dans ce forum plus tard, je crois avoir compris son fonctionnement (hier soir j'ai déjà eu du mal à m'inscrire, parce que les mails de validation ne sont pas immédiats) à bientôt, lourran.
  • Bonjour,

    Est-ce que tu cherches la probabilité $p_k$ que la face tirée au $k$-ème lancer ne soit jamais sortie avant ? C'est ce que ton premier paragraphe laisse croire.
    Où alors cherches-tu la probabilité $q_k$ qu'il n'y ait aucune répétition en $k$ tirages ? C'est complètement différent du problème précédent.
    Que veux-tu finalement ? Ce n'est pas un problème de connaissance mathématique, c'est un problème de clarté d'expression.
  • bonjour , je réponds à tous
    je n'ai pas de chance avec les forums, avec l'expression scientifique ou avec la langue française. Il y en a un qui croit que 'répétition" veut dire "occurrence", un autre qui pense que "une face sortie" signifie "une et une seule face particulière sortie", un autre qui estime que cela veut dire "la dernière face sortie".
    'une face sortie' signifie "n'importe quelle face, si elle est sortie au moins une fois" (en français)
    En outre, je mets un exemple pour m'expliquer, mais ça ne sert à rien, apparemment.

    pour Gabuzomeu : si mon premier paragraphe laisse croire ce que tu dis, il faut que je revienne en CM1. Par contre, il signifie bien (à l'inverse, ou en complémentaire) que je cherche la probabilité qu'il n'y ait aucune répétition en k tirages.

    Ainsi, à la séquence 2-3-3-5-6-1-3, je fais correspondre le nombre 0.286, à la séquence 1-2-4-6-3, zéro. Ma question est : pour un dé à n faces que je lance k fois, quels sont les nombres qui vont correspondre à k=2, k=3, k=4,..., etc, même avec k>n, donc un nombre >1.
    Autrement dit : à un moment donné (lequel?) la probabilité qu'une face (ou deux, ou trois, "une" au sens de l'article indéfini) soit déjà sortie sera supérieure à celle où aucune face ne serait sortie une deuxième fois .
    Encore autre façon de m'exprimer :Dès qu'il y a un doublon (ou un i-plet), je rajoute 1 et je redivise par le nombre de lancers ; ça fait quelle courbe? (en abcisse le nombre de jets, en ordonnée le rapport sigma des répétitions sur nombre de lancers)
    Merci à tous de votre aide, et excusez-moi si j'ai encore été obscur, mais je doute de pouvoir mieux faire
  • La question de bien se faire comprendre, c'est toujours difficile. Tu parles beaucoup de ce problème ... un peu trop. Mais c'est effectivement une question essentielle.
    Je ne sais plus qui disait : un problème bien énoncé est à moitié résolu.

    Essayons d'être concret.
    Dans ton mesage, tu posais une première question et une question subsidiaire. (2 questions dans le même message ... c'est peut-être une des raisons des embrouilles, non ?)

    A priori, on considère que la première question est résolue.
    Je résume cette première question : on a un dé à n faces, on le lance plusieurs fois. Et dès que la face qui sort est déjà apparue, on stoppe l'expérience.... et on veut des probabilités sur cette expérience. Comme tu l'as dit : au lancer n°n+1, on est s^^ur que l'expérience s'arrête.
    Et dans un message précédent, on avait les probabilités pour les étapes intermédiaires.

    On passe à la question subsidiaire.

    On lance plusieurs fois notre dé à 6 faces (6 faces dans un premier temps, n faces dans un second temps).
    Si on le lance plein de fois, on va forcément avoir des doublons.
    A partir des résultats des lancers, on calcule un indicateur $x$.
    La formule pour calculer cet indicateur, c'est quoi ?
    1. On a le nombre total de lancers , noté $k$
    2. On a le nombre total de valeurs différentes obtenues , que je vais noter $d$. Donc $d=6$ au maximum ; d=5 dans les 2 exemples 2-3-3-5-6-1-3 et 1-2-4-6-3 ( le 4 n'est pas sorti dans la 1ère série, et le 5 n'est pas sorti dans la seconde).
    3. L'indicateur que tu calcules est donc x = (k-d)/k
    Et on veut calculer l'espérance de ce nombre x.

    En fait, ça revient à calculer l'espérance de d, puisqu'on peut passer de l'un à l'autre par : E(x) = \frac{k-E(d)}{k}$

    Pour fixer les idées, si on a un nombre de lancers très grand , par exemple 100 lancers pour un dé à 6 faces, on est à peu près certain que les 6 faces vont apparaître chacune au moins une fois.
    Et donc, dans la très très grande majorité des cas, x=94/100. Ou éventuellement, très rarement , on n'aura que 5 faces différentes au bout de 100 lancers (proba quasi nulle, mais admettons). Et dans ces cas x=95/100.
    En moyenne , E(x)=94/100.

    Pour les cas intermédiaires, il faut réfléchir un peu plus. J'espère que d'autres vont te répondre dans l'heure, sinon ça va m'empêcher de me concentrer sur d'autre sujets plus importants.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Bon, les calculs sont tout simplement horriblement longs et lourds.

    On lance un dé à $n$ faces $k$ fois de suite. On note $d$ le nombre de faces différentes obtenues, et on veut la loi de $d$.

    On va commencer comme dans un exercice, en posant des questions intermédaires.
    Chaque question intermédiaire s'appuie sur la question précédente. Et à la fin on a (en théorie) la réponse à notre question.

    Q1 : On fait un lancer, qui donne A avec une probabilité $p$, et qui donne non-A avec une probabilité $q=1-p$.
    On répète ce lancer $k$ fois.

    Quelle est la probabilité d'avoir le résultat A à tous les lancers ?
    Réponse : ... ...

    Q2 : On a un dé à n faces. On choisit d faces sur lesquelles on dessine un petit symbole blanc.
    On lance ce dé $k$ fois.
    Quelle est la probabilité de tomber sur une face avec ce petit symbole blanc à tous les lancers ?

    Réponse : C'est en fait la même question que la question 1... en adaptant un tout petit peu.

    Q3 : On a un dé à n faces, on a un nombre d, compris entre 1 et n.
    On veut mettre un petit symbole blanc sur d faces.
    Quel est le nombre de façons de choisir les d faces ?

    Réponse : tirage sans remise ... ...

    Q4 : On a un dé à $n$ faces, on lance ce dé $k$ fois. On a un entier $d$ compris entre $1$ et $n$. Quelle est la probabilité que le nombre de faces différentes vues au cours de ces $k$ lancers soit inférieur ou égal à $d$

    Réponse : application directe des questions 2 et 3.

    Q5 : On a un dé à $n$ faces, on lance ce dé $k$ fois. On a un entier $d$ compris entre $1$ et $n$. Quelle est la probabilité que le nombre de faces différentes vues au cours de ces $k$ lancers soit égal à $d$

    Réponse : application directe de la question 4.

    Et ensuite, on trouve la réponse à ta question.

    Mais, les formules "générales" obtenues à chaque étape deviennent vite très compliquées. Lisibles par des matheux, mais pas par des non matheux.
    Personnellement, je n'ai pas le courage de les chercher, ni de les écrire ici.
    A priori, tu as écrit 2 ou 3 trucs qui font penser qu'avec ce coup de pouce, tu peux trouver la formule toi-même.

    Au pire, ce que tu veux, c'est peut-être des formules avec des symboles mathématiques ( $ \Sigma \C _i ^j $ ) mais plutôt des résultats numériques.
    Pour un dé à 6 faces, que je lance 8 fois, quelle est l'espérance de x ? Et tu veux un nombre, pas une formule.

    Et là, une simulation informatique, en faisant la moyenne de 1000 x 8 lancers, ça donne une très bonne estimation. ... mais on remplace une complexité mathématique par une complexité programmation.
    Tu me dis, j'oublie. Tu m'enseignes, je me souviens. Tu m'impliques, j'apprends. Benjamin Franklin
    L'hypocrisie est pire qu'une vérité qui fait mal. Franck Ntasamara.
  • Michelex : ben oui, je crois bien qu'il faut que tu retournes au CM1.
    toi a écrit:
    Je jette p fois un dé à n faces et je note chaque fois la face "sortie" (=numéro qui apparaît) : quelle est la probabilité qu'une face déjà "sortie" "ressorte" au i-ème coup (ce que j'appelle "répétition", r) ?

    Tu considères l'évènement "une face déjà sortie ressort au i-ème coup". C'est bien ce que tu as écrit, non ? Tu demandes la probabilité de cet évènement, C'est 1 - la probabilité de l'évènement contraire.
    L'évènement contraire est "la face qui sort au i-ème coup n'est jamais sortie avant". Logique élémentaire n'est-ce pas ?
    moi a écrit:
    Est-ce que tu cherches la probabilité $p_k$ que la face tirée au $k$-ème lancer ne soit jamais sortie avant ? C'est ce que ton premier paragraphe laisse croire.

    Je le répète, la phrase de toi que j'ai citée veut dire que tu cherches $1-p_i$, avec ma notation.
    Pourquoi suis-je passé à l'évènement contraire ? Parce que sa probabilité se calcule aisément : $p_i=\left(\dfrac{n-1}{n}\right)^{i-1}$.
  • Ceci dit, et puisque tu t'intéresses visiblement à autre chose :

    Soit $n$ le nombre total de faces, équiprobables. On a une belle chaîne de Markov absorbante avec $n$ états $1,2,\ldots, n$ où l'état $k$ est "on a déjà vu sortir $k$ faces différentes".
    Au premier tirage on est forcément dans l'état 1.
    La probabilité de passage de l'état $k$ à l'état $k$ est $k/n$, la probabilité de passage de l'état $k$ à l'état $k+1$ (pour $k<n$) est $(n-k)/n$. L'état absorbant est bien sûr l'état $n$.
    Si on est dans l'état $k$ après $p$ tirages, c'est qu'il y a $p-k$ répétitions.

    Il est facile d'écrire un petit programme qui, étant donnés $n$, $p$ et $k$, retourne la probabilité qu'on soit dans l'état $k$ au bout de $p$ tirages, et un autre qui donne l'espérance du nombre de répétitions en fonction de $n$ et $p$.
  • "Il est facile de"
    La preuve en python :
    import numpy as np
    # matrice de transition
    def TrMat(n) :
        P=np.zeros((n,n))
        for k in range(n) : P[k,k]=(k+1)/n
        for k in range(n-1) : P[k,k+1]=(n-k-1)/n
        return P
    # espérance du nombre de faces différentes après p lancers
    def EspDif(n,p) :
        if p==0 : return 0
        if p>0 :
            P=TrMat(n)
            Pp=np.linalg.matrix_power(P,p-1)
            V=Pp[0]
            return sum((k+1)*V[k] for k in range(n))
    # espérance du nombre de répétitions après p lancers
    def EspRep(n,p) :
        return p-EspDif(n,p)
    
    Espérance du nombre de répétitions après 20 lancers d'un dé à 20 faces :
    EspRep(20,20)
    
    7.169718448170839

    Et pour 100 lancers d'un dé à 6 faces :
    EspRep(6,100)
    
    94.00000007244805
  • Bonjour,

    Il y a également cette formule très simple qui indique l'espérance mathématique du nombre $R$ de "répétitions" observées au cours d'une série de $k$ lancers successifs d'un dé à $N$ faces: $$ \mathbb E(R) = k-N+ N\left(1-\dfrac 1N \right) ^k.$$
  • Oui, c'est bien plus simple ainsi : l'espérance du nombre de faces différentes apparues en $p$ lancers est $n$ fois la probabilité qu'une face donnée soit apparue, et la probabilité de l'événement contraire "une face donnée n'est pas apparue au cours de $p$ lancers" est $\left(1-\dfrac1n\right)^p$.
  • Salut GaBuZoMeu,

    Tu sembles dire que $R=p-A$ où $A=\:\text{"nombre de faces qui ne sont pas apparues"}.$ Ce n'est pas le cas.
    J'ai considéré pour ma part, $\forall i\in [\![1;N]\!] ,X_i: =\:\text{nombre d'apparitions de la face}\: i\:$ et $\quad R: =\displaystyle \sum_{i=1}^N Y_i,\quad Y_i=\left\{\begin{array}{cl} X_i-1& \text{si}\:X_i>0\\ 0&\text{si}\: X_i =0.\end{array} \right.$
  • Ben non. On sait bien que $r$ est égal à $p$ (le nombre de tirages) moins le nombre de faces différentes qui sont apparues en $p$ lancers : $r=p-\sum_{i=1}^n A_i$ où $A_i=1$ si la face n° $i$ est apparue au cours des $p$ lancers et $A_i=0$ sinon. Et donc $\mathbb E(r)=p-\sum_{i=1}^n \mathbb E(A_i)$.
    Tous les $\mathbb E(A_i)$ sont égaux, et ils sont égaux à la probabilité qu'une face donnée apparaisse en $p$ tirages. La probabilité de l'événement contraire (une face donnée n'apparaît pas en $p$ tirages) est facile à calculer. Et à la fin, on trouve bien sûr le résultat que tu annonces.
  • En effet, je ne sais trop pourquoi j'ai eu, en te lisant, cette apparition d'une "non apparition" .
  • Merci lourran, de ta compréhension (et surtout de ta bienveillance et de ton honnêteté, et ce dès ton premier message) ; la complexité (de formulation et de résolution) de ma question, je la connais depuis longtemps (cela fait plusieurs semaines que je me débats avec ce truc), et je te suis reconnaissant de l'avoir reconnue.
    J'ai fait des approximations sous excel avec des formules de combinatoire classique (gamma de p dans q, anagramme avec répét, etc) et des expériences avec random, et j'étais arrivé à la conclusion qu'il n'y avait pas de formule qui m'aurait donné un résultat du genre : "si je tire 26 fois, je devrais avoir eu en moyenne 8 répétitions depuis le début".
    C'est ma surprise d'ignorant ("tiens, il y a des problèmes de maths élémentaires qui n'ont pas d'algorithme" ; je parle de pbs simples, je ne parle pas des limitations internes des formalismes ou des conjectures insolubles) qui m'a fait m'adresser aux forums des spécialistes, plutôt dans l'esprit "métamathématique" : "le hasard n'est saisissable qu'imparfaitement" ou "il y a qqch quelque chose dans la réalité qui résiste à la mathématique", voyons donc ce qu'en disent les matheux (je rendais déjà fou mon prof de math élem avec mes questions à la noix en 66).
    J'étais absent pendant deux jours, voilà pourquoi je ne réponds qu'aujourd'hui. Je vais maintenant bosser ta réponse, que je n'ai lue qu'une fois et je reviendrai vers toi dans quelques jours.
    Bon courage dans ton travail
  • je réponds à Gabuzomeu
    je veux bien admettre que mon premier paragraphe signifie autre chose que ce que j'ai voulu dire ou que tu as compris autre chose, etc, on ne va pas se disputer pour ça, point final. Un forum ce n'est pas un espace de rivalité de coqs et moi je ne suis qu'un poussin parmi vous.
    Je vois que tu me balances dans le bec une "belle chaîne de Markov absorbante", alors là ça me coupe le caquet. J'allais mettre en vente sur ebay un petit bouquin de l'APMEP de Guerber et Hennequin (bibliothèque d'enseignement des mathématiques, 1970), je ne vois pas Markov dans l'index, et sur Wikipédia je vois que la chaîne de Markov est au prgramme des Term! J'en déduis (si ajouter un mot ajoute une chose) que contrairement à ce que soutient Laurent Lafforgue, l'enseignement des maths a progressé en cinquante ans. Je m'en réjouis car je pensais que c'était le contraire.
    Merci de vos formules et de vos programmes, Gabuzomeu et Lou, ça me donne du grain à moudre pour au moins quinze jours!
  • Ah ah, j'avance :
    Hennequin, Paul-Louis. "Processus de Markoff en cascade." Annales de l'institut Henri Poincaré 18.2 (1963)
  • Commence plutôt par la formule donnée par LOU16.
    Tu as deux explications pour cette formule : celle que j'ai donnée et celle donnée par LOU16.
    Les chaînes de Markov donnent d'autres renseignements, mais il n'y en a pas besoin ici pour calculer l'espérance du nombre de répétitions.
    En tout cas, ne t'embarque surtout pas dans l'article spécialisé de Paul-Louis Hennequin !
  • Ben dis donc, merci Gabuzomeu, je suis dans Markov depuis ce matin et j'en oublie de manger... et les matrices de transition, ouaah
    Je t'écrivais ce mot de remerciement et je trouve ton message ; non non Hennequin, c'est trop fort pour moi, tu as raison et je trouve tout plein de pdf sur Markov (univ Lille et Grenoble) manifestement d'un niveau top, mais il y a aussi des vidéos d'initiation pas mal faites. Merci pour cette découverte, je n'avais jamais entendu parler de Markov (j'ai vérifié sur mon Pisot Zamansky (mathématiques générales, Dunod, 1959)), et il n'y est pas, c'est quand même incroyable).
    Bon week-end !
  • Heu ... en 1959, chez les matheux français, et depuis plus de 30 ans, les probas n'étaient pas considérées comme des "vraies maths", tu ne trouveras pas de probas chez Bourbaki; donc pas non plus chez Pisot-Zamanski. Pour anecdote : j'ai suivi en 1970 un cours de calcul intégral (donnant l'équivalent de la moitié de l'actuelle L3) dont la plupart des théorèmes servent en probas sans que le prof n'en parle jamais !!

    Cordialement.
  • compris, merci camarade (je suis de 50)!
Connectez-vous ou Inscrivez-vous pour répondre.