Probabilité sur des intervalles non disjoints — Les-mathematiques.net The most powerful custom community solution in the world

Probabilité sur des intervalles non disjoints

Bonjour
J'ai une action qui se produit n fois par jour. Cette action peut réussir ou échouer. La probabilité p qu'elle échoue est très faible.
Comment calculer la probabilité d'avoir sur un an, une période de 30 jours où il y a au moins x échecs ?
Merci.

Réponses

  • On a besoin d’un modèle pour représenter l’état de ton « action » pendant une journée . Est-ce que ton action peut se « reproduire » une fois qu’elle a échoué ou est-ce que c’est un one shot, et l’expérience s’arrête dès qu’on a un « échec »?
    --->  ~ Heartbeat Heartbeat ~ www.youtube.com/watch?v=yogaAzfzpkk <---
  • Les actions sont indépendantes. Qu'il y ait des échecs ou non, on a n actions par jour.
  • Les actions sont indépendantes. Qu'il y ait des échecs ou non, on a n actions par jour.
  • Modifié (18 Sep)
    Premier calcul, relativement classique, loi binomiale : pour une journée donnée, proba d'avoir au moins x échecs.
    On obtient une proba P qui dépend évidemment de p.

    Deuxième calcul, totalement indépendant du premier (on utilise juste la proba P) : un événement a une proba P de se produire sur une journée, quelle est la proba qu'il se répète au moins 30 jours de suite.
    Ce deuxième calcul est beaucoup plus compliqué. À ma connaissance, il n'y a pas de formule 'directe' pour ce 2ème calcul. Selon la valeur de P, il doit y avoir des approximations possibles.
  • Modifié (19 Sep)
    Bonjour, si j'ai bien compris le problème (ce qui n'est pas certain du tout), je pars directement du deuxième calcul de @lourrran qui est si je comprends bien : la probabilité $P(k,n)$ d'avoir pendant $k=30$ jours successifs un événement de probabilité $q$ chaque jour, indépendamment d'un jour sur l'autre, pendant une année de $n=365$ jours

    Je propose une version récursive relativement tout public :
    $\forall n<k$ alors $P(k,n)=0$
    pour $n=k$ alors $P(k,n)=q^k$
    $\forall n>k$ alors $P(k,n)=P(k,n-1)+q^k(1-q)(1-P(k,n-k-1))$ car :
    - soit j'ai les événements pendant $k$ jours successifs lors des $n-1$ premiers jours
    - soit je dois attendre les $k$ derniers jours pour avoir mes événements donc j'avais l'événement contraire juste avant et encore avant, je n'ai jamais eu $k$ jours successifs

    Sinon bien sûr, il y a les chaines de Markov absorbantes qu'apprécient @GaBuZoMeu . Il faut prendre $k+1$ états $n_0,n_1,...,n_k$ avec comme probabilité de transition :
    - $n_0$ -> $n_1 = q$ et $n_0$ -> $n_0 = 1-q$
    - $\forall i$ tel que $0<i<k$ alors $n_i$ -> $n_{i+1} = q$ et $n_i$ -> $n_0 = 1-q$
    - $n_k$ ->$n_k = 1$
    Et cela devrait le faire en élevant la matrice à la puissance $n=365$ avec un gentil ordinateur et en regardant le coefficient correspondant à $n_0$ -> $n_k$

    Je laisse le calcul binomial pour avoir la valeur de $q$ et les applications numériques à mathosphere si je suis assez claire (ce qui est encore moins certain que mon hypothèse de départ).
  • P.2P.2
    Modifié (19 Sep)
    'une période de 30 jours ou il y a au moins $x$ échecs.'
    Pourrais tu préciser ?
    1) une suite consécutive de 30 jours avec au moins $x$ échecs chaque jour ?
    2) Une suite consécutive de trente jours durant laquelle le nombre total des échecs en ces trente jours est supérieur ou égal à $x$ ?
  • Modifié (19 Sep)
    Bonjour,
    "la probabilité d'avoir sur un an, une période de 30 jours où il y a au moins x échecs"
    Comment interpréter ça ?
    a) La probabilité d'avoir 30 jours consécutifs tels qu'il y a au moins x échecs pendant chacun de ces jours ?
    b) La probabilité d'avoir 30 jours consécutifs tels qu'il y au moins x échecs au total pendant ces 30 jours ?
    c) La probabilité d'avoir 30 jours consécutifs tels qu'il y a parmi ceux-ci au moins x jours pendant lesquels un échec s'est produit ?

    PS. Je n'ai pas copié sur P.2. On est donc au moins deux à trouver la question ambigüe.

  • Désolé pour ces problèmes de compréhension, la bonne interprétation est la suivante:

    b) La probabilité d'avoir 30 jours consécutifs tels qu'il y au moins x échecs au total pendant ces 30 jours ?
  • Modifié (9 Oct)
    Les calculs précis vont être atrocement lourds. Eventuellement, en calculant 2 approximations (un majorant et un minorant), on doit pouvoir arriver à des calculs raisonnables.
    Je vais énormément simplifier, pour illustrer les calculs.
    365 jours : on reste sur 365 jours, ça n'impacte pas vraiment les calculs.
    30 jours : simplifions, 4 jours. C'est ce critère là qui alourdit énormément les calculs.
    Et je vais prendre x= 7 par exemple.
    Et chaque jour, on peut avoir de 0 à 7 échecs, avec des probas respective de P0,P1, ...P7
    Si on a plus de 7 échecs sur une journée, on regroupe avec le cas 7 échecs, puisque de toutes façons on s'intéresse au résultat : au moins 7 échecs sur 4 jours consécutifs.
    Je vois ça avec un oeil d'informaticien, mais il y a juste 2 ou 3 mots pour transposer ça en langage de matheux.

    On va boucler 365 fois sur le même calcul.
    A la fin de chaque jour, on regarde la situation telle qu'elle était en début de journée (en proba : on a un vecteur $A_n$ avec toutes les situations possibles, et les proba associées), on regarde le nombre d'échecs dans la journée (en proba), et on prépare le vecteur $A_{n+1}$ avec toutes les situations possibles au début du jour $n+1$

    Les situations possibles sont : 
    - On a déjà eu une séquence de 4 jours avec au moins 7 échecs 
    - On a eu au cours des 3 derniers jours (a,b,c) échecs, avec a+b+c<7 ... Donc une vingtaine de situations possibles.
    Si on revient sur 30 jours, ce vecteur n'a pas une trentaine de lignes, mais quelques millions, voire milliards, voire plus en fonction de x.
    Je note la première ligne (ECHEC) et les autres (a,b,c)

    On a ce vecteur, avec une vingtaine de lignes, et on a les probas associées pour chaque position.
    A la fin du premier jour, les 8 lignes qui ont une proba non nulles sont les lignes (0,0,i) avec i de 0 à 6, et la première ligne celle qui dit qu'on a déjà eu un cas de 4 jours consécutifs avec 7 échecs. Les probas associées sont les P0,P1, ..P6. Notons ce vecteur A_0

    On a une matrice de transition : Partant de (a,b,c), on arrive forcément à (b,c,0) ou (b,c,1) ou ... ou (ECHEC) avec les probas associées P0,P1,P2 ...
    Avec quelques restrictions : si on part de (a=quelconque, b=2, c=4) on arrive à (a=2, b=4, c=0) avec une proba P0, ou à (ECHEC) avec une proba 1-P0.

    Cette matrice de transition, il faut la préparer une fois, et s'en servir 364 fois (ou 365?)
    En fait, une simplification, c'est d'élever cette matrice à la puissance 364, puis de multiplier la matrice obtenue par le vecteur $A_0$

    Voilà, il n'y a plus qu'à implémenter tout ça, et faire des grosses multiplications de matrices. Des matrices carrées qui ont un milliards de lignes et de colonnes.

    En langage mathématique, il y a les chaines de Markov qui traitent de tout ça. Je n'ai fait que traduire en langage informatique ce qui se dit dans la théorie des chaines de Markov.

    Edit : En fait, mes estimations de volume sont peut-être totalement fausses. x a un impact important sur les volumes à traiter. 
    Si on a x=3 par exemple, les tailles des matrices sont  raisonnables. En gros une matrice 1000x1000 à élever à la puissance 364.
Connectez-vous ou Inscrivez-vous pour répondre.
Success message!