Probabilité sur des intervalles non disjoints
Bonjour
J'ai une action qui se produit n fois par jour. Cette action peut réussir ou échouer. La probabilité p qu'elle échoue est très faible.
Comment calculer la probabilité d'avoir sur un an, une période de 30 jours où il y a au moins x échecs ?
Merci.
J'ai une action qui se produit n fois par jour. Cette action peut réussir ou échouer. La probabilité p qu'elle échoue est très faible.
Comment calculer la probabilité d'avoir sur un an, une période de 30 jours où il y a au moins x échecs ?
Merci.
Connectez-vous ou Inscrivez-vous pour répondre.
Réponses
On obtient une proba P qui dépend évidemment de p.
Deuxième calcul, totalement indépendant du premier (on utilise juste la proba P) : un événement a une proba P de se produire sur une journée, quelle est la proba qu'il se répète au moins 30 jours de suite.
Ce deuxième calcul est beaucoup plus compliqué. À ma connaissance, il n'y a pas de formule 'directe' pour ce 2ème calcul. Selon la valeur de P, il doit y avoir des approximations possibles.
$\forall n<k$ alors $P(k,n)=0$
pour $n=k$ alors $P(k,n)=q^k$
$\forall n>k$ alors $P(k,n)=P(k,n-1)+q^k(1-q)(1-P(k,n-k-1))$ car :
- soit j'ai les événements pendant $k$ jours successifs lors des $n-1$ premiers jours
- soit je dois attendre les $k$ derniers jours pour avoir mes événements donc j'avais l'événement contraire juste avant et encore avant, je n'ai jamais eu $k$ jours successifs
Sinon bien sûr, il y a les chaines de Markov absorbantes qu'apprécient @GaBuZoMeu . Il faut prendre $k+1$ états $n_0,n_1,...,n_k$ avec comme probabilité de transition :
- $n_0$ -> $n_1 = q$ et $n_0$ -> $n_0 = 1-q$
- $\forall i$ tel que $0<i<k$ alors $n_i$ -> $n_{i+1} = q$ et $n_i$ -> $n_0 = 1-q$
- $n_k$ ->$n_k = 1$
Et cela devrait le faire en élevant la matrice à la puissance $n=365$ avec un gentil ordinateur et en regardant le coefficient correspondant à $n_0$ -> $n_k$
Je laisse le calcul binomial pour avoir la valeur de $q$ et les applications numériques à mathosphere si je suis assez claire (ce qui est encore moins certain que mon hypothèse de départ).
1) une suite consécutive de 30 jours avec au moins $x$ échecs chaque jour ?
2) Une suite consécutive de trente jours durant laquelle le nombre total des échecs en ces trente jours est supérieur ou égal à $x$ ?
b) La probabilité d'avoir 30 jours consécutifs tels qu'il y au moins x échecs au total pendant ces 30 jours ?
Je vais énormément simplifier, pour illustrer les calculs.
365 jours : on reste sur 365 jours, ça n'impacte pas vraiment les calculs.
30 jours : simplifions, 4 jours. C'est ce critère là qui alourdit énormément les calculs.
Et je vais prendre x= 7 par exemple.
Et chaque jour, on peut avoir de 0 à 7 échecs, avec des probas respective de P0,P1, ...P7
Si on a plus de 7 échecs sur une journée, on regroupe avec le cas 7 échecs, puisque de toutes façons on s'intéresse au résultat : au moins 7 échecs sur 4 jours consécutifs.
Je vois ça avec un oeil d'informaticien, mais il y a juste 2 ou 3 mots pour transposer ça en langage de matheux.
On va boucler 365 fois sur le même calcul.
A la fin de chaque jour, on regarde la situation telle qu'elle était en début de journée (en proba : on a un vecteur $A_n$ avec toutes les situations possibles, et les proba associées), on regarde le nombre d'échecs dans la journée (en proba), et on prépare le vecteur $A_{n+1}$ avec toutes les situations possibles au début du jour $n+1$
Les situations possibles sont :
- On a déjà eu une séquence de 4 jours avec au moins 7 échecs
- On a eu au cours des 3 derniers jours (a,b,c) échecs, avec a+b+c<7 ... Donc une vingtaine de situations possibles.
Si on revient sur 30 jours, ce vecteur n'a pas une trentaine de lignes, mais quelques millions, voire milliards, voire plus en fonction de x.
Je note la première ligne (ECHEC) et les autres (a,b,c)
On a ce vecteur, avec une vingtaine de lignes, et on a les probas associées pour chaque position.
A la fin du premier jour, les 8 lignes qui ont une proba non nulles sont les lignes (0,0,i) avec i de 0 à 6, et la première ligne celle qui dit qu'on a déjà eu un cas de 4 jours consécutifs avec 7 échecs. Les probas associées sont les P0,P1, ..P6. Notons ce vecteur A_0
On a une matrice de transition : Partant de (a,b,c), on arrive forcément à (b,c,0) ou (b,c,1) ou ... ou (ECHEC) avec les probas associées P0,P1,P2 ...
Avec quelques restrictions : si on part de (a=quelconque, b=2, c=4) on arrive à (a=2, b=4, c=0) avec une proba P0, ou à (ECHEC) avec une proba 1-P0.
Cette matrice de transition, il faut la préparer une fois, et s'en servir 364 fois (ou 365?)
En fait, une simplification, c'est d'élever cette matrice à la puissance 364, puis de multiplier la matrice obtenue par le vecteur $A_0$
Voilà, il n'y a plus qu'à implémenter tout ça, et faire des grosses multiplications de matrices. Des matrices carrées qui ont un milliards de lignes et de colonnes.
En langage mathématique, il y a les chaines de Markov qui traitent de tout ça. Je n'ai fait que traduire en langage informatique ce qui se dit dans la théorie des chaines de Markov.
Edit : En fait, mes estimations de volume sont peut-être totalement fausses. x a un impact important sur les volumes à traiter.
Si on a x=3 par exemple, les tailles des matrices sont raisonnables. En gros une matrice 1000x1000 à élever à la puissance 364.