Petit jeu décisionnel de Markov
Bonjour à toutes et à tous !
Je m'intéresse au processus décisionnel de Markov suivant :
Soit $E=\{0,...,N\}$ un ensemble fini, $A = \{0,1\}$ l'ensemble des actions possibles. Pour chaque point de E sauf 1 (voir plus loin), on peut choisir n'importe quelle action, 0 ou 1. J'ai précisé sauf 1 parce qu'il y a un point qui ne dispose que de l'action 0 (j'appelle ce point 0).
Les récompenses sont définies de la manière suivante : Si l'action 0 est choisie, l'agent ne gagne rien puis transition selon la matrice de transition $P$. Si l'action 1 est choisie, l'agent gagne une récompense $R>0$ puis transitionne selon la matrice $P^a$, avec a entier.
La matrices P est telle que $\forall i,j$ $P_{ij} >0$
Intuitivement, j'ai l'impression (peut être fausse) que la récompense moyenne à l'infinie ($\lim_{N \to \infty} \frac{1}{N} \sum_{n=1}^N R_n $ ) est maximisée lorsqu'on choisit toujours l'action 1 si elle est disponible. Mais j'ai du mal à comprendre comment le montrer.
Avec vous des idées ?
Merci d'avance !
bredouille
Réponses
-
Sauf $1$ ou sauf un ?
-
Pardon je n’avais pas vu que c’était ambigu. Il n’y a qu’un seul point qui ne dispose que de l’action 0. Par choix j’ai appelé ce point 0.
-
Ah et as-tu fait des simulations ?
-
Non pas vraiment. Je pensais pouvoir arriver à une preuve formelle en utilisant que choisir 0 puis 1 est équivalent à choisir 1 puis 0 si c’est possible.
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 165.1K Toutes les catégories
- 58 Collège/Lycée
- 22.1K Algèbre
- 37.5K Analyse
- 6.3K Arithmétique
- 58 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 20 CultureMath
- 51 Enseignement à distance
- 2.9K Fondements et Logique
- 10.7K Géométrie
- 83 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 79 Informatique théorique
- 3.9K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 337 Mathématiques et Physique
- 5K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 801 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres