Vitesse convergence algorithme stochastique
Bonsoir amis mathématiciens !!!
Je vous propose en ce samedi soir un petit problème sur la vitesse de convergence $L^2$ d'un algorithme stochastique. Je mets l'énoncé puis mes réponses (pour faciliter la lecture ).Soit $H : \mathbb{R}^d \times \mathbb{R}^q \rightarrow \mathbb{R}^d$ une fonction borélienne et $Z : (\Omega, \mathcal{A}, \mathbb{P}) \rightarrow \mathbb{R}^q$ un vecteur aléatoire vérifiant $$\forall y \in \mathbb{R}^d, \| H(y,Z)\| \leq C_{H,Z} (1 + |y|)$$
0. Montrer que l'égalité $h(y) = \mathbb{E}H(y,Z)$ définit bien une fonction (borélienne) $h : \mathbb{R}^d \rightarrow \mathbb{R}^d$ vérifiant $$\forall y \in \mathbb{R}^d,\ |h(y)| \leq C_{H,Z} (1 + |y|)
$$ On définit par récurrence l'algorithme stochastique
$$Y_{n+1} = Y_n - \gamma_{n+1} H(Y_n, Z_{n+1}), Y_0 \in L^2(\Omega, \mathcal{A}, \mathbb{P})$$ où $(Z_n)$ désigne une suite de copies indépendantes de $Z$ définies sur ce même espace de probabilités $(\Omega, \mathcal{A}, \mathbb{P})$ et $(\gamma_n)_{n \geq 1}$ une suite de pas strictement positifs vérifiant $\lim\limits_{n}{\gamma_n} = 0$
1. On suppose dans toute la suite du problème qu'il existe $y^* \in \mathbb{R}^d$ et une constante réelle $c > 0$ telle que $$\forall y \in \mathbb{R}^d, (y - y^* | h(y)) \geq c|y - y^*|^2
$$ 1.a. Montrer que $\{ h = 0 \} = \{ y^* \}$.
1.b. Montrer que, sous des hypothèses additionnelles que l'on précisera avec soin, la suite $(Y_n)_{n \geq 0}$ converge p.s. vers $y^*$ (des arguments précis sur $h$ et $(\gamma_n)_{n \geq 1}$ sont demandés).
2. Pour tout $n \geq 0$, on pose $\varepsilon_n = \mathbb{E}|Y_n - y^*|^2$.
2.a. Montrer que, pour tout $n \geq 0$, $$\varepsilon_{n+1} \leq \varepsilon_n - 2 c \gamma_{n+1} \varepsilon_n + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2
$$ 2.b. Montrer que pour tout $n \geq 0$, $\mathbb{E}|H(Y_n,Z_{n+1})|^2 \leq C'(1 + \varepsilon_n)$ et en déduire que $$\varepsilon_{n+1} \leq \varepsilon_n ( 1 - 2 c \gamma_{n+1} + C'\gamma_{n+1}^2) + C'\gamma_{n+1}^2$$
Je vous propose en ce samedi soir un petit problème sur la vitesse de convergence $L^2$ d'un algorithme stochastique. Je mets l'énoncé puis mes réponses (pour faciliter la lecture ).Soit $H : \mathbb{R}^d \times \mathbb{R}^q \rightarrow \mathbb{R}^d$ une fonction borélienne et $Z : (\Omega, \mathcal{A}, \mathbb{P}) \rightarrow \mathbb{R}^q$ un vecteur aléatoire vérifiant $$\forall y \in \mathbb{R}^d, \| H(y,Z)\| \leq C_{H,Z} (1 + |y|)$$
0. Montrer que l'égalité $h(y) = \mathbb{E}H(y,Z)$ définit bien une fonction (borélienne) $h : \mathbb{R}^d \rightarrow \mathbb{R}^d$ vérifiant $$\forall y \in \mathbb{R}^d,\ |h(y)| \leq C_{H,Z} (1 + |y|)
$$ On définit par récurrence l'algorithme stochastique
$$Y_{n+1} = Y_n - \gamma_{n+1} H(Y_n, Z_{n+1}), Y_0 \in L^2(\Omega, \mathcal{A}, \mathbb{P})$$ où $(Z_n)$ désigne une suite de copies indépendantes de $Z$ définies sur ce même espace de probabilités $(\Omega, \mathcal{A}, \mathbb{P})$ et $(\gamma_n)_{n \geq 1}$ une suite de pas strictement positifs vérifiant $\lim\limits_{n}{\gamma_n} = 0$
1. On suppose dans toute la suite du problème qu'il existe $y^* \in \mathbb{R}^d$ et une constante réelle $c > 0$ telle que $$\forall y \in \mathbb{R}^d, (y - y^* | h(y)) \geq c|y - y^*|^2
$$ 1.a. Montrer que $\{ h = 0 \} = \{ y^* \}$.
1.b. Montrer que, sous des hypothèses additionnelles que l'on précisera avec soin, la suite $(Y_n)_{n \geq 0}$ converge p.s. vers $y^*$ (des arguments précis sur $h$ et $(\gamma_n)_{n \geq 1}$ sont demandés).
2. Pour tout $n \geq 0$, on pose $\varepsilon_n = \mathbb{E}|Y_n - y^*|^2$.
2.a. Montrer que, pour tout $n \geq 0$, $$\varepsilon_{n+1} \leq \varepsilon_n - 2 c \gamma_{n+1} \varepsilon_n + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2
$$ 2.b. Montrer que pour tout $n \geq 0$, $\mathbb{E}|H(Y_n,Z_{n+1})|^2 \leq C'(1 + \varepsilon_n)$ et en déduire que $$\varepsilon_{n+1} \leq \varepsilon_n ( 1 - 2 c \gamma_{n+1} + C'\gamma_{n+1}^2) + C'\gamma_{n+1}^2$$
Réponses
-
Toutes vos remarques sont les bien venues.
0. Soit $y \in \mathbb{R}^d$. On a : $\|H(y,Z)\|_2 \leq C_{H,Z} (1 + |y|)$
d'où a fortiori, $H(y,Z) \in L^2(\Omega)$, puis $H(y,Z) \in L^1(\Omega)$.
On a également en utilisant l'inégalité de Cauchy-Schwarz :
\begin{eqnarray*}
|\mathbb{E}H(y,Z)| &\leq& \left( \mathbb{E}|H(y,Z)|^2 \right)^{\frac{1}{2}} \\
&=& \| H(y,Z)\|_2 \\
&\leq& C_{H,Z}(1 + |y|)
\end{eqnarray*}
Pour tout pavé $A \subset \mathbb{R}^d$, on a donc : \quad $\displaystyle \int_{A} \mathbb{E}H(y,Z) dy \leq \int_{A} C_{H,Z} (1 + |y|) dy < +\infty$
Par Fubini, on en déduit que $h(y) = \mathbb{E}H(y,Z)$ est mesurable de $A$ dans $\mathbb{R}$.
$h : \mathbb{R}^d \rightarrow \mathbb{R}^d$ est donc bien une fonction borélienne vérifiant : $\forall y \in \mathbb{R}^d,\ |h(y)| \leq C_{H,Z} (1 + |y|)$
1.a. Soit $y \in \{ h = 0 \}$. On a alors : \quad $(y - y^* | h(y)) = 0$
Soit comme $(y - y^* | h(y)) \geq c|y - y^*|$, $|y - y^*|$. Soit finalement, $y = y^*$.
On a donc : $\{ h = 0 \} = \{ y^* \}$
1.b. No idea.
2.a. Soit $n \in \mathbb{N}$.
\begin{eqnarray*}
\varepsilon_{n+1} &=& \mathbb{E}|Y_{n+1} - y^*|^2 \\
&=& \mathbb{E}|Y_n - \gamma_{n+1}H(Y_n,Z_{n+1}) - y^*|^2 \\
&=& \mathbb{E}|Y_n - y^*|^2 + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2 - 2\gamma_{n+1}\mathbb{E}[(Y_n - y^*|H(Y_n,Z_{n+1})] \\
&=& \varepsilon_n + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2 - 2\gamma_{n+1}(\mathbb{E}(Y_n - y^*)|\mathbb{E}(H(Y_n,Z_{n+1})) \\
&=& \varepsilon_n + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2 - 2\gamma_{n+1}(\mathbb{E}(Y_n - y^*)|h(Y_n)) \\
&\leq& \varepsilon_n + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2 - 2\gamma_{n+1}c\mathbb{E}|Y_n - y^*|^2
\end{eqnarray*}
Soit finalement : \quad $\varepsilon_{n+1} \leq \varepsilon_n - 2 c \gamma_{n+1} \varepsilon_n + \gamma_{n+1}^2 \mathbb{E}|H(Y_n,Z_{n+1})|^2$
2.b. Soit $n \in \mathbb{N}$.
\begin{eqnarray*}
\mathbb{E}|H(Y_n,Z_{n+1})|^2 &=& \mathbb{E}[\mathbb{E}[|H(Y_n,Z_{n+1})|^2|Y_n]]
\end{eqnarray*}
Connectez-vous ou Inscrivez-vous pour répondre.
Bonjour!
Catégories
- 164.5K Toutes les catégories
- 42 Collège/Lycée
- 22K Algèbre
- 37.4K Analyse
- 6.2K Arithmétique
- 56 Catégories et structures
- 1.1K Combinatoire et Graphes
- 13 Sciences des données
- 5.1K Concours et Examens
- 16 CultureMath
- 49 Enseignement à distance
- 2.9K Fondements et Logique
- 10.6K Géométrie
- 79 Géométrie différentielle
- 1.1K Histoire des Mathématiques
- 73 Informatique théorique
- 3.8K LaTeX
- 39K Les-mathématiques
- 3.5K Livres, articles, revues, (...)
- 2.7K Logiciels pour les mathématiques
- 24 Mathématiques et finance
- 329 Mathématiques et Physique
- 4.9K Mathématiques et Société
- 3.3K Pédagogie, enseignement, orientation
- 10.1K Probabilités, théorie de la mesure
- 786 Shtam
- 4.2K Statistiques
- 3.8K Topologie
- 1.4K Vie du Forum et de ses membres