Image
Toute l’analyse réelle.

Quelques synthèses et compléments d’analyse

Ce chapitre un peu fourre-tout propose des rappels sur le corps des réels ([chiff1]) et sur les nombres complexes ([chiff2]), puis l’intégrale de Riemann ([chiff3]) et ses liens avec celle de Lebesgue ([chiff4]).

L’importante section « suites et séries » ([chiff5]) sera complétée par deux sections de zoologie sur respectivement les suites et séries ([chiff11] et [chiff12]).

On viendra à des choses très directement pratiques avec le théorème de Rolle et les formules de Taylor ([chiff6]), la trigonométrie ([chiff7]), le calcul de primitives ([chiff8]), la dérivation ([chiff9]) et l’intégration ([chiff10]).

La section [chiff13], enfin, rassemble les résultats quant aux permutations toujours délicates entre limites et opérateurs d’intégration/dérivation.

Les sections les plus simples et les moins abstraites (corps des réels, nombres complexes, suites réelles, suites complexes) permettent notamment de faire les tours des notions les plus utiles dans la vie la plus quotidienne.

Synthèse: le corps des réels

On considère un corps \(\mathbb{K}\), commutatif, muni d’une relation d’ordre total \(\leq\).

(Définitions de base).
\(\mathbb{K}\) est un corps ordonné si \(\forall (x,y) \in \mathbb{K}^2\ 0\leq x\land 0\leq y \rightarrow 0 \leq x+y \land 0 \leq x.y \land -x\leq 0\).

\(\mathbb{K}\) est totalement ordonné si \(\forall (x,y) \in \mathbb{K}^2\ x\leq y\lor y\leq x\).

\(\mathbb{K}\) est archimédien si \(\forall (x,y) \in \mathbb{K}^2\ 0 \leq x\land 0< y \rightarrow \exists n \in \mathbb{N}; x < y + ... + y \mbox{($n$ fois)}\)

\(\mathbb{K}\) a la propriété de la borne supérieure si toute partie non vide majorée de \(\mathbb{K}\) admet une borne supérieure.

On appelle corps réel un corps commutatif totalement ordonné possédant la propriété de la borne supérieure. On le note \(\mathbb{R}\). On admettra l’unicité à isomorphisme près d’un tel corps (l’existence s’obtient par l’étude du complété de \(\mathbb{Q}\)). Il possède en outre la propriété de la borne inférieure et il est archimédien (preuve laissée en exercice).
(Propriétés).
\(\bullet\)\(\mathbb{R}\) est de caractéristique nulle; \(1+1+...+1+1\) est différent de \(0\). \(\bullet\)\(\mathbb{R}\) est infini.
(Quelques définitions supplémentaires).
\(\bullet\)On appelle valeur absolue de \(x \in \mathbb{R}\) et on note \(|x|\) le réel \(sup(\{x,-x\})\); c’est une norme, dite norme usuelle, de \(\mathbb{R}\) en tant que \(\mathbb{R}\)-espace vectoriel; la métrique associée est dite distance usuelle de \(\mathbb{R}\).

\(\bullet\)On note \(x^+=max(x,0)\), et \(x^-=max(-x,0)\), si \(x\) est un réel.

\(\bullet\)On note \(f^+(x)=(f(x))^+\), si \(f\) est une fonction à valeurs réelles. On définit de même \(f^-(x)=(f(x))^-\).

\(\bullet\)On peut définir \(x^+\) à partir de \(x\) et \(|x|\), \(|x|\) à partir de \(x^+\) et \(x^-\), \(sup(x,y)\) à partir de \(|x-y|\), \(x\) et \(y\), en utilisant simplement des additions et des soustractions; on ne donne pas le détail des formules, que l’on retrouve facilement, et qu’il n’est pas utile de connaître par coeur.

\(\bullet\)On appelle partie entière d’un réel \(x\) et on note \(E(x)\) ou \(\lfloor x \rfloor\) le plus grand entier qui lui est inférieur ou égal. Il est caractérisé par \(E(x) \in \mathbb{N}\land E(x)\leq x < E(x)+1\). \(x-E(x)\) est appelé partie décimale ou partie fractionnaire de \(x\), et est noté \([x]\).

\(\bullet\)On appelle intervalle de \(\mathbb{R}\) toute partie de \(\mathbb{R}\) contenant le segment d’extrémités \(x\) et \(y\) pour tous \(x\) et \(y\) dans cette partie.

\(\bullet\)On appelle longueur d’un intervalle \(I\) non vide le réel \(sup_{(x,y)\in I^2} |x-y|\).

\(\bullet\)Une partie \(A\) de \(\mathbb{R}\) est dite bornée si \(\{|x-y|;(x,y)\in A^2\}\) est majoré; si \(A\) est non vide le \(sup\) de cet ensemble est alors le diamètre de la partie \(A\), noté \(\delta(A)\).

Remarquons que \(A\) bornée équivaut à \(A\) majorée et minorée, et que \(\delta(A)=sup(A)-\inf(A)\).

(Propriétés).
\(\bullet\)Le diamètre d’une boule ou d’une sphère de rayon \(r\) est \(\leq 2.r\), si cette partie est non vide (ce qui est toujours le cas si l’espace n’est pas réduit à zéro à moins qu’il ne s’agisse d’une boule ouverte de rayon nul)

\(\bullet\)Un intervalle peut-être de la forme \([a,b]\), \(]a,b[\), \([a,b[\), \(]a,b]\), avec éventuellement \(a=-\infty\) si l’intervalle est ouvert à gauche, et/ou \(b=+\infty\) si l’intervalle est ouvert à droite.

\(\bullet\)Un segment est un intervalle fermé, de diamètre sa longueur.

\(\bullet\)\(\mathbb{R}\) est complet, i.e. toutes les suites de Cauchy dans \(\mathbb{R}\) sont convergentes.

Noter qu’il existe une autre manière de construire \(\mathbb{R}\) : en tant que complété de \(\mathbb{Q}\). La construction peut s’obtenir à l’aide des coupures, ou en quotientant l’ensemble des suites de Cauchy à valeurs dans \(\mathbb{Q}\).

(droite numérique achevée).
On appelle droite numérique achevée et on note \(\overline{\mathbb{R}}\) l’ensemble totalement ordonné \(\mathbb{R}\cup\{-\infty,+\infty\}\), avec \(+\infty\) plus grand élément et \(-\infty\) plus petit élément (le reste de l’ordre étant l’ordre usuel). On étend les définitions de segments et d’intervalles à \(\overline{\mathbb{R}}\).

Très brève synthèse: les nombres complexes

Le corps des nombres complexes est un sur-corps de \(\mathbb{R}\). Il contient notamment \(i^2=(-i)^2=-1\). Le corps des complexes peut par exemple être simplement construit comme le produit cartésien de \(\mathbb{R}\) par \(\mathbb{R}\), muni des opérations suivantes: \[(a,b)+(c,d)=(a+c,b+d)\] \[(a,b)\times (c,d) = (a\times c - b \times d, a \times d + b \times c)\] On note alors \(i=(0,1)\). On note \(Im(z)\) la partie imaginaire d’un nombre complexe \(z=(a,b)\), c’est-à-dire \(Im(a,b)=b\), et \(Re(z)\) sa partie réelle, c’est-à-dire \(Re(a,b)=a\). \(\mathbb{C}\) est la clôture algébrique de \(\mathbb{R}\) (c’est une autre construction possible de \(\mathbb{C}\)): tout polynôme est scindé sur \(\mathbb{C}\). La dérivabilité de fonctions de \(\mathbb{C}\) dans \(\mathbb{C}\) conduit à beaucoup plus de résultats que la dérivabilité de fonctions de \(\mathbb{R}\) dans \(\mathbb{R}\): voir le chapitre sur les fonctions holomorphes. Les nombres complexes sont le bon cadre pour définir la trigonométrie, pour résoudre différentes équations, pour formuler confortablement diverses propriétés de circuits électriques, pour formuler aussi la mécanique quantique. Une extension de \(\mathbb{C}\) importante est la sphère de Riemann.

Définition de l’intégration au sens de Riemann

Cette partie est un bref rappel sur l’intégrale de Riemann. Pour une définition complète, on consultera par exemple [GRA].

L’intégrale de Riemann est tout d’abord définie pour les fonctions en escalier. Etant donnée \(f\) une telle fonction et \(\sigma\) une subdivision de l’intervalle \([a,b]\), i.e. une famille \((\sigma_0,...,\sigma_n)\) vérifiant \(a=\sigma_0<\sigma_1<\sigma_2<...<\sigma_n=b\), l’intégrale sur \(I\) de \(f\), pour \(\sigma\) adaptée à \(f\), c’est-à-dire telle que sur chaque \(]\sigma_i,\sigma_{i+1}[\) \(f\) soit constante, est par définition \(\int_I f=\sum_{k=0}^{n-1} {\lambda}_i (\sigma_{i+1}-\sigma_i)\), où \(f_{|]\sigma_i,\sigma_{i+1}[}={\lambda}_i\).

(Propriétés).
\(\bullet\)Définition de l’intégrale indépendante de la subdivision adaptée choisie.

\(\bullet\)linéarité de l’intégrale (i.e. \(\int_I ({\lambda}f+ \mu g)={\lambda} \int_I f+\mu \int_I g\)).

\(\bullet\)Loi de Chasles : \(\int_{[a,b]} f + \int_{[b,c]} f = \int_{[a,c]} f\)

\(\bullet\)Valeur de l’intégrale inchangée si on modifie la valeur de \(f\) en un nombre fini de points.

\(\bullet\)\(f\leq g\) implique \(\int_I f\leq \int_I g\) (en particulier l’intégrale d’une fonction positive est positive, l’intégrale d’une fonction \(\leq M\) sur un intervalle de longueur \(l\) est inférieure à \(lM\))

Une application de \(\mathbb{R}\) dans \(E\) (\(\mathbb{K}\)-espace vectoriel normé de dimension finie, \(\mathbb{K}=\mathbb{R}\) ou \(\mathbb{C}\)) est dite continue par morceaux sur \(I=[a,b]\) s’il existe une subdivision \(\sigma\) de \(I\) telle que sur chaque \(]\sigma_i,\sigma_{i+1}[\) elle est continue et admet des limites aux bords.

Notons \(F_b([a,b],\mathbb{R})\)1 l’ensemble des fonctions bornées de \([a,b]\) dans \(\mathbb{R}\). Il s’agit d’un espace vectoriel normé complet pour \({\parallel}f {\parallel}_\infty=sup_{x\in [a,b]} |f(x)|\) 2. Notons \({\cal E}\) l’ensemble des fonctions en escalier de \([a,b]\) dans \(\mathbb{R}\). On voit alors que \({\cal E}\) est inclus dans \(F_b([a,b],\mathbb{R})\) et que l’application intégration \(f \mapsto \int_{[a,b]} f\) est linéaire, de norme \(\leq |b-a|\); l’intégration est ainsi uniforméméent continue. \(\overline {\cal E}\) est appelé l’ensemble des fonctions réglées sur \([a,b]\) . D’après le théorème de prolongement, et comme (1) \({\cal E}\) est dense dans \(\overline {\cal E}\) (par définition de l’adhérence) (2) \(\overline {\cal E}\) est complet puisque fermé de \(F_b\) qui est lui-même complet (proposition [fermecomplet]), on peut prolonger \(\int_{[a,b]}\) de manière unique en une application linéaire continue de \(\overline {\cal E}\) dans \(\mathbb{R}\) (encore de norme \(\leq |b-a|\)). Cette méthode permet ainsi de définir l’intégrale sur \([a,b]\) sans avoir à montrer directement que la limite est indépendante des subdivisions choisies (il suffit juste de voir que les fonctions continues par morceaux appartiennent à \(F_b\)).

Toute application \(f\) continue par morceaux sur \(I\) est limite uniforme d’applications en escalier. Soit \((f_n)_{n\in\mathbb{N}}\) une telle suite; \(\int_I f_n\) converge vers une limite, indépendante du choix de \(f_n\). Par définition, cette limite commune est l’intégrale de \(f\).

(Propriétés).
\(\bullet\)linéarité de l’intégrale (i.e. \(\int_I ({\lambda}f+ \mu g)={\lambda} \int_I f+\mu \int_I g\)).

\(\bullet\)Loi de Chasles : \(\int_{[a,b]} f + \int_{[b,c]} f = \int_{[a,c]} f\)

\(\bullet\)Valeur de l’intégrale inchangée si on modifie la valeur de \(f\) en un nombre fini de points.

\(\bullet\)\(f\leq g\) implique \(\int_I f \leq \int_I g\) (en particulier l’intégrale d’une fonction positive est positive, l’intégrale d’une fonction \(\leq M\) sur un intervalle de longueur \(l\) est inférieure à \(lM\))

\(\bullet\)Une fonction continue positive d’intégrale nulle sur \(I\) est nulle sur \(I\).

L’inégalité de Schwartz et l’inégalité de Minkowski, données dans la partie [lp], sont valables aussi dans le cadre de l’intégrale de Riemann.

On note aussi la formule de la moyenne: avec \(f\) et \(g\) continues par morceaux sur \([a,b]\), \(f\) à valeurs dans \(\mathbb{R}\), \(g\) à valeurs dans \(\mathbb{R}^+\), \(m=\inf_{x\in I}\ f(x)\), \(M=sup_{x\in I}\ f(x)\), on a \[m \int_I g \leq \int_I fg \leq M \int_I g\] Si de plus \(f\) est continue, alors \[\exists c \in I ; \int_I fg = f(c)\int_I g\] Un corollaire important est le cas d’une fonction \(g\) constante égale à \(1\): \(m|b-a| \leq \int f \leq M|b-a|\) et si \(f\) est continue, \(\int_I f=(b-a)f(c)\) pour un certain \(c\in [a,b]\).

Maintenant, quelques propriétés des sommes de Riemann : on appelle subdivision pointée de \(I=[a,b]\) un couple \((\sigma,\xi)\) avec \(\sigma\) une subdivision \((\sigma_0,...,\sigma_n)\) et \(\xi\) une famille \((\xi_0,...,\xi_{n-1})\) avec \(\xi_i\in [\sigma_i,\sigma_{i+1}]\). On appelle somme de Riemann associée à la subdivision pointée \((\sigma,\xi)\) et on note \(Riemann(f,\sigma,\xi)\) la valeur \(\sum_{i=0}^{n-1} f(\xi_i)|\sigma_{i+1}-\sigma_i|\). On appelle pas d’une subdivision ou d’une subdivision pointée la quantité \(sup_{i\in[0,n-1]} | \sigma_{i+1}-\sigma_i |\). On le note \(pas(\sigma)\). Alors, si \(f\) est continue, \[\lim_{pas(\sigma)\to 0} Riemann(f,\sigma,\xi)=\int_I f\]

Notation : si \(a\), \(b\in\mathbb{R}\), on note \(\int_a^bf(x)\,dx\), ou plus simplement \(\int_a^b f\) la quantité \(\int_{[a,b]}f\) si \(a\leq b\), et \(-\int_{[b,a]}f\) sinon.

Si \(f\) est continue sur \([a,b]\), alors \(F:x \mapsto \int_a^x f\) est \(C^1\) et est une primitive de \(f\), i.e. \(F'=f\).

Enfin, en intégrale de Riemann l’intégration par parties est valable:

(Intégration par parties).
Soient \(f\) et \(g\) des primitives de fonctions réglées sur \(I=[a,b]\), à valeurs dans \(\mathbb{R}\). Alors \[\int_I fg'=[fg]_a^b-\int_a^b f'g\] avec par définition \([fg]_a^b=f(b)g(b)-f(a)g(a)\).

Dans le cadre de l’intégration de Lebesgue, ce n’est plus vrai; en effet, on peut trouver des fonctions particulières, par exemple l’escalier de Cantor, pour lesquelles l’intégration par parties est fausse. En effet, l’escalier de Cantor est continu, dérivable presque partout, croissant, avec une dérivée nulle partout où elle est définie. Appliquons l’intégration par parties sur \([a,b]\) à \(f\) et \(g\), avec \(f\) la fonction constante égale à \(1\), \(g\) l’escalier de Cantor, et on arrive à la conclusion erronée selon laquelle \(g\) est constante (puisque \(\int_a^b g'=0\)), ce qui n’est pas le cas. Pour appliquer l’intégration par parties, il convient donc de vérifier que les fonctions sont des primitives de fonctions réglées.

Cette formule sert à peu près partout, par exemple la proposition [susnd] (calcul de la somme des \(1/n^2\)), le théorème [fpsfp], pour les intégrales de Wallis (partie [wallis]). On trouvera dans le formulaire (partie [formulaire]) une preuve de la formule de Stirling utilisant l’intégration par parties.

Le changement de variable est aussi valable:

(Changement de variable).
Si \(f\) est continue sur \([c,d]\) et si \(\theta\) est \(C^1\) de \([a,b]\) dans \([c,d]\), alors on a \[\int_{\theta(a)}^{\theta(b)}f= \int_a^b (f \circ \theta)\theta'\]

Dans le cadre Lebesgue, on a le théorème [lebesguecdv].

Lien entre intégrale de Riemann et intégrale de Lebesgue

Soit \({\lambda}\) la mesure de Lebesgue sur \(\mathbb{R}\).

(i) Soit \(I=[a,b]\) intervalle compact (\(-\infty <a<b<\infty\)), \(f\) de \(I\) dans \(\mathbb{R}\) ou \(\mathbb{C}\) continue (ou simplement réglée). Alors \(f\) est mesurable, \(L^1\) sur \([a,b]\) et \[\int_I f d{\lambda}\mbox{(au sens de Lebesgue)}=\int_a^b f(x)dx \mbox{(au sens de Riemann)}\]

(ii) Soit \(I=]a,b[\) intervalle de \(\mathbb{R}\) (\(\infty \leq a < b \leq \infty\)), \(f\) continue de \(]a,b[\) dans \(\mathbb{C}\) (ou simplement réglée sur tout intervalle compact de \(I\)). \(f\) est alors mesurable, et \(f\) est \(L^1\) si et seulement si son intégrale au sens de Riemann est absolument convergente (i.e. si \(\lim_{X \to a^+,Y\to b^-} \int_X^Y |f(x)|dx < \infty\)) et alors \[\int_a^b f(x)dx=\int f d{\lambda}\]

Le terme de gauche désignant l’intégrale généralisée au sens de Riemann (i.e. \(\lim_{X \to a^+,Y\to b^-} \int_X^Y f(x)\,dx\)) et le terme de droite l’intégrale au sens de Lebesgue.

Admise.

Suites et séries

On parlera ici de suites, avant de cibler les suites réelles (sans oublier qu’une suite à valeurs dans \(\mathbb{R}^d\) est à peu près \(d\) suites à valeurs dans \(\mathbb{R}\)). On passera ensuite aux séries qui sont aussi, par définition, un cas particulier de suites.

Suites

Après les définitions, on passera aux propriétés, lesquelles propriétés seront vues du cadre le plus général au cadre le plus réduit.

Définitions

(suite).
On appelle suite à valeurs dans un ensemble \(E\) une application de \(\mathbb{N}\) dans \(E\). On note fréquemment \((x_n)_{n\in \mathbb{N}}\) la suite \(n\mapsto x(n)\). La suite \((y_n)_{n \in \mathbb{N}}\) est une suite extraite de la suite \((x_n)_{n\in \mathbb{N}}\) si il existe \(\phi\) de \(\mathbb{N}\) dans \(\mathbb{N}\) strictement croissante telle que \(\forall k,\ y_k=x_{\phi(k)}\).

\(x\) est un point d’accumulation ou une valeur d’adhérence de la suite \(x_n\) si \(x \in \cap_n \overline{\{x_k ; k \geq n\}}\).

\(x_n\) converge vers \(x\) si pour tout voisinage \(V\) de \(x\) il existe \(N\) tel que pour tout \(n>N\), \(x_n \in V\).

La suite \(x_n\) est dite convergente si elle converge vers un certain \(x\).

Propriétés

\(\bullet\)Cas général

Une suite finie (i.e. à valeurs dans un ensemble fini) admet une suite extraite constante.

Dans \(\mathbb{R}\), une suite infinie admet une suite extraite monotone.

Dans \(\mathbb{R}\), une suite bornée admet une suite extraite convergente.

\(x\) est point d’accumulation des \(x_n\) si pour tout \(V\) voisinage de \(x\) il existe une infinité de \(n\) tels que \(x_n\) est dans \(V\).

La notion de convergence d’une suite est équivalente à la notion de limite en l’infini, avec la topologie que l’on s’est donnée dans le chapitre [topo] (topologie) sur \(\mathbb{N}\cup \{ + \infty \}\).

Dans un espace séparé, la limite est unique.

Si une suite converge vers \(x\), alors toute suite extraite de cette suite converge vers \(x\).

Une limite de suite extraite est une valeur d’adhérence (pas de réciproque dans le cas général).

\(\bullet\)Cas métrique

Dans le cas d’un espace métrique, \(x\) est donc point d’accumulation si pour tout \(\epsilon>0\) il existe une infinité de \(n\) tels que \(d(x_n,x)<\epsilon\).

Dans un espace métrique, la limite est unique.

Dans le cas d’un espace métrique, une valeur d’adhérence est une limite de suite extraite.

Dans un espace métrique, une suite de Cauchy a au plus une valeur d’adhérence, et si elle en a une, elle converge et cette valeur est sa limite.

Dans un espace métrique compact (qui est donc aussi complet), une suite n’admettant qu’une seule valeur d’adhérence est une suite convergente.

Dans un espace métrique il sera souvent utile d’introduire la définition \(X_n=\{x_p;p\geq n\}\); l’ensemble des valeurs d’adhérence est alors l’intersection des \(\overline{X_n}\), c’est donc un fermé, et la suite est une suite de Cauchy si le diamètre des \(X_n\) tend vers \(0\).

\(\bullet\)Cas d’un espace vectoriel normé

L’ensemble des suites d’un espace vectoriel normé est un espace vectoriel avec les opérations de multiplication par un scalaire terme à terme, et d’addition terme à terme (valable même si l’espace n’est pas normé).

L’ensemble des suites bornées en est un sous-espace vectoriel. On peut le normer par la fonction qui à une suite associe le sup des normes de ses éléments. On notera cette norme \(\parallel . \parallel\).

L’ensemble des suites de Cauchy est un sous-espace vectoriel de l’espace vectoriel des suites bornées.

L’ensemble des suites convergentes est un sous-espace vectoriel de l’espace vectoriel des suites de Cauchy. L’application qui à une suite convergente associe sa limite (qui est unique) est linéaire et continue de norme \(1\).

Si notre espace vectoriel normé est muni de deux normes différentes \({\parallel . \parallel}_1\) et \({\parallel . \parallel}_2\) et si il existe \(\alpha\) tel que \({\parallel . \parallel}_1 \leq \alpha {\parallel . \parallel}_2\) alors les suites bornées pour \({\parallel . \parallel}_2\) sont des suites bornées pour \({\parallel . \parallel}_1\), idem pour les suites de Cauchy, et idem pour les suites convergentes. Dans le cas de normes équivalentes, on a donc les mêmes suites de Cauchy, les mêmes suites bornées, et les mêmes suites convergentes. Ainsi, il est de Banach pour \({\parallel}. {\parallel}_1\) si et seulement si il est de Banach pour \({\parallel}. {\parallel}_2\).

Il existe d’ailleurs une réciproque : si un espace est de Banach pour deux normes, alors ces normes sont équivalentes (c’est une application du théorème d’isomorphisme de Banach [Banak] : voir le corollaire qui le suit).

\(\bullet\)Cas d’un corps \(\mathbb{K}=\mathbb{Q}\), \(\mathbb{R}\) ou \(\mathbb{C}\).

L’ensemble des suites est une \(\mathbb{K}\)-algèbre commutative et unitaire; il est muni pour cela du produit par un scalaire, de l’addition terme à terme, du produit terme à terme (l’unité étant la suite constante égale à \(1\)).

L’ensemble des suites bornées est une sous-algèbre unitaire de cette algèbre.

L’ensemble des suites de Cauchy est une sous-algèbre unitaire de cette sous-algèbre.

L’ensemble des suites convergentes est une sous-algèbre unitaire de cette sous-algèbre.

L’application qui à une suite associe sa limite est un morphisme d’algèbres. Ce morphisme est continu. Le noyau de ce morphisme (l’ensemble des suites qui convergent vers \(0\)) est un idéal de l’ensemble des suites bornées.

\(\bullet\)Cas du corps \(\mathbb{R}\). Toute suite monotone bornée converge. Si deux suites sont adjacentes, alors elles convergent et ont même limite.

\(\bullet\)Cas du corps \(\mathbb{Q}\). Une suite converge dans \(\mathbb{Q}\) si et seulement si elle converge dans \(\mathbb{R}\) et sa limite est dans \(\mathbb{Q}\).

\(\bullet\)Cas du corps \(\mathbb{C}\). Dans le cas d’une suite complexe on peut se ramener à l’étude de suites réelles; la suite converge si les parties réelles et imaginaires convergent.

Suites réelles

Généralités

L’ensemble des suites réelles est un anneau commutatif, un espace vectoriel sur \(\mathbb{R}\), ou même une \(\mathbb{R}\)-algèbre.

(majorée).
Une suite (réelle ou non, du moins dans un espace ordonné et métrique) est dite majorée, minorée, bornée, finie, si son image est majorée, minorée, bornée, finie.

L’ensemble des suites réelles bornées est un sous-anneau, un sous-espace vectoriel, une sous-algèbre de l’ensemble des suites réelles.

(converge).

Pour la définition de la limite d’une suite, on pourra consulter [topo], et notamment la topologie de \(\mathbb{N}\cup \{+\infty\}\).

Une suite converge vers un réel \(x\) si sa limite en \(+\infty\) est \(x\). Une suite diverge si et seulement si elle ne converge pas. \(\mathbb{R}\) étant séparé, la limite d’une suite est unique.

Une suite tend vers \(+\infty\) (resp. \(-\infty\)) si sa limite en \(+\infty\) est \(+\infty\) (resp. \(-\infty\)) dans \(\overline{\mathbb{R}}\).

L’ensemble des suites réelles convergentes est un sous-anneau, un sous-espace vectoriel, une sous-algèbre de l’ensemble des suites réelles bornées.

Suites monotones. Applications

Toute suite croissante majorée de \(\mathbb{R}\) est convergente; sa limite est le \(sup\) de son image.

Toute suite décroissante minorée de \(\mathbb{R}\) est convergente; sa limite est l’\(\inf\) de son image.

Si deux suites sont l’une croissante, l’autre décroissante, et si leur différence tend vers \(0\), alors elles sont dites adjacentes; deux suites adjacentes convergent vers la même limite.
Ces résultats, très simples, constituent un (petit!) entraînement à l’utilisation des \(\epsilon\).

Une illustration des suites adjacentes est le résultat [pinpon].

\(\mathbb{R}\) est complet.
Il est évident qu’une suite convergente est de Cauchy; et réciproquement étant donnée une suite de Cauchy \(x_n\) on peut considérer les deux suites \(n \mapsto sup_{k \geq n}\ x_k\) et \(n \mapsto \inf_{k \geq n}\ x_k\); ces deux suites sont adjacentes.
(Théorème des segments emboîtés).
L’intersection d’une suite décroissante de segments dont la longueur tend vers \(0\) est un singleton.
Il suffit de considérer la suite des \(sup\) et la suite des \(\inf\) des segments; ces suites sont adjacentes.

Séries

Dans cette partie on travaillera avec \(\mathbb{K}=\mathbb{R}\) ou \(\mathbb{K}=\mathbb{C}\).

On se donne une suite \((u_n)_{n\in \mathbb{N}}\), à valeurs dans \(\mathbb{K}\). On définit \(U_n=\sum_{k=0}^n u_k\). On se pose la question de la convergence de la suite \(U_n\). Si la limite existe, on l’appellera somme de la série et on la notera \[\sum_{k=0}^{+\infty} u_k = lim_{k\to +\infty} U_k\] On dit que \((U_n)\) est la série de terme général \((u_n)\).

On dit que la série de terme général \((u_n)\) converge absolument si la série de terme général \((|u_n|)\) converge. Une série est dite semi-convergente si elle converge sans converger absolument.

On dit que deux séries sont de même nature si et seulement si elles sont simultanément convergentes ou simultanément divergentes.

On appelle somme partielle d’ordre \(p\) de la série de terme général \((u_n)_{n\geq 0}\) la somme \(\sum_{n=0}^p u_n\).

On appelle reste d’ordre \(p\) de la série de terme général \((u_n)_{n\geq 0}\) la somme de la série de terme général \((v_n)_{n\geq 0}\) définie par \(v_n=u_{n+p+1}\), lorsque cette série converge. On notera par la suite \(R_p\) le reste à l’ordre \(p\) de la série de terme général \((U_n)\). On a \(R_p=\sum_{n\geq p+1} u_n\).

Quelques remarques simples:

\(\bullet\)La série de terme général \((u_n)\) converge si et seulement si la suite \(n\mapsto \sum_{i=0}^n u_i\) converge.

\(\bullet\)S’il y a convergence de la série, alors \(u_n \to 0\).

\(\bullet\)S’il y a convergence de la série, alors la série définissant \(R_p\) converge, et on a pour tout \(p\), \(\sum_{n=0}^{+\infty}u_n=U_p+R_p\).

On en déduit notamment \(\lim_p R_p=0\).

\(\bullet\)La série de terme général \((x_n)\) converge si et seulement si \(|x|<1\). Elle converge d’ailleurs si et seulement si elle converge absolument.

\(\bullet\)Une série converge (resp. converge absolument) si et seulement si son reste à un certain ordre \(p\) converge (resp. converge absolument); et en ce cas son reste à tout ordre converge (resp. converge absolument).

\(\bullet\)Si une série converge, alors la suite \((R_n)\) tend vers \(0\) en \(+\infty\).

\(\bullet\)\(\mathbb{C}\) et \(\mathbb{R}\) étant complets, on peut directement appliquer le critère de Cauchy aux séries dans ces espaces; la série de terme général \((u_n)\) converge (resp. converge absolument) si et seulement si \[\forall \epsilon>0,\ \exists N ; \forall n\geq 0,\ \left|\sum_{i=N}^{N+n} u_i\right| < \epsilon\] \[\mbox{resp. si et seulement si }\forall \epsilon>0,\ \exists N ; \forall n\geq 0,\ \sum_{i=N}^{N+n}| u_i | < \epsilon\]

Voir pour application la partie [constrdivpos] (construction de « petites » séries divergentes positives).

\(\bullet\)si une série est semi-convergente, alors la série de terme général \(u_n^+=max(u_n,0)\) et la série de terme général \(u_n^-=max(-u_n,0)\) sont divergentes (tendent vers \(+\infty\)).

\(\bullet\)si une série converge absolument alors elle converge (preuve en considérant les parties réelles et imaginaires, et en les décomposant en partie positive et en partie négative - preuve possible aussi en utilisant le critère de Cauchy).

Séries à termes positifs, absolue convergence

Quelques remarques simples:

\(\bullet\)Une série à termes positifs converge si et seulement si elle est absolument convergente. Ainsi, on ne change rien à sa nature et à sa somme éventuelle en permutant l’ordre des termes.

\(\bullet\)Toute série de terme général extrait du terme général d’une série à termes positifs convergente est convergente, de somme inférieure à la somme de la série initiale.

\(\bullet\)Toute série déduite d’une série convergente à termes positifs par permutation (éventuellement infinie) des termes est une série convergente de même somme.

\(\bullet\)Si deux séries à termes positifs sont ordonnées par \(u_n \leq v_n\), alors si \(\sum v_n\) converge on peut affirmer que \(\sum u_n\) converge, et si \(\sum u_n\) diverge on peut affirmer que \(\sum v_n\) diverge.

Dans le premier cas, on a \(0\leq\sum_{n=0}^{+\infty}u_n\leq\sum_{n=0}^{+\infty}v_n\).

\(\bullet\)Si \(u_n=O(v_n)\) avec \(v_n\) terme général d’une série absolument convergente (par exemple une série convergente à termes positifs), alors \(u_n\) est le terme général d’une série absolument convergente (nb: il n’est pas requis que \(u_n\) soit une suite \(\geq 0\)).

\(\bullet\)Si \(u_n \simeq v_n\) et si l’une de ces deux séries est à termes positifs (au moins au voisinage de l’infini) alors les deux séries sont de même nature.

On déduit notamment de ceci le fait que si \(u_n\) est le terme général d’une série à termes positifs ou nuls, alors les séries de termes généraux \(\ln(1+u_n)\) et \(\ln(1-u_n)\) sont de même nature (et de même nature que la série de terme général \(u_n\), dans le cas où \(u_n\to 0\)).

Si \(u_n\) est une série à terme général positif ou nul, alors \(n\mapsto\Pi_{i=1}^n (1+u_i)\) converge si et seulement si \(n\mapsto \sum_{i=0}^n u_i\) converge.
\(\diamond\) Séries de Riemann, séries de Bertrand

\(\bullet\)Série de Riemann: \(x \in \mathbb{R}\), \(\sum 1/n^x\) converge si et seulement si \(x>1\) (démonstration par la comparaison avec une intégrale, voir plus loin)

\(\bullet\)Série de Bertrand: \((x,y) \in \mathbb{R}^2\), \(\sum 1/(n^x.\ln(n)^y)\) converge si et seulement si \(x>1\) ou (\(x=1\) et \(y>1\)) (démonstration par la comparaison avec une intégrale, voir plus loin)

On trouvera une preuve amusante de ces deux résultats en partie [grp] (plus originale que la preuve par comparaison avec une intégrale).

\(\diamond\) Utilisation de \(u_{n+1}/u_n\)

On se donne \((u_n)\) et \((v_n)\) deux suites à termes \(>0\). Alors si \(u_{n+1}/u_n\leq v_{n+1}/v_n\) (au moins à partir d’un certain rang), alors

\(\bullet\)la convergence de la série de terme général \(v_n\) entraine la convergence de la série de terme général \(u_n\)

\(\bullet\)la divergence de la série de terme général \(u_n\) entraine la divergence de la série de terme général \(v_n\)
On déduit de l’inégalité (supposée vraie pour \(n\geq N\)) que \(\forall n\geq N\), \(u_n\leq\frac{u_N}{v_N}v_n\). On a ainsi \(u_n=O(v_n)\), et on peut conclure grâce aux critères précédemment donnés.
(Critère de D’Alembert).
Si \((u_n)\) est une série à termes positifs telle que \(u_{n+1}/u_n\) tend vers \(k\), alors si \(k<1\) la série converge, et si \(k>1\), alors la série diverge.

\(\bullet\)Cas où \(k<1\): on se donne \(k'\) avec \(k<k'<1\); la proposition ci-dessous, jointe au fait que la série de terme général \(k'^n\) converge, permet de conclure que la série de terme général \(u_n\) converge.

\(\bullet\)Cas où \(k>1\): en prenant \(k'\) tel que \(1<k'<k\), on constate que la suite \(u_n\) ne tend pas même vers zéro, ce qui serait la moindre des choses pour le terme général d’une série convergente.

Bien noter que si \(k=1\), « tout est possible » (cf. les séries de Riemann : \(u_n=n^\alpha\), pour lesquelles on a \(u_{n+1}/u_n\) de limite 1, mais la convergence de \(\sum u_n\) dépend de \(\alpha\).).

\(\diamond\) Règle de Cauchy

(Règle de Cauchy).

Si pour tout \(n\), \(u_n>0\), alors

\(\bullet\)\(limsup\ \sqrt[n]{u_n} = l < 1\ \ \ \to \ \ \ \sum u_n\) converge

\(\bullet\)\(limsup\ \sqrt[n]{u_n} = l > 1\ \ \ \to \ \ \ \sum u_n\) diverge
Il suffit dans le premier cas de choisir \(x\) compris entre \(l\) et \(1\); et dans le deuxième cas, la suite n’a pas même le bon goût de tendre vers \(0\).
\(\diamond\) Critère de Raabe-Duhamel (alias \(\frac{u_{n+1}}{u_n}\), suite)

Soit \(u_n>0\), avec \(\frac{u_{n+1}}{u_n}=1-\frac{a}{n}+r_n\), avec \(r_n\) terme général d’une série absolument convergente; alors \(u_n \simeq K/n^a\) pour un certain \(K>0\) (et donc la série de terme général \(u_n\) converge \(\iff a>1\)).
On définit \(v_n=\ln(n^a.u_n)\); il est clair que si cette suite converge on a bien le résultat souhaité. Or \(v_{n+1}-v_n=\ln(u_{n+1}/u_n)+a.\ln(\frac{n+1}{n})=-a/n+r_n+O(-a/n+r_n)^2+a/n+O(1/n^2)\). En utilisant le fait que \(|(a/n).w_n|\leq \frac12 (a^2/n^2+w_n^2)\), on en déduit que \(v_{n+1}-v_n=O(1/n^2)+O(r_n^2)+r_n=O(r_n+\frac 1 {n^2})\). Or \(r_n\) et \(\frac1{n^2}\) sont tous deux termes généraux de séries absolument convergentes, donc \(v_{n+1}-v_n\) est terme général d’une série absolument convergente, donc convergente, et donc \((v_n)\) est une suite convergente.

Du théorème de Rolle aux formules de Taylor

On va ici s’intéresser au théorème de Rolle, puis introduire la série des théorèmes façon Taylor.

(Théorème de Rolle).
Soit \(f\) une fonction continue définie sur le segment \([a,b]\) et à valeurs dans \(\mathbb{R}\), dérivable sur \(]a,b[\), avec \(f(a)=f(b)\). Alors il existe \(c\in]a,b[\) tel que \(f'(c)=0\).

\(\bullet\)Si \(f\) est constante sur \([a,b]\), le résultat est clair.

\(\bullet\)Si \(f\) n’est pas constante, alors \(f\) atteint soit son maximum soit son minimum dans \(]a,b[\) (il y a là une application de la compacité; l’image du compact \([a,b]\) par une application continue est un compact, théorème [imcococo]); la dérivée de \(f\) en ce point (ou l’un de ces points) est nécessairement nulle.

Comme le signale judicieusement le livre [POM], on peut aussi avoir le même théorème sur \([a,+\infty[\), avec \(f(a)=lim_{x\to +\infty} f(x)\).

Applications du théorème de Rolle: \(\bullet\)le polynôme dérivé d’un polynôme scindé de \(\mathbb{R}\) dans \(\mathbb{R}\) est scindé.

\(\bullet\)le théorème [taylag] (Taylor-Lagrange).

\(\bullet\)les résultats [prelhopital] et [lhopital] (règle de L’Hôpital).

\(\bullet\)le théorème qui suit:
(Théorème des accroissements finis pour une application de \(\mathbb{R}\) dans \(\mathbb{R}\)).

On se donne \(f\) continue de \([a,b]\) dans \(\mathbb{R}\), dérivable sur \(]a,b[\).

Alors il existe \(c\in[a,b]\) tel que \(f(b)-f(a)=f'(c).(b-a)\).
Il suffit de soustraire \(x\mapsto f(a)+\frac{f(b)-f(a)}{b-a}.(x-a)\) à la fonction \(f\) pour se ramener au théorème de Rolle.
Ne pas confondre avec le théorème [TAF], inégalité des accroissements finis (à valeurs ailleurs que dans \(\mathbb{R}\)).
Cela pourrait servir pour le théorème [darb] même si ici on ne l’écrira pas exactement comme ça. C’est surtout la première étape des formules de Taylor (c’est la formule de Taylor-Lagrange au rang \(n=0\)).
(Théorème des valeurs intermédiaires pour la dérivée).

Ce théorème est aussi dit théorème de Darboux.

Soit \(f\) dérivable d’un intervalle \(I\) dans \(\mathbb{R}\); alors \(f'(I)\) est un intervalle.

\(\bullet\)Il s’agit de montrer que si \(a,b\in I\) (avec \(a<b\)) et si \({\lambda}\in[f'(a),f'(b)]\), alors il existe \(c\in[a,b]\) tel que \(f'(c)={\lambda}\). Il suffit évidemment de se limiter au cas \({\lambda}\in]f'(a),f'(b)[\).

\(\bullet\)Quitte à remplacer \(f(x)\) par \(f(x)-{\lambda}.x\) et éventuellement cette fonction par son opposée, on se ramène à \({\lambda}=0\), et plus précisément à montrer que :

si \(f'(a)<0\) et \(f'(c)>0\), alors il existe \(c\in]a,b[\) tel que \(f'(c)=0\).

L’idée de la preuve va alors être la même que pour le théorème de Rolle.

\(\bullet\)On considère \(c\in[a,b]\) tel que \(\displaystyle f(c)=\min_{[a,b]} f\) (atteint, car \(f\) dérivable, donc continue, sur le compact \([a,b]\)).

\(\bullet\)Le fait que \(f'(a)<0\) implique que \(f\) n’est pas minimale en \(a\). En effet, \(\lim_{h\to 0^+}\frac{f(a+h)-f(a)}{h}<0\) implique pour \(h>0\) assez petit que \(\frac{f(a+h)-f(a)}{h}<0\), et ainsi \(f(a+h)<f(a)\).

On a donc \(m<f(a)\), d’où \(c\neq a\).

\(\bullet\)De même, le fait que \(f'(b)>0\) implique que \(c\neq b\).

\(\bullet\)La fonction \(f\) étant minimale en \(c\in]a,b[\) et dérivable en ce point \(c\), on peut en déduire \(f'(c)=0\) (comme pour le théorème de Rolle), ce qui achève la preuve du théorème de Darboux.
(Polynôme de Taylor).
Etant donnée une fonction \(f\) de \(\mathbb{R}\) dans un espace vectoriel normé \(E\) au moins \(n\) fois dérivable en \(a\), on définit le développement de Taylor de \(f\) à l’ordre \(n\) en \(a\) qui est une fonction de \(\mathbb{R}\) dans \(E\) définie par \(P_{f,a,n}(x)=f(a)+\sum_{k=1}^n \frac{f^{(k)}(a)}{k!} (x-a)^k.\)
(Formule de Taylor-Lagrange).
Soit \([a,b]\) un segment de \(\mathbb{R}\), avec \(a\neq b\), \(f\) de classe \(C^n\) de \([a,b]\) dans \(\mathbb{R}\), \(n+1\) fois dérivable sur \(]a,b[\); alors il existe \(c \in ]a,b[\) tel que \[f(b)=P_{f,a,n}(b)+\frac{f^{(n+1)}(c)}{(n+1)!}(b-a)^{n+1}\]

\(\bullet\)On définit \[g(x)=f(b)-P_{f,x,n}(b)-K.\frac{(b-x)^{n+1}}{(n+1)!}\] avec \(K\) choisi de manière à avoir \(g(a)=0\) (toujours possible car \(b-a\) est non nul par hypothèse).

\(\bullet\)On dérive \(g\), on a pile poil les bonnes hypothèses pour appliquer Rolle [rolle] à \(g\), on en déduit qu’il existe \(c\) tel que \(g'(c)=0\) (puisque \(g(b)=0=g(a)\)). Or le calcul de \(g'\) permet alors d’écrire que \(g'(c)=0\) implique que \(f^{(n+1)}(c)=K\).

\(\bullet\)Il ne reste plus qu’à écrire que \(g(a)=0\).
(Formule de Mac Laurin).
Il s’agit simplement de la même formule, dans le cas \(a=0\) (l’usage veut que ce cas particulier soit nommé « formule de Mac Laurin »). \[f(b)=P_{f,0,n}(b)+\frac{f^{(n+1)}(c)}{(n+1)!}(b)^{n+1}\]
Conséquence immédiate du résultat précédent.

Quelques exemples d’applications, extraites de [POM]:

\(\bullet\)\(x\mapsto \exp(x)\) est limite de la suite des \(P_{\newlineexp,0,n}\)

\(\bullet\)au voisinage de \(+\infty\) et pour tout polynôme \(P\), \(P(x)=o(e^x)\).

\(\bullet\)Si \(f\) est \(C^2\) de \(\mathbb{R}\) dans \(\mathbb{R}\), le fait que \(f\) et \(f''\) sont bornées implique que \(f'\) est bornée, et avec \(M_i\) pour \(i\in\{0,1,2\}\) défini comme le sup de \(|f^{(i)}|\), on a \(M_1\leq 2\sqrt {M_0.M_2}\) (preuve en écrivant (par Taylor-Lagrange) que \(f(a+t)=f(a)+f'(a)t+\frac12 f''(c)t^2\) pour un certain \(c\in ]a,a+t[\), en divisant par \(t\) pour obtenir \(f'(a)=\frac{f(a+t)-f(a)}{t}-\frac12 f''(c)t^2\) et donc \(|f'(a)|\leq \frac{2M_0}t+\frac{M_2t}2\) minimal pour \(t=2\sqrt{M_0/M_2}\)).

\(\bullet\)Si \(f\) est \(C^{n+1}\) de \(\mathbb{R}\) dans \(\mathbb{R}\), et si \(f\) et \(f^{(n+1)}\) sont bornées, alors les \(f_i\) pour \(i \in \{1,2,\dots,n\}\) sont bornées (la preuve utilise le fait que l’ensemble des polynômes de degré \(\leq n\) est de dimension finie, bornée, et le fait que toutes les normes sont équivalentes en dimension finie).

(Inégalité de Taylor-Lagrange).

Soit \([a,b]\) un segment de \(\mathbb{R}\), avec \(a\neq b\), \(E\) un espace de Banach, et \(f\) : \([a,b]\to E\) de classe \(C^n\) sur \([a,b]\) et \(n+1\) fois dérivable sur \(]a,b[\); on suppose en outre que \(f^{(n+1)}\) est bornée par \(M\) sur \(]a,b[\).

Alors \({\parallel}f(b)-P_{f,a,n}(b) {\parallel}\leq M\cdot \displaystyle \frac{(b-a)^{n+1}}{(n+1)!}\).

\(\bullet\)On définit \[g(x)=f(b)-P_{f,x,n}(b)\]

\(\bullet\)On considère l’application \(h\) qui à \(x\) associe \(-M\cdot \displaystyle \frac{(b-x)^{n+1}}{(n+1)!}\). Pour tout \(x\) dans \([a,b]\) on a \({\parallel}g'(x) {\parallel}\leq h'(x)\); le théorème des accroissements finis [TAF] permet alors d’écrire que \({\parallel}g(b)-g(a){\parallel}\leq h(b)-h(a)\) - ce qui est précisément ce qu’on voulait prouver puisque \(g(b)=0\).
Il y a plus simple dans le cas de \(f\) application à image dans \(\mathbb{R}\): il s’agit alors d’une conséquence rapide de la formule de Taylor-Lagrange.
(Formule de Taylor avec reste intégral).
Cette fois-ci, \(f\) est supposée \(C^{n+1}\) sur \([a,b]\) et à valeurs dans un espace de Banach. Alors: \[f(b)=P_{f,a,n}(b)+\frac{1}{n!}\int_a^b (b-t)^n.f^{(n+1)}(t)dt\]

\(\bullet\)Comme d’habitude pour ce genre de formule, on définit \(g(x)=f(b)-P_{f,x,n}(b)\).

\(\bullet\)\(g\) est \(C^1\); donc \(g(b)-g(a)\) est égale à l’intégrale de \(g'\) entre \(a\) et \(b\); il s’agit précisément de la formule de Taylor avec reste intégral.
le résultat peut aussi se prouver par récurrence sur \(n\), l’induction s’obtenant grâce à une intégration par parties.

La formule étant passablement douloureuse à apprendre le plus simple est sans doute de faire le calcul soi-même, il n’est pas difficile, et peut être retrouvé très rapidement.

Noter qu’avec le changement de variable \(t=a+(b-a)s\), la formule s’écrit \[f(b)=P_{f,a,n}(b)+\frac{(b-a)^{n+1}}{n!}\int_0^1 (1-S)^n.f^{(n+1)}(a+(b-a)s)ds,\] ce qui peut être plus pratique pour obtenir certaines majorations.

Le théorème de Bernstein, stipulant que toute fonction \(f\) \(C^\infty\) de \([-a,a]\) dans \(\mathbb{R}\), avec \(a>0\), et dont toutes les dérivées d’ordre pair \(f^{(2n)}\) sont \(\geq 0\) sur \([-a,a]\), est développable en série entière sur \(]-a,a[\), est démontré dans [POM] en application de la formule de Taylor avec reste intégral.
(Formule de Taylor-Young).
On se donne une fonction \(f\) de \(\mathbb{R}\) dans un espace de Banach \(E\), \(n\) fois dérivable en \(a\). Alors \[f(x)-P_{f,a,n}(x)=o((x-a)^n)\]
Par récurrence, avec le théorème des accroissements finis [TAF].
Ceci fournit bien évidemment une méthode de détermination de développements limités. Mais c’est aussi un outil pour calculer des dérivées de fonctions, comme on va le voir avec les corollaires ci-dessous, permettant de généraliser la formule bien connue \(f'(a)=\displaystyle \lim_{h\to 0} \frac{f(a+h)-f(a)}h\). Il faut noter que la formule se généralise à tout ordre, mais elle devient plus compliquée. On peut aussi trouver une application avec le théorème central limite [tcl]. Enfin on peut en déduire des résultats sur l’ensemble des zéros d’une fonction suffisamment dérivable, comme illustré par le corollaire [micka] (les informations étant bien faibles par rapport aux informations fournies par la dérivabilité d’une fonction de \(\mathbb{C}\) dans \(\mathbb{C}\), ne pas tout confondre!).
On peut démontrer ainsi la convergence rapide des suites obtenues par la méthode de Newton (voir chapitre [ananume]) vers le zéro d’une fonction.

On peut aussi s’intéresser à Sinus, avec l’aide de Maple:

Exemple Maple
\(>\ \)\(\ p[i/2] :=convert(series(\sin(x),x,i),polynom)\)

\(>\ od;\) \(\belowdisplayshortskip3pt p := \text{array}(1 .. 5, \,[])\) \(\belowdisplayshortskip3pt {p_{1}} := x\) \(\belowdisplayshortskip3pt {p_{2}} := x - {\frac {1}{6}} \,x^{3}\) \(\belowdisplayshortskip3pt {p_{3}} := x - {\frac {1}{6}} \,x^{3}+{\frac {1}{120}} \,x^{5}\) \(\belowdisplayshortskip3pt {p_{4}} := x - {\frac {1}{6}} \,x^{3} + {\frac {1}{120}} \,x^{5} - {\frac {1 }{5040}} \,x^{7})\) \(\belowdisplayshortskip3pt {p_{5}} := x - {\frac {1}{6}} \,x^{3} + {\frac {1}{120}} \,x^{5} - {\frac {1 }{5040}} \,x^{7} + {\frac {1}{362880}} \,x^{9}\)

\(>\ plot(p,x=-5..5);\)

Le résultat est montré sur la figure [taylor].

Image

On voit qu’il y a convergence simple sur \(\mathbb{R}\), et même convergence uniforme sur tous les compacts de \(\mathbb{R}\). En effet, on constate que \(\sin(x)\) est la somme de la série entière \(\sum\frac{(-1)^n}{(2n+1)!}x^{2n+1}\), et les sommes partielles de cette série entière correspondent justement aux \(p_n\), d’où la convergence uniforme sur tout compact par les propriétés des séries entières. On peut aussi déduire la convergence uniforme sur les compacts de l’inégalité de Taylor-Lagrange à l’ordre \(2n+1\) : les dérivées successives de \(\sin\) sont \(\pm \sin\) et \(\pm \cos\) et sont toutes uniformément bornées par 1, d’où \(\forall x\in\mathbb{R}\), \(|\sin x-P_{f,0,2n+1}|\leq 1\frac{|x|^{2n+2}}{(2n+2)!}\), c’est-à-dire (comme \(p_n=P_{f,0,2n-1}\)) \[\forall x\in\mathbb{R},\ |\sin(x)-p_n(x)|\leq\frac{|x|^{2n}}{(2n)!},\] dont on déduit la convergence uniforme de \((p_n)\) vers \(\sin\) sur tout compact de \(\mathbb{R}\).

(Calcul de la dérivée seconde d’une fonction).
Soit \(f\) une fonction \(2\) fois dérivable en \(a\). Alors \[f''(a)=\lim_{h\to 0} \frac{f(a+h)+f(a-h)-2.f(a)}{h^2}\]
Par la formule de Taylor-Young, on sait que \[f(a+h)=f(a)+f'(a).h+\frac{f''(a)}{2}.h^2+o(h^2)\] \[\mbox{et }f(a-h)=f(a)-f'(a).h+\frac{f''(a)}{2}.h^2+o(h^2)\] On en déduit bien l’égalité annoncée.

On peut généraliser ce corollaire aux dérivées \(n\)-ièmes:

(Calcul de la dérivée \(n\)-ième d’une fonction).
Si \(f\) est \(n\) fois dérivable en \(0\), alors \[f^{(n)}(0)=\lim_{h\to 0} \sum_{k=0}^n C_n^k(-1)^{n-k}f(kh)\]
Notons \(A(h)=\sum_{k=0}^n C_n^k(-1)^{n-k}f(kh)\), et utilisons la formule de Taylor-Young à l’ordre \(n\) pour chaque \(f(kh)\), on obtient \[A(h)=\sum_{(k,i)\in[0,n]^2} C_n^k (-1)^{n-k} \frac{f^{(i)}(0)}{i!} k^ih^i + o(k^nh^n)\]

Le terme en \(h^p\) est alors \(\frac{f^{(p)}(0)}{p!}\sum_{k=0}^nC_n^k (-1)^{n-k} k^p\).

Il ne reste plus qu’à voir que \(\sum_{k=0}^n C_n^k (-1)^{n-k} k^n=n!\) et\(\sum_{k=0}^n C_n^k (-1)^{n-k} k^p=0\) pour \(0\leq p<n\); voir proposition [doudou].
(ordre).
On appelle ordre d’un zéro d’une fonction \(f\) \(C^\infty\) l’entier \(p\) minimal tel que \(f^{(p)}(a)\neq 0\). Si un tel entier n’existe pas, le zéro est dit d’ordre infini.
Tout zéro d’ordre fini \(n\) d’une fonction dérivable au moins \(n\) fois est isolé.
Il suffit d’écrire Taylor-Young, et de se placer suffisamment près du zéro \(\alpha\) : on aura \(f(x)\simeq c(x-\alpha)^n\), avec \(c=\frac{f^{(n)}(\alpha)}{n!}\neq 0\).

La parité de l’ordre d’un zéro \(x\) dans l’intérieur du domaine d’une fonction de \(\mathbb{R}\) dans \(\mathbb{R}\), et le signe de la première dérivée non nulle, sont d’importants indicateurs pour de l’optimisation:

  • ordre pair et dérivée d’ordre \(p\) positive en \(x\): \(x\) est un minimum (au moins local);

  • ordre impair: \(x\) n’est pas un minimum.

Une fonction \(C^\infty\) qui possède une infinité de zéros sur un compact donné en compte au moins un qui est d’ordre infini. On peut en déduire que toute fonction analytique sur \(\mathbb{R}\) possédant une infinité de zéros sur un compact est nulle.

La trigonométrie

On ne donnera ici que quelques définitions, les (schémas de) preuves et formules étant données dans le formulaire (partie [trigono]).

Les fonctions trigonométriques se définissent généralement à partir de l’exponentielle complexe: avec \(\exp(t)\) lui-même défini par une somme de série (voir partie [expocomp]).

On y définit aussi \(\cos(x)=Re(e^{ix})\) et \(\sin(x)=Im(e^{ix})\), pour \(x\) réel3. On dérive certaines propriétés (voir partie [trigono]) de ces fonctions. La (\(2\pi\)) périodicité de \(x\mapsto e^{ix}\) donne notamment de nombreux résultats.

Exemple Maple
\(>\ combine(\cos(x)\mbox{\^\ }\!\!5,trig)\) \(\frac1{16}\cos(5x)+\frac5{16}\cos(3x)+\frac58\cos(x)\)

Pratique du calcul de primitives

Il est nécessaire avant tout de bien connaître les primitives signalées dans le chapitre [formulaire]. Dans tous les cas, on aura bien soin de regarder sur quels intervalles on peut définir la primitive. Pour cela on déterminera les intervalles sur lesquels la fonction candidate comme primitive est bien définie et continue, puis on regarde aux bornes de chaque intervalle si la fonction peut-être prolongée par continuité.

Primitives de fractions rationnelles

On trouvera au théorème [simples] une méthode de décomposition en éléments simples d’une fraction rationnelle. Une fois une fraction rationnelle décomposée en éléments simples, il suffit d’appliquer les recettes de cuisine évoquées à la partie « primitives » du chapitre [formulaire]. Les points de discontinuité sont les pôles de la fraction rationnelle.

Primitives de \(P(\cos(x),\sin(x))\)

\(P\) désigne un polynôme à deux indéterminées.

Cette situation se présente couramment dans la vie de tous les jours et il est indispensable d’être bien préparé pour y faire face.

Il est évidemment suffisant de savoir intégrer un monôme, c’est-à-dire un élément de la forme \(f_{n,m} = x\mapsto \cos(x)^n \sin(x)^m\)

\(\bullet\)Si \(n\) est impair, il suffit de remplacer \(\cos(x)^n\) par \((1-\sin(x)^2)^{\frac{n-1}2}\cos(x)\), et le changement de variable \(u=\sin(x)\) nous ramène au calcul de la primitive d’un polynôme.

\(\bullet\)Si \(m\) est impair, il suffit de remplacer \(\sin(x)^n\) par \((1-\cos(x)^2)^{\frac{n-1}2}\sin(x)\), et le changement de variable \(u=\cos(x)\) nous ramène au calcul de la primitive d’un polynôme.

\(\bullet\)Si \(n\) et \(m\) sont pairs, une méthode générale est de linéariser, voir pour cela la partie [trigonometrie]. On peut aussi procéder par une intégration par parties, pour se ramener à \(I_{n+m,0}\) ou \(I_{0,n+m}\),

  • c’est-à-dire que dans l’intégration par parties on intègre \(\cos(x)^nsin(x)\) et on dérive \(\sin(x)^{m-1}\) si \(n>m>0\), pour se ramener à une primitive de \(\cos(x)^{n+2}\sin(x)^{m-2}\)

  • et si \(m>n>0\) on intègre \(\sin(x)^m\cos(x)\) et on dérive \(\cos(x)^{n-1}\) pour se ramener à une primitive de \(\cos(x)^{n-2}\sin(x)^{m+2}\).

Primitives de \(G(x)=F(\cos(x),\sin(x))\)

\(F\) désigne une fraction rationnellle à deux indéterminées. Les discontinuités seront généralement en nombre infini, périodiques; il convient d’étudier précisément ce qu’il se passe au niveau de chaque discontinuité. On aura alors recours à la règle de Bioche (que l’on peut justifier rigoureusement, voir par exemple le livre d’analyse de Arnaudiès et Fraysse [ARFR]). La règle de Bioche nous dit que :

\(\bullet\)Si \(G\) est paire, i.e. \(G(-x)=G(x)\), on fait le changement de variable \(u=\sin(x)\)

\(\bullet\)Si \(G\) est impaire, i.e. \(G(-x)=-G(x)\), on fait le changement de variable \(u=\cos(x)\)

\(\bullet\)Si \(G\) est \({\omega}\)-périodique (\({\omega}<2\pi\)), c’est-à-dire si \(G(x)=G(x+{\omega})\), on fait le changement de variable \(u=\tan(\frac{\pi x}{{\omega}})\).

\(\bullet\)Si \(G\) n’est rien de tout ca, on n’aura plus d’autre choix que le changement de variable \(u=\tan(x/2)\). Rappelons que dans ce cas, \(\cos(x)=\frac{1-u^2}{1+u^2}\), \(\sin(x)=\frac{2u}{1+u^2}\), \(dx=\frac{2}{1+u^2}du\)

Primitives de \(H(x)=F(ch(x),sh(x))\)

La trigonométrie hyperbolique (définie par V. Riccati et J.H. Lambert au 18ème siècle) basée sur \(ch\) et \(sh\) au lieu de \(cos\) et \(sin\)) n’est pas qu’un jouet: elle sert en physique théorique et pour l’analyse des hyperboles. Elle tire son nom du fait que, alors que \((\cos(x),\sin(x))\) parcourt un cercle \(x^2+y^2=1\), \((\mathop{\mathrm{ch}}(x),\mathop{\mathrm{sh}}(x))\) parcourt l’hyperbole \(y^2+1=x^2\) (de même que la trigonométrie usuelle est qualifiée de sphérique, la trigonométrie utilisant \(\mathop{\mathrm{ch}}\) et \(\mathop{\mathrm{sh}}\) est qualifié d’hyperbolique). On pensera bien à vérifier en quels points s’annule le dénominateur. \(F\) désigne une fraction rationnelle à deux indéterminées. On considère alors la fonction \(G(x)=F(\mathop{\mathrm{ch}}(x),\mathop{\mathrm{sh}}(x))\).

\(\bullet\)Si \(G\) est paire, i.e. \(G(-x)=G(x)\), on fait le changement de variable \(u=\mathop{\mathrm{sh}}(x)\)

\(\bullet\)Si \(G\) est impaire, i.e. \(G(-x)=-G(x)\), on fait le changement de variable \(u=\mathop{\mathrm{ch}}(x)\)

\(\bullet\)Si \(G\) est \(\pi\)-périodique, c’est-à-dire si \(G(x)=G(x+\pi)\), on fait le changement de variable \(u=\mathop{\mathrm{th}}(x)\) .

\(\bullet\)Si \(G\) n’est rien de tout ca, on peut faire le changement de variable \(u=\mathop{\mathrm{th}}(x/2)\). La partie [trigonoh] fournit les formules nécessaires. Dans beaucoup de cas pratiques, il sera en fait préférable de faire \(u=e^x\).

Primitives abéliennes

Une étude plus complète (notamment incluant des justifications géométriques) se trouve dans le livre d’analyse de Arnaudiès et Fraysse [ARFR].

\(\int R(x,\sqrt{ax+b})\)

\(R\) est supposée être une fraction rationnelle à deux indéterminées, \(a\) et \(b\) des réels. Il suffit alors de faire le changement de variable \(u=\sqrt{ax+b}\) pour que « magiquement » tout s’arrange et que l’on n’ait plus qu’une fraction rationnelle à intégrer.

\(\int R(x,\sqrt{ax^2+bx+c})\) avec \(a>0\)

\(R\) est supposée être une fraction rationnelle à deux indéterminées.

On fait alors le changement de variable \(u=\sqrt{ax^2+bx+c}-\sqrt a x\). En fait cela revient simplement à considérer un repère dans lequel l’équation de l’hyperbole est plus sympathique, c’est-à-dire un repère dont les axes sont les asymptotes de l’hyperbole.

On trouvera dans [ARFR] des compléments utiles.

\(\int R(x,\sqrt{ax^2+bx+c})\) avec \(a<0\)

Géométriquement, on constate simplement que la courbe \(x\mapsto (x,\sqrt{ax^2+bx+c})\) est dans le cas \(a<0\) un morceau d’ellipse, et on se donne une paramétrisation sympathique, qui nous donne \(x\) comme un cosinus de \(u\) (à divers facteurs près) et \(\sqrt{ax^2+bx+c}\) comme un sinus de \(u\) (là encore à divers facteurs près).

On fait le changement de variable \(\cos(u)=\sqrt{\frac{a^2}{b^2/4-ac}}(x+b/a)\). Cela nous ramène à \(\sqrt{ax^2+bx+c}=\sqrt{\frac{ac-b^2/4}{a}}\sin(u)\), et nous simplifie tout ça de manière à en faire une fraction rationnelle.

\(\int R(x,\sqrt[n]{\frac{ax+b}{cx+d}})\)

\(R\) est supposée être une fraction rationnelle à deux indéterminées.

Si \(n=2\), il suffit de multiplier par \(\sqrt{\frac{cx+d}{cx+d}}\) pour se ramener au cas précédent; sinon on constate que la fonction réciproque de cette fonction est rationnelle, et donc on pose simplement \(u=\sqrt[n]{\frac{ax+b}{cx+d}}\) pour se ramener à une fraction rationnelle.

Zoologie de la dérivation: la règle de L’Hôpital

Soient \(f\) et \(g\) deux applications continues de \([a,b]\) dans \(\mathbb{R}\), dérivables sur \(]a,b[\). Si \(g(b)\neq g(a)\), alors il existe \(c \in ]a,b[\) tel que le déterminant \[\left|\begin{array}{cc} f(b)-f(a) & f'(c) \\ g(b)-g(a) & g'(c) \newline \end{array}\right|\] s’annule.
Il suffit d’appliquer le théorème de Rolle [rolle] à la fonction \(h\) définie par \(h(t)=f(t)-f(a)-\frac{g(t)-g(a)}{g(b)-g(a)}.(f(b)-f(a))\).

Intuition Alors que le théorème des accroissements finis exprime le fait qu’une application de \(\mathbb{R}\) dans \(\mathbb{R}\) a une tangente parallèle à n’importe laquelle de ses cordes, le théorème [prelhopital] montre que c’est en fait valable pour n’importe quelle courbe dérivable dans \(\mathbb{R}^2\).

(Règle de L’Hôpital).

On se donne deux fonctions \(f\) et \(g\) de \(\mathbb{R}\) dans \(\mathbb{R}\) continues en \(a\in\mathbb{R}\), et dérivables sur un voisinage de \(a\) privé de \(a\), avec \(f(a)=g(a)=0\).

On suppose que \(g\) et \(g'\) sont non nulles sur un voisinage de \(a\) privé de \(a\).

Alors si \(\frac{f'}{g'}\) tend vers \(l\) en \(a\), alors \(\frac{f}{g}\) tend vers \(l\) en \(a\).
Il s’agit exactement d’une application de la proposition [prelhopital].
Une application possible est l’étude de la tangente en des points singuliers d’une courbe.

Zoologie de l’intégration

L’essort de l’informatique, Maple, Mathematica, font qu’on n’a pas forcément envie d’être expert en intégration, vu que les machines font désormais très bien pas mal de choses, et qu’on a plus la conviction qu’un calcul est juste quand il sort de Maple ou Mathematica que quand on le fait soi-même. Ainsi, les exploits de calcul d’intégrales sont moins importants sans doute qu’ils ne l’étaient autrefois. Néanmoins, le domaine reste important, ne fût-ce que pour les gens qui développent ce genre de beaux outils, et une bonne façon de devenir expert en la matière est de s’entrainer, et d’apprendre quelles sont les briques de base auxquelles on fait bien de se ramener (notamment les intégrales de Wallis), celles auxquelles on peut se comparer pour décider du comportement asymptotique d’une primitive (par exemple on peut élucider \(\int f\) au voisinage de l’infini avec une bonne connaissance de \(f'/f\) au voisinage de \(\infty\)). On verra aussi ici la transformée de Laplace, qui a son importance en automatique.

Intégrales de Wallis

On définit \(I_n=\int_0^{\pi/2} \sin(x)^n.dx\).

Supposons \(n\geq 2\). On peut écrire \(I_n=\int_0^{\pi/2} \sin^{n-2}(x).(1-\cos^2(x)).dx\) car \(\cos^2+\sin^2=1\).

Ensuite on peut écrire \(I_n=I_{n-2} - \int_0^{\pi/2} \sin^{n-2}(x).\cos^2(x).dx\).

Par une intégration par partie (théorème [ipp]) (on intègre \(\sin^{n-2}(x).\cos(x)\) et on dérive \(\cos(x)\)) on obtient \[I_n = \frac{n-1}{n} I_{n-2}.\] Le produit \(n.I_n.I_{n-1}\) est donc constant, égal à \(I_1.I_0=\pi/2\).

Il reste à remarquer que \(I_n \leq I_{n-1} \leq I_{n-2}=\frac{n}{n-1} I_n\) pour pouvoir dire que \(I_n \simeq I_{n-1}\).

On peut alors conclure que \(I_n \simeq \sqrt{\frac{\pi}{2n}}\).

Calcul de \(c>0\) dans la formule de Stirling \(n!\sim cn^ne^{-n}\sqrt{n}\), grâce au fait que \(\forall n\), \(I_{2n}=\frac{\pi}{2}.\frac{(2n)!}{2^{2n}(n!)^2}\).

Primitives de \(f\), \(\frac{f'}{f}=a/x+o(1/x)\)

On se donne \(f\) une fonction \(>0\) et \(C^1\) au voisinage de \(+\infty\), et on suppose que \(\frac{f'}{f}=a/x+o(1/x)\), avec \(a\neq -1\).

On définit \(F(x)=\int_b^x f(t)dt\).

Si l’intégrale \(\int_b^{+\infty} f\) converge, on définit \(R_f(x)=\int_x^\infty f(t)dt\).

Alors: \[\left\{\begin{array}{l} a > - 1 \Rightarrow \left\{\begin{array}{c} \int_b^{+\infty} f \mbox{ diverge } \\ F(x) \simeq \frac{xf(x)}{a+1} \end{array}\right.\newline a < - 1 \Rightarrow \left\{\begin{array}{c} \int_b^{+\infty} f \mbox{ converge et } R_f(x) \simeq -\frac{xf(x)}{a+1} \end{array}\right. \end{array}\right.\]

\(\bullet\)Si \(a=0\), l’intégrale \(\int_b^\infty f(t)dt\) diverge car \[f'(x)/f(x)=o(1/x)\] \[-\epsilon\ln(x/b) \leq \ln(f(x)/f(b))\] \[f(x)/f(b) \geq (x/b)^{-\epsilon}\] Donc si \(\epsilon\leq 1\), on minore bien notre fonction par quelque chose de trop gros pour être intégrable.

Il suffit ensuite de faire une intégration par partie (théorème [ipp]) pour justifier que \(F(x)=xf(x)-bf(b)-\int_b^x tf'(t)dt\).

L’intégrale \(\int_b^x tf'(t)dt\) est un \(o(\int_b^x f(t)dt)\) puisque \(tf'(t)\) est un \(o(f(t))\), \(f\) étant positive et d’intégrale divergente.

Donc \(F(x) \simeq xf(x)\).

\(\bullet\)Si \(a\neq 0\), alors la primitive de \(a/x\) est de signe constant et est divergente en \(+\infty\), donc on peut écrire \(\ln(f(x))\simeq a\ \ln(x)\).

– Si \(a>-1\), avec \(\epsilon=(a+1)/2\) et \(\eta\) tel que pour \(x>\eta\), \(\ln(f(x)) \geq (a-\epsilon) \ln(x)\), on a pour \(x>\eta\) \(f(x) \geq x^{a-\epsilon}\) avec \(a-\epsilon>-1\), et donc l’intégrale diverge. On peut alors écrire, grâce à une intégration par parties (théorème [ipp]): \[\begin{aligned} F(x)=xf(x)-bf(b)-\int_b^x f(t)dt\end{aligned}\] Puisque l’intégrale diverge et puisque \(a\ f(t)\simeq tf'(t)\) \[a F(x) \simeq \int_b^x tf'(t)dt\] En replaçant cette expression dans l’équation ([eloyer]), on obtient \[F(x)=xf(x)-a F(x) + o(F(x))\] \[\mbox{et donc }F(x)\simeq \frac{xf(x)}{1+a}\]

– Si \(a<-1\), avec \(\epsilon=(a+1)/2\) et \(\eta\) tel que pour \(x>\eta\), \(\ln(f(x)) \leq (a+\epsilon) \ln(x)\), donc pour \(x>\eta\) \(f(x) \leq x^{a+\epsilon}\) avec \(a+\epsilon<-1\), et donc l’intégrale converge. \[\mbox{Par définition, }R_f(x)=\lim_{Y\to\infty} \int_x^Y f(t)dt\] On peut alors écrire, grâce à une intégration par parties (théorème [ipp]): \[\begin{aligned} R_f(x)=\lim_{Y\to \infty} \left(Y f(Y) -xf(x) -\int_x^Y tf'(t)dt\right)\end{aligned}\] Or \(\int_x^Y tf'(t)dt\) converge pour \(Y\to\infty\), et \(\int_x^\infty tf'(t)dt = a R_f(x)+o(R_f(x))\). \[\mbox{Donc }R_f(x)=-\frac{1}{1+a}xf(x) + lim_{Y \to \infty} Y\ F(Y) + o(F(x))\] Par ailleurs \(Y\ f(Y)\) a une limite en \(+\infty\) (au vu de l’équation [amoreau]); cette limite ne peut être que \(0\), vue la convergence de l’intégrale de \(f\). \[\mbox{D'où }R_f(x)=-\frac{1}{1+a}xf(x) + o(R_F(x))\] ce qui est bien le résultat souhaité.
ici aussi, tout est possible dans le cas \(a=-1\) : il suffit de considérer les fonctions \(f(x)=\frac{1}{x}(\ln x)^\gamma\), pour lesquelles on a \(\frac{f'}{f}=-\frac{1}{x}+\frac{\gamma}{x\ln x}=-\frac{1}{x}+o(\frac{1}{x})\), et on sait que la convergence de \(\int_2^{+\infty}f\) dépend de \(\gamma\) (convergence si \(\gamma>1\), divergence si \(\gamma\leq 1\)).

Méthode de Laplace

La méthode de Laplace permet de calculer le maximum d’une fonction de \(]a,b[\) dans \(\mathbb{R}\). Il s’agit en fait de ramener la recherche du maximum à un calcul d’intégrale, dont la valeur est liée à la position du maximum de la fonction. Signalons aussi l’existence de la fonction d’Airy et de la méthode de la phase stationnaire, liées à la méthode de Laplace.

(Méthode de Laplace).

Soit \(f\) une fonction \(C^2\) sur \(]a,b[\), avec \((a,b)\in \overline{\mathbb{R}}^2\), telle que \(f\) admette un maximum unique en \(c\in]a,b[\), avec \(f''(c)<0\), \(f\) n’ayant pas \(f(c)\) pour valeur d’adhérence pour \(x\to a\) ni pour \(x\to b\), et soit \(g\) une fonction continue sur \(]a,b[\) avec \(g(c)\neq 0\).

On suppose en outre que pour tout \(t\) l’intégrale \[\int_a^b |g(x)|e^{tf(x)}dx\mbox{ est convergente}.\] \[\mbox{Alors }\int_a^b g(x)e^{tf(x)}dx \simeq_{t\to\infty} \frac{\sqrt{2\pi}g(c)e^{tf(c)}}{\sqrt{-tf''(c)}}\]
La preuve va se faire (i) en se ramenant à \(c=0\) (ii) en approximant \(f\) et \(g\) en \(0\) (iii) en majorant et minorant l’intégrale à calculer par quelque chose de pas trop loin de quelque chose (\(F(t)\) défini plus bas) qu’on sait calculer.

\(\bullet\)En remplaçant \(f(x)\) par \(f(x-c)\) et \(g(x)\) par \(g(x-c)\) on se ramène au cas où \(c=0\), quitte à changer \(a\) et \(b\) (s’ils ne sont pas infinis).

\(\bullet\)Quitte à remplacer \(g\) par \(-g\), on suppose \(g(0)>0\).

\(\bullet\)On se donne \(\epsilon>0\).

\(\bullet\)On se donne \(\delta>0\), suffisamment petit pour que \(|x|\leq \delta\) implique \[f(0)+\frac{f''(0)}{2}x^2(1+\epsilon) \leq f(x) \leq f(0)+\frac{f''(0)}{2}x^2(1-\epsilon)\] \[\mbox{et }(1-\epsilon)g(0)\leq g(x) \leq (1+\epsilon)g(0)\]

\(\bullet\)On précise alors \(I(\delta,t)=\int_0^\delta g(x)e^{tf(x)}dx\) : \[\int_0^\delta g(x)e^{tf(0)+t\frac{f''(0)}2(1+\epsilon)x^2}\,dx\leq I(\delta,t) \leq \int_0^\delta g(x)e^{tf(0)+t\frac{f''(0)}2(1-\epsilon)x^2}\,dx\]

\(\bullet\)On cherche alors à préciser \(U(\delta,t,\pm)=\int_0^\delta g(x)e^{tf(0)+t\frac{f''(0)}2(1\pm \epsilon)x^2}\,dx\). \[\int_0^\delta g(0)(1-\epsilon)e^{tf(0)+t\frac{f''(0)}2(1\pm \epsilon)x^2} \leq U(\delta,t,\pm)\leq \int_0^\delta g(0)(1+\epsilon)e^{tf(0)+t\frac{f''(0)}2(1\pm \epsilon)x^2}dx\]

– On effectue un changement de variable \(y=x\sqrt{-tf''(0)(1-\epsilon)/2}\).

– En ne traitant que l’inégalité de droite (l’autre étant similaire): \[U(\delta,t,\pm) \leq \frac{\int_0^{ \delta{\sqrt{-tf''(0)(1\pm \epsilon)/2}}} g(0)(1+\epsilon)e^{tf(0)-y^2}dy}{\sqrt{-tf''(0)(1\pm \epsilon)/2}}\]

– On a alors \(U(\delta,t,\pm) \leq \frac{g(0)e^{tf(0)}\int_0^{ \delta{\sqrt{-tf''(0)(1-\epsilon)/2}}} (1+\epsilon) e^{-y^2}dy}{\sqrt{-tf''(0)(1\pm \epsilon/2)}}\leq e^{tf(0)}g(0) \frac{2\pi}{2\sqrt{-tf''(0)(1\pm\epsilon)}}\)

\(\bullet\)Majorons maintenant \(U(\delta,t,-)\), en prenant garde au fait que \(\delta\) dépend de \(\epsilon\) : \[U(\delta,t,-)\leq \int_0^\delta g(0)(1+\epsilon)e^{tf(0)+t\frac{f''(0)}2(1-\epsilon)x^2}dx\] avec \(y=\sqrt{-tf''(0)(1-\epsilon)}x\), \[\leq \int_0^{\delta{\sqrt{-tf''(0)(1- \epsilon)x}}} \frac{g(0)(1+\epsilon)e^{tf(0)-y^2}dy}{\sqrt{-tf''(0)(1- \epsilon)x}}\] \[\leq g(0)(1+\epsilon) e^{tf(0)}\frac{\int_0^\infty e^{-y^2}dy}{\sqrt{-tf''(0)(1- \epsilon)x}}\] Or \(\int_0^\infty e^{-y^2}dy=\frac{\sqrt{\pi}}2\), donc \[\leq \frac {\sqrt{2\pi}g(0)e^{tf(0)}(1+\epsilon)}{2\sqrt{-tf''(0)}\sqrt{1-\epsilon}}\]

De même on minore \(U(\delta,t,+)\) par

\[\int_0^\delta g(0)(1-\epsilon)e^{tf(0)+t\frac{f''(0)}2(1+\epsilon)x^2}dx\] avec \(y=\sqrt{-tf''(0)\frac{1+\epsilon}2}\), on arrive à \[\geq \frac{\sqrt{2\pi}g(0)e^{tf(0)}(1-\epsilon)}{2\sqrt{-tf''(0)}(1+\epsilon)}\mbox{ pour }t\geq T_\epsilon.\] \(\bullet\)On conclut alors que \(I(\delta,t)\), qui vérifie \[U(\delta,t,+) \leq I(\delta,t) \leq U(\delta,t,-)\] est compris entre \(\frac{1-\epsilon}{1+\epsilon} F(t)\) et \(\frac{1+\epsilon}{\sqrt{1-\epsilon}}F(t)\), avec \(F(t)=\frac{\sqrt{2\pi}g(0)e^{tf(0)}}{2\sqrt{-tf''(0)}}\).

\(\bullet\)\(I(\delta,t)\) est équivalent à \(e^{tf(0)}g(0) \frac{2\pi}{2\sqrt{-tf''(0)}}\)

\(\bullet\)On considère par ailleurs \(V(\delta,t)=\int_\delta^b g(x)e^{tf(x)}\).

\(|V(\delta,t)|\leq \int_\delta^b |g(x)|e^{(t-1)f(x)}e^{f(x)}dx\)

– Pour \(x\in [\delta,b]\), \(f(x)\leq f(\delta)\), si du moins on prend la peine d’imposer \(\delta\) suffisamment petit.

– Donc pour un tel \(\delta\), \(|V(\delta,t)|\leq e^{(t-1)f(\delta)} \int_\delta^b |g(x)|e^{f(x)}dx\)

– Or \(\int_\delta^b |g(x)|e^{f(x)}dx \leq \int_a^b |g(a)|e^{f(x)} < \infty\) (\(<\) par hypothèse)

\(\bullet\)\(V(\delta,t)=o(I(\delta,t))\) pour \(t\to\infty\) (car \(f(\delta)<f(0)\))

\(\bullet\)On en déduit \[\int_0^b g(x)e^{tf(x)} \simeq e^{tf(0)}g(0) \frac{\sqrt{2\pi}}{2\sqrt{-tf''(0)}}\]

\(\bullet\)En effectuant la même manœuvre sur \(]a,0]\) et en sommant (les équivalents étant tous deux positifs) on obtient le résultat désiré.
[WIK] propose l’utilisation de cette méthode pour calculer l’approximation de Stirling.

Zoologie des suites

On présente ici la moyenne de Cesaro et la constante \(\gamma\) d’Euler.

Moyenne de Cesaro

On va ici présenter la moyenne de Cesaro, dont l’intérêt est de permettre la définition de valeur moyenne d’une suite même dans des cas où la suite diverge. Le cas \({\lambda}_n=1\) est déjà intéressant en soi. Une application est brièvement citée en section [applicesaro].

(Moyenne de Cesaro).

On se donne une suite \(u_n\) à valeurs dans un \(\mathbb{R}\)-espace vectoriel normé \(E\). Soit \({\lambda}_n\) une suite de réels \(>0\), telle que \(\sum {\lambda}_n\) diverge.

Si \(u_n \to l\), alors \(v_n \to l\), avec \(v_n=\frac{\sum_{k=0}^n {\lambda}_k.u_k}{\sum_{k=0}^n {\lambda}_k}\).

\(\bullet\)On se ramène tout d’abord au cas où \(l=0\), simplement en considérant la suite de terme général \(u_n-l\) (il est clair que \(v_n\) est ainsi diminué lui aussi de \(l\)).

\(\bullet\)On se donne \(\epsilon>0\); il existe un certain \(N\) tel que pour tout \(n>N\), \(|u_n| < \epsilon\).

\(\bullet\)Pour \(n>N\), on a alors \[v_n =\frac{\sum_{k=0}^N {\lambda}_k.u_k}{\sum_{k=0}^n {\lambda}_k} +\frac{\sum_{k=N+1}^n {\lambda}_k.u_{k}}{\sum_{k=0}^n {\lambda}_k}\]

\(\bullet\)Le premier terme de la somme ci-dessus tend clairement vers \(0\), le second est plus petit qu’\(\epsilon\) (en valeur absolue), d’où le résultat.

Constante \(\gamma\) d’Euler

La constante \(\gamma\) d’Euler, que l’on va définir ci-dessous, est à ne pas confondre avec \(\exp(1)=2.718\dots\) que l’on appelle parfois constante d’Euler. La constante \(\gamma\) d’Euler a nombre de définitions équivalentes. On ne sait pas si elle est irrationelle, mais on sait que si on peut l’écrire sus la forme \(a/b\) avec \(a\) et \(b\) entiers alors \(b\) s’écrit en décimal avec au moins \({242080}\) chiffres (résultat de T. Papanikolaou).

La constante \(\gamma\) est souvent aussi appelée constante d’Euler-Mascheroni.

Définissons \(u_n=\sum_{k=1}^n \frac{1}{k} - \ln(n)\). \[\mbox{On a }\forall n\in \mathbb{N}, \frac{1}{n+1} < \int_n^{n+1} \frac1t dt < \frac1n\] car \(t\mapsto 1/t\) est décroissante sur \(\mathbb{R}_+^*\).

En écrivant \(u_{n+1}-u_n\), on obtient donc que \(u_n\) décroît.

Par ailleurs, \(u_{n+1}-u_n>\frac{1}{n+1}-\frac{1}{n}\), donc par sommation \(u_n-u_1>1/n-1\), donc \(u_n>0\). Donc \(u_n\), décroissante positive, tend vers une limite finie, notée \(\gamma\) et appelée constante d’Euler.

On obtient en Maple (par la commande « evalf(gamma,100) »): \[\gamma\simeq .5772156649015328606065120900824024310421593359399235\] \[988057672348848677267776646709369470632917467495\]

Zoologie des séries

Comme pour l’intégration ou les équations différentielles ou les dérivées ou les groupes, étudier la zoologie des séries n’est pas anecdotique. Cela fournit les briques de base pour étudier d’autres problèmes. Il n’est donc pas inutile d’étudier beaucoup de séries (comme la somme des inverses des nombres premiers) et d’avoir les références sous la main pour en connaitre plein d’autres. Il n’est pas non plus inutile de savoir qu’on peut dans certains cas permuter les termes ou les grouper, ou convoluer des séries, ou effectuer l’analogue d’une intégration par parties pour des suites (transformation d’Abel plus bas).

Il est aussi intéressant de voir qu’il n’existe pas de série positive divergente « ultimement petite », telle qu’il suffise de se comparer à cette série pour savoir si on a affaire à une série convergence ou une série divergente.

Construction de séries divergentes positives toujours plus petites

Le comportement d’une série étant asymptotique, on pourrait se demander s’il ne serait pas possible de construire une suite de terme général \((u_n)\) positif qui soit « à la limite » de la convergence, fournissant un critère par simple comparaison, permettant de décider si une série positive diverge ou non.

Il n’en est rien, car étant donnée une suite \(u_n>0\) telle que la série \(\sum_{n=0}^{+\infty} u_n\) diverge, on peut construire une suite \(v_n>0\) telle que \(v_n=o(u_n)\) et \(\sum_{n=0}^{\infty} v_n\) diverge.

Pour cela, soit \(v_n=\frac{u_n}{U_n}\), où \(U_n=\sum_{k=0}^nu_k\). Il est clair que \(v_n=o(u_n)\). Il reste à voir que la série de terme général \((v_n)\) diverge. Pour cela on utilise le critère de Cauchy : \[\forall N \in \mathbb{N}, \forall n > 0, V_{N+n}-V_N=\!\!\!\sum_{i=N+1}^{N+n} \frac{u_i}{U_i}\! \geq \frac{u_{N+1}}{U_{N+n}}+...+\frac{u_{N+n}}{U_{N+n}}\! \geq \frac{U_{N+n}-U_{N-1}}{U_{N+n}} \to 1\] comme \(n\to \infty\), donc le critère de Cauchy n’est pas vérifié.

Somme des inverses des nombres premiers

On définit \(p_n\) comme le \(n\)-ième nombre premier, dans l’ordre croissant. On se préoccupe de la nature de la série \(\sum 1/p_n\) de terme général \(1/p_n\).

Définissons \(u_n=\Pi_{i=1}^n \frac{1}{1-\frac{1}{p_i}}\), et considérons \(\ln(u_n)=\sum_{i=1}^n \ln(1-1/p_n)\), il apparaît que la série est de même nature que la suite (et non pas série!) \((u_n)\). \[\mbox{On remarque alors que }\;\frac{1}{1-\frac{1}{p_n}}=\sum_{i=0}^{+\infty} 1/p_n^i\] et on peut écrire tout nombre \(1/n\) comme produit d’un certain nombre d’inverses de nombres premiers; donc le produit \(u_n\) est supérieur à la somme des inverses des entiers plus petits que \(n\) (un nombre entier étant produit de nombres premiers inférieurs ou égaux à lui-même...); donc la suite \((u_n)\) diverge, car \(\sum 1/n\) diverge.

\[\mbox{D'où }\sum_{n\geq 0} 1/p_n = +\infty\]

Groupement de termes

On a vu que dans le cas de séries à termes positifs, on pouvait permuter les termes autant qu’on le souhaitait sans changer la convergence de la série ni la valeur de la somme; dans le cas général ce n’est pas vrai (considérer \(u_n=(-1)^n\) par exemple, ou bien la série de terme général \(u_n=(-1)^n/n\), que l’on peut faire tendre vers n’importe quelle limite réelle ou infinie en changeant l’ordre des termes). On a toutefois des résultats partiels:

On considère une suite \(u_n\) à valeurs dans \(\mathbb{R}\) ou \(\mathbb{C}\).

Soit \(\phi\) une application strictement croissante de \(\mathbb{N}\) dans \(\mathbb{N}\) avec \(\phi(0)=0\).

On définit \(Tranche_n=u_{\phi(n)}+u_{\phi(n)+1}+...+u_{\phi(n+1)-1}\) (ceux qui n’ont pas compris pourquoi on appelait cette série « Tranche » sont priés de relire soigneusement cette ligne).

On définit \(GrosseTranche_n=|u_{\phi(n)}|+|u_{\phi(n)+1}|+...+|u_{\phi(n+1)-1}|\).

On suppose que \(GrosseTranche_n\) tend vers \(0\).

Alors la série de terme général \((u_n)\) converge si et seulement si la série de terme général \(Tranche_n\) converge, et si elles convergent elles ont même somme.

Peu importe le caractère convergent de la série de terme général \((GrosseTranche_n)\) !
Pas dur... On associe à tout \(n\) la somme partielle d’ordre \(\phi_n\), on montre que cette suite converge (c’est en fait l’hypothèse), et on montre en utilisant la seconde hypothèse que la différence entre \(U_n\) (la somme partielle d’ordre \(n\)) et \(U_{\phi(p)}\), avec \(p\) maximal tel que \(\phi(p)\leq n\), est petite pour \(n\) grand...
Dans le cas d’une série à termes positifs, on n’a pas besoin de l’hypothèse « \(GrosseTranche_n\) tend vers \(0\) ».
Application possible : règle de la loupe.  
(Règle de la loupe).
Soit \(u_n\) une suite décroissante de réels \(>0\); alors les séries \(\sum u_n\) et \(\sum 2^n.u_{2^n}\) sont de même nature.
Facile avec le groupement de termes; \[\frac 12 2^{n+1} u_{2^{n+1}} \leq u_{2^{n+1}}+...+u_{2^n-1} \leq 2^n.u_{2^n}\] D’où le résultat, en constatant qu’on peut grouper les termes par \(\phi(n)=2^n\), puisque l’on est dans le cas d’une série à termes positifs.

L’hypothèse de décroissance est nécessaire, comme on peut s’en convaincre en considérant \(u_{2^n}=\frac1{2^{2^n}}\) et \(u_p=1\) si \(p\not \in \{2^n;n\in \mathbb{N}\}\).

Application possible : série de Riemann, série de Bertrand.

Si \(u_n=1/n^x\), \(2^n.u_{2^n}=\frac{2^n}{2^{nx}}=2^{n.(1-x)}\) donc \(\sum u_n\) converge si et seulement si \(x>1\).

Si \(u_n=1/(n^x.\log(n)^y)\), le résultat ci-dessus donne la convergence de la série \(\sum u_n\) si \(x>1\), et la divergence si \(x<1\); il reste le cas limite \(u_n=1/(n.\log(n)^y)\), dans ce cas \(2^n.u_{2^n}=1/(n.\ln(2))^y\), dont la série converge si et seulement si \(y>1\).

Exponentielle d’un endomorphisme

Étant donné \(f \in {\cal L}(E)\) (i.e. \(f\) un endomorphisme continu de \(E\)), avec \(E\) un espace de Banach, on appelle exponentielle de \(f\) et on note \(\exp(f)\) l’endomorphisme qui à \(x\) associe \[\abovedisplayshortskip0pt \belowdisplayshortskip-5pt \sum_{n=0}^\infty \frac{1}{n!} \underbrace{f \circ \dots \circ f}_{\mbox{ $n$ fois }}(x)\]

Bien entendu, la convergence est normale sur tout borné de \({\cal L}(E)\), donc uniforme sur tout borné.

On trouvera une application au niveau des équations différentielles linéaires avec le théorème [t962] et les résultats qui suivent. Notons aussi quelques éléments intéressants quant à l’exponentielle:
  • La matrice de l’exponentielle d’un endormorphisme est l’exponentielle de la matrice de cet endormorphisme (dans la même base naturellement), i.e. \(Mat_B(\exp f)=\exp Mat_B(f)\) (voir section [cem] pour l’exponentielle de matrice).

  • L’exponentielle d’une matrice antisymétrique est une matrice orthogonale directe.

  • Le déterminant de l’exponentielle d’une matrice est l’exponentielle de la trace de cette matrice, i.e. \(\det \exp M = \exp Tr(M)\).

(Dérivation de l’exponentielle).

Soit \(E\) un Banach et soit \(f\in {\cal L}(E)\), alors l’application \(t \mapsto \exp(t f)\) est dérivable, de dérivée \(\exp(tf)\circ f=f \circ \exp(tf)\).

Il suffit de voir que l’on a convergence uniforme de la série dérivée, et d’appliquer le théorème de dérivation sous le signe intégrale [condersom].
Attention à ne pas généraliser en croyant que \(d(f\mapsto \exp(f))=(g\mapsto \exp(f)g)\), ce n’est pas vrai en général, et du ici au fait que l’homothétie commute avec tout endomorphisme!

Intuition Pour la pratique du calcul de l’exponentielle d’un endomorphisme en dimension finie, voir la partie [cem].

Transformation d’Abel

(Transformée d’Abel).
Soit \(E\) un espace vectoriel normé , \((r_n)\) une suite de réels, \((e_n)\) une suite de \(E\). On note \(E_n=\sum_{k=0}^n e_k\). Alors pour tout \(M<N\) \[\sum_{n=M}^N r_ne_n = [rE]_M^N - \sum_{n=M}^{N-1} (r_k-r_{k+1}) E_k\] avec \([rE]_M^N=r(N)E(N)-r(M)E(M-1)\) par définition (attention au \(-1\)!).
\[\begin{aligned} \sum_{n=M}^N r_ne_n &= \sum_{n=M}^N r_n(E_n-E_{n-1})\newline &=\sum_{n=M}^N r_nE_n - \sum_{k=M-1}^{N-1} r_{n+1}E_n = [rE]_M^N - \sum_{n=M}^{N-1} (r_k-r_{k+1}) E_k,\end{aligned}\] d’où le résultat. Soulignons l’analogie avec l’intégration par parties (théorème [ipp]).
Les théorèmes [thab] et [thdi2].

On trouvera aussi dans la partie [moch4] une application quant à la convergence de certaines séries entières au bord du disque de convergence.

Théorème d’Abel

Soit \((r_n)\) une suite de réels tendant en décroissant vers \(0\) (au moins au voisinage de l’infini), soit \((e_n)\) le terme général d’une série dans un Banach dont les sommes partielles sont bornées, alors la série de terme général \((u_n)\) avec \(u_n=r_n.e_n\) converge, ie \[\sum_{n=0}^\infty r_n.e_n\mbox{\ converge}\]
Application directe de la transformation d’Abel!

Un cas particulier classique est le cas \(e_n=(-1)^n\):

(Série alternée).

Si \(u_n=(-1)^n \epsilon_n\) et si \(\epsilon_n\) décroît vers \(0\), alors la série de terme général \(u_n\) converge.

La preuve utilisant Abel, quoique possible, est un peu forte pour ce résultat, qui s’obtient directement en considérant les suites \(U_{2n}\) et \(U_{2n+1}\); elles sont clairement adjacentes. On voit alors en outre que la limite \(U\) de \(U_n\) est toujours comprise entre \(U_{2n+1}\) et \(U_{2n}\).

Théorème de Dirichlet

(variation bornée).
On dit qu’une suite \((x_n)\) est à variation bornée si la série de terme général \((y_n)\) est absolument convergente, avec \(y_n=x_{n+1}-x_n\),

Grâce au critère de Cauchy, on peut constater qu’une suite à variation bornée, dans un espace de Banach, est convergente.

Soit \(\epsilon_n\) une suite à variation bornée tendant vers \(0\), et soit \((v_n)\) une suite telle que la série de terme général \((v_n)\) ait ses sommes partielles bornées, alors la série de terme général \((u_n)\) converge, avec \(u_n=\epsilon_n.v_n\).
Encore grâce à la transformation d’Abel, avec au passage une utilisation du critère de Cauchy.

L’hypothèse \(\epsilon_n \to 0\) est nécessaire; pour avoir un contre-exemple, considérer \(\epsilon_n=2+\frac1{n^2}\) et \(x_n=(-1)^n\).

Produit de convolution de deux séries

Pour commencer

(produit de convolution).
On se donne deux séries \(\sum u_n\) et \(\sum v_n\). Par définition, le produit de convolution de ces deux séries est la série de terme général \(w_n\) défini par \[w_n=\sum_{k=0}^n u_k.v_{n-k}\]
Si deux séries sont absolument convergentes, alors le produit de leurs sommes est égal à la somme de leur produit de convolution (qui est une série absolument convergente).
On suppose tout d’abord les séries à termes positifs.

En notant \(U_n\), \(V_n\) et \(W_n\) les sommes partielles des séries de termes généraux \(u_n\), \(v_n\), \(w_n\), on constate que \[W_n \leq U_n.V_n \leq W_{2n}\] (on peut s’en convaincre en cochant sur le plan quadrillé les coordonnées \((a,b)\) telles que \(u_a.v_b\) intervienne dans les différentes sommes ci-dessus, on obtient un carré et deux triangles imbriqués les uns dans les autres: voir figure [convol].)

\[\includegraphics[scale=1]{convol.eps}\]

Le cas général est un peu plus délicat.

On reprend les mêmes notations, et on ajoute les notations \(|U|_n\), \(|V|_n\) et \(|W|_n\) pour les sommes partielles des séries de termes généraux \(|u_n|\), \(|v_n|\) et \(|w_n|\).

La convergence absolue du produit de convolution découle trivialement du cas positif. La convergence de \(W_n\) vers \((lim\ U_n.lim\ V_n)\), elle, vient du fait que \[|U_n.V_n-W_n|\leq |U|_n.|V|_n-|W|_n\]

Pour aller plus loin: le théorème de Cauchy-Mertens

On peut en fait affaiblir les hypothèses (le résultat étant à peine affaibli):

(Cauchy-Mertens).
On se donne deux séries de termes généraux \((u_n)\) et \((v_n)\), la série de terme général \((u_n)\) étant supposé absolument convergente, et la série de terme général \(v_n\) étant convergente. Alors le produit de convolution de ces deux séries est convergent, et la somme du produit de convolution est égale au produit des sommes de ces deux séries.
On utilise les notations usuelles pour \(U_n\), \(V_n\), \(W_n\); on introduit aussi les quantités \(U\), \(V\) et \(W\), égales respectivement à la somme des \(u_n\), à la somme des \(v_n\) et à la somme des \(w_n\).

\(\bullet\)On remplace \(v_0\) par \(v_0-V\). En changeant cela on ne change pas la nature de la série de terme général \(v_n\). La somme \(U\) n’est pas changée, et la somme \(W\) est diminuée de \(V.U\), et \(V\) est remplacé par \(0\); donc il n’y a pas de perte de généralité.

\(\bullet\)On suppose donc que \(V=0\). Par un raisonnement analogue à celui illustré sur la figure [convol], on constate que \[W_n=\sum_{k=0}^n u_k.V_{n-k}\] On se donne \(M\) un majorant de \(|V_n|\).

On se donne alors \(\epsilon>0\), et \(N\) tel que la somme des \(|u_i|\) pour \(i>N\) soit inférieure à \(\epsilon\).

On décompose alors \(W_n\) en deux sommes: \[|W_n|\leq \sum_{k=0}^N |u_k.V_{n-k}| + \sum_{k=N+1}^n |u_k.V_{n-k}|\] or:

  • \(\displaystyle\sum_{k=0}^N |u_k.V_{n-k}| \leq (N+1).(\max_{k\in[0,N]} |u_k|).(\max_{k\in[0,N]} |V_{n-k}|)\)

    et par ailleurs

  • \(\displaystyle\sum_{k=N+1}^n |u_k.V_{n-k}|\leq M\sum_{k=N+1}^n | u_k | \leq \epsilon M\) \[\mbox{d'où }\; |W_n|\leq (N+1).(\max_{k\in[0,N]} |u_k|).(\max_{k\in[0,N]} |V_{n-k})| + \epsilon.M \leq \epsilon.M + \epsilon\] pour \(n\) assez grand, d’où le résultat.

Et si c’est le produit qui converge ?

On se donne deux séries de termes généraux \(u_n\) et \(v_n\), et on définit \(w_n\) le terme général de la série produit de convolution de ces deux séries.

On suppose que \(\sum w_n\) converge. Alors les séries de termes généraux \((u_n)\) et \((v_n)\) convergent. Ce résultat est cité dans [POM], avec un embryon de démonstration (il s’agit d’utiliser Cesaro).

Transformation de Toeplitz

(transformation de Toeplitz).
Etant donnée une famille \((c_{i,j})_{(i,j)\in \mathbb{N}^2}\) de coefficients complexes, on définit la transformation de Toeplitz associée à cette famille comme étant l’application qui à une suite complexe \((u_n)_{n\in\mathbb{N}}\) associe la suite \((Tu_n)_{n\in \mathbb{N}}\) définie par \(Tu_n=\sum_{i=0}^\infty c_{n,i}.u_i\). On dit que \(T\) est régulière si et seulement si pour toute suite \(u_n\) convergente, \(Tu_n\) est définie pour tout \(n\) et la suite \((Tu_n)\) converge vers la même limite que \((u_n)\).
Il s’agit de convergence de suites et non de séries; seuls les termes des \(Tu_n\) sont définis par des séries.

La transformation de Toeplitz \(T\) associée à \(c_{n,m}\) est régulière si et seulement si les trois conditions suivantes sont vérifiées:

\(\bullet\)Pour tout \(j\), \(c_{i,j} \to 0\) comme \(i\) tend vers \(+\infty\).

\(\bullet\)\(\sum_{j=0}^\infty c_{i,j}\) tend vers \(1\) comme \(i \to \infty\)

\(\bullet\)\(\sum_{j=0}^\infty |c_{i,j}|\) est défini et est borné par une constante \(M\) indépendante de \(i\)

\(\bullet\)Supposons que la transformation \(T\) soit régulière.

  • le premier \(\bullet\) exprime simplement le fait que \(T\) est régulière appliqué à la suite \(u_n=\delta_{n,j}\).

  • Le second \(\bullet\) exprime simplement le fait que \(T\) est régulière appliqué à la suite constante égale à \(1\).

  • Le troisième \(\bullet\) se montre en utilisant le théorème de Banach-Steinhaus. On définit: \[T_i(x)=\sum_{j=0}^\infty c_{i,j} x_j\] qui est bien défini dès que \(x\) est une suite convergente; \(T_i\) est bornée indépendamment de \(i\).

Chaque \(T_i\) est une application linéaire continue de l’espace de Banach des suites convergentes de \(\mathbb{C}\) (pour la norme \({\parallel}. {\parallel}_\infty\)) dans \(\mathbb{C}\).

Par le théorème de Banach-Steinhaus (théorème [banste]), on peut donc trouver \(M\) tel que pour toute suite \(x\), \[|T_i(x)| \leq M.{\parallel}x {\parallel}_\infty\] On considère alors, pour \(i\) donné et \(m\) quelconque, la suite \(x^{(m)}\) définie par: \[x_j=\overline c_{i,j}/|c_{i,j}| \mbox{ si $j<m$ et $c_{i,j}\neq 0$}\] \[x_j=0 \mbox{ sinon}\] \(x^{(m)}\) est convergente, de limite \(0\), bornée par \(1\).

En calculant \(T_i(x^{(m)})\), on constate que la somme des \(|c_{i,j}(x)|\) est bornée par \(M\).

D’où le point.

\(\bullet\)Il reste à voir la réciproque, c’est-à-dire que l’on suppose les trois points réalisés, et on cherche à montrer que \(T\) est régulière.

  • On se donne \((u_n)\) une suite convergente.

  • La suite \(\sum_j c_{i,j} u_j\) est évidemment convergente car \(c_{i,j} u_j=O(c_{i,j})\) avec \(\sum_j c_{i,j}\) absolument convergente. Donc \(Tu_n\) est bien défini pour tout \(n\).

  • Il reste à montrer que pour toute suite \((u_n)\) la suite de terme général \(Tu_n=\sum_{i=0}^\infty c_{n,j} u_j\) converge vers la même limite que \((u_n)\)

  • dans le cas général, on se ramène au cas d’une limite nulle \(0\), en remplaçant \(u_n\) de limite \(l\) par \(u_n-l\) (rappelons que par hypothèse \(\sum_j c_{i,j}\to 1\) quand \(i\to\infty\)).

  • On se donne donc une suite \(u_n\) de limite nulle.

  • On se donne \(N\) tel que \(|u_n|<\frac{\epsilon}{M}\) pour \(n\geq N\). \[| Tu_i|=\sum_{j=0}^N c_{i,j}.u_j + \sum_{j=N+1}^\infty c_{i,j}.u_j\]

  • Le terme \(\sum_{j=0}^N c_{i,j}.u_j\) tend vers \(0\) pour \(i\) tendant vers \(+\infty\), puisque par hypothèse \(c_{i,j}\to 0\) pour tout \(j\) quand \(i\to+\infty\).

  • Le terme \(\sum_{j=N+1}^\infty c_{i,j}.u_j\) est borné par \(\epsilon\), par définition de \(M\) et \(N\).

  • On a donc bien le résultat souhaité.

Ce résultat implique que la moyenne de Cesaro est une transformation de Toeplitz régulière; \(c_{n,m}=1/(n+1)\) si \(m\leq n\) et \(0\) sinon.

Si \(u_n\), suite à valeurs complexes, converge vers \(l\), alors \(Tu_n=\frac1{n+1} \sum_{i=0}^n u_i\) converge aussi vers \(l\).

Interversions

La hantise classique du mathématicien est de justifier les permutations entre sommes, intégrales, limites, dérivation. L’objectif de cette partie est de fournir tous les outils (ou presque) pour affronter cette tâche...

Interversion de limites et de dérivation

Pour cela, on consultera la partie [ild], ainsi que la section [derivse] quant à la dérivation de séries entières.

Interversion de limites et de limites

Il s’agit bien sûr d’intervertir une limite au sens d’un espace de fonctions avec une limite au sens de l’espace sur lequel sont définies ces fonctions... Formellement ça donne ça:

Soit \(X\) un espace topologique, \(A\) une partie de \(X\), \(a\) un point de l’adhérence de \(A\).

Soit \((E,d)\) un espace métrique, et enfin soit \((f_n)\) une suite d’applications de \(A\) dans \(E\), et \(f\) une application de \(A\) de \(E\).

Supposons que :

\(\bullet\)\(lim_{x\to a} f_n(x)=e_n\)

\(\bullet\)\(f_n\) converge uniformément vers \(f\) sur \(A\)

\(\bullet\)\(E\) est complet

Alors il existe un certain \(e\) limite de \(e_n\) et \(lim_{x\to a} f(x)=e\)

\(\bullet\)On considère \(\tilde f_n\) la fonction égale à \(f_n\) sur \(A\) et prolongée par continuité en \(a\) en posant \(\tilde f_n(a)=e_n\); \(\tilde f_n\) est donc continue en \(a\).

\(\bullet\)On se donne \(\epsilon>0\).

\(\bullet\)La convergence des \(f_n\) étant uniforme, on peut trouver \(N\) tel que \[n,m>N \Rightarrow \forall x, d(f_n(x),f_m(x))<\epsilon\]

\(\bullet\)On passe à la limite pour \(x\to a\) et on obtient \[n,m>N \Rightarrow d(e_n,e_m) \leq \epsilon\] (ceci implique que la suite \((e_n)\) est de Cauchy, donc par complétude de \(E\) qu’elle a une certaine limite \(e\))

\(\bullet\)La convergence de \(\tilde f_n\) est donc uniforme (par le critère de Cauchy pour la norme uniforme) (voir [norunicom])

\(\bullet\)Les \(\tilde f_n\) étant continues en \(a\), leur limite (uniforme) est donc continue en \(a\) (voir proposition [limcon]); d’où le résultat.
Soit \(f_n\) des fonctions continues admettant une limite \(e_n\) en \(a\in \overline A\), à valeurs dans \(E\) espace de Banach, telles que la série des \(f_n\) converge normalement (pour la norme infinie \({\parallel}.{\parallel}_\infty\)) vers \(f\). Alors la série de terme général \(e_n\) converge vers un certain \(e\), et \(f\) tend vers \(e\) en \(a\).
C’est exactement la même propriété, dans le cas des séries...

Interversion d’une limite et d’une intégrale

(Application réglée).
Une application de \(\mathbb{R}\) dans un espace topologique est dite réglée si et seulement si elle admet une limite à droite et une limite à gauche en tout point.
On ne demande pas du tout que la limite à droite soit égale à la limite à gauche, ni qu’aucune de ces deux limites soit égale à la valeur de l’application en ce point.

Intuition Les applications réglées ont été définies en parties [intrie] (sur l’intégrale de Riemann) comme les éléments de l’adhérence de l’ensemble des fonction en escalier (adhérence pour la norme \({\parallel}. {\parallel}_\infty\)). Ces deux définitions sont équivalentes, pour peu que \(X\) soit métrique.

On se donne \(E\) un espace de Banach, et \((f_n)\) une suite d’applications réglées du segment \([a,b]\) de \(\mathbb{R}\) dans \(E\) convergeant uniformément vers \(f\). Alors \(f\) est réglée et \(\displaystyle\int_{[a,b]} f=\lim_n\ \int_{[a,b]} f_n\).
Le fait que \(f\) soit réglée est un corollaire immédiat du théorème [ill] (interversion des limites de suites et de fonctions sous certaines hypothèses). Pour conclure il suffit d’observer que \[\left|\int_{[a,b]} f-\int_{[a,b]} f_n\right| \leq \int_{[a,b]} |f-f_n| \leq (b-a) {\parallel}f-f_n {\parallel}_\infty.\]
Si \(\sum f_n\) converge normalement (pour la norme \({\parallel}.{\parallel}_\infty\)), de \([a,b]\) segment de \(\mathbb{R}\) dans un espace de Banach \(E\), et si les \(f_n\) sont réglées, alors la somme des \(f_n\) est une fonction \(f\) réglée, d’intégrale la somme des intégrales des \(f_n\).
C’est exactement la même propriété, dans le cas des séries.

  1. 1  \(\mathbb{R}\) pouvant d’ailleurs éventuellement être remplacé par \(E\) Banach, ce qui sera utile pour la résolution d’équations linéaires à coefficients non constants en dimension infinie.
  2. 2  \(|f(x)|\) remplacé par \({\parallel}f(x) {\parallel}\) si \(E\) espace de Banach au lieu de \(\mathbb{R}\).
  3. 3  Pour \(z\) complexe, \(\cos(z)=\frac{e^{iz}-e^{iz}}2\) et \(\sin(z)=\frac{e^{iz}+e^{-iz}}{2i}\).

Bibliographie

  • [GRA] A. Gramain, Intégration, Hermann 1988, Paris.

  • [POM] A. Pommellet, Cours d’analyse, Ellipses 1994.

  • [ARFR] J.M. Arnaudiès, H. Fraysse, Cours de mathématiques. Analyse. Dunod, 1987.

  • [WIK] Wikipédia, L’encyclopédie Libre, Wikipédia, Wikipédia Fondation.


Barre utilisateur

[ID: 35] [Date de publication: 19 avril 2021 12:47] [Catégorie(s): Le cours d'agrégation ] [ Nombre commentaires: 0] [nombre d'éditeurs: 1 ] [Editeur(s): Emmanuel Vieillard-Baron ] [nombre d'auteurs: 6 ] [Auteur(s): François Capaces Christophe Antonini Olivier Teytaud Pierre Borgnat Annie Chateau Edouard Lebeau ]




Commentaires sur le cours

Documents à télécharger

Quelques synthèses et compléments d’analyse
Télécharger Télécharger avec les commentaires

L'article complet