Lecture zen
Soient \(f\in \mathscr F \left(I,\mathbb{R}\right)\) et \(a\in I\). Le plan étant ramené à un repère orthonormé, pour \(x \in I\setminus \left\{ a \right\}\), considérons la droite joignant les points \(A \left|\begin{matrix} a \\ f(a) \end{matrix} \right.\) et \(M \left|\begin{matrix} x \\ f(x) \end{matrix} \right.\). La pente de la droite \((AM)\) est donnée par \[\Delta_a(x)={\dfrac{f(x)-f(a)}{x-a}}\] Si la fonction \(f\) est dérivable au point \(a\in I\), cette pente a pour limite \(f'(a)\) quand \(x\) tend vers \(a\). Le vecteur de composante \(\left|\begin{matrix} 1 \\ \Delta_a(x) \end{matrix} \right.\) dirige la corde \((AM)\) et tend vers \(\left|\begin{matrix} 1 \newline f'(a) \end{matrix} \right.\). La droite passant par \(A\) et de pente \(f'(a)\) est donc tangente à la courbe d’équation \(y=f(x)\). C’est la position limite des cordes \((AM)\) quand \(M\) tend vers \(A\).
Dérivabilité en un point, sur un intervalle puis les fameux théorèmes de Rolle et des accroissements finis.
Dérivation des fonctions réelles à variable réelle
Dérivabilité en un point, sur un intervalle puis les fameux théorèmes de Rolle et des accroissements finis.
On dit qu’une grandeur est la limite d’une autre grandeur, quand la seconde peut s’approcher de la première plus près que d’une grandeur donnée, si petite qu’on puisse la supposer...
D’Alembert.
Pour bien aborder ce chapitre
Ce chapitre est une introduction à l’une des plus fabuleuses invention de l’homme, celle du calcul différentiel, dans le cas des fonctions d’une variable réelle à valeurs réelles.
L’histoire du calcul différentiel débute en grande partie avec Galilée et Newton qui avaient besoin de nouveaux outils mathématiques pour développer les notions de vitesse et d’accélération d’un mouvement. Mais la possibilité de calculer la pente de la tangente à une courbe était essentielle dans d’autres problèmes comme dans ceux d’extremum ou pour des questions plus appliquées. Newton et Leibniz furent les premiers à tenter de formaliser la notion de dérivée. Ils se disputèrent la paternité de cette invention mais il semble certain maintenant qu’ils l’ont découvert de manière indépendante et chacun via des formalismes différents. Comme expliqué dans l’introduction du chapitre [chapitre_suites_reelles], la notion de limite n’a été développée que bien plus tard, au \(19^{\textrm{ ème}}\) siècle par Cauchy et Weierstrass aussi la formalisation de la dérivation par Newton et Leibniz souffrait de nombreuses lacunes. Newton refusa d’ailleurs de publier son travail et les écrits de Leibniz étaient obscurs et difficiles à comprendre. Lagrange, un siècle plus tard introduit le terme de dérivée ainsi que la notation \(f'\).
Après avoir défini ce qu’est une fonction dérivable ainsi que sa dérivée, nous démontrerons les règles de calcul des dérivées que vous connaissez depuis le lycée. Nous verrons en particulier que la dérivée permet d’approcher une fonction donnée par une fonction affine (voir le théorème page [DL1]). Nous nous intéresserons aux propriétés globales des fonctions dérivables. Le théorème de Rolle [Theo_de_Rolle] page [Theo_de_Rolle] et celui des accroissements finis [thm:TAF] page [thm:TAF] seront d’un usage constant en analyse. L’inégalité des accroissements finis [thm:IAF] page [thm:IAF] qui découle du théorème du même nom est une véritable machine à fabriquer des inégalités. Des accroissements finis découle aussi le caractère \(k\)-Lipschitzien des fonctions dérivables, ce qui permet d’appliquer à celles pour qui \(k\in\left]0,1\right[\) le très important théorème du point fixe [thm:0709115046] page [thm:0709115046]. Le théorème de dérivation de la bijection réciproque [derivee_non_nulle_implique_bij] page [derivee_non_nulle_implique_bij] permettra de justifier les démonstrations effectuées dans le chapitre sur les fonctions usuelles. Nous continuerons cette section par une étude des fonctions de classe \(\mathcal{C}^{n}\) et \(\mathcal{C}^{\infty}\) et nous la terminerons par une introduction aux fonctions convexes. Ce dernier outil servira aussi à construire de nombreuses inégalités.
Dérivée en un point, fonction dérivée
Dans tout ce paragraphe, \(I\) est un intervalle de \(\mathbb{R}\) non vide et non réduit à un point. Les fonctions considérées sont définies sur \(I\) et à valeurs réelles.
Définitions
(Taux d’accroissement). Soient \(f\in \mathscr F \left(I,\mathbb{R}\right)\) et \(a\in I\). On définit le taux d’accroissement de la fonction \(f\) au point \(a\) comme étant la fonction \(\Delta_{a,f}\) définie par \[\Delta_{a,f}: \left\{ \begin{array}{ccl} I\setminus \left\{ a \right\} & \longrightarrow & \mathbb{R} \newline x & \longmapsto & \dfrac{f(x)-f(a)}{x-a} \end{array} \right.\]
(Fonction dérivable à droite, à gauche ). Soient \(f\in \mathscr
F \left(I,\mathbb{R}\right)\), \(a\in I\) et \(\Delta_{a,f}\) le taux d’accroissement de \(f\) au point \(a\). On dit que
(Dérivée en un point). Soient \(f\in \mathscr F \left(I,\mathbb{R}\right)\) et \(a\in I\). On dit que \(f\) est dérivable au point \(a\) si et seulement si son taux d’accroissement \(\Delta_{a,f}\) possède une limite finie quand \(x\) tend vers \(a\). Cette limite s’appelle le nombre dérivée de \(f\) au point \(a\) et est noté: \[f'(a) \quad \textrm{ ou} \quad Df(a) \quad \textrm{ ou} \quad\dfrac{df}{dx}(a)\]
Pour un point \(a\) intérieur à \(I\) (c’est-à-dire tel qu’il existe \(\alpha>0\) vérifiant \(\left]a-\alpha,a+\alpha\right[\subset I\)) alors \(f\) est dérivable au point \(a\) si et seulement si on a simultanément :
Interprétations de la dérivée
Interprétation géométrique
Soient \(f\in \mathscr F \left(I,\mathbb{R}\right)\) et \(a\in I\). Le plan étant ramené à un repère orthonormé, pour \(x \in I\setminus \left\{ a \right\}\), considérons la droite joignant les points \(A \left|\begin{matrix} a \\ f(a) \end{matrix} \right.\) et \(M \left|\begin{matrix} x \\ f(x) \end{matrix} \right.\). La pente de la droite \((AM)\) est donnée par \[\Delta_a(x)={\dfrac{f(x)-f(a)}{x-a}}\] Si la fonction \(f\) est dérivable au point \(a\in I\), cette pente a pour limite \(f'(a)\) quand \(x\) tend vers \(a\). Le vecteur de composante \(\left|\begin{matrix} 1 \\ \Delta_a(x) \end{matrix} \right.\) dirige la corde \((AM)\) et tend vers \(\left|\begin{matrix} 1 \newline f'(a) \end{matrix} \right.\). La droite passant par \(A\) et de pente \(f'(a)\) est donc tangente à la courbe d’équation \(y=f(x)\). C’est la position limite des cordes \((AM)\) quand \(M\) tend vers \(A\).
Interprétation cinématique
Considérant \(f(t)\) comme l’abscisse à l’instant \(t\) d’un point en mouvement rectiligne, pour \(t\neq a\), \(\Delta_{a,f}(t)\) représente la vitesse moyenne entre les instants \(t\) et \(a\) et sa limite \(f'(a)\), notée aussi \(\stackrel{.}{f}(a)\) la vitesse instantanée à l’instant \(a\).
Interprétation analytique
Le théorème suivant permet de caractériser la dérivabilité en un point sans faire intervenir de division. Il sera généralisé en deuxième année pour des fonctions de plusieurs variables.
(Développement limité à l’ordre \(1\) d’une fonction dérivable). Soit \(f \in \mathscr F \left(I,\mathbb{R}\right)\). La fonction \(f\) est dérivable au point \(a\in I\) si et seulement si il existe \(\varepsilon:I
\rightarrow \mathbb{R}\) telle que \(\varepsilon(x) \xrightarrow[x\rightarrow a]{} 0\) et un réel \(c\) tel que \[\forall x\in I, \quad \boxed{f(x)=f(a)+c(x-a)+
\underbrace{(x-a)\varepsilon(x)}_{\underset{x \rightarrow a}{o}\left(x-a\right)}}\] On a alors \(c=f'(a)\).
Dérivabilité et continuité
(Dérivabilité implique continuité ). Soient \(f \in \mathscr F \left(I,\mathbb{R}\right)\) et \(a\in I\). Si \(f\) est dérivable en \(a\) alors \(f\) est continue en \(a\).
Comme \(f\) est dérivable en \(a\), d’après la proposition [DL1], il existe une fonction \(\varepsilon : I \rightarrow \mathbb{R}\) vérifiant \(\varepsilon(x)
\xrightarrow[x\rightarrow a]{} 0\) et telle que \[\forall x\in I, \quad f(x)=f(a)+f'\left(a\right)(x-a)+ (x-a)\varepsilon(x).\] Comme \(\varepsilon\left(x\right)\xrightarrow[x\rightarrow 0]{}0\), par opérations sur les limites, \(f\left(x\right)
\xrightarrow[x\rightarrow 0]{} f\left(a\right)\) et \(f\) est bien continue en \(a\).
La réciproque est bien entendu fausse (par exemple \(f : \mathbb{R} \rightarrow \mathbb{R}, x \mapsto \left|x\right|\) est continue en \(0\) mais pas dérivable en \(0\)).
Fonction dérivée
(Dérivabilité sur un intervalle). On dit qu’une fonction \(f\) est dérivable sur \(I\) si et seulement si elle est dérivable en tout point \(a \in I\). On définit alors la fonction dérivée \[f': \left\{ \begin{array}{ccl} I & \longrightarrow & \mathbb{R} \newline x & \longmapsto & f'(x) \end{array} \right.\] La fonction dérivée se note aussi \(Df\) ou \(\dfrac{df}{dx}\).
Si une fonction \(f\) est dérivable sur \(I\) alors elle est continue sur \(I\).
Opérations sur les dérivées
(Règles de calcul de dérivées). Soient deux fonctions \(f\) et \(g\) définies sur \(I\) et dérivables en un point \(a\in I\). On a les propriétés suivantes :
Soit \(x \in I\setminus\left\{a\right\}\).
(Théorème d’opérations sur les fonctions dérivables). Soient \(f\) et \(g\) deux fonctions définies et dérivables sur \(I\).
Ces propriétés sont vraies en chaque point de \(I\) et donc sur \(I\) tout entier.
(Dérivation des fonctions composées). Soient deux fonctions \(f:I \rightarrow R\), \(g:J \rightarrow \mathbb{R}\) telles que \(f(a)\in J\). On suppose que
Alors la fonction \(g\circ f\) est dérivable en \(a\) et \[\boxed{\left(g\circ f\right)'\left(a\right)= g'\left(f\left(a\right)\right) \times f'\left(a\right)}\]
Introduisons la fonction \[h: \left\{ \begin{array}{ccl} J & \longrightarrow & \mathbb{R} \\ x & \longmapsto & \begin{cases}
\dfrac{g\left(y\right)-g\left(b\right)}{y-b} &\textrm{ si } y\neq b \newline g'\left(y\right) &\textrm{ si } y=
b \end{cases} \end{array} \right.\] qui est continue en \(b\) car \(g\) est dérivable en \(b\). Alors pour tout \(x\in I\setminus\left\{a\right\}\) :
\[\dfrac{g\left(f\left(x\right)\right)- g\left(f\left(a\right)\right)}{x-a} = h\left(f\left(x\right)\right)\dfrac{f\left(x\right)-f\left(a\right)}{x-a}
\xrightarrow[x\rightarrow a]{} h\left(b\right) \times f'\left(a\right)= g'\left(f\left(a\right)\right) \times f'\left(a\right)\] par opérations sur les limites.
Dans cette preuve, on pourrait être tenter d’écrire pour \(x\in
I\setminus \left\{ a\right\}\) \[\dfrac{g\circ f\left(x\right) -
g\circ f\left(a\right)}{x-a} = \dfrac{g\left(f\left(x\right)\right) - g\left(f\left(a\right)\right)}{f\left(x\right)-f\left(a\right)}
\dfrac{f\left(x\right)-f\left(a\right)}{x-a}\] ce qui n’est pas correct car la fonction \(f\) peut s’annuler une infinité de fois au voisinage de \(a\) sans être constante et tout en étant dérivable en \(a.\) Un exemple d’une telle fonction est donné par \(x\mapsto x^2 \sin 1/x\) en \(a=0\).
Soient deux fonctions \(f:I \rightarrow R\) et \(g:J \rightarrow \mathbb{R}\) telles que \(f(I)\subset J\). On suppose que
Alors la fonction \(g\circ f\) est dérivable sur \(I\) et \[\boxed{\left(g\circ f\right)'= (g'\circ {f}) \times f'}\]
La propriété est vraie en chaque point de \(I\) donc elle est vraie sur \(I\).
(Dérivation de la bijection réciproque). Soit une fonction \(f:I \rightarrow R\). On suppose que
Alors la fonction \(f\) réalise une bijection de l’intervalle \(I\) sur l’intervalle \(J=f(I)\) et son application réciproque, \(f^{-1}\) est dérivable sur l’intervalle \(J\) avec \[\boxed{\left(f^{-1}\right)'=\dfrac{1}{f'\circ f^{-1}}}\]
Comme \(f\) est injective sur \(I\), elle est bijective de \(I\) sur \(J\) et comme elle est dérivable sur \(I\) elle est continue sur \(I\) et \(J\) est un intervalle de \(\mathbb{R}\). En appliquant le théorème [theo_bij_continue], sa bijection réciproque \(f^{-1}\) est continue sur \(J\). Soit \(y_0\in J\). Montrons que la fonction \(f^{-1}\) est dérivable au point \(y_0\). Soit \(y\in J\setminus
\left\{y_0\right\}\). Écrivons : \[\Delta_{y_0, f^{-1}}(y) = \dfrac{f^{-1}(y) - f^{-1}(y_0)}{y-y_0} =
\dfrac{1}{\dfrac{f(f^{-1}(y)) - f(f^{-1}(y_0))}{f^{-1}(y)-f^{-1}(y_0)}} =
\dfrac{1}{\Delta_{f^{-1}(y_0), f}(f^{-1}(y))}\] Puisque la fonction \(f\) est dérivable au point \(f^{-1}(y_0)\), \(\Delta_{f^{-1}(y_0), f}(y) \xrightarrow[y \rightarrow y_0]{} f'(f^{-1}(y_0))\). Puisque cette limite est non nulle, par opération sur les limites, \(\Delta_{y_0, f^{-1}}(y) \xrightarrow[y \rightarrow y_0]{} 1/f'(f^{-1}(y_0))\).
Étude globale des fonctions dérivables
Extremum d’une fonction dérivable
(Condition nécessaire d’un extremum relatif). Soit \(f\) une fonction définie sur un intervalle \(I\) de \(\mathbb{R}\) et soit \(a\) un point de \(I\) tel que
alors \(\boxed{f'(a)=0}\).
Quitte à changer \(f\) en \(-f\), on peut supposer que \(f\) possède un maximum local en \(a\), c’est-à-dire qu’il existe \(\beta>0\) tel que \(\forall
x\in\left[a-\beta,a+\beta\right]\cap I,\quad f\left(x\right)\leqslant f\left(a\right)\). Posons \(r=\min\left(r_1,r_2\right)\).
Puisque \(f\) est dérivable en \(a\), on obtient que \(f'_g\left(a\right) = f'_d\left(a\right)=f'\left(a\right)=0\).
Théorème de Rolle
(Théorème de Rolle). Soit \(f:\left[a,b\right] \rightarrow \mathbb{R}\). On suppose que
Alors il existe \(c\in\left]a,b\right[\) tel que \(\boxed{f'\left(c\right)=0}\).
Comme \(f\) est continue sur le segment \(\left[a,b\right]\), l’image de ce segment, par application du théorème [image_segment_appl_continue] est un segment \(\left[m,M\right]\) avec \(m\leqslant M\).
Interprétation graphique
Interprétation cinématique
Un point mobile sur un axe qui revient à sa position de départ a vu sa vitesse s’annuler à un instant donné.
appendice analyse pour l’utilisation pratique du théorème de Rolle, polynômes, extremum d’une bonne fonction auxiliaire
Égalité des accroissements finis
(Théorème des accroissement finis (TAF)). Soit une fonction \(f:\left[a,b\right] \rightarrow \mathbb{R}\). On suppose que
Alors il existe un point intérieur \(c\in\left]a,b\right[\) tel que \[\boxed{f(b)-f(a)=f'(c)\left(b-a\right)}\]
Nous allons donner deux preuves typiques dont on s’inspire dans les exercices. L’idée consiste à appliquer le théorème de Rolle à une bonne fonction auxiliaire pour obtenir l’existence du réel \(c\) vérifiant la propriété qui nous intéresse. La première preuve consiste à voir sur un dessin un problème d’extremum.
(1). En examinant la figure ci-dessus, on voit que le point \(c\) correspond au maximum de l’écart vertical entre la corde \([A,B]\) et le point \((x, f(x))\). Définissons donc la mesure algébrique de cet écart : \[\varphi: \left\{ \begin{array}{ccl} [a,b] & \longrightarrow & \mathbb{R} \newline x & \longmapsto & f(x) - \left[f(a) + \dfrac{f(b)-f(a)}{b-a}(x-a)\right] \end{array} \right.\] La fonction \(\varphi\) est continue sur le segment \([a, b]\) (théorèmes généraux), dérivable sur l’intervalle \(]a, b[\) (théorème généraux sur les dérivées) et on calcule \(\varphi(a) = \varphi(b) = 0\). D’après le théorème de Rolle, il existe un point intérieur \(c \in ]a, b[\) tel que \(\varphi'(c) = 0\), c’est-à-dire \(f'(c) - \dfrac{f(b)-f(a)}{b-a} = 0\).
La deuxième preuve est plus taupinale et peu naturelle, mais fournit une recette qui fonctionne bien dans les exercices lorsque la formule à démontrer est compliquée.
(1). Appliquons cette recette à notre problème. La formule à montrer s’écrit \(f(b) - f(a) - f'(c)(b-a) = 0\). Définissons donc une fonction auxiliaire \(\varphi: \left\{ \begin{array}{ccl} [a,b] & \longrightarrow & \mathbb{R} \newline x & \longmapsto & f(t)-f(a) - K(t-a) \end{array} \right.\) où \(K\) est une constante que nous choisissons de telle sorte que \(\varphi(a)=\varphi(b)\). On trouve que \(K = [f(b)-f(a)]/(b-a)\) ce qui conduit à la fonction auxiliaire de la première preuve.
Cette méthode d’un usage très courant est très employée dans les exercices
Quand un mobile se déplace sur un axe et part d’un point \(A\) au temps \(t_1\), arrive en \(B\) au temps \(t_2\) et si \(f\) est la fonction position de ce mobile sur l’axe, alors il existe un instant \(t\in\left]t_1,t_2\right[\) tel que la vitesse instantanée en \(t\) : \(f'\left(t\right)\) de ce mobile soit égale à sa vitesse moyenne \(\dfrac{f\left(t_2\right)-f\left(t_1\right)}{t_2-t_1}\).
Inégalité des accroissements finis
(Inégalité des accroissement finis (IAF)). Soit une fonction \(f:\left[a,b\right] \rightarrow \mathbb{R}\). On suppose que
Alors on a \[\boxed{m\left(b-a\right)\leqslant f(b)-f(a)\leqslant M\left(b-a\right)}\]
Il suffit d’appliquer le théorème des accroissements finis à la fonction \(f\) sur le segment \(\left[a,b\right]\). Il existe un réel \(c\in\left]a,b\right[\) tel que \(f(b)-f(a)=f'(c)\left(b-a\right)\). Puisque \(m \leqslant f'(x) \leqslant M\), on en déduit que \(m\left(b-a\right)\leqslant f(b)-f(a)\leqslant M\left(b-a\right)\).
(Dérivée bornée implique lipschitzienne). Soit une fonction \(f:I \rightarrow \mathbb{R}\) définie sur un intervalle \(I\). On suppose que
Alors la fonction \(f\) est \(K\)-lipschitzienne sur l’intervalle \(I\).
Soit \((x, y) \in I^2\) avec \(x<y\). Puisque \([x, y] \subset I\), la fonction \(f\) est continue sur le segment \([x,y]\) et dérivable sur l’intervalle ouvert \(]x, y[\), d’après le théorème des accroissements finis, il existe \(c \in ]x, y[\) tel que \(f(y)-f(x) = f'(c)(y-x)\). On en déduit que \(\lvert f(y)-f(x) \rvert = \lvert f'(c) \rvert \lvert y-x \rvert \leqslant K\lvert y-x \rvert\).
Application: Variations d’une fonction
Le résultat suivant, utilisé depuis le lycée est une conséquence du théorème des accroissements finis.
(Caractérisation des fonctions constantes, monotones). Soit une fonction \(f : I \mapsto \mathbb{R}\). On suppose que
Alors on a les résultats suivants :
Démontrons la première équivalence. Les trois suivantes se démontrent de même.
La réciproque de (2) est fausse : la fonction \(x \mapsto x^3\) est strictement croissante sur \(\mathbb{R}\), dérivable et pourtant sa dérivée s’annule en \(0\).
Condition suffisante de dérivabilité en un point
(Théorème du prolongement dérivable). Soit une fonction \(f:I \rightarrow \mathbb{R}\) et un réel \(a\in I\). On suppose que
Alors la fonction \(f\) est dérivable au point \(a\) et \(f'(a)=l\).
Soit \(x\in I\setminus\left\{a\right\}\). La formule des accroissements finis appliquée au segment \(\left[a,x\right]\) nous assure de l’existence de \(c_x\in\left]a,x\right[\) tel que \(\dfrac{f\left(x\right)-f\left(a\right)}{x-a}=f'\left(c_x\right)\). Comme \(c_x
\xrightarrow[x\rightarrow a^+]{}a\), on en déduit que \(\dfrac{f\left(x\right)-f\left(a\right)}{x-a}
\xrightarrow[x\rightarrow a^+]{}l\) et donc que \(f\) est dérivable à droite en \(a\) et que \(f_d'(a)=l\). On fait de même à gauche de \(a\).
Soient \(f:I \rightarrow \mathbb{R}\) et \(a\in I\). On suppose que
Alors \(\displaystyle{\lim_{x \rightarrow a}\dfrac{f(x)-f(a)}{x-a}}=+\infty\). En d’autres termes, la courbe représentative de \(f\) possède une tangente verticale au point \(a\).
Laissée au lecteur en s’inspirant par exemple de la preuve de la proposition précédente.
(1). La réciproque du théorème de prolongement dérivable est fausse comme le montre le contre-exemple suivant \[f : \left\{ \begin{array}{ccl} \mathbb{R} & \longrightarrow & \mathbb{R} \\ x & \longmapsto & \begin{cases} x^2\sin\dfrac{1}{x} & \textrm{
si } x \neq 0 \newline
0 & \textrm{ si } x = 0
\end{cases}
\end{array} \right.\] Cette fonction est dérivable en \(0\) et \(f'(0) = 0\) car \[\Bigl| \dfrac{f(x) - f(0)}{x}\Bigr| \leqslant\lvert x \rvert \lvert \sin{\scriptstyle 1\over\scriptstyle x} \rvert
\leqslant\lvert x \rvert \xrightarrow[x \rightarrow 0]{} 0\] La fonction \(f\) est dérivable en tout point \(x \neq 0\) avec \(f'(x) = 2x\sin(1/x) - \cos(1/x)\) et \(f'\) n’admet pas de limite lorsque \(x \rightarrow 0\). En effet, la suite \(\left(f\left(1/(n\pi)\right)\right)_{n\geqslant 1}\) admet deux sous-suites, une convergeant vers \(1\) et l’autre vers \(-1\).
Dérivées successives
Dérivée seconde
Soit une fonction \(f\) définie et dérivable sur un intervalle \(I\) de \(\mathbb{R}\).
(Fonction deux fois dérivable). On dit que la fonction \(f\) est deux fois dérivable sur \(I\) lorsque la fonction \(f'\) est dérivable en tout point de \(I\). Sa dérivée est appelée fonction dérivée seconde de \(f\) et est notée \[f'' \quad \textrm{ ou} \quad D^2f \quad \textrm{ ou} \quad\dfrac{d^2f}{dt^2}\]
Si \(f\) est deux fois dérivable sur \(I\) alors \(f'\) et \(f\) sont continues sur \(I\).
Lorsque \(f(t)\) est l’abscisse à l’instant \(t\) d’un point en mouvement rectiligne alors \(f''(t)\), si elle existe, représente l’accélération de ce point à l’instant \(t\).
Dérivée d’ordre \(n\)
Soit \(n\in \mathbb{N}\).
(Dérivées successives). Étant donné une fonction \(f:I\rightarrow \mathbb{R}\), on pose \(f^{(0)}=f\) et on définit par récurrence, la dérivée \(n^{\textrm{ ème}}\) de \(f\) sur \(I\), notée \(f^{(n)}\), comme la dérivée de \(f^{(n-1)}\), si elle existe. On la note \[f^{(n)} \quad \textrm{ ou} \quad D^n f \quad \textrm{ ou} \quad\dfrac{d^n f}{dt^n}\]
Étant donné deux fonctions \(f\) et \(g\) définies sur \(I\) et \(n\) fois dérivables sur \(I\) ainsi que deux réels \(\alpha\) et \(\beta\). Alors la fonction \(\alpha f + \beta g\) est elle aussi \(n\) fois dérivable sur \(I\) et : \[\forall x\in I, \quad \boxed{
\left(\alpha f+\beta g\right)^{(n)}\left(x\right)=\alpha f^{(n)}\left(x\right)+\beta
g^{(n)}\left(x\right)}\]
Par récurrence.
Gottfried Leibniz, Né le 1er juillet \(1646\) à Leipzig , mort le \(14\) novembre \(1716\) à Hanovre Gottfried Leibniz est un philosophe, scientifique, mathématicien, diplomate, bibliothécaire et juriste allemand. Il se montre précoce intellectuellement et possède de fortes capacités d’apprentissage. Il dit avoir appris seul le latin et à \(15\) ans il connaît la littérature grecque et latine. Il obtient son baccalauréat à \(17\) ans et rentre la même année à l’Université de Leipzig où il étudie la philosophie, le droit et les mathématiques. Cette université lui refuse en \(1666\) de lui décerner le titre de docteur, sans doute à cause de son très jeune âge et il obtient celui-ci un an plus tard à l’Université de Nuremberg. Plutôt que de chercher un poste universitaire, il rentre au service du baron von Boyneburg à Francfort qui l’initie à la politique. Leibniz est, avec Newton, l’inventeur du calcul infinitésimal et fut le découvreur des formules de dérivation d’un produit, d’un quotient et d’une puissance. Newton était parvenu de son côté, quelques années auparavant, aux mêmes résultats que Leibniz mais sans publier son travail. Une longue polémique s’ensuivit afin de déterminer qui avait la paternité de cette théorie.
(Formule de Leibniz). Si \(f\) et \(g\) sont deux fonctions \(n\) fois dérivables sur \(I\) alors il en est du même du produit \(fg\) et on a la formule de Leibniz qui permet d’exprimer la dérivée \(n\)-ième du produit \[\boxed{\left(fg\right)^{(n)}=\displaystyle{\sum_{k=0}^n \dbinom{n}{k}
f^{(k)}g^{(n-k)}}}\]
Par récurrence. Voir la preuve de la formule du binôme de Newton [formule_du_binome].
Soient \(f:I \rightarrow \mathbb{R}\) et \(g:J \rightarrow \mathbb{R}\) telles que \(f(I)\subset J\). Soit \(n\in \mathbb{N}^*\). Si
Alors la fonction composée \(g\circ f\) est \(n\) fois dérivable sur l’intervalle \(I\).
Par récurrence sur \(n\). Pour \(n = 1\), la propriété a déjà été montrée. Soit \(n\in\mathbb{N}^*\). Supposons qu’une composée de fonctions \(n\) fois dérivable est \(n\) fois dérivable sur \(I\). Montrons que si \(f\) et \(g\) sont \((n+1)\) fois dérivable sur \(I\) et \(J\) respectivement alors \(g\circ f\) est \(n+1\) fois dérivable sur \(I\). On sait que \(f\) et \(g\) sont \(1\) fois dérivable sur respectivement \(I\) et \(J\) et que \((f\circ g)' =
f' \times g'\circ f\). D’après l’hypothèse de récurrence, comme \(f'\) et \(g'\) sont \(n\) fois dérivables sur \(I\) et \(J\) respectivement, \(g'\circ f\) est \(n\) fois dérivable sur \(I\) et d’après le théorème de Leibniz, \(f' \times g'\circ f\) est aussi \(n\) fois dérivable sur \(I\). Donc \(\left(g\circ f\right)'\) est \(n\) fois dérivable sur \(I\) et \(g\circ f\) est \((n+1)\) fois dérivable sur \(I\). La propriété est ainsi prouvée par récurrence.
Une expression de la dérivée \(n\)-ième de la composée de deux fonctions est donnée par la formule de Faà di Bruno. Elle est très difficile à manipuler et ne relève pas du programme.
Fonctions de classe \(\mathcal{C}^{n}\)
Soit \(n\in \mathbb{N}\).
(Fonctions de classe \(\mathcal{C}^{n}\)). On dit qu’une fonction \(f:I \rightarrow \mathbb{R}\) est de classe \(\mathcal{C}^{n}\) sur l’intervalle \(I\) si et seulement si
On note
Soit \((f,g)\in \mathcal{C}^{n}\left(I\right)^2\) et soit \(\left(\alpha,\beta\right) \in \mathbb{R}^2\). Alors
Soient \(f:I \rightarrow \mathbb{R}\) et \(g:J \rightarrow \mathbb{R}\) telles que \(f(I)\subset J\). Soit \(n\in \mathbb{N}\). Si
alors \(g\circ f\in \mathcal{C}^{n}\left(I\right)\).
Soient \(n\in \mathbb{Z}\) et \(f_n: \left\{ \begin{array}{ccl} \mathbb{R}^* & \longrightarrow & \mathbb{R} \newline x & \longmapsto & x^n \end{array} \right.\). On a pour tout \(n\in
\mathbb{Z},\quad f_n \in \mathcal{C}^{\infty}\left(\mathbb{R}^*\right)\) ( On a même \(f_n \in
\mathcal{C}^{ \infty}\left(\mathbb{R}\right)\) si \(n\in\mathbb{N}\)).
Soit \(f\in \mathcal{C}^{n}\left(I\right)\) ne s’annulant pas sur \(I\), alors \(1/f\) est élément de \(\mathcal{C}^{n}\left(I\right)\).
(Théorème de la bijection de classe \(\mathcal{C}^{n}\)). Soit \(f\in \mathcal{C}^{n}\left(I\right)\) telle que
alors \(f\) est une bijection sur son image \(J=f(I)\) et \(f^{-1}\) est de classe \(\mathcal{C}^{n}\) sur \(J\).
Fonctions convexes
(Fonction convexe). Soit \(f:I\mapsto \mathbb{R}\) une fonction définie sur un intervalle \(I\subset \mathbb{R}\). On dit que \(f\) est convexe lorsque \[\forall (x,y)\in I^2, \forall \lambda \in [0,1], \quad
f\bigl(\lambda x + (1-\lambda)y\bigr) \leqslant
\lambda f(x) + (1-\lambda)f(y)\]
Cela signifie géométriquement que le graphe de \(f\) est situé en dessous de toutes les cordes joignant deux points de ce graphe.
On dit qu’une fonction \(f\) définie sur un intervalle \(I\) est concave lorsque \[\forall (x,y)\in I^2, \forall \lambda \in [0,1], \quad
f\bigl(\lambda x + (1-\lambda)y\bigr) \geqslant
\lambda f(x) + (1-\lambda)f(y)\] La fonction \(f\) est concave si et seulement si la fonction \(-f\) est convexe. Dans la suite, on n’étudiera que les propriétés des fonctions convexes.
Les fonctions qui sont à la fois convexes et concaves sont les fonctions affines.
(Fonction strictement convexe). On dit qu’une fonction \(f: I \mapsto \mathbb{R}\) est strictement convexe lorsque \(\forall (x, y)\in I^2\), \(x \neq y\), \[\forall \lambda \in ]0, 1[,\quad f\bigl(\lambda x + (1-\lambda) y \bigr)
< \lambda f(x) + (1-\lambda) f(y)\]
(Inégalité de convexité généralisée). Soit une fonction \(f\) convexe sur l’intervalle \(I\). Alors \[\forall n\geqslant 2, \forall (x_1,\dots,x_n)\in I^n, \forall
(\lambda_1,\dots,\lambda_n)\in [0,1]^n \textrm{ tels que } \sum_{i=1}^n
\lambda_i=1\] \[f(\lambda_1x_1+\dots+\lambda_nx_n) \leqslant\lambda_1f(x_1)+\dots +
\lambda_n f(x_n).\]
Par récurrence sur \(n\). Pour \(n = 2\), c’est la définition d’une fonction convexe. Montrons \(\mathcal{P}(n) \Rightarrow \mathcal{P}(n+1)\). Soient \(x_1,\dots, x_n, x_{n+1} \in I\) et \(\lambda_1,\dots \lambda_{n+1} \in [0, 1]\) tels que \(\sum_{i=1}^{n+1} \lambda_i = 1\). On peut supposer que tous les \(\lambda_i\) sont strictement positifs, sinon on se ramène à la propriété \(\mathcal{P}(n)\). Posons \(y=\dfrac{\sum_{i=1}^n \lambda_i x_i
}{\sum_{i=1}^n \lambda_i}\) et pour \(i \in [\kern-0.127em[ 1, n ]\kern-0.127em]\), \(\mu_i = \dfrac{\lambda_i}{\sum_{i=1}^n \lambda_i}\) : \(\sum_{i=1}^n
\mu_i = 1\). Puisque \(f\) est convexe, \[f(\lambda_{n+1} x_{n+1} + (1-\lambda_{n+1})y) \leqslant\lambda_{n+1}
f(x_{n+1}) + (1-\lambda_{n+1}) f(y)\] et d’après \(\mathcal{P}(n)\), \[f(y) = f(\mu_1 x_1 + \dots + \mu_n x_n) \leqslant\mu_1 f(x_1) + \dots +
\mu_n f(x_n)\] En utilisant que \(1-\lambda_{n+1} = \sum_{i=1}^n \lambda_i\), on obtient \[(1-\lambda_{n+1}) f(y) \leqslant\lambda_1 f(x_1) + \dots + \lambda_n
f(x_n)\] d’où l’inégalité souhaitée.
Le résultat suivant est à la base de toutes les démonstrations et est souvent utilisé dans les exercices théoriques sur les fonctions convexes. Il est facile à retenir, il suffit de faire le schéma suivant :
(Lemme des trois pentes). Soit \(f:I\mapsto \mathbb{R}\) une fonction convexe : \[\forall (x,y,z)\in I^3,~x<y<z, \quad\dfrac{f(y)-f(x)}{y-x}
\leqslant\dfrac{f(z)-f(x)}{z-x}
\leqslant\dfrac{f(z)-f(y)}{z-y}\]
Puisque \(x < y < z\), \(y\) peut s’écrire comme barycentre de \(x\) et \(z\) : il existe \(\lambda \in [0, 1]\) tel que \(y
= \lambda x + (1-\lambda) z\). Après calculs, on trouve que \[\lambda = \dfrac{z-y}{z-x}\] Puisque \(f\) est convexe, \[f(y) \leqslant\lambda f(x) + (1-\lambda) f(z)\] On en tire que \[f(y) - f(x) \leqslant(1-\lambda) \bigl(f(z)-f(x)\bigr)\] et comme \(1-\lambda = \dfrac{y-x}{z-x}\), que \[\dfrac{f(y)-f(x)}{y-x} \leqslant\dfrac{f(z)-f(x)}{z-x}\] De même, \[f(y) - f(z) \leqslant\lambda \bigl(f(x) - f(z)\bigr)\] d’où \[\lambda\bigl(f(z)-f(x)\bigr) \leqslant f(z)-f(y)\] et donc \[\dfrac{z-y}{z-x}\bigl(f(z)-f(x)\bigr) \leqslant f(z)-f(y)\] d’où l’on tire \[\dfrac{f(z)-f(x)}{z-x} \leqslant\dfrac{f(z)-f(y)}{z-y}\]
Le théorème suivant fournit un moyen très pratique de montrer qu’une fonction est convexe : il suffit de montrer que sa dérivée seconde est positive sur \(I\).
(Caractérisation des fonctions convexes dérivables).
(Le graphe d’une fonction convexe est situé au dessus de toutes ses tangentes). Soit une fonction \(f:I\mapsto \mathbb{R}\) convexe et dérivable. \[\forall x_0\in I,~\forall x\in I, \quad f(x) \geqslant f(x_0)+f'(x_0)(x-x_0)\]
Multimédia: tangente qui varie, lemme des 3 pentes
On obtient des inégalités intéressantes, dites inégalités de convexité de la façon suivante :
(Exemples d’inégalités de convexité).
(Concavité du logarithme).
En notant \(f : x \mapsto \ln x\), \(f''(x) = -1/x^2 \leqslant 0\) donc la fonction logarithme est concave sur \(]0, +\infty[\).
En résumé
Les différents théorèmes de ce chapitre doivent être parfaitement connus. Il est du plus mauvais effet d’oublier de vérifier une des hypothèses du théorème de Rolle ou de celui des accroissement finis dans une démonstration. A ce stade de l’année, les calculs de dérivée doivent être menés sans hésitation et les formules de dérivation doivent être connues à la perfection. On complétera la lecture du chapitre par celle du paragraphe [AnnexeC_derivees] page [AnnexeC_derivees] de l’annexe [AnnexeC] qui traite des méthodes de calcul des dérivées. Enfin, il est intéressant de maîtriser la démonstration du théorème du point fixe [thm:0709115046] page [thm:0709115046]. Nombreux sont les exercices qui n’en sont qu’un cas particulier.
Bibliographie
Barre utilisateur
[ID: 67] [Date de publication: 10 décembre 2021 17:32] [Catégorie(s): Le cours de SUP ] [ Nombre commentaires: 0] [nombre d'éditeurs: 1 ] [Editeur(s): Emmanuel Vieillard-Baron ] [nombre d'auteurs: 3 ] [Auteur(s): Emmanuel Vieillard-Baron Alain Soyeur François Capaces ]Commentaires sur le cours
Documents à télécharger
L'article complet