Sauter au contenu

Section 2.9 Multiplicateurs de Lagrange

Dans la dernière section, nous avons dû résoudre un certain nombre de problèmes de la forme “Quelle est la valeur maximale de la fonction \(f\) sur la courbe \(\plan{C}\text{?}\)”. Dans ces exemples, la courbe \(\plan{C}\) était suffisamment simple pour que nous puissions réduire le problème au problème plus simple de recherche du maximum d’une fonction d’une variable. Pour des problèmes plus compliqués, cette réduction pourrait ne pas être possible. Dans cette section, nous introduisons une autre méthode pour résoudre de tels problèmes. Tout d’abord, un peu de terminologie.

Définition 2.9.1.

Un problème de la forme
  • “Trouver le maximum ou le minimum d’une fonction \(f(x,y)\) pour \((x,y)\) sur la courbe \(g(x,y)=0\)
est un type de problème d’optimisation avec une contrainte. La fonction qui doit être maximisée/minimisée, \(f\text{,}\) est appelée la fonction objectif. La fonction \(g\text{,}\) qui définit la courbe d’intérêt, est la fonction de contrainte.
Ces problèmes sont assez courants. Comme nous l’avons dit plus haut, nous les avons déjà rencontrés dans la dernière section sur les maximums et les minimums absolus, lorsque nous cherchions les valeurs extrêmes d’une fonction sur le bord d’un domaine. En économie, les “fonctions d’utilité” sont utilisées pour modéliser l’“utilité relative”, ou “désirabilité” ou “préférence”, de divers choix économiques. Par exemple, une fonction d’utilité \(U(w,\ka)\) pourrait spécifier le niveau relatif de satisfaction qu’une personne obtiendrait en achetant une quantité \(w\) de vin et \(\ka\) de café. Si elle veut dépenser 100$ et que le vin coûte 20$ par unité et que le café coûte 5$ par unité, alors elle souhaiterait maximiser \(U(w,\ka)\) tout en respectant la contrainte \(20w+5\ka=100\text{.}\)
Jusqu’à présent, nous avons toujours résolu ce genre de problèmes avec contrainte :
  • en isolant \(y\) à partir de \(g(x,y)=0\) pour avoir \(y\) en fonction de \(x\) (ou réciproquement), ou
  • en paramétrant la courbe \(g(x,y)=0\text{,}\) c’est-à-dire en écrivant les points sur la courbe sous la forme \(\big(x(t), y(t)\big)\) pour certaines fonctions \(x(t)\) et \(y(t)\text{.}\) Par exemple, nous avons utilisé \(x(t)=\cos t\text{,}\) \(y(t)=\sin t\) pour paramétrer le cercle \(x^2+y^2=1\) dans l’Exemple 2.8.24.
Cependant, très souvent, la fonction \(g(x,y)\) est tellement compliquée qu’on ne peut pas résoudre explicitement \(g(x,y)=0\) pour \(y\) en fonction de \(x\) ni pour \(x\) en fonction de \(y\) et, en plus, on ne peut pas paramétrer \(g(x,y)=0\text{.}\) Parfois, on pourrait résoudre \(g(x,y)=0\) pour \(y\) en fonction de \(x\text{,}\) mais la solution résultante peut être si compliquée qu’il peut être vraiment difficile, ou même virtuellement impossible, de travailler avec elle. Ce type de traitement peut devenir encore plus difficile dans les dimensions supérieures lorsque, par exemple, on souhaite optimiser une fonction \(f(x,y,z)\) soumise à une contrainte \(g(x,y,z)=0\text{.}\)

Sous-section La méthode des multiplicateurs de Lagrange : une contrainte

Il existe une autre procédure, appelée la méthode des “multiplicateurs de Lagrange”
 1 
Joseph-Louis Lagrange est en fait né Giuseppe Lodovico Lagrangia à Turin, en Italie, en 1736. Il s’installe à Berlin en 1766, puis à Paris en 1786. Il a fini par obtenir la nationalité française, et la communauté mathématique française affirme qu’il était un mathématicien français, tandis que la communauté italienne continue à affirmer qu’il était un mathématicien italien.
, qui vient à notre secours dans ces scénarios. Voici la version tridimensionnelle de la méthode. Il y a des analogues pour d’autres dimensions.

Démonstration.

Écrivons \(\vr = (x,y,z)\) et supposons que \(\vr_0=(x_0, y_0, z_0)\) est un point sur \(\plan{S}\) tel que \(f(\vr)\geqslant f(\vr_0)\) pour tous les points \(\vr\) sur \(\plan{S}\) qui sont près de \(\vr_0\text{.}\) En d’autres termes, \(\vr_0\) est un point de minimum local pour \(f\) sur \(\plan{S}\text{.}\) Naturellement, l’argument pour les maximums locaux sera identique.
Imaginons que nous nous promenons sur la surface \(\plan{S}\) avec le temps (disons \(t\)) allant de \(t=-1\) à \(t=+1\text{,}\) de sorte que la position à \(t=0\) est exactement \(\vr_0\text{.}\) Notre position est donnée par un chemin \(\vr(t) =\big(x(t),y(t),z(t)\big)\text{.}\)
Posons
\begin{equation*} F(t) = f\circ\vr\,(t) = (r) f\big(x(t),y(t),z(t)\big)\text{,} \end{equation*}
de sorte que \(F(t)\) est la valeur de \(f\) observée au temps \(t\) de notre balade. Alors, pour \(t\) près de \(0\text{,}\) \(\vr(t)\) est près de \(\vr_0 = \big(x(0),y(0),z(0)\big)\text{,}\) et
\begin{equation*} F(0) = f\circ \vr(0) = f(\vr_0) \leqslant f\circ \vr(t) = F(t) \end{equation*}
pour tout \(t\) suffisamment près de zéro, c’est-à-dire que \(F\) admet un minimum local à \(t=0\) et que, par conséquent, \(F'(0)=0\text{.}\)
En vertu de la règle de dérivation des fonctions composées, vue au Théorème 2.5.1, nous avons
\begin{align*} &0=F'(0)= \left(f\circ \vr \right)'(0) = \vnabla f(\vr_0)\cdot \vr'_0\\ &\implies \vnabla f(\vr_0) \perp \vr'_0\text{.} \end{align*}
Ainsi, le vecteur \(\vnabla f(\vr_0)\) est orthogonal au vecteur vitesse lors du passage par \(\vr_0\text{.}\) Ceci est vrai pour tout chemin contenu dans \(\plan{S}\) qui passe par \(\vr_0\) à \(t=0\text{.}\) Il en résulte que \(\vnabla f(\vr_0)\) est orthogonal à tout vecteur tangent à \(\plan{S}\) en \(\vr_0\text{.}\)
Par ailleurs, nous savons, en vertu du Théorème 2.6.16, que \(\vnabla g(\vr_0)\) est aussi orthogonal à \(\plan{S}\) en \(\vr_0\text{.}\) Ainsi, \(\vnabla f(\vr_0)\) et \(\vnabla g(\vr_0)\) doivent être des vecteurs colinéaires, c’est-à-dire que
\begin{equation*} \vnabla f(\vr_0) = \la \vnabla g(\vr_0) \end{equation*}
pour un certain scalaire \(\la\text{.}\)
Ainsi, pour trouver le maximum et le minimum de \(f(x,y,z)\) parmi les points d’une surface \(\plan{S}\) donnée par \(g(x,y,z)=0\text{,}\) avec l’hypothèse supplémentaire que \(f\) et \(g\) ont des dérivées partielles continues et que \(\vnabla g\ne\vZero\text{,}\) on doit :
  1. Dresser la liste de points candidats \(\vr = (x,y,z)\) en résolvant les équations
    \begin{align*} \vnabla f(\vr) &= \la\vnabla g(\vr) \qquad \text{ et } \qquad g(\vr)&=0\text{.} \end{align*}
    Il faut noter qu’il y a quatre équations en tout et quatre inconnues, à savoir \(\la\) et les trois composantes de \(\vr\text{.}\)
  2. Évaluer \(f\) à chacun des points de la liste de candidats. La valeur la plus grande est le maximum; la plus petite, le minimum.
Une autre façon d’écrire le système d’équations ci-haut est d’écrire
\begin{equation*} L_x(a,b,c,\la) = L_y(a,b,c,\la) = L_z(a,b,c,\la) = L_\la(a,b,c,\la) = 0\text{,} \end{equation*}
\(L(x,y,z,\la)\) est la fonction auxiliaire
\begin{equation*} L(x,y,z,\la)=f(x,y,z)-\la\, g(x,y,z)\text{.} \end{equation*}

Observation 2.9.3.

Nous avons formulé et prouvé le Théorème 2.9.2 pour les fonctions à trois variables, c’est-à-dire l’optimisation d’une fonction \(f\) sur une surface \(g=0\text{.}\) Le même résultat tient lorsque la fonction objectif ainsi que la fonction de contrainte sont des fonctions de deux variables : ceci revient à maximiser/minimiser une quantité \(f(x,y)\) sur une courbe \(g(x,y)=0\text{.}\) Nous verrons d’autres généralisations plus tard.
Voyons quelques exemples.

Exemple 2.9.4.

Trouver le maximum et le minimum de \(x^2-10x-y^2\) sur l’ellipse d’équation \(x^2+4y^2= 16\text{.}\)
Solution.
Dans ce problème, la fonction objectif est \(f(x,y) = x^2-10x-y^2\text{,}\) et la fonction de contrainte est \(g(x,y)=x^2+4y^2-16\text{.}\) Afin d’appliquer la méthode des multiplicateurs de Lagrange, nous calculons les gradients \(\vnabla f\) et \(\vnabla g\text{.}\)
\begin{equation*} f_x=2x-10\qquad f_y=-2y\qquad g_x=2x\qquad g_y=8y \end{equation*}
Ainsi, on doit trouver les solutions de
\begin{align*} 2x-10&=\la (2x),\\ -2y&=\la (8y),\\ x^2+4y^2-16&=0\text{.} \end{align*}
Après réarrangement, on obtient
\begin{align*} (\la-1)x&=-5, \tag{E1}\\ (4\la+1)y&=0, \tag{E2}\\ x^2+4y^2-16&=0 \tag{E3}\text{.} \end{align*}
De (E2), nous avons \(\la=-\frac{1}{4}\) ou \(y=0\text{.}\)
  • Si \(\la=-\frac{1}{4}\text{,}\) (E1) donne \(-\frac{5}{4}x=-5\text{,}\) et donc \(x=4\text{,}\) et alors (E3) donne \(y=0\text{.}\)
  • Si \(y=0\text{,}\) alors (E3) donne \(x=\pm 4\) (et même si l’on aurait pu utiliser (E1) pour trouver \(\la\text{,}\) nous n’en avons pas vraiment besoin).
Ainsi, la méthode des multiplicateurs de Lagrange, le Théorème 2.9.2 (la version 2D en fait), donne que les seuls candidats possibles pour les points de maximum et de minimum de \(f\) sont \((4,0)\) et \((-4,0)\text{.}\) Pour compléter le problème, on calcule la valeur de \(f\) en ces points.
point \((4,0)\) \((-4,0)\)
valeur de \(f\) \(-24\) \(56\)
min. max.
Ainsi, la valeur maximale de \(x^2-10x-y^2\) sur l’ellipse est \(56\text{,}\) et la valeur minimale est \(-24\text{.}\)
Une parabole standard sur l’intervale  [-2,4]
Figure 2.9.5. Les courbes de niveau de la fonction objectif \(f(x,y) = x^2-10x-y^2 \text{,}\) en bleu. La contrainte \(x^2 + 4y^2 =16\) est l’ellipse en brun.
Dans les exemples précédents, la fonction objectif et la fonction de contrainte étaient données explicitement. Ce ne sera pas toujours le cas. Le prochain exemple montre comment utiliser la géométrie pour trouver les deux fonctions.

Exemple 2.9.6.

Trouver l’aire du plus grand rectangle (avec des côtés parallèles aux axes) qui peut être inscrit dans l’ellipse \(x^2+2y^2=1\text{.}\)
Solution.
Ce problème étant de nature nettement géométrique, commençons par faire une figure.
Soit \((x,y)\) les coordonnées du point du rectangle du premier quadrant. Les quatre coins sont alors \((\pm x, \pm y)\text{,}\) de sorte que ses côtés mesurent \(2x\) et \(2y\text{.}\) Par ailleurs, la fonction objectif est \(f(x,y) = 4xy\text{.}\) La fonction de contrainte du problème est \(g(x,y)=x^2+2y^2-1\text{.}\) De nouveau, pour utiliser les multiplicateurs de Lagrange, nous calculons quelques dérivées partielles :
\begin{equation*} f_x=4y,\qquad f_y=4x,\qquad g_x=2x,\qquad g_y=4y\text{.} \end{equation*}
Ainsi, nous devons trouver les solutions de
\begin{align*} 4y&=\la (2x), \tag{E1}\\ 4x&=\la (4y), \tag{E2}\\ x^2+2y^2-1&=0 \tag{E3}\text{.} \end{align*}
L’équation (E1) donne \(y=\frac{1}{2}\la x\text{.}\) En remplaçant dans l’équation (E2), nous obtenons
\begin{gather*} 4x=2\la^2 x \qquad\text{ou}\qquad 2x\big(2-\la^2\big)=0\text{.} \end{gather*}
Ainsi, (E2) est vérifiée si \(x=0\) ou \(\la=\sqrt{2}\) ou \(\la=-\sqrt{2}\text{.}\)
  • Si \(x=0\text{,}\) alors (E1) donne \(y=0\) aussi. Mais \((0,0)\) ne satisfait pas l’équation (E3).
  • Si \(\la=\sqrt{2}\text{,}\) alors
    • (E2) donne \(x=\sqrt{2}y\text{,}\) et alors
    • (E3) donne \(2y^2+2y^2=1\) ou \(y^2=\frac{1}{4}\text{,}\) de sorte que
    • \(y=\pm\frac{1}{2}\) et \(x=\sqrt{2}y=\pm\frac{1}{\sqrt{2}}\text{.}\)
  • Si \(\la=-\sqrt{2}\text{,}\) alors
    • (E2) donne \(x=-\sqrt{2}y\text{,}\) et alors
    • (E3) donne \(2y^2+2y^2=1\) ou \(y^2=\frac{1}{4}\text{,}\) et donc
    • \(y=\pm\frac{1}{2}\) et \(x=-\sqrt{2}y=\mp\frac{1}{\sqrt{2}}\text{.}\)
Nous avons à présent les quatre points candidats \((x,y)\text{,}\) à savoir \(\big(\frac{1}{\sqrt{2}},\,\frac{1}{2}\big)\text{,}\) \(\big(-\frac{1}{\sqrt{2}},\,-\frac{1}{2}\big)\text{,}\) \(\big(\frac{1}{\sqrt{2}},\,-\frac{1}{2}\big)\) et \(\big(-\frac{1}{\sqrt{2}},\,\frac{1}{2}\big)\text{.}\) Ils sont les quatre coins d’un rectangle. Nous avons dit que nous voulions que \((x,y)\) soit le coin du premier quadrant, il s’agit de \(\big(\frac{1}{\sqrt{2}},\,\frac{1}{2}\big)\text{.}\)

Exemple 2.9.7.

Trouver les extrémités des demi-axes de l’ellipse \(3x^2-2xy+3y^2=4\text{.}\) Il s’agit des points sur l’ellipse qui sont le plus loin et le plus près de l’origine.
Solution.
Soit \((x,y)\) un point sur \(3x^2-2xy+3y^2=4\text{.}\) Ce point est à l’extrémité du demi-axe le plus grand lorsqu’il maximise la distance au centre de l’ellipse, qui coïncide avec l’origine. Le point se trouve à l’extrémité du petit demi-axe lorsque cette distance est minimisée. Nous devons donc maximiser et minimiser la distance \(\sqrt{x^2+y^2}\) avec la contrainte
\begin{equation*} g(x,y)=3x^2-2xy+3y^2-4=0\text{.} \end{equation*}
Notons cependant que de maximiser ou de minimiser \(\sqrt{x^2+y^2}\) est équivalent
 2 
Car la fonction \(S(z)=z^2\) est strictement croissante pour \(z\geqslant 0\text{.}\) Ainsi, pour \(a,b\geqslant 0\text{,}\) le fait d’avoir “\(a \lt b\)” équivaut à avoir “\(S(a) \lt S(b)\)”.
à maximiser ou à minimiser son carré, \(\big(\sqrt{x^2+y^2}\big)^2=x^2+y^2\text{.}\) Ainsi, nous pouvons choisir la fonction objectif
\begin{equation*} f(x,y)=x^2+y^2\text{,} \end{equation*}
ce que nous ferons afin de rendre les calculs plus simples. De nouveau, utilisons les multiplicateurs de Lagrange. Pour cela, calculons les dérivées partielles
\begin{equation*} f_x(x,y)=2x,\quad f_y(x,y)=2y, \quad g_x(x,y)=6x-2y,\quad g_y(x,y)=-2x+6y\text{.} \end{equation*}
Nous devons trouver les solutions de
\begin{align*} 2x&=\la (6x-2y),\\ 2y&=\la (-2x+6y),\\ 3x^2-2xy+3y^2-4&=0\text{.} \end{align*}
En divisant ces deux équations par \(2\) et en factorisant, on obtient
\begin{align*} (1-3\la)x+\la y&=0, \tag{E1}\\ \la x+(1-3\la)y&=0, \tag{E2}\\ 3x^2-2xy+3y^2-4&=0 \tag{E3}\text{.} \end{align*}
Pour commencer, concentrons-nous sur les deux premières équations. Supposons que la valeur de \(\la\) est connue et que nous voulons trouver \(x\) et \(y\text{.}\)
Le système d’équations \((1+3\la)x-\la y=0\text{,}\) \(-\la x+(1+3\la)y=0\) admet une solution évidente, à savoir \(x=y=0\text{.}\) Cependant, cette solution n’est pas acceptable, car il ne s’agit pas d’un point sur l’ellipse. On sait, grâce aux cours d’algèbre linéaire, qu’un système homogène d’équations linéaires admet une solution non nulle si et seulement si le déterminant de la matrice des coefficients est nul.
\begin{equation*} \det\left[\begin{matrix} 1-3\la&\la\\ \la&1-3\la \end{matrix}\right]=(1-3\la)^2-\la^2 =(1-2\la)(1-4\la)=0\implies\la=\half,\frac{1}{4} \end{equation*}
On peut diviser par \(\la\text{,}\) et (E1) donne
\begin{equation*} y=-\frac{1-3\la}{\la}x\text{.} \end{equation*}
En remplaçant ceci dans (E2), on obtient
\begin{equation*} \la x-\frac{(1-3\la)^2}{\la}x=0\text{.} \end{equation*}
À nouveau, \(x\) ne peut pas être nul, car, dans ce cas, \(y=-\frac{1-3\la}{\la}x\) donnerait \(y=0\text{,}\) et \((0,0)\) n’est toujours pas sur l’ellipse.
Ainsi, on peut diviser \(\la x-\frac{(1-3\la)^2}{\la}x=0\) par \(x\text{,}\) ce qui donne
\begin{align*} \la -\frac{(1-3\la)^2}{\la}=0 &\iff (1-3\la)^2-\la^2=0\\ &\iff 8\la^2-6\la+1 =(2\la-1)(4\la-1)=0\text{.} \end{align*}
Nous avons que \(\la\) doit être \(\frac{1}{2}\) ou \(\frac{1}{4}\text{.}\) Remplacer ces valeurs dans (E1) ou (E2) donne
\begin{alignat*}{3} \la&=\frac{1}{2} &\ \implies\ -\frac{1}{2} x+\frac{1}{2} y&=0 &\ \implies\ x&=y\\ & &\ \impliesover{(E3)}\ 3x^2-2x^2+3x^2&=4 &\ \implies\ x&=\pm 1,\\ \la&=\frac{1}{4} &\ \implies\ \phantom{-}\frac{1}{4} x+\frac{1}{4} y&=0 &\ \implies\ x&=-y\\ & &\ \impliesover{(E3)}\ 3x^2+2x^2+3x^2&=4 &\ \implies\ x&=\pm \frac{1}{\sqrt{2}}\text{.} \end{alignat*}
Ici, “\(\impliesover{(E3)}\)” signifie que l’on utilise (E3). Nous avons maintenant \((x,y)=\pm (1,1)\) (de \(\la=\frac{1}{2}\)) et \((x,y)=\pm\left(\frac{1}{\sqrt{2}},-\frac{1}{\sqrt{2}}\right)\) (de \(\la=\frac{1}{4}\)). La distance de \((0,0)\) à \(\pm (1,1)\text{,}\) à savoir \(\sqrt{2}\text{,}\) est supérieure à la distance de \((0,0)\) à \(\pm\big(\frac{1}{\sqrt{2}},-\frac{1}{\sqrt{2}}\big)\text{,}\) à savoir \(1\text{.}\) Ainsi, les extrémités du petit demi-axe sont \(\pm\big(\frac{1}{\sqrt{2}},-\frac{1}{\sqrt{2}}\big)\text{,}\) et celles du grand demi-axe sont \(\pm(1,1)\text{.}\) Ces points sont esquissés dans la figure de gauche ci-bas. Une fois ces points trouvés, il devient aisé de dessiner l’ellipse
 3 
Si l’on incline la tête de sorte à ce que la droite par \((1,1)\) et \((-1,-1)\) apparaisse horizontale.
.

Exemple 2.9.8.

Trouver les valeurs de \(w\geqslant0\text{,}\) \(\ka\geqslant0\) qui maximisent la fonction d’utilité
\begin{equation*} U(w,\ka) =6 w^{\frac{2}{3}}\ka^{\frac{1}{3}} \qquad\text{avec la contrainte}\qquad 4w+2\ka=12\text{.} \end{equation*}
Solution.
La contrainte \(4w+2\ka=12\) est suffisamment simple pour exprimer \(\ka\) en termes de \(w\text{.}\) On peut alors remplacer \(\ka=6-2w\) dans \(U(w,\ka)\) et maximiser \(U(w,6-2w) = 6 w^{\frac{2}{3}}(6-2w)^{\frac{1}{3}}\) avec les technique du calcul différentiel à une variable.
Cependant, afin de pratiquer la méthode des multiplicateurs de Lagrange, on va présenter une solution avec celle-ci. On a \(U(w,\ka) =6 w^{\frac{2}{3}}\ka^{\frac{1}{3}}\text{,}\) et la fonction de contrainte est \(g(w,\ka)=4w+2\ka-12\text{.}\) Les dérivées partielles sont
\begin{equation*} U_w=4w^{-\frac{1}{3}}\ka^{\frac{1}{3}},\qquad U_\ka=2w^{\frac{2}{3}}\ka^{-\frac{2}{3}},\qquad g_w=4,\qquad g_\ka=2\text{.} \end{equation*}
Les valeurs \(w=0\) et \(\ka=0\) donnent une utilité de \(0\text{,}\) qui ne sera certainement pas un maximum. Il suffit alors de considérer les maximums locaux. Nous devons résoudre
\begin{alignat*}{1} 4w^{-\frac{1}{3}}\ka^{\frac{1}{3}}&=4\la, \tag{E1}\\ 2w^{\frac{2}{3}}\ka^{-\frac{2}{3}}&=2\la, \tag{E2}\\ 4w+2\ka-12&=0 \tag{E3}\text{.} \end{alignat*}
Alors,
  • l’équation (E1) donne \(\la=w^{-\frac{1}{3}}\ka^{\frac{1}{3}}\text{;}\)
  • En remplaçant ceci dans (E2), on obtient \(w^{\frac{2}{3}}\ka^{-\frac{2}{3}}=\la =w^{-\frac{1}{3}}\ka^{\frac{1}{3}}\text{,}\) et alors \(w=\ka\text{;}\)
  • Puis, en remplaçant \(w=\ka\) dans (E3), on obtient \(6\ka=12\text{.}\)
Ainsi, \(w=\ka=2\text{,}\) et l’utilité maximale est \(U(2,2)=12\text{.}\)

Exemple 2.9.9.

Trouver le point sur la sphère \(x^2+y^2+z^2=1\) qui est le plus éloigné de \((1,2,3)\text{.}\)
Solution.
Comme précédemment, on simplifie les calculs en considérant le carré de la distance comme fonction objectif
\begin{equation*} f(x,y,z) = (x-1)^2 +(y-2)^2 + (z-3)^2 \end{equation*}
avec la contrainte
\begin{equation*} g(x,y,z)= x^2 + y^2 + z^2 -1=0\text{.} \end{equation*}
Puisque
\begin{align*} f_x(x,y,z)&=2(x-1), & f_y(x,y,z)&=2(y-2), & f_z(x,y,z)&=2(z-3),\\ g_x(x,y,z)&=2x, & g_y(x,y,z)&=2y, & g_z(x,y,z)&= 2z\text{,} \end{align*}
nous devons résoudre
\begin{alignat*}{2} 2(x-1)&=\la (2x)\qquad&\iff\qquad x&=\frac{1}{1-\la}, \tag{E1}\\ 2(y-2)&=\la (2y)\qquad&\iff\qquad y&=\frac{2}{1-\la}, \tag{E2}\\ 2(z-3)&=\la (2z)\qquad&\iff\qquad z&=\frac{3}{1-\la}, \tag{E3}\\ 0&=x^2+y^2+z^2-1 \tag{E4}\text{.} \end{alignat*}
En remplaçant (E1), (E2) et (E3) dans (E4), on obtient
\begin{gather*} \frac{1+4+9}{(1-\la)^2}-1=0 \implies (1-\la)^2 = 14 \implies 1-\la = \pm\sqrt{14}\text{.} \end{gather*}
On peut alors remplacer les deux valeurs de \(\la\) dans les expressions pour \(x\text{,}\) \(y\text{,}\) \(z\) en termes de \(\la\) pour obtenir les points \(\frac{1}{\sqrt{14}}(1,2,3)\) et \(-\frac{1}{\sqrt{14}}(1,2,3)\text{.}\)
Le vecteur de \(\frac{1}{\sqrt{14}}(1,2,3)\) à \((1,2,3)\text{,}\) à savoir \(\left\{1-\frac{1}{\sqrt{14}}\right\}(1,2,3)\text{,}\) est clairement de norme plus petite que le vecteur de \(-\frac{1}{\sqrt{14}}(1,2,3)\) à \((1,2,3)\text{,}\) c’est-à-dire \(\left\{1+\frac{1}{\sqrt{14}}\right\}(1,2,3)\text{.}\) Ainsi, le point le plus proche est \(\frac{1}{\sqrt{14}}(1,2,3)\text{,}\) et le point le plus éloigné est \(-\frac{1}{\sqrt{14}}(1,2,3)\text{.}\)

Sous-section Deux contraintes

Dans cette section, on considère l’exemple d’un problème de la forme “maximiser (ou minimiser) \(f(x,y,z)\) avec les deux contraintes \(g(x,y,z)=0\) et \(h(x,y,z)=0\)”. La méthode des multiplicateurs de Lagrange, vue au Théorème 2.9.2, s’adapte à ce contexte comme suit.
On peut, bien entendu, formuler ce théorème avec une fonction auxiliaire, comme avant :
\begin{equation*} L(x,y,z,\la,\mu)=f(x,y,z)-\la\, g(x,y,z) - \mu\, h(x,y,z)\text{.} \end{equation*}
Il s’agit d’une fonction de cinq variables : les trois variables originales, \(x\text{,}\) \(y\) et \(z\text{,}\) et les deux variables auxiliaires, \(\la\) et \(\mu\text{.}\) S’il y a un extremum local à \(\vr_0\text{,}\) alors \(\vr_0\) doit aussi satisfaire la formule suivante:
pour certains \(\la\) et \(\mu\text{.}\) Ainsi, résoudre ce système de cinq équations donne les points candidats pour les extremums locaux. Nous verrons un exemple sous peu.

Preuve du Théorème 2.9.10.

Avant de voir un exemple, justifions la validité de cette approche. Supposons donc que le minimum est atteint à \(\vr_0\text{,}\) le point gris dans la figure ci-après. Comme précédemment, imaginons que nous commençons à nous déplacer en partant de \(\vr_0\) le long de la courbe \(g=h=0\text{.}\) La trajectoire est la droite grise de la figure suivante.
Soit \(\vv\) le vecteur vitesse lors du passage à \(\vr_0\text{,}\) il est donc tangent à la courbe \(g=h=0\text{.}\) Comme \(f\) admet un minimum local en \(\vr_0\text{,}\) \(f\) doit être croissante en quittant \(\vr_0\text{,}\) de sorte que la dérivée directionnelle dans la direction de notre mouvement est positive :
\begin{equation*} D_{\vv}f(\vr_0)=\vnabla f(\vr_0) \cdot \vv\geqslant 0\text{.} \end{equation*}
Recommençons, mais, cette fois, en allant dans la direction opposée avec le vecteur vitesse \(-\vv\text{.}\) De nouveau, \(f\) doit être croissante lorsque l’on quitte \(\vr_0\text{,}\) de sorte que la dérivée directionnelle est positive :
\begin{equation*} D_{-\vv}f(\vr_0)=\vnabla f(\vr_0) \cdot (-\vv)\geqslant 0\text{.} \end{equation*}
Comme \(\vnabla f(\vr_0) \cdot \vv\) et \(-\vnabla f(\vr_0) \cdot \vv\) sont positifs ou nuls, nous devons avoir
\begin{equation*} \vnabla f(\vr_0) \cdot \vv=0 \tag{$*$}\text{,} \end{equation*}
et ceci tient pour tout vecteur \(\vv\) qui est tangent à la courbe \(g=h=0\) en \(\vr_0\text{.}\) Soit \(\cT\) l’ensemble des vecteurs \(\vv\) qui sont tangents à la courbe \(g=h=0\) en \(\vr_0\) et soit \(\cT^\perp\) l’ensemble des vecteurs orthogonaux à ces vecteurs tangents. Ainsi, \((*)\) dit que \(\vnabla f(\vr_0)\) doit faire partie de \(\cT^\perp\text{.}\)
Nous allons maintenant trouver les vecteurs de \(\cT^\perp\text{.}\) Nous pouvons facilement deviner deux de ces vecteurs, à savoir \(\vnabla g(\vr_0)\) et \(\vnabla h(\vr_0)\text{.}\) Tout vecteur qui est une combinaison linéaire de ces deux vecteurs sera également orthogonal à tout vecteur de \(\cT\text{.}\)
Par ailleurs, les vecteurs de \(\cT\) forment en fait une droite (la tangente à \(\cal{C}\) en \(\vr_0\)). Ainsi, \(\cT^\perp\text{,}\) l’ensemble orthogonal à \(\cT\text{,}\) est un plan. Lorsque \(\la\) et \(\mu\) parcourent les réels, les vecteurs \(\la\vnabla g(\vr_0) + \mu\vnabla h(\vr_0)\) décrivent un plan. Ainsi, nous pouvons conclure que tout vecteur de \(\cT^\perp\text{,}\) et en particulier \(\vnabla f(\vr_0)\text{,}\) doit s’écrire sous la forme \(\la\vnabla g(\vr_0)+\mu\vnabla h(\vr_0)\text{.}\)
\begin{equation*} \vnabla f(\vr_0) =\la\vnabla g(\vr_0)+\mu\vnabla h(\vr_0) \end{equation*}

Exemple 2.9.12.

Trouver la distance de l’origine à la courbe intersection des surfaces
\begin{equation*} z^2=x^2+y^2,\qquad x-2z=3\text{.} \end{equation*}
Solution.
De nouveau, nous simplifions les calculs en considérant le carré de la distance comme fonction objectif
\begin{equation*} f(x,y,z)=x^2+y^2+z^2 \end{equation*}
avec les contraintes
\begin{equation*} 0=g(x,y,z)=x^2+y^2-z^2,\qquad 0=h(x,y,z)=x-2z-3\text{.} \end{equation*}
Puisque
\begin{align*} f_x&=2x, & f_y&=2y, & f_z&=2z,\\ g_x&=2x, & g_y&=2y, & g_z&=-2z,\\ h_x&=1, & h_y&=0, & h_z&=-2\text{,} \end{align*}
la méthode des multiplicateurs de Lagrange nous impose de trouver les solutions de
\begin{alignat*}{2} 2x&=\la(2x) + \mu(1), \tag{E1}\\ 2y&=\la(2y) + \mu(0) \qquad&\iff\qquad(1-\la)y&=0, \tag{E2}\\ 2z&=\la(-2z) + \mu(-2), \tag{E3}\\ z^2&=x^2+y^2, \tag{E4}\\ x-2z&=3 \tag{E5}\text{.} \end{alignat*}
Puisque l’équation (E2) se factorise, nous commençons par le faire. Nous devons donc avoir \(y=0\) ou \(\la=1\text{.}\)
Cas \(\la=1\) : Lorsque \(\la=1\text{,}\) les autres équations se réduisent à
\begin{alignat*}{1} 0&=\mu, \tag{E1}\\ 0&=4z + 2 \mu, \tag{E3}\\ z^2&=x^2+y^2, \tag{E4}\\ x-2z&=3 \tag{E5}\text{,} \end{alignat*}
donc
  • l’équation (E1) donne \(\mu=0\text{;}\)
  • Puis, en remplaçant \(\mu=0\) dans (E3), on obtient \(z=0\text{;}\)
  • Puis, remplacer \(z=0\) dans (E5) donne \(x=3\text{;}\)
  • Finalement, remplacer \(z=0\) et \(x=3\) dans (E4) donne \(0=9+y^2\text{,}\) ce qui est absurde.
Ainsi, il est impossible d’avoir \(\la=1\text{.}\)
Cas \(y=0\) : Lorsque \(y=0\text{,}\) les autres équations se réduisent à
\begin{alignat*}{1} 2(1-\la)x &= \mu, \tag{E1}\\ (1+\la)z&= -\mu, \tag{E3}\\ z^2&=x^2, \tag{E4}\\ x-2z&=3 \tag{E5}\text{.} \end{alignat*}
Les simplifications ne sont pas aussi faciles qu’au cas \(\la=1\text{.}\) Cependant, au moins, l’équation (E4) donne \(z=\pm x\text{.}\) Nous devons donc considérer ces deux possibilités.
Sous-cas \(y=0\text{,}\) \(z=x\) : Lorsque \(y=0\) et \(z=x\text{,}\) les équations deviennent
\begin{alignat*}{1} 2(1-\la)x &= \mu, \tag{E1}\\ (1+\la)x&= -\mu, \tag{E3}\\ -x&=3 \tag{E5}\text{.} \end{alignat*}
Ainsi, l’équation (E5) nous dit que \(x=-3\text{,}\) et donc \((x,y,z)=(-3,0,-3) \text{.}\) Nous ne nous soucions pas des valeurs de \(\la\) et \(\mu\text{,}\) mais puisque \(-6(1-\la)=\mu\) et \(-3(1+\la)=-\mu\text{,}\) nous obtenons
\begin{equation*} -9+3\la=0 \implies \la=3\text{,} \end{equation*}
puis, après substitution, \(\mu=12\text{.}\)
Sous-cas \(y=0\text{,}\) \(z=-x\) : Lorsque \(y=0\) et \(z=-x\text{,}\) les équations deviennent
\begin{alignat*}{1} 2(1-\la)x &= \mu, \tag{E1}\\ (1+\la)x&= \mu, \tag{E3}\\ 3x&=3 \tag{E5}\text{.} \end{alignat*}
Ainsi, l’équation (E5) donne \(x=1\text{,}\) de sorte que \((x,y,z)=(1,0,-1) \text{.}\) De nouveau, même si elles ne sont pas nécessaires, on calcule les valeurs de \(\la\) et \(\mu\text{.}\) Comme \(2(1-\la)=\mu\) et \((1+\la)=\mu\text{,}\) on soustrait la seconde équation de la première pour obtenir
\begin{equation*} 1-3\la=0 \implies \la=\frac{1}{3}\text{,} \end{equation*}
ce qui à son tour donne \(\mu=\frac{4}{3}\text{.}\)
Conclusion : Nous avons deux candidats pour les points de maximum et de minimum local, à savoir \((-3,0,-3)\) et \((1,0,-1)\text{.}\) Le premier se trouve à distance \(3\sqrt{2}\) de l’origine, ce qui donne le maximum; le second se trouve à distance \(\sqrt{2}\text{,}\) ce qui donne le minimum. En particulier, la distance est \(\sqrt{2}\text{.}\)

Exercices Exercices

Pour se pratiquer.

1.
Utilisez la méthode des multiplicateurs de Lagrange pour trouver les valeurs maximales et minimales des fonctions suivantes, sous les contraintes données :
  1. \(f(x, y, z) = x^2y + z^2\) sous la contrainte \(x^2 + 2y^2 + 3z^2 = 6\text{.}\)
  2. \(f(x, y) = xy\) sous la contrainte \(4x^2 + 8y^2 = 16\text{.}\)
  3. \(f(x, y) = 4x^3 + y^2\) sous la contrainte \(2x^2 + y^2 = 1\text{.}\)
  4. \(f(x, y, z) = x^2 + y^2 + z^2\) sous la contrainte \(x^4 + y^4 + z^4 = 1\text{.}\)
  5. \(f(x, y) = x^2 + y^2\) sous la contrainte \((x - 1)^2 + 4y^2 = 4\text{.}\)
  6. \(f(x, y) = 4xy\text{,}\) avec \(\frac{x^2}{9} + \frac{y^2}{16} = 1\) comme contrainte.
  7. \(f(x, y, z) = x + 3y - z\text{,}\) avec la contrainte \(x^2 + y^2 + z^2 = 4\text{.}\)
  8. \(f(x, y, z) = x^2 + y^2 + z^2\text{,}\) avec la contrainte \(xyz = 4\text{.}\)
  9. \(f(x, y) = x^2 + y^2\) sur l’hyperbole définie par la contrainte \(xy = 1\text{.}\)
  10. \(f(x, y, z) = yz + xy\text{,}\) avec les contraintes \(xy = 1\) et \(z^2 + z^2 = 1\text{.}\)
  11. \(f(x, y, z) = x + y + z\text{,}\) avec les contraintes \(\frac{1}{x} + \frac{1}{y} + \frac{1}{z} = 1\text{.}\)
2.
  1. Est-ce que la fonction \(f(x, y) = x^2 +y^2\) admet un maximum ou un minimum sur la courbe \(xy = 1\text{?}\) Expliquez.
  2. Trouvez tous les maximums et minimums de \(f(x, y)\) sur la courbe \(xy = 1\text{.}\)
Réponse.
(a) \(f\) n’admet pas de maximum. Elle admet un minimum.
(b) Les minimums sont en \(\pm (1,1)\text{,}\)\(f\) prend les valeurs \(2\text{.}\)
3.
Trouvez les valeurs maximales et minimales de la fonction \(f(x,y,z)=x+y-z\) sur la sphère \(x^2+y^2+z^2=1\text{.}\)
Réponse.
Le maximum est \(f=\sqrt{3}\) et le minimum est \(f=-\sqrt{3}\text{.}\)
4.
Utilisez la méthode des Multiplicateurs de Lagrange pour trouver la valeur minimale de \(z = x^2 + y^2\) sujet à \(x^2 y = 1\text{.}\) À quel(s) point(s) se trouve(nt) le(s) minimum(s)?
Réponse.
La valeur minimale est \(2^{\frac{1}{3}} + 2^{-\frac{2}{3}} =\frac{3}{2}\root{3}\of{2} =\frac{3}{\sqrt[3]{4}}\) en \(\big(\pm 2^{\frac{1}{6}}\,,\, 2^{-\frac{1}{3}}\big)\text{.}\)
5.
Utilisez la méthode des Multiplicateurs de Lagrange pour trouver les valeurs maximale et minimale de
\begin{equation*} f(x, y) = xy \end{equation*}
sujet à la contrainte
\begin{equation*} x^2 + 2y^2 = 1. \end{equation*}
Réponse.
Les valeurs maximale et minimale de \(f\) sont \(\frac{1}{2\sqrt{2}}\) et \(-\frac{1}{2\sqrt{2}}\text{,}\) respectivement.

Pour mieux comprendre.

6.
Utilisez les Multiplicateurs de Lagrange pour trouver les valeurs maximale et minimale de la fonction \(f(x,y,z) = x^2 + y^2 -\frac{1}{20} z^2\) sur la courbe d’intersection du plan \(x + 2y + z = 10\) et du paraboloïde \(x^2 + y^2 - z = 0\text{.}\)
Réponse.
Le maximum est \(5\) et le minimum est \(0\text{.}\)
7.
  1. Utilisez les Multiplicateurs de Lagrange pour trouver les valeurs extrêmes de
    \begin{equation*} f (x, y, z) = (x - 2)^2 + (y + 2)^2 + (z - 4)^2 \end{equation*}
    sur la sphère \(x^2 + y^2 + z^2 = 6\text{.}\)
  2. Trouvez le point sur la sphère \(x^2 + y^2 + z^2 = 6\) qui est le plus loin du point \((2, -2, 4)\text{.}\)
Réponse.
(a) Le minimum est \(6\) et le maximum est \(54\text{.}\)
(b) \((-1,1,-2)\)
8.
Une boîte fermée rectangulaire avec un volume de 96 mètres cubes est construit avec deux matériaux. Le matériel pour le dessus coûte deux fois plus par mètre carré que le matériel utilisé pour les côtés et le dessous. Utilisez la méthode des Multiplicateurs de Lagrange pour trouver les dimensions de la boîte la moins cher.
Réponse.
\(x=y=4,\ z=6\ \text{mètres}\)
9.
Trouvez les dimensions de la boîte ayant un volume maximal dont les faces sont parallèles aux plans de coordonnées et qui est contenue dans la région \(0\leqslant z\leqslant 48-4x^2-3y^2\text{.}\)
Réponse.
\(2\sqrt{3} \times 4\times 24\)
10.
Utilisez les Multiplicateurs de Lagrange pour trouver la distance minimale de l’origine à tous les points de l’intersection des courbes
\begin{align*} g(x,y,z) &= x-z-4=0\\ \text{et } h(x,y,z) &= x+y+z-3=0 \end{align*}
Réponse.
\(\sqrt{11}\)
11.
La température dans le plan est donnée par \(T(x,y) = e^y\big(x^2+y^2\big)\text{.}\)
    1. Donnez le système d’équations qui doit être résolu afin de trouver le point où la température est la plus élevée et où elle est la plus faible sur le cercle \(x^2+y^2=100\) par la méthode des Multiplicateurs de Lagrange.
    2. Trouvez les points le plus chaud et le plus froid sur le cercle en résolvant ce système.
    1. Donnez le système d’équations qui doit être résolu afin de trouver les points critiques de \(T(x,y)\text{.}\)
    2. Trouvez les points critiques en résolvant ce système.
  1. Trouvez le point le plus froid sur le disque solide \(x^2+y^2\leqslant 100\text{.}\)
Réponse.
(a - i)
\begin{align*} 2x\,e^y &=\la (2x)\\ e^y\big(x^2+y^2+2y\big) &=\la (2y)\\ x^2+y^2&=100 \end{align*}
(a-ii) Le point le plus chaud est \((0,10)\) et le point le plus froid est \((0,-10)\text{.}\)
(b-i)
\begin{align*} 2x\,e^y &=0\\ e^y\big(x^2+y^2+2y\big) &=0 \end{align*}
(b-ii) \((0,0)\) et \((0,-2)\)
(c) \((0,0)\)

Pour aller plus loin.

12.
Soit \(f(x,y)\) ayant des dérivées partielles continues. Considérez le problème de trouver un minimum et maximum local de \(f(x,y)\) sur la courbe \(xy=1\text{.}\)
  • Définissez \(g(x,y) = xy -1\text{.}\) D’après la méthode des Multiplicateurs de Lagrange, si \((x,y)\) est un minimum ou maximum local de \(f(x,y)\) sur la courbe \(xy=1\text{,}\) alors il existe un nombre réel \(\la\) tel que
    \begin{equation*} \vnabla f(x,y) =\la \vnabla g(x,y),\quad g(x,y)=0 \tag{E1} \end{equation*}
  • Sur la courbe \(xy=1\text{,}\) on a \(y=\frac{1}{x}\) et \(f(x,y) =f\big(x,\frac{1}{x}\big)\text{.}\) Définissez \(F(x)=f\big(x,\frac{1}{x}\big)\text{.}\) Si \(x\ne 0\) est un minimum ou maximum local de \(F(x)\text{,}\) on a que
    \begin{equation*} F'(x)=0 \tag{E2} \end{equation*}
Montrez que (E1) est équivalent à (E2), dans le sens que
\begin{align*} &\text{il existe $\la$ tel que vérifie (E1)}\\ &\hskip-0.5in\text{si et seulement si}\\ &\text{ vérifie (E2) et } \end{align*}
Réponse.
Notez que si \((x,y)\) obéit \(g(x,y)=xy-1=0\text{,}\) alors \(x\) est nécessairement non-nul. Donc on peut supposer que \(x\ne 0\text{.}\) Alors
\begin{align*} &\text{Il existe $\la$ tel que $(x,y,\la)$ vérifie (E1)}\\ & \iff \text{il existe $\la$ tel que } f_x(x,y)=\la g_x(x,y),\ f_y(x,y)=\la g_y(x,y),\\ &\hskip2.0in g(x,y)=0\\ & \iff \text{il existe $\la$ tel que } f_x(x,y)=\la y,\quad f_y(x,y)=\la x,\quad xy=1\\ & \iff \text{il existe $\la$ tel que } \frac{1}{y}f_x(x,y)= \frac{1}{x} f_y(x,y)=\la ,\quad xy=1\\ & \iff \frac{1}{y}f_x(x,y)= \frac{1}{x} f_y(x,y) ,\quad xy=1\\ & \iff xf_x\Big(\!x,\frac{1}{x}\Big)= \frac{1}{x} f_y\Big(\!x,\frac{1}{x}\Big) ,\quad y=\frac{1}{x}\\ & \iff F'(x) = \diff{}{x} f\Big(\!x,\frac{1}{x}\Big) = f_x\Big(\!x,\frac{1}{x}\Big) -\frac{1}{x^2}f_y\Big(\!x,\frac{1}{x}\Big) =0,\quad y=\frac{1}{x} \end{align*}