Algèbre linéaire, formes normales et applications

Contenu

Algèbre linéaire, formes normales et applications#

Nicolas M. Thiéry <Nicolas.Thiery at universite-paris-saclay.fr>

Mathematics is the art of reducing any problem to linear algebra - William Stein.

Avant propos: formes normales#

Définition

Soit \(E\) en ensemble muni d’une relation d’équivalence \(\rho\). Une fonction \(f: E\mapsto E\) donne une forme normale pour \(\rho\) si, pour chaque classe d’équivalence \(C\), tous les élements de \(C\) sont envoyés sur le même élément \(c\) de \(C\). L’élément \(c\) est alors appelé la forme normale des éléments de \(C\).

Exemple 1

\(E=\mathbb{Z}\)

\(\rho\) : égalité modulo \(p\)

\(f: x \mapsto x \mod p\)

Exemple 2

\(E=\mathbb{Z}\times \mathbb{Z}\)

\(\rho: \qquad(a,b) \ \rho\ (c,d) \quad \text{ si } \quad ad=bc\)

\(f\) : ???

Quel intérêt?

Les formes normales permettent de représenter les classes d’équivalence et donc de calculer dans le quotient.

Question

Formes normales pour les matrices?

Échauffement#

Exercice

Résoudre le système d’équations suivant sur \(GF(5)\) :

\[\begin{split}\begin{aligned} \begin{align*} 3x_3 + x_4 + 4x_5 &= 0\\ 3x_1 + x_2 + 4x_3 + 2x_4 + x_5 &= 0\\ 4x_1 + 3x_2 + 2x_3 + x_4 + 3x_5 &= 0\\ \end{align*} \end{aligned}\end{split}\]

On donnera une paramétrisation et une base de l’ensemble des solutions.

Solution partielle

%display latex

K = GF(5)

M = matrix(K, [[0,0,3,1,4], [3,1,4,2,1], [4,3,2,1,3]]); M

v = vector(SR.var('x1,x2,x3,x4,x5'))
for eq in matrix(ZZ,M) * v:
    display( eq == 0 )

M.echelon_form()

Calcul du pivot de Gauß à la main:

N = copy(M)
N

N[0],N[1] = N[1],N[0]
N

N[0] = N[0] / K(3)
N

N[2] = N[2] - 4*N[0]
N

N[1] = N[1] / K(3)
N

N[0] = N[0] - 3*N[1]
N

Calcul d’une base des solutions:

M.right_kernel()

Astuce Sage

Le système ci-dessus a été fabriqué avec:

random_matrix(GF(5),3,5,  algorithm='echelonizable', rank=2); M  # random

L’algorithme de Gauß revisité#

On se place dans un corps \(K\) quelconque

Forme échelon (réduite)#

Définition

Une matrice est sous forme échelon (en lignes) si le nombre de zéros précédant la première valeur non nulle d’une ligne augmente ligne par ligne jusqu’à ce qu’il ne reste plus que des zéros:

\[\begin{split}\begin{aligned} \begin{pmatrix} \underline{*} & * & * & * & * & * & * & * & * \\ 0 & 0 & \underline{*} & * & * & * & * & * & * \\ 0 & 0 & 0 & \underline{*} & * & * & * & * & * \\ 0 & 0 & 0 & 0 & 0 & 0 & \underline{*} & * & * \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & \underline{*} \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix} \end{aligned}\end{split}\]

Définition

Les colonnes caractéristiques sont les colonnes contenant les pivots (soulignés ci-dessus), c’est-à-dire les premiers coefficients non nul d’une ligne.

Définition

Une matrice est sous forme échelon réduite si les pivots valent 1 et si les autres coefficients dans les colonnes des pivots sont nuls:

\[\begin{split}\begin{aligned} \begin{pmatrix} 1 & * & 0 & 0 & * & * & 0 & * & 0 \\ 0 & 0 & 1 & 0 & * & * & 0 & * & 0 \\ 0 & 0 & 0 & 1 & * & * & 0 & * & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 1 & * & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{pmatrix} \end{aligned}\end{split}\]

Exemple

Une matrice sous forme échelon et ses colonnes caractéristiques:

M2 = random_matrix(QQ, 4, 8, algorithm='echelon_form', num_pivots=3); M2 # random

M2.pivots()                                                             # random

Remarque

L’algorithme du pivot de Gauß-Jordan transforme une matrice jusqu’à ce qu’elle soit sous forme échelon (réduite).

Forme échelon, réduction et division euclidienne#

Exercice

Revenons à notre matrice:

Note à l’enseignant: copier la matrice au tableau

Exercice (suite)

Déterminez si les vecteurs suivants sont des combinaisons linéaires des lignes de \(M\) :

u = vector([1, 2, 4, 1, 0])
v = vector([2, 1, 4, 0, 1])

Solution

Sur \(M\), ce n’est pas évident. Par contre, si on part de sa forme échelon \(N\) :

N = M.echelon_form(); N

On voit aisément que \(u\) est combinaison linéaire des lignes de \(N\) :

u - N[0]

u - N[0] - 4*N[1]

Mais pas \(v\) :

v - 2*N[0]

v - 2*N[0] - 4*N[1]

Théorème-Définition: réduction modulo forme échelon

Soit \(N\) une matrice sous forme échelon sans ligne nulle et \(u\) un vecteur.

Alors, on peut écrire de manière unique

\[u = q N + r ,\]

où:

\(qN\) est une combinaison linéaire de lignes de \(N\)
\(r\) a des coefficients nuls dans les colonnes caractéristiques de \(N\).

On appelle \(r\) la réduction de \(u\) modulo \(N\).

Moralement: on ajoute \(u\) en dernière ligne de \(N\) et on finit le pivot de Gauß.

Note à l’enseignant

Copier le théorème au tableau.

Exercice

Considérons les deux polynômes suivants:

x = QQ['x'].gen()
P = x^2 - 2*x + 1
U = x^5 - x + 2

Exercice (suite)

Écrivez la matrice \(N\) des polynômes \(x^3P,x^2P,xP,P\), vus comme vecteurs ligne dans la base canonique \(x^5, x^4, \ldots, 1\) des polynômes de degré inférieur à 5.
De même écrivez le vecteur ligne \(u\) représentant le polynôme \(U\) dans cette base.
Calculez la réduction de \(u\) modulo \(N\).
Que constatez-vous?

Solution

Construisons N et u:

N = matrix([[1,-2,1,0,0,0],[0,1,-2,1,0,0],[0,0,1,-2,1,0],[0,0,0,1,-2,1]])
u = vector([1, 0, 0, 0, -1, 2])

Calculons la réduction:

u - N[0]

u - N[0] - 2*N[1]

u - N[0] - 2*N[1] - 3*N[2]

u - N[0] - 2*N[1] - 3*N[2] -4*N[3]

u - N[0] - 2*N[1] - 3*N[2] -4*N[3]

Comparons cela avec la division Euclidienne:

U % P

U // P

Conclusion

La division Euclidienne est un cas particulier de réduction d’un vecteur modulo une forme échelon. Le vecteur \(q\) donne la résultat de la division et \(r\) le reste.

Forme échelon et matrices équivalentes#

Exercice: matrices à deux lignes

Pour chacunes des matrices suivantes, écrivez la première étape du pivot de Gauß sous forme de multiplication à gauche par une matrice \(P\) de taille \(2\times 2\) :

%display latex
var('a1,b1,c1,a2,b2,c2');

Échange lignes \(1\) et \(2\) pour:

M1 = matrix([[0,b1,c1],[1,b2,c2]]); M1

Renormalisation \(L_1 = \frac{1}{a_1} L_1\) pour:

M2 = matrix([[a1,b1,c1],[0,b2,c2]]); M2

Pivot \(L_2 = L_2 -\frac{a_2}{a_1}L_1\) pour:

M3 = matrix([[a1,b1,c1],[a2,b2,c2]]); M3

Solutions:

P = matrix([[0,1],[1,0]]);      P, P * M1

P = matrix([[1/a1,0],[0,1]]);   P, P * M2

P = matrix([[1,0],[-a2/a1,1]]); P, P * M3

Remarques

Les opérations sur les lignes peuvent être implantées par multiplication à gauche par des matrices inversibles.
Si \(N\) est obtenue de \(M\) par l’algorithme du pivot de Gauß, alors \(N=PM\) où \(P\) est une matrice inversible, éventuellement de déterminant \(1\) (le produit des matrices ci-dessus).
S’il n’y a pas de permutation à effectuer, alors on peut écrire \(M\) sous la forme \(M=LU\), où \(U=N\) est triangulaire supérieure (upper triangular), et \(L=P^{-1}\) est triangulaire inférieure (lower triangular): le produit des inverses des matrices ci-dessus. On appelle cela la décomposition \(LU\).

Exemple

Déterminer la décomposition \(M=LU\) de notre matrice favorite.

Solution:

P, L, U = M.LU()
P, L, U

L * U

P * L * U

Matrices équivalentes (à gauche)#

Définition

Disons ici que deux matrices \(M\) et \(M'\) de \(M_{n,m}(K)\) sont équivalentes (modulo l’action de \(GL_n(K)\) à gauche) s’il existe une matrice inversible \(P\) telle que \(M=PM'\).

Exercice

Vérifier que cela définit une relation d’équivalence!

Question

La remarque précédente dit que si deux matrices \(M\) et \(M'\) donnent la même forme échelon réduite par Gauß, alors elles sont équivalentes.

Réciproque?

Démonstration de la réciproque

Soient \(M\) et \(M'\) deux matrices équivalentes, et \(N\) et \(N'\) leurs formes échelons réduites. On veut montrer que \(N=N'\).

On note que \(N\) et \(N'\) sont équivalentes: on peut prendre \(P\) telle que \(N=PN'\).

Notons \(N_k\) la sous-matrice composée des \(k\) premières colonnes de \(N\) et de même pour \(N'\); elles sont encore sous forme échelon, et \(N_k=PN'_k\). On remarque alors que:

Le rang de \(N_k\) est le nombre de colonnes caractéristiques \(\leq k\) de \(N\); de même pour \(N'\).
Comme \(P\) est inversible, \(N_k\) et \(N'_k\) sont de même rang.

Conclusion: les colonnes caractéristiques de \(N\) et \(N'\) coïncident.

En regardant ce qui se passe au niveau des pivots, on déduit que les \(rang(N')\) premières colonnes de \(P\) sont celles de l’identité. Il s’ensuit que \(N=N'\).

Théorème

On considère les matrices \(n\times m\) à coefficients dans un corps \(K\). La forme échelon réduite donne une forme normale pour les matrices modulo l’action de \(GL_n(K)\) à gauche.

Corollaire

Il y a une certaine liberté dans l’ordre d’exécution des opérations du pivot de Gauß. Le théorème précédent garantit que le résultat final ne dépend pas de l’ordre des calculs.

Interprétation géométrique#

Reprenons notre matrice:

M = matrix(GF(5), [[0,0,3,1,4], [3,1,4,2,1], [4,3,2,1,3]]); M

et sa forme échelon:

M.echelon_form()

Pour le moment, cette forme échelon est décrite comme le résultat d’un calcul: l’application du pivot de Gauß. C’est opératoire, mais pas très conceptuel.

Peut-on faire mieux?

Sous espaces vectoriels et formes échelon#

Exercice

Soient \(M\) et \(M'\) deux matrices de \(M_{n,m}(K)\), que l’on voit comme deux paquets de \(n\) vecteurs de \(K^m\).

Montrer que \(M\) et \(M'\) sont équivalentes (modulo l’action de \(GL_n(K)\) à gauche) si et seulement si les vecteurs engendrent le même sous-espace vectoriel de \(K^m\).

Solution

Si les matrices sont équivalentes, la multiplication à gauche par la matrice inversible permet d’exprimer les vecteurs de l’une en fonction de l’autre, et réciproquement. Ils engendrent donc le même sous-espace vectoriel.

Réciproquement, supposons que les vecteurs engendrent le même espace vectoriel \(F\). S’ils forment une base, il suffit de prendre la matrice \(P\) qui exprime la première base en fonction de la deuxième (\(P\) est inversible!), de sorte que \(M=PM'\). Sinon on remplace \(M\) et \(M'\) par leurs formes échelon (qui leurs sont équivalentes); et on prend la matrice \(P\) pour les lignes non nulles (qui forment une base), et on la complète par l’identité pour les lignes nulles.

Corollaire

L’ensemble quotient \(GL_n(K) \backslash M_{n,m}(K)\) représente l’ensemble des sous-espaces vectoriels de dimension au plus \(n\) dans \(K^m\). Cet ensemble est naturellement muni d’une structure de variété appelée variété Grassmanienne.

Corollaire

La forme échelon réduite donne une forme normale pour les sous-espaces vectoriels!

Exercice

Comptez le nombre de sous espaces vectoriels de rang \(2\) d’un espace de dimension \(4\) sur \(GF(5)\).

Exercice

Comptez le nombre de sous-espaces vectoriels de dimension 0, 1 (droites), 2 (plans), 3 dans \(GF(q)^3\).
On se place maintenant dans \(\mathbb{R}^3\). Décrire géométriquement, en fonction de leur forme échelon, comment ces sous espaces vectoriels se positionnent dans l’espace.

Drapeaux#

Exercice

Soit \((e_1,\dots, e_5)\) la base canonique de \(K^5\), et soit \(E\) le sous espace vectoriel de \(K^5\) engendré par les lignes de notre matrice favorite \(M\) :

Pour \(i\) de \(1\) à \(5\), calculer la dimension de l’espace vectoriel

\[E_i = E \cap \langle e_i,\ldots,e_5\rangle\]

Puis décrire les quotients successifs \(E_i / E_{i+1}\).

Digression: lien avec les groupes de permutations

Pour manipuler un sous-groupe \(G\) du groupe symétrique \(S_n\), on avait considéré le sous-groupe \(G_{n-1}\) des éléments fixant \(n\), puis ceux fixant \(n\) et \(n-1\), et ainsi de suite récursivement.

Formellement, on avait considéré la suite des groupes symétriques emboîtés:

\[\{id\} = S_0\subsetneq S_1 \subsetneq \cdots \subsetneq S_n\]

et la suite induite des groupes emboîtés \(G_i:=G \cap S_i\) :

\[\{id\} = G_0\subset G_1 \subset \cdots \subset G_n=G\]

L’étude de \(G\) se ramenait alors à l’étude des quotients successifs \(G_i/G_{i-1}\).

Appliquer le même programme aux sous-espaces vectoriels?

Définition: Drapeau

Un drapeau complet d’un espace vectoriel \(V\) de dimension \(n\) est une suite maximale de sous-espaces strictement emboîtés:

\[\{0\} = V_0 \subsetneq V_1 \subsetneq \cdots \subsetneq V_n=V\]

Définition: Drapeau canonique

À chaque base ordonnée, on peut associer naturellement un drapeau complet. Ici on considérera principalement le drapeau canonique associé à la base canonique \(e_1,\ldots,e_m\) de \(V=K^m\) :

\[\{0\} = \langle\rangle \subsetneq \langle e_n \rangle \subsetneq \cdots \subsetneq \langle e_i,\ldots,e_n\rangle \subsetneq \cdots \subsetneq \langle e_1,\ldots,e_n\rangle = V\]

Note: on prend les éléments dans cet ordre pour que cela colle avec nos petites habitudes de calcul du pivot de Gauß.

Formes échelon et bases adaptées

Dans ce formalisme, qu’est-ce qu’une matrice sous forme échelon?

C’est une base \(B\) d’un espace vectoriel \(E\) adaptée à un drapeau complet donné. C’est-à-dire une base sur laquelle on peut lire immédiatement les sous espaces \(E_i:=E\cap \langle e_i,\ldots,e_n\rangle\) :

\[E_i = \langle B \cap E_i\rangle\]

Le pivot de Gauß est un algorithme de calcul de base adaptée.

Définition intrinsèque des colonnes caractéristiques

Remarque: en passant de \(E_{i+1}\) à \(E_i\), la dimension croît de \(0\) ou de \(1\).

Cela permet de donner une définition intrinsèque de la notion de colonnes caractéristiques d’un sous espace vectoriel \(E\) : les \(i\) tels que la dimension de \(E_i\) croît strictement. Cela décrit la position de \(E\) par rapport à un drapeau complet fixé.

Évidemment, sur une forme échelon pour \(E\), cela correspond aux colonnes \(i\) pour lesquelles on a un vecteur de la forme \(e_i+\cdots\).

Formes échelon réduites

Considérons deux bases adaptées d’un même espace vectoriel \(E\). Pour \(i\) une colonne caractéristique, on note \(a_i\) et \(b_i\) les vecteurs de la forme \(a_i=e_i+\cdots\) et \(b_i=e_i+\cdots\).

Alors \(a_i-b_i\in V_{i+1}\); autrement dit \(a_i=b_i\) dans le quotient \(E_i/E_{i+1}\).

Prendre une forme échelon réduite, c’est faire un choix d’un représentant (relativement canonique) \(a_i\) dans chaque quotient \(E_i/E_{i+1}\) : celui qui a des zéros aux autres colonnes caractéristiques.

Ce formalisme montre que le vecteur \(a_i\) est intrinsèque à \(E\) (et au choix du drapeau complet). En particulier il est clair qu’il est complètement indépendant des autres coefficients de la forme échelon réduite, même si opératoirement le calcul de \(a_i\) par Gauß passe par ceux-ci.

Remarque

La permutation \(P\) apparaissant dans le calcul de l’algorithme de Gauß a une interprétation géométrique naturelle (position du drapeau \(\langle v_1\rangle, \langle v_1,v_2\rangle\) par rapport au drapeau canonique).

Les variétés Grassmaniennes et ses variantes (variétés de drapeaux, …) et leur multiples généralisations sont l’objet d’études approfondies en géométrie. La combinatoire y joue un rôle important: l’apparition d’une permutation \(P\) dans le pivot de Gauß est le prototype du type de lien.

Résumé#

La forme échelon d’une matrice joue un rôle central en algèbre linéaire car:

Il existe des algorithmes relativement peu coûteux pour la calculer (par exemple Gauß: \(O(n^3)\)).

La plupart des problèmes en algèbre linéaire sur un corps se traitent aisément sur cette forme échelon. Notamment:
- calcul sur les matrices
- calcul sur les équations
- calcul sur espaces vectoriels
- calcul sur les morphismes

La forme échelon a un sens algébrique: c’est une forme normale pour la relation d’équivalence induite par l’action à gauche du groupe linéaire.

La forme échelon a un sens géométrique: c’est une forme normale pour un sous-espace vectoriel; elle décrit sa position par rapport au drapeau canonique.

Nous verrons d’autres formes normales pour d’autres classes d’équivalences de matrices.

Textes connexes#

Quelques références#

Storjohan.2004
Algorithms for Matrix Canonical Forms, Arne Storjohan, PhD Thesis, Department of Computer Science, Swiss Federal Institute of Technology – ETH, 2000