6. Algebra lineare#

In questa sezione vengono presentati gli argomenti dell’algebra lineare che riguardano la soluzione di sistemi di equazioni lineari, per i quali si discutono le condizioni di esistenza e unicità della soluzione e dei quali viene fornita una rappresentazione grafica. Viene introdotto il formalismo matriciale, e le operazioni algebriche elementari sulle matrici; vengono date le definizioni le matrici vengono interpretate come funzioni lineari (applicazioni lineari), e utilizzate per formulare le condizioni di esistenza e unicità delle soluzioni di sistemi lineari (teorema di Rouché-Capelli).

6.1. Introduzione#

L’algebra lineare è fondamentale per studiare matrici, sistemi lineari e trasformazioni geometriche. Questo capitolo esplora le matrici, i determinanti e la risoluzione dei sistemi.

6.2. Sistemi lineari e formalismo matriciale#

Un sistema di \(m\) equazioni lineari in \(n\) incognite \(\{ x_1 \}\),

\[\begin{split}\begin{cases} a_{11} x_1 + a_{12} x_2 + \dots + a_{1n} x_n & = b_1 \\ \dots \\ a_{m1} x_1 + a_{m2} x_2 + \dots + a_{mn} x_n & = b_m \\ \end{cases}\end{split}\]

può essere riscritto usando il formalismo matriciale come

\[\begin{split} \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ \dots & \dots & \dots & \dots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \dots \\ x_n \end{bmatrix} = \begin{bmatrix} b_1 \\ \dots \\ b_m \end{bmatrix} \qquad , \qquad \mathbf{A} \mathbf{x} = \mathbf{b} \ , \end{split}\]

avendo raccolto i coefficienti \(a_{ij}\) nella matrice \(\mathbf{A} \in \mathbb{R}^{m,n}\), una tabela di \(m\) righe e \(n\) colonne, le incognite \(x_j\) nella \(n\)-upla \(\mathbf{x} \in \mathbb{R}^n\) e i coefficienti \(b_i\) nella \(m\)-upla \(\mathbf{b} \in \mathbb{R}^m\), organizzate in un vettore colonna. Il prodotto matrice-vettore colonna \(\mathbf{A} \mathbf{x}\) rimane definito dall’equivalenza delle diverse espressioni dello stesso sistema lineare.

6.3. Matrici#

Definizione. Una matrice \(\mathbf{A} \in \mathbb{R}^{m,n}\) è una tabella 2-dimensionale di numeri reali con \(m\) righe e \(n\) colonne,

\[\begin{split} \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ \dots & \dots & \dots & \dots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{bmatrix} \end{split}\]

6.3.1. Inteprepretazione del contenuto di una matrice#

Spesso risulta utile intepretare una matrice \(\mathbf{A} \in \mathbb{R}^{m,n}\) come una tabella di \(n\) colonne di \(m\)-tuple o vettori colonna, o come una tabella di \(m\) righe di \(n\)-tuple o vettori riga,

\[\begin{split}\mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ \dots & \dots & \dots & \dots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{bmatrix} = \left[ \begin{array}{c|c|c|c} & & & \\ \mathbf{a}_{col,1} & \mathbf{a}_{col,2} & \dots & \mathbf{a}_{col,n} \\ & & & \\ \end{array} \right] = \begin{bmatrix} \quad \mathbf{a}^T_{row,1} \quad \\ \hline \quad \dots \quad \\ \hline \quad \mathbf{a}^T_{row,m} \quad \end{bmatrix} \ . \end{split}\]

In seguito si faranno cadere i pedici \(col\) e \(row\) per motivi di sintesi, usando il simbolo \(^T\) per intendere un vettore riga, come vettore trasposto di un vettore colonna. Nel formalismo matriciale, un vettore colonna con \(m\) elementi viene quindi intepretato come una matrice \(\in \mathbb{R}^{m,1}\) di \(m\) righe e una colonna; viceversa un vettore riga con \(n\) elementi una matrice \(\in \mathbb{R}^{1,n}\) di una riga e \(n\) colonne.

6.3.2. Operazioni#

  • Somma. La somma è possibile tra due matrici con le stesse dimensioni \(\mathbf{A},\, \mathbf{B} \in \mathbb{R}^{m,n}\). La somma di due matrici \(\mathbf{A}\), \(\mathbf{B}\) è la matrice \(\mathbf{A} + \mathbf{B} \in \mathbb{R}^{m,n}\) con componenti

    \[(\mathbf{A} + \mathbf{B})_{ij} = a_{ij} + b_{ij} \ ,\]

    o più esplicitamente,

\[\begin{split} \mathbf{A} + \mathbf{B} = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ \dots & \dots & \dots & \dots \\ a_{m1} & a_{m2} & \dots & a_{mn} \end{bmatrix} + \begin{bmatrix} b_{11} & b_{12} & \dots & b_{1n} \\ \dots & \dots & \dots & \dots \\ b_{m1} & b_{m2} & \dots & b_{mn} \end{bmatrix} = \begin{bmatrix} a_{11}+b_{11} & a_{12}+b_{12} & \dots & a_{1n}+b_{1n} \\ \dots & \dots & \dots & \dots \\ a_{m1}+b_{m1} & a_{m2}+b_{m2} & \dots & a_{mn}+b_{mn} \\ \end{bmatrix} \end{split}\]
  • Moltiplicazione per uno scalare. La moltiplicazione di una matrice \(\mathbf{A} \in \mathbb{R}^{m,n}\) per un numero reale \(c \in \mathbf{R}\) è la matrice \(c \mathbf{A} \in \mathbb{R}^{m,n}\) con componenti

    \[(c \mathbf{A})_{ij} = c \, a_{ij} \ ,\]

    o più esplicitamente,

\[\begin{split} c A = \begin{bmatrix} c \cdot a_{11} & \dots & c \cdot a_{1n} \\ \dots & \dots & \dots \\ c \cdot a_{m1} & \dots & c \cdot a_{mn} \end{bmatrix} \end{split}\]
  • Prodotto di matrici. Il prodotto \(\mathbf{A} \mathbf{B}\) tra matrici è possibile tra due matrici \(\mathbf{A} \in \mathbb{R}^{m,p}\), \(\mathbf{B} \in \mathbb{R}^{p,n}\), ed è la matrice \(\mathbf{A} \mathbf{B} \in \mathbb{R}^{m,n}\) con le componenti

    \[(\mathbf{A}\mathbf{B})_{ij} = \sum_{k=1}^{n} a_{in} b_{nj} = \mathbf{a}_i^T \mathbf{b}_j \ .\]

    avendo usanto l”intepretazione dei componenti di una matrice in vettori riga e colonna, per esprimere l’elemento \(ij\) della matrice \(\mathbf{A} \mathbf{B}\) come prodotto matriciale della \(i\)-esima riga di \(\mathbf{A}\) con la \(j\)-esima colonna di \(\mathbf{B}\).

    Osservazione. Non vale la proprietà commutativa per il prodotto di matrici. Per di più, in generale non è possibile formare il prodotto \(\mathbf{B} \mathbf{A}\), se \(m \ne n\).

6.3.3. Matrice come funzione lineare#

Tramite il prodotto matrice vettore (colonna), una matrice \(\mathbf{R}^{m,n}\) rappresenta la funzione lineare più generale \(f_A: \mathbb{R}^n \rightarrow \mathbb{R}^m\), che prende un vettore colonna \(\mathbf{x} \in \mathbb{R}^n\) come argomento e restituisce un vettore \(\mathbf{y} \in \mathbb{R}^m\),

\[\mathbf{y} = f(\mathbf{x}) = \mathbb{A} \mathbf{x} \ .\]

Si lasciano dimostrare le proprietà di linearità di questa funzione come esercizio (consiglio: utilizzare le operazioni matriciali)

6.3.4. Immagine e nucleo#

Immagine e nucleo sono due insiemi1 sono due insiemi che caratterizzano le funzioni e quindi possono essere definiti anche per una matrice che rappresenta una funzione lineare.

Il nucleo di una matrice \(\mathbf{A} \in \mathbb{R}^{m,n}\) è l’insieme dei vettori colonna \(\mathbf{x} \in \mathbb{R}^n\) tali che \(\mathbf{A} \mathbf{x} = \mathbf{0}_m\),

\[\text{N}(\mathbf{A}) = \{ \mathbf{x} \in \mathbb{R}^n \, | \, \mathbf{A} \mathbf{x} = \mathbf{0}_m \} \ .\]

L”immagine di una matrice \(\mathbf{A} \in \mathbb{R}^{m,n}\) è l’insieme dei vettori colonna \(\mathbf{y} \in \mathbb{R}^m\) per i quali esiste un vettore \(\mathbf{x} \in \mathbb{R}^n\) tale che \(\mathbf{A} \mathbf{x} = \mathbf{y}\),

\[\text{I}(\mathbf{A}) = \{ \mathbf{y} \in \mathbb{R}^m \, | \, \exists \mathbf{x} \in \mathbb{R}^n \, | \, \mathbf{A} \mathbf{x} = \mathbf{y} \} \ .\]

todo fare riferimento alle definizioni per le funzioni, immagine di una funzione, nucleo di una funzione.

6.3.5. Determinante#

Per una matrice quadrata \(\mathbf{A} \in \mathbb{R}^{n,n}\) è possibile definire una grandezza scalare, definita determinante, il cui nome dovrebbe farne intuire la rilevanza: essa infatti riassume alcune caratteristiche della matrice e, tra le altre, determina un criterio di esistenza della matrice inversa e un criterio di esistenza e di unicità della soluzione di un sistema lineare, \(\mathbf{A} \mathbf{x} = \mathbf{b}\).

La definizione e una discussione completa del determinante di una matrice vanno ben oltre (todo probabilmente) lo scopo di questo materiale.

todo Rapporto con immagine e nucleo

todo Espressione del determinante per matrici 2x2, 3x3; mettere in evidenza la comparsa del determinante nei metodi di soluzione sotto

6.4. Risoluzione di Sistemi#

La soluzione dei sistemi lineari è una delle attività più frequenti nelle applicazioni di matematica, soprattutto negli algoritmi di calcolo numerico; non ci occuperemo qui dei metodi numerici di soluzione dei sistemi lineari, ma si discutono diversi approcci alla soluzione analitica «a manina» di sistemi lineari, utili per il calcolo analitico della soluzione esatta di sistemi lineari di dimensioni sufficientemente ridotte (3, salvo casi eccezionali…).

Come descritto dal teorema di Rouché-Capelli, esistono 3 possibili situazioni: il sistema lineare ha 1. una sola soluzione; 2. un numero infinito di soluzioni; 3. nessuna soluzione.

I metodi presentati sono tra di loro equivalenti, intendendo che portano alla stessa soluzione. todo Equivalenti nel caso esista una soluzione unica. Danno le stesse informazioni anche nel caso esistano infinite soluzioni o non esistano soluzioni? Riguardo il rango e/o il nucleo…

todo Collegamento a soluzione numerica di sistemi lineari, nel $\(\texttt{bbook}\)$ sull”introduzione alla programmazione e al calcolo numerico

6.4.1. Metodo di sostituzione#

Il metodo di sostituzione consiste nell’usare in successione un’equazione per ricavare un’incognita in funzione delle altre incognite, e sostituire l’espressione ricavata nelle altre successioni, per ottenere un sistema lineare con al dimensione ridotta di 1. Si continua così fino a ottenere un’equazione in un’incognita, immediata da risolvere. Successivamente si trovano i valori delle altre incognite in funzione delle incognite già calcolate. Se esiste una soluzione del problema, l’algoritmo descritto permette di calcolare la soluzione. todo Altrimenti, in caso di esistenza di infinite soluzioni si arriva a un’identità \(0=0\); in caso di nessuna soluzione si arriva a una contraddizione \(1=0\). todo vedi esempi sotto

6.4.2. Metodo di eliminazione di Gauss#

Il metodo di eliminazione di Gauss consiste nella combinazione lineare delle equazioni del sistema per ottenere una forma del sistema facilmente risolvibile, tipicamente una matrice dei coefficienti con forma triangolare.

6.4.3. Metodo di Cramer#

todo Per quale motivo discuterlo? E” scomodo, non dà grandi informazioni in caso di assenza o numero infinito di soluzioni…

6.5. Teorema di Rouché-Capelli#

6.5.1. Interpretazione geometrica#

Example 6.4 (Sistema quadrato determinato)

Example 6.5 (Sistema quadrato indeterminato)

Example 6.6 (Sistema quadrato sovradeterminato)

Example 6.7 (Sistema indeterminato)

6.6. Problemi#

6.6.1. Matrici come funzione lineare#

6.6.2. Soluzione di sistemi lineari#

Viene chiesto di stabilire se i seguenti problemi hanno soluzione, di calcolare le eventuali soluzioni, fornire una rappresentazione grafica del problema algebrico, e - per sistemi con uguale numero di equazioni ed incognite - calcolare il determinante delle matrici del sistema lineare.

\[\begin{split} \begin{cases} x + y = 4 \\ \frac{3}{2}x + y = 5 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x - y = 2 \\ x + y = -1 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + 2y = 5 \\ 2x + 2y = 11 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = 3 \\ x - y = 1 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x - y + z = 0 \\ 2x - 2y + 2z = 0 \\ -x + y - z = 0 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y + z = 2 \\ x + 2y + z = 4 \\ x + y + 2z = 6 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y + z = 3 \\ 2x + 2y + z = 8 \\ \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y + z = 7 \\ x + y - z = 3 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} 3x + 2y = 6 \\ x - y = 1 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = 2 \\ 3x + 2y = 6 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x - y = 1 \\ x - 3y + z = 3 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = 5 \\ 2x - y = 1 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = 1 \\ x + y + z = 3 \\ 2x + 2y + z = 4 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y + z = 5 \\ 2x - 2y + 2z = 10 \\ 3x - y + 3z = -5 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = 4 \\ 2x + 2y = 8 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + 2y = 8 \\ 3x - 4y = -2 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = 3 \\ 2x + 2y = 6 \\ x + 3y = 4 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y - z = 3 \\ 2x - y + z = 2 \\ -x + y + 2z = 4 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y + z = 6 \\ x - y + z = 4 \\ 2x + y - z = 7 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y + 3z = 6 \\ 2x + 4y + 6z = 12 \\ -x - 2y - 3z = -6 \end{cases} \end{split}\]

Viene chiesto di ripetere la discussione degli esercizi precedenti, al variare dei parametri nel sistemi.

\[\begin{split} \begin{cases} x + ky = 2 \\ x - 2y = 1 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x + y = b \\ ax + y = 2 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} x - y + mz = 3 \\ mx + 2y + z = 4 \\ x + y - z = 1 \end{cases} \end{split}\]
\[\begin{split} \begin{cases} kx + y = 4 \\ 2x + ky = 3 p \end{cases} \end{split}\]
\[\begin{split} \begin{cases} px + y = 1 \\ 2x + y + z = 2 \\ y + qz = p \end{cases} \end{split}\]

todo Qualche esercizio con disequazioni


1

Rango e nucleo non sono semplici insiemi, ma hanno qualche proprietà in più che li rende spazi vettoriali. Per quello che ci serve qui, possiamo considerarli insiemi.