L. Pandolfi

Lezioni di Analisi Matematica 2

Il testo presenta tre blocchi principali di argomenti:

Successioni e serie numeriche e di funzioni: Cap. 1, e 2.

Questa parte consta di due, da studiarsi in sequenza. B1 Funzioni di più variabili e integrazione (multipla, di curva e di superficie): Cap. 3–8. B2 Campi conservativi,Cap. 9.

Sistemi di equazioni differenziali: Cap. 10.

Lo studio dei blocchi A e B può scambiarsi di ordine senza problemi. Invece, è consigliabile studiare C per ultimo. Infatti, lo studio del Cap. 10 richiede il concetto di continuità e differenziabilità di funzioni di più variabili, studiato ai paragrafi 4.1–4.2. Ovunque nello studio del Cap. 10 è necessario conoscere il concetto di curva (ma non le proprietà differenziali delle curve, né gli integrali di curva). L’esponenziale di matrici richiede la definizione di serie, Cap. 1, e 2 e il paragrafo 10.4 richiede il Cap. 9.

Indice

Elenco delle figure
1 Serie numeriche
1.1 Successioni numeriche: ricapitolazione
1.2 Le serie numeriche
  1.2.1 Serie telescopiche
1.3 Criteri di convergenza
  1.3.1 Il teorema di Cauchy per le serie
  1.3.2 Monotonia e serie a termini di segno costante
  1.3.3 Il test di MacLaurin
  1.3.4 Serie a termini di segno qualsiasi
1.4 Alcuni esempi numerici
1.5 Convergenza condizionata ed incondizionata
  1.5.1 Serie dipendenti da un parametro e serie di funzioni
1.6 Operazioni algebriche e serie
1.7 Prodotto alla Cauchy
1.8 Appendici
  1.8.1 Appendice: ancora sul test di MacLaurin
  1.8.2 La dimostrazione del Teorema di Leibniz
2 Successioni e serie di funzioni
2.1 Introduzione
2.2 Distanze tra funzioni
  2.2.1 Il prodotto interno su

ℒ^{2} (a, b)

  2.2.2 Proprietà della convergenza uniforme
2.3 Serie di funzioni
2.4 Serie di potenze
  2.4.1 Operazioni sulle serie di potenze
  2.4.2 Serie di potenze nel campo complesso
  2.4.3 Serie di Taylor
  2.4.4 Serie di potenze ed equazioni differenziali lineari
2.5 Serie di Fourier: introduzione
  2.5.1 Premesse: le funzioni periodiche
  2.5.2 Premesse: le formule d’Eulero
2.6 La serie di Fourier in

ℒ^{2} (- L, L)

2.6.1 Estensioni pari e dispari, e serie di Fourier
2.7 La convergenza puntuale della serie di Fourier
3 Lo spazio lineare normato

ℝ^{n}

3.1 Lo spazio lineare

ℝ^{n}

  3.1.1 Connessione e convessità
  3.1.2 Vettori liberi e vettori applicati
3.2 Basi e basi ordinate
  3.2.1 Il piano e lo spazio
3.3 Norme e distanze
  3.3.1 Completezza di

ℝ^{n}

3.4 La norma euclidea
3.4.1

ℝ^{2}

ℝ^{3}

con la norma euclidea
3.5 Il prodotto vettoriale
3.6 Coordinate curvilinee nel piano e nello spazio
3.7 Funzioni da

ℝ

ℝ^{n}

4 Funzioni da

ℝ^{n}

ℝ^{m}

4.1 Limiti e continuità
  4.1.1 Funzioni continue su insiemi
4.2 Le proprietà di differenziabilità
  4.2.1 Il differenziale delle funzioni a valori reali
  4.2.2 Regole di derivazione
  4.2.3 La direzione del gradiente e la direzione di massima velocità crescita
  4.2.4 Le funzioni definite tramite integrali
4.3 Le derivate di ordine superiore
  4.3.1 La formula di Taylor per le funzioni a valori reali
4.4 Gli estremi
4.5 Il differenziale delle funzioni a valori in

ℝ^{m}

  4.5.1 Regole di calcolo della matrice jacobiana
4.6 Campi vettoriali
  4.6.1 Operatori differenziali e campi vettoriali
4.7 Appendici
  4.7.1 Appendice: Rappresentazione di funzioni di due variabile
  4.7.2 Appendice: Propagazione ondosa
  4.7.3 Appendice: Funzioni omogenee
  4.7.4 Appendice: La dimostrazione del teorema 132
  4.7.5 Appendice: la dimostrazione del teorema di Schwarz
5 Funzioni implicite ed estremi vincolati
5.1 Insiemi di livello
5.2 Il teorema della funzione implicita
  5.2.1 Curve piane definite implicitamente
  5.2.2 Superfici definite implicitamente
  5.2.3 Curve intersezione di due superfici
5.3 Il teorema della funzione inversa ed i cambiamenti di variabili
5.4 Ulteriori esempi
  5.4.1 Superfici assegnate in modo implicito e curve intersezione di due superfici
5.5 Estremi vincolati
  5.5.1 Estremi vincolati ad una curva piana
  5.5.2 Estremi vincolati ad una superficie
  5.5.3 Estremi vincolati ad una curva dello spazio
  5.5.4 Osservazione importante
5.6 Appendice: la dimostrazione del teorema 165
6 Curve e superfici
6.1 Curve parametriche
  6.1.1 I cambiamenti di parametro e la definizione di curva
  6.1.2 Lunghezza di un arco
  6.1.3 Proprietà differenziali delle curve piane e dello spazio
6.2 Curve piane
6.3 Le superfici
  6.3.1 Superfici definite parametricamente
  6.3.2 Il piano tangente e la normale a una superficie
6.4 Appendici
  6.4.1 Appendice: le formule di Frenet per curve nello spazio
  6.4.2 Appendice: Curve in

ℝ^{n}

7 Integrazione delle funzioni di più variabili
7.1 Integrazione delle funzioni di due variabili
  7.1.1 La definizione di integrale
  7.1.2 Le proprietà dell’integrale
  7.1.3 Domini di integrazione definiti mediante curve di Jordan
  7.1.4 Riduzione di integrali doppi ad integrali iterati
7.2 Integrazione delle funzioni di tre variabili
7.3 Formula di riduzione per gli integrali tripli
  7.3.1 Integrazione e Cambiamento di variabili
7.4 Alcuni jacobiani che è importante ricordare
  7.4.1 Volumi delimitati da superfici di rotazione
7.5 Appendici
  7.5.1 Appendice: Integrali impropri
  7.5.2 Appendice: Teorema dei valori intermedi e Teorema di Brower
8 Integrali di curva e di superficie
8.1 Funzioni definite su curve: la densità
8.2 Gli integrali di curva
  8.2.1 Integrali di curva di prima specie
  8.2.2 Integrali di curva di seconda specie
  8.2.3 Integrali di curva di prima e di seconda specie
  8.2.4 Integrali di curva di seconda specie e forme differenziali
  8.2.5 Il ﬂusso
8.3 Analisi vettoriale nel piano
  8.3.1 Una considerazione preliminare
  8.3.2 Formula di Green
  8.3.3 Formula di Green e forme differenziali
  8.3.4 Le forme differenziali e le aree piane
  8.3.5 Le estensioni
8.4 Integrali di superficie
  8.4.1 Area di una calotta
  8.4.2 Densità superficiale
  8.4.3 Integrali di superfici di prima specie
  8.4.4 Integrale di superficie di seconda specie
  8.4.5 Integrale di superficie di seconda specie e forme differenziali
8.5 Analisi vettoriale nello spazio
  8.5.1 Formula della divergenza e formula di Gauss
  8.5.2 La formula di Stokes: il caso delle superfici parametriche
  8.5.3 Estensioni
8.6 Appendici
  8.6.1 Appendice: fatti da ricordare
  8.6.2 Appendice: osservazioni sulla terminologia
8.7 Appendice: Una dimostrazione del Teorema di Stokes
9 Campi conservativi
9.1 Potenziale
  9.1.1 Il calcolo del potenziale
9.2 Il linguaggio delle

1

-forme differenziali
9.3 Primitive di

2

-forme differenziali
9.4 Alcune formule importanti
10 I sistemi di equazioni differenziali
10.1 Introduzione
10.2 Esistenza e unicità di soluzione
  10.2.1 Equazioni differenziali lineari a coeffcienti costanti
  10.2.2 Il caso dell’equazione completa e delle equazioni di ordine superiore
  10.2.3 Il comportamento in futuro delle soluzioni
10.3 La stabilità
10.4 Sistemi piani ed integrali primi
  10.4.1 Integrali primi e stabilità
  10.4.2 Stabilità asintotica e perturbazioni

Elenco delle figure

1.1 Il test di MacLaurin
1.2

Σ_{n = 0}^{+ \infty} {(1 ∕ 2)}^{n} = 2

a sinistra,

Σ_{n = 0}^{+ \infty} {(- 1 ∕ 2)}^{n} = 2 ∕ 3

a destra
1.3

Σ_{n = 0}^{+ \infty} 1 ∕ n! = e

a sinistra,

Σ_{n = 0}^{+ \infty} {(- 1)}^{n} ∕ n = log 2

a destra
1.4

Σ_{n = 1}^{+ \infty} 1 ∕ n^{2} = π^{2} ∕ 6

a sinistra e

Σ_{n = 0}^{+ \infty} {(- 1)}^{n} ∕ [(2 n + 1)!] = sin (1)

a destra
2.1 Distanza

d_{\infty} (f, g)

2.2 Le distanze

d_{1} (f, g)

d_{2} (f, g)

2.3 Convergenza uniforme e convergenza in media
2.4 La convergenza uniforme non implica la convergenza della successione delle derivate
2.5 Gli intervalli che si usano nella dimostrazione del teorema di Abel
2.6 Somme parziali della serie (2.3) (a sinistra e della serie (2.4) (a destra)
2.7 Somma parziali della serie (2.5)
2.8 Illustrazione del Teorema 83
2.9 Estensione per periodicità della funzione (2.32)
2.10 Il fenomeno di Gibbs
2.11 Le serie di Fourier delle restrizioni a

(- π, π)

f (x) = s i g n x

(sinistra sopra ), di

f (x) = | x |

(destra sopra), di

f (x) = x

(sinistra sotto) e di

f (x) = | sin x |

(destra sotto)
3.1 Insieme connesso, a sinistra, e convesso a destra.
3.2 Senso positivo di rotazione e verso sugli assi coordinati
3.3 Sfera di centro l’origine in norme diverse
3.4 Teorema di Pitagora e identità del parallelogramma
3.5 Calcolo dell’area di un parallelogramma
3.6 Coordinate oblique
3.7 Trasformazione a coordinate oblique
3.8 coordinate polari
3.9 coordinate cilindriche
3.10 coordinate sferiche
4.1 La funzione dell’esempio 126
4.2 Piano tangente e vettore normale
4.3 Un punto di minimo e un punto di sella
4.4 Un parallelogramma, la sua immagine e il parallelogramma che la approssima
4.5 un campo vettoriale
4.6 Paraboloide di rotazione
4.7 Paraboloide di rotazione e sue curve di livello
4.8 La funzione (4.10)
4.9 Una funzione omogenea
4.10 Funzione omogenea di grado

1 ∕ 2

4.11 Superficie di rotazione
4.12 Una funzione periodica
4.13 La funzione (4.11)
4.14 La funzione (4.12)
4.15 Lunghezza d’onda
5.1 Esistenza o non esistenza della funzione implicita
5.2 La dimostrazione del teorema della funzione implicita
5.3 Il grafico della funzione

y = \sqrt[3]{x^{2}}

5.4 Esiste la funzione implicita anche se le condizioni del teorema non sono soddisfatte
5.5 Il grafico della funzione (5.8)
5.6 Gradiente nullo ma curva di livello regolare
5.7 Intersezione di due cilindri
5.8 Estremi vincolati e curve di livello
5.9 Grafici tangenti e estremi vincolati
5.10
6.1 Le curve (6.1) e (6.3)
6.2 La definizione di lunghezza: una curva e i suoi vettori approssimanti
6.3 Versore tangente e versore normale
6.4 Le regioni interna ed esterna e la normale esterna
6.5 Regola d’Ampère per una curva piana
6.6 Insieme su cui si proietta una calotta
6.7 Una calotta ed il suo “bordo”
6.8 Ancora una calotta col suo “bordo”
6.9 Il piano tangente e la normale ad una superficie
6.10 Riferimento mobile su una curva nello spazio
7.1 Domini di integrazione
7.2 Suddivisione in rettangoli di un dominio di integrazione
7.3 Riduzione di un integrale doppio
7.4 Riduzione per fili e per strati di un integrale triplo
7.5 Volume di una superficie di rotazione
8.1 “Operazioni” sugli archi
8.2 Gli archi (8.8) e (8.9) a sinistra. A destra una regione delimitata da due archi
8.3 Archi che “si elidono”
8.4 Integrali di curva di seconda specie ed archi che “si elidono”
8.5 Il ﬂusso
8.6 Versi di percorrenza
8.7 Formula di Green
8.8 Area di una regione di Jordan
8.9 Estensione della formula di Green
8.10 Area di una calotta
8.11 Calotta di rotazione (caso particolare: paraboloide di rotazione)
8.12 Flusso attraverso una superficie
8.13 Una sfera e la parte “sotto l’equatore”
8.14 Le due regioni
8.15 Una sezione della regione
8.16 Ancora la regione
8.17 Le due orientazioni del bordo
8.18 Estensione al caso del cilindro
8.19 Estensione ad una superficie non regolare
8.20 La costruzione del nastro di Möbius
8.21 Il cilindro e il nastro di Möbius
9.1 Un campo vettoriale conservativo ed uno non conservativo
10.1 Spezzata di Eulero
10.2 Nodo e punto di sella
10.3 Centro e fuoco
10.4 Nella definizione di stabilità in generale si deve scegliere

δ < 𝜖

10.5 Il caso dell’esempio 277: la limitatezza delle soluzioni non implica la stabilità
10.6 Integrali primi e stabilità
10.7 Il caso considerato nell’esempio 285

Capitolo 1
Serie numeriche

Le serie numeriche vogliono generalizzare la somma di un numero finito di termini al caso in cui si sommano infiniti termini. Per questo si introduce il limite di una opportuna successione di “somme parziali”. Prima di tutto quindi ricapitoleremo i concetti fondamentali relativi alle successioni numeriche.

1.1 Successioni numeriche: ricapitolazione

Una successione numerica è una funzione definita su $ℕ$ ed a valori in $ℝ$ (oppure in $ℂ$ . Noi qui ci limitiamo a considerare successioni a valori reali). Una successione si indica col simbolo $(x_{n})$ e si sottintende che $n \in ℕ$ . Talvolta, $n$ è un qualsiasi numero intero maggiore od uguale ad un certo $n_{0}$ che può anche essere negativo. Se è necessario specificare il primo dei valori dell’indice $n$ scriveremo ${(x_{n})}_{n \geq n_{0}}$ . La successione si chiama:

“limitata” quando esiste $M$ tale che $| x_{n} | < M$ per ogni $n$ ;
“convergente”, quando esiste finito il limite $lim_{n \to + \infty} x_{n}$ , che spesso si indica semplicemente come $lim x_{n}$ ;
“divergente” quando $lim x_{n} = + \infty$ oppure quando $lim x_{n} = - \infty$ ;
“regolare” quando è convergente oppure divergente;
“oscillante” quando non è regolare; ossia quando $lim x_{n}$ non esiste, né finito né $+ \infty$ né $- \infty$ .

Ricordiamo che una successione si dice fondamentale o di Cauchy quando

per ogni

𝜖 > 0

esiste un

N_{𝜖}

tale che per ogni

n > N_{𝜖}

e per ogni

m > 0

si ha:

| x_{n} - x_{n + m} | < 𝜖 .

In simboli:

\forall 𝜖 > 0 \exists N_{𝜖} | \forall n > N_{𝜖}, \forall m > 0 \Rightarrow | x_{n} - x_{n + m} | < 𝜖 .

Vale:

Teorema 1 Ogni successione convergente è fondamentale; ogni successione fondamentale è limitata e quindi ogni successione convergente è limitata.

Naturalmente, esistono successioni limitate e non convergenti. Per esempio la successione di termine generale $x_{n} = {(- 1)}^{n}$ . Invece:

Teorema 2 Ogni successione fondamentale è convergente.

Dim. Accenniamo ai passi cruciali della dimostrazione, che si trova nei testi di Analisi Matematica 1. Sia $(x_{n})$ la successione. Prima di tutto si prova che la successione $(x_{n})$ ammette s.successioni convergenti. Questo si vede così: dato che una successione fondamentale è limitata, l’immagine di $(x_{n})$ , ossia l’insieme ${x_{n}}$ è limitato. Se è finito, almeno uno dei suoi elementi è immagine di infiniti $n$ e quindi la successione $(x_{n})$ ha una s.successione $(x_{n_{k}})$ costante e quindi convergente, di ciamo ad $x_{0}$ . Se l’insieme ${x_{n}}$ è infinito, esso ammette almeno un punto di accumulazione $x_{0}$ , per il Teorema di Bolzano-Weierstrass. Si costruisce quindi una s.successione $(x_{n_{k}})$ convergente ad $x_{0}$ . L’ultimo passo della dimostrazione consiste nel mostrare che è la successione $(x_{n})$ stessa che converge ad $x_{0}$ , usando la definizione di successione fondamentale. _ Una successione $(x_{n})$ è crescente quando $n > m$ implica $x_{n} \geq x_{m}$ ; decrescente quando $n > m$ implica $x_{n} \leq x_{m}$ . Un altro risultato importante da ricordare è il teorema delle funzioni monotone, la cui formulazione particolarizzata al caso delle successioni è la seguente:

Teorema 3 Sia $(x_{n})$ una succesione monotona. Esiste $lim x_{n};$ ossia, ogni successione monotona è regolare.

Infine, ricordiamo che se una successione $(x_{n})$ è regolare, anche la successione che si ottiene da essa trascurandone un numero finito di termini, ossia ${(x_{n})}_{n > m}$ è regolare, ed ha il medesimo limite¹.

1.2 Le serie numeriche

Sia $(x_{n})$ una successione di numeri. Per fissare le idee sia $n \geq 1$ , ma in modo analogo si può trattare il caso in cui il primo indice sia per esempio $0$ o comunque sia diverso da $1$ . Si chiama serie dei numeri $x_{n}$ una nuova successione $(s_{n})$ costruita come segue:

s_{1} = x_{1}, s_{2} = x_{1} + x_{2}, s_{k} = \sum_{n = 1}^{k} x_{n},

(1.1)

ossia, detto in modo più conciso:

s_{1} = x_{1}, s_{k} = s_{k - 1} + x_{k} .

I numeri $s_{n}$ si chiamano le somme parziali della serie². La nuova successione $(s_{n})$ si indica anche col simbolo

\sum_{n = 1}^{\infty} x_{n} o, più semplicemente, \sum x_{n} .

I numeri $x_{n}$ si chiamano i termini della serie e si dice che $x_{n}$ è il termine generale della serie. Nella definizione precedente niente si richiede al comportamento della successione $(x_{n})$ o della successione $(s_{n})$ . Se però la successione $(s_{n})$ converge allora si dice che la serie converge; se la successione $(s_{n})$ diverge (a $+ \infty$ oppure a $- \infty$ ) allora si dice che la serie diverge (rispettivamente a $+ \infty$ oppure a $- \infty$ ). Se la successione $(s_{n})$ è priva di limite, si dice che la serie è oscillante o indeterminata. Una serie si dice regolare quando converge oppure diverge. Il carattere della serie o comportamento della serie è la proprietà di essere convergente, divergente o oscilante. Ricapitolando, se la successione $(s_{n})$ converge ad $l$ oppure diverge, dovremmo indicare questo col simbolo

lim_{k \to + \infty} \sum_{n = 1}^{k} x_{n} = α,

$α$ rispettivamente uguale a $l$ oppure $+ \infty$ oppure $- \infty$ . Più brevemente si scrive

\sum_{n = 1}^{\infty} x_{n} = α o anche \sum x_{n} = α .

Si dice brevemente che $α$ è la somma della serie. Ovviamente, scambiando l’ordine di un numero finito di termini di una serie, non si cambia nè il comportamento della serie nè la sua somma, nel caso che la serie sia convergente (diremo più avanti cosa accade scambiando tra loro infiniti termini della serie). E’ anche vero che, sopprimento o aggiungendo un numero finito di termini, oppure cambiando il valore di un numero finito di termini, la serie rimane convergente, divergente o oscillante; ossia:

Teorema 4 Il carattere di una serie non muta alterandone un numero finito di termini.

Va detto esplicitamente che se la serie è convergente, la somma della serie cambia alterandone un numero finito di termini. Se invece è divergente, la sua somma non cambia.

Inoltre:

Teorema 5 Se $\sum x_{n}$ converge allora $lim_{n \to + \infty} x_{n} = 0$ .

Dim. Si indichi con $s_{k} = \sum_{n = 1}^{k} x_{n}$ . L’ipotesi è che la successione $(s_{k})$ converge e quindi anche la successione $s_{k - 1}$ converge, ed al medesimo limite. Dunque,

0 = lim_{k \to + \infty} s_{k} - lim_{k \to + \infty} s_{k - 1} = lim_{k \to + \infty} (s_{k} - s_{k - 1}) = lim_{k \to + \infty} x_{k} .

Di conseguenza:

Esempio 6 La serie di “termine generale” ${(- 1)}^{n} n$ , ossia la serie

\sum {(- 1)}^{n} n

non converge. _

Invece:

Esempio 7 La successione

{(q^{n})}_{n \geq 0}

(con $q \in ℝ$ fissato) si chiama progressione geometrica (di ragione $q$ ). La serie

\sum_{n = 0}^{+ \infty} q^{n}

si chiama serie geometrica E’ noto che, se $q \neq 1$ ,

\sum_{n = 0}^{N} q^{n} = \frac{1 - q^{N + 1}}{1 - q}

e quindi

lim_{N \to + \infty} \frac{1 - q^{N + 1}}{1 - q} = \sum_{n = 0}^{+ \infty} q^{n} = \{\begin{matrix} 1 ∕ (1 - q) & s e & | q | < 1 \\ + \infty & s e & q \geq 1 \\ oscillante & a l t r i m e n t i . \end{matrix}

Si noti che la serie geometrica per definizione inizia con l’indice $n = 0$ . Se per qualche ragione si deve iniziare con un primo indice diverso, di ciò va tenuto conto nel calcolo della somma. Per esempio

\sum_{n = 0}^{+ \infty} \frac{1}{2^{n}} = \frac{1}{1 - 1 ∕ 2} = 2, \sum_{n = 1}^{+ \infty} \frac{1}{2^{n}} = 2 - 1 = 1 .

1.2.1 Serie telescopiche

Sia ${(b_{k})}_{k \geq 0}$ una successione e sia

a_{n} = b_{n} - b_{n - 1}

(ovviamente definita per $n \geq 1$ ). Consideriamo la serie

\sum_{n = 1}^{+ \infty} a_{n} .

(1.2)

Una serie ottenuta con questo procedimento si chiama serie telescopica E’ facile calcolare le somme parziali di una serie telescopica:

s_{1} = a_{1} = b_{1} - b_{0}, s_{2} = a_{1} + a_{2} = (b_{1} - b_{0}) + (b_{2} - b_{1}) = b_{2} - b_{0}

e, in generale,

s_{k} = b_{k} - b_{0} .

Dunque:

Teorema 8 La serie telescopica costruita sopra converge se e solo se

lim b_{k} = l \in ℝ

e in tal caso

\sum_{n = 1}^{+ \infty} a_{n} = l - b_{0};

diverge se $lim b_{k} = + \infty$ oppure se $lim b_{k} = - \infty$ . La serie è oscillante se e solo se la successione $(b_{k})$ è priva di limite.

Esempi

Vediamo alcuni esempi.

Esempio 9 Consideriamo la serie

\sum_{n = 1}^{+ \infty} log (1 + \frac{1}{n}) .

Questa serie diverge. Infatti,

log (1 + \frac{1}{n}) = log \frac{n + 1}{n} = log (n + 1) - log n .

Sia ha quindi una serie telescopica e

\sum_{n = 1}^{k} log (1 + \frac{1}{n}) = log (k + 1) da cui lim_{k \to + \infty} \sum_{n = 1}^{k} log (1 + \frac{1}{n}) = + \infty .

Esempio 10 Consideriamo la serie

\sum_{n = 1}^{+ \infty} \frac{1}{n^{2} + n} .

Si vede che questa è una serie telescopica notando che

\frac{1}{n^{2} + n} = \frac{1}{n} - \frac{1}{n + 1} = - [\frac{1}{n + 1} - \frac{1}{n}]

e inoltre $b_{n} = 1 ∕ n \to 0$ . Dunque,

\sum_{n = 1}^{+ \infty} \frac{1}{n^{2} + n} = 1 .

Se per qualche ragione si devono sommare i termini con $n \geq n_{0}$ , allora

\sum_{n = n_{0}}^{+ \infty} \frac{1}{n^{2} + n} = \frac{1}{n_{0}} .

Consideriamo ora la serie

\sum_{n = 1}^{+ \infty} \frac{1}{4 n^{2} + 8 n + 3} .

Decomponendo in fratti semplici,

\frac{1}{4 n^{2} + 8 n + 3} = \frac{- 1}{4} [\frac{1}{n + 3 ∕ 2} - \frac{1}{n + 1 ∕ 2}] = \frac{1}{4} [b_{n + 1} - b_{n}], b_{n} = \frac{- 1}{n + 1 ∕ 2} .

Si tratta quindi di una serie telescopica, la cui somma è $1 ∕ 6$ . _

Infine:

Esempio 11 Anche la serie seguente è una serie telescopica:

\sum_{n = 2}^{+ \infty} log [\frac{1}{\sqrt[n]{{(n + 1)}^{1 ∕ (n - 1)}}} {(1 + \frac{1}{n})}^{1 ∕ (n - 1)}] .

Infatti,

{(1 + \frac{1}{n})}^{1 ∕ (n - 1)} \frac{1}{\sqrt[n]{{(n + 1)}^{1 ∕ (n - 1)}}} = \frac{{(n + 1)}^{1 ∕ n}}{n^{1 ∕ (n - 1)}}

e quindi la serie è uguale a

\sum_{n = 2}^{+ \infty} [\frac{1}{n} log (n + 1) - \frac{1}{n - 1} log n] = \sum_{n = 2}^{+ \infty} [b_{n + 1} - b_{n}], b_{n} = \frac{1}{n} log (n + 1) .

Dunque, la serie converge e la sua somma è $- (1 ∕ 2) log 3$ . _

Nonostante gli esempi importanti della serie geometrica e delle serie telescopiche, calcolare esplicitamente le somme parziali di una serie è pressoché impossibile. L’unica cosa che si può fare è dare condizioni per la convergenza o divergenza di serie, e quindi, se già si sa che la serie converge, approssimarne numericamente la somma.

1.3 Criteri di convergenza

Come si è detto, è ben diffcile calcolare esplicitamente le somme parziali di una serie. Per questo è necessario conoscere dei criteri che assicurino la convergenza o meno di una serie, senza calcolarne le somme parziali. Dato che la somma di una serie è il limite della successione delle somme parziali, dovremo basarci su criteri per l’esistenza del limite, che non facciano intervenire la preliminare conoscenza del limite stesso. Essenzialmente, questi criteri si riducono a due soli: il teorema di Cauchy per le successioni e il teorema delle funzioni monotone. Esaminiamone le conseguenze per il caso delle serie.

1.3.1 Il teorema di Cauchy per le serie

Vediamo come si trascrive il Teorema di Cauchy nel caso in cui $(s_{n})$ è la successione delle somme parziali della serie

\sum_{k} x_{k} .

(1.3)

Sia, per fissare le idee, $m > n$ . Allora,

| s_{m} - s_{n} | = |\sum_{k = n + 1}^{m} x_{k}| .

Possiamo quindi enunciare il Teorema di Cauchy come segue:

Teorema 12 La serie (1.3) converge se e solo se per ogni $𝜖 > 0$ esiste $N_{𝜖}$ tale che per ogni coppia di indici $n$ , $m$ con

m > n > N_{𝜖}

vale

|\sum_{k = n + 1}^{m} x_{k}| < 𝜖 .

D’altra parte, notiamo che

|\sum_{k = n + 1}^{m} x_{k}| \leq \sum_{k = n + 1}^{m} | x_{k} |

e quindi:

Corollario 13 Se la serie

\sum_{k} | x_{k} |

converge, anche la serie

\sum_{k} x_{k}

converge.

Dim. Infatti, se $\sum_{k} | x_{k} |$ converge, per ogni $𝜖 > 0$ esiste $N_{𝜖}$ tale che per $m > n > N_{𝜖}$ si ha

|\sum_{k = n + 1}^{m} x_{k}| \leq \sum_{k = n + 1}^{m} | x_{k} | < 𝜖 .

E quindi anche la serie $\sum_{k} x_{k}$ converge, grazie al Teorema 12. _ Più avanti vedremo una diversa dimostrazione di questo corollario. Si dice che la serie $\sum_{k} x_{k}$ converge assolutamente quando è convergente la serie $\sum_{k} | x_{k} |$ . Il corollario precedente quindi può enunciarsi in questo modo:

Teorema 14 Una serie assolutamente convergente è convergente.

Questo risultato è molto importante perché la serie $\sum_{k} | x_{k} |$ è una serie a termini positivi. Criteri di convergenza facilmente usabili esistono appunto per il caso delle serie a termini positivi, come ora andiamo a vedere.

1.3.2 Monotonia e serie a termini di segno costante

Usando il teorema delle funzioni monotone, è facile vedere che

Teorema 15 Sia $(x_{n})$ una successione a termini positivi. La serie degli $x_{n}$ converge se e solo se esiste $M$ tale che $s_{n} < M$ per ogni $n$ .

Dim. Ricordiamo il significato di $\sum_{n} x_{n}$ : prima si costruisce la successione

s_{k} = \sum_{n = 1}^{k} x_{n}

e poi si studia il limite $lim_{k \to + \infty} s_{k}$ . La successione $(s_{k})$ è crescente perché, essendo $x_{k} \geq 0$ per ogni $k$ ,

s_{k + 1} = \sum_{n = 1}^{k + 1} x_{n} = [\sum_{n = 1}^{k} x_{n}] + x_{k + 1} \geq \sum_{n = 1}^{k} x_{n} = s_{k} .

Dunque la successione $(s_{k})$ ammette limite, finito o meno, per il teorema delle funzioni monotone. Il limite è finito se e solo se la successione $(s_{k})$ è superiormente limitata, ossia se e solo se esiste $M$ tale che $s_{k} < M$ per ogni $k$ . _ Il teorema facilmente si estende al caso di successioni a termini negativi oppure definitivamente positive o negative. Inoltre:

Teorema 16 (Teorema del confronto) siano $\sum x_{n}$ e $\sum y_{n}$ due serie a termini positivi, con $x_{n} \leq y_{n}$ per ogni $n$ . Allora, se $\sum y_{n}$ converge, anche $\sum x_{n}$ converge; se $\sum x_{n}$ diverge lo stesso fa $\sum y_{n}$ .

Questo semplice risultato ha come conseguenza due importanti criteri di convergenza per le serie a termini positivi:

Teorema 17 (Criterio della radice) Sia $x_{n} \geq 0$ per ogni $n$ :

Se esiste $q \in [0, 1)$ ed esiste $N$ tale che $\sqrt[n]{x_{n}} < q \forall n > N,$
allora la serie converge.
Se esiste $q > 1$ e se esiste una s.successione $(x_{n_{k}})$ tale che $\sqrt[n_{k}]{x_{n_{k}}} > q$
allora la serie diverge.

Dim. Da ${\sqrt[n]{x}}_{n} < q < 1$ segue infatti $x_{n} < q^{n}$ e, se $0 \leq q < 1$ , la convergenza della serie $\sum x_{n}$ segue dall’esempio 7 e dal Teorema del confronto. Se per un $q > 1$ vale

\sqrt[n_{k}]{x_{n_{k}}} > q ossia x_{n_{k}} > q^{n_{k}}

allora³

lim x_{n_{k}} = + \infty .

Di conseguenza il termine generale della serie non tende a zero, e quindi la serie non converge. _ Si ha inoltre:

Teorema 18 (Criterio del rapporto) Se vale definitivamente

\frac{x_{n + 1}}{x_{n}} < q < 1

(1.4)

allora $\sum x_{n}$ converge; se $\frac{x_{n + 1}}{x_{n}} > q > 1$ allora $\sum x_{n}$ diverge.

Dim. Proviamo l’asserto nel caso in cui la (1.4) valga per ogni $n$ . Se $\frac{x_{n + 1}}{x_{n}} < q < 1$ allora $x_{2} < q x_{1}$ , $x_{3} < q x_{2} < q^{2} x_{1}$ e, in generale, $x_{n} < q^{n - 1} x_{1}$ . Si sa che se $0 \leq q < 1$ allora $\sum x_{1} q^{n} = x_{1} \sum q^{n}$ converge, si veda l’esempio 7. L’asserto segue quindi dal Teorema del confronto. In modo analogo si vede il secondo asserto. _ Ricordando i teoremi sui limiti, si può enunciare il corollario seguente:

Corollario 19 Sia $\sum x_{n}$ una serie a termini positivi. Vale:

se $lim_{n \to + \infty} \frac{x_{n + 1}}{x_{n}} = q < 1$ allora la serie converge;
se $lim_{n \to + \infty} \sqrt[n]{x_{n}} = q < 1$ allora la serie converge;
se $lim_{n \to + \infty} \frac{x_{n + 1}}{x_{n}} = q > 1$ allora la serie diverge;
se $lim_{n \to + \infty} \sqrt[n]{x_{n}} = q > 1$ allora la serie diverge.

Concludiamo con un esempio:

Esempio 20 Consideriamo la serie

\sum_{n = 1}^{+ \infty} \frac{1}{n} .

(1.5)

Mostriamo che questa serie è divergente. Si noti che per ogni $x \geq - 1$ vale

x \geq log (1 + x) .

Infatti, la funzione $log (1 + x)$ è concava e quindi ha grafico che sta sotto a ciascuna delle sue tangenti; e $y = x$ è la tangente nell’origine. In particolare vale

\frac{1}{n} \geq log (1 + \frac{1}{n}) .

Abbiamo visto che la serie a termini positivi

\sum_{n = 1}^{+ \infty} log (1 + \frac{1}{n})

diverge, si veda l’esempio 9. Dunque, per confronto, anche la serie (1.5) diverge⁴. _ La serie (1.5) si chiama serie armonica. Si osservi che il carattere della serie armonica non può determinarsi usando il criterio del rapporto oppure quello della radice. Infatti, nel caso della serie armonica,

lim \frac{x_{n + 1}}{x_{n}} = lim \frac{n}{n + 1} = 1, lim \sqrt[n]{x_{n}} = lim \sqrt[n]{\frac{1}{n}} = 1 .

All’esempio 24 vedremo una serie di termine generale $x_{n}$ che è convergente e tale che anche per essa vale

lim \frac{x_{n + 1}}{x_{n}} = 1, lim \sqrt[n]{x_{n}} = 1 .

Combinando questi due esempi si ha:

niente può dedursi dai criteri della radice e del rapporto, se il numero

q

che compare in tali criteri è uguale ad

1

Le serie a termini positivi hanno una notevole proprietà, che non è condivisa dalle generiche serie a termini di segno variabile: se si altera l’ordine di infiniti termini di una serie si trova una nuova serie, che generalmente ha un comportamento diverso da quello della serie di partenza. Invece:

Teorema 21 Due serie a termini positivi, con gli stessi elementi in ordine diverso, hanno la medesima somma.

La formula di Stirling

Per ragioni che vedremo, molto spesso il termine generale di una serie contiene dei fattoriali. I fattoriali hanno un “buon comportameno” rispetto al rapporto, nel senso che permettono facilmente di fare semplificazioni. Invece, il criterio della radice sembra diffcile da usare in presenza dei fattoriali. In realtà non è così grazie alla formula di Stirling

n! \sim n^{n} e^{- n} \sqrt{2 π n} o s s i a lim \frac{n^{n} e^{- n} \sqrt{2 π n}}{n!} = 1 .

(1.6)

La dimostrazione si trova nei testi di Analisi Matematica 1.

1.3.3 Il test di MacLaurin

Consideriamo le somme parziali di una serie a termini positivi

\sum_{n = 1}^{+ \infty} a_{n} .

Esse sono

\begin{matrix} s_{1} = a_{1} & = & a_{1} \cdot 1 \\ s_{2} = a_{1} + a_{2} & = & a_{1} \cdot 1 + a_{2} \cdot 1 \\ s_{3} = a_{1} + a_{2} + a_{3} & = & a_{1} \cdot 1 + a_{2} \cdot 1 + a_{3} \cdot 1 \\ ⋮ \end{matrix}

Queste espressioni si possono interpretare come somma di aree di rettangoli interpretando $1$ come misura della base ed $a_{n}$ come misura dell’altezza.

s_{k} = \sum_{n = 1}^{k} a_{n} = \int_{1}^{k} a (x) d x

ove $a (x)$ è la funzione costante a tratti

a (x) = a_{n} s e 1 \leq n \leq x < (n + 1) .

Dunque, la somma della serie è l’integrale improprio di $a (x)$ :

\sum_{n = 1}^{+ \infty} a_{n} = lim_{k \to + \infty} s_{k} = \int_{1}^{+ \infty} a (x) d x .

figura 1.1: Il test di MacLaurin

Pensiamo ora ai rettangoli messi come in figura 1.1, a sinistra, e supponiamo di poter trovare due funzioni, $f (x)$ e $g (x)$ , che prendono valori maggiori o uguali a zero e tali che inoltre valga

x \in [n, n + 1) \Rightarrow g (x) \leq a_{n} \leq f (x) .

Si veda la figura 1.1, a destra. In tal caso si ha

\int_{1}^{k} g (x) d x \leq s_{k} \leq \int_{1}^{k} f (x) d x .

La serie è a termini positivi e quindi regolare; le funzioni sono non negative e quindi ammettono integrale improprio finito o meno. Dunque, dal teorema di confronto per i limiti, si ha

\int_{0}^{+ \infty} g (x) d x \leq \sum_{n = 1}^{+ \infty} a_{n} \leq \int_{0}^{+ \infty} f (x) d x .

Ricapitolando,

Se $\int_{1}^{+ \infty} g (x) d x = + \infty$ allora la serie diverge;
Se $\int_{1}^{+ \infty} f (x) d x < + \infty$ allora la serie converge. In questo caso si trovano anche stime, da sotto e da sopra, per la somma della serie.

Il caso tipico in cui quest’argomento si applica facilmente è il caso in cui esiste una funzione $g (x)$ definita su $[0, + \infty)$ , decrescente e inoltre

a_{n} = g (n) .

In questo caso,

x \in [n, n + 1) \Rightarrow g (x) \leq a_{n} = g (n) \leq g (x - 1) .

(1.7)

Definiamo, per $x \geq 0$ ,

f (x) = g (x - 1)

e notiamo che la (1.7) si scrive

g (x) \leq a_{n} = g (n) \leq f (x) x \in [n, n + 1) .

Inoltre,

\begin{aligned} \int_{1}^{+ \infty} f (x) d x = \int_{1}^{+ \infty} g (x - 1) d x = \int_{0}^{1} g (x) d x + \int_{1}^{+ \infty} g (x) d x, \\ \int_{1}^{+ \infty} g (x) d x < + \infty \Leftrightarrow \int_{1}^{+ \infty} f (x) d x < + \infty . \end{aligned}

Ossia, nel caso descritto, i due integrali impropri hanno il medesimo comportamento e questo comportamento è ereditato dalla serie. Possiamo quindi enunciare:

Teorema 22 (Test di MacLaurin) Sia $g (x)$ una funzione non negativa e decrescente definita su $[0, + \infty)$ . Si consideri la serie

\sum_{n = 1}^{+ \infty} g (n) .

Le sue somme parziali verificano

\int_{1}^{k} g (x) d x \leq s_{k} = \sum_{n = 1}^{k} a_{n} \leq \int_{0}^{1} g (x) d x + \int_{1}^{k} g (s) d s .

(1.8)

In particolare, la serie a termini positivi

\sum_{n = 1}^{+ \infty} g (n)

converge se e solo se

\int_{0}^{+ \infty} g (x) d x < + \infty .

L’interesse di questo teorema sta nel fatto che talvolta l’integrale di $g (x)$ può esplicitamente calcolarsi mediante il calcolo delle primitive; e comunque esistono test effcienti per lo studio della convergenza o divergenza degli integrali impropri.

Esempio 23 Si sa già che la serie armonica

\sum_{n = 1}^{+ \infty} \frac{1}{n}

diverge. La serie

\sum_{n = 2}^{+ \infty} \frac{1}{n {log}^{2} n}

converge, come si vede dal criterio di MacLaurin. Infatti, la funzione

f (x) = \frac{1}{x {log}^{2} x}

ha integrale improprio convergente:

lim_{T \to + \infty} \int_{2}^{T} \frac{1}{x {log}^{2} x} d x = lim_{T \to + \infty} [\frac{1}{log 2} - \frac{1}{log T}] = \frac{1}{log 2} .

Procedendo in modo analogo⁵ si provi invece che

\sum_{n = 2}^{+ \infty} \frac{1}{n log n} = + \infty .

Esempio 24 Si calcola immediatamente

\int_{0}^{+ \infty} \frac{1}{{(x + 1)}^{γ}} d x = \{\begin{matrix} < + \infty & se γ > 1 \\ = + \infty & se γ \geq 1 . \end{matrix}

Dunque,

\sum_{n = 1}^{+ \infty} \frac{1}{n^{γ}}

converge per $γ > 1$ , diverge altrimenti. _

Possiamo combinare l’esempio 24 col criterio di confronto, ottenendo:

Corollario 25 Consideriamo la serie $\sum_{n = 1}^{+ \infty} a_{n}$ . Vale:

se esitono $M > 0$ e $γ > 1$ tali che $0 \leq a_{n} \leq M \frac{1}{n^{γ}},$
allora la serie converge.
se esistono $m > 0$ e $γ \leq 1$ tali che $a_{n} \geq m \frac{1}{n^{γ}}$
allora la serie diverge.

In particolare, possiamo enunciare:

a_{n} \geq 0

e se esiste

γ > 1

tale che

a_{n} = o (\frac{1}{n^{γ}}),

(1.9)

allora la serie

\sum a_{n}

converge.

Per ora, stiamo lavorando con serie a termini positivi, ma non abbiamo scritto esplicitamente questa condizione perché vedremo, al Corollario 27, che il test precedente vale per ogni serie.

1.3.4 Serie a termini di segno qualsiasi

Sulle serie a termini di segno qualsiasi, limitiamoci ad osservare due proprietà. Si è già detto che se la serie $\sum | x_{n} |$ converge, si dice che la serie $\sum x_{n}$ converge assolutamente. Ricordiamo, dal teorema 15:

Teorema 26 Una serie assolutamente convergente è convergente.

Ricordiamo ora che $f = o (g)$ quando $f ∕ g$ è un infinitesimo, e ciò accade se e solo se $| f | ∕ | g |$ è un infinitesimo. Quindi:

Corollario 27 Se esite $γ > 1$ tale che $a_{n} = o (\frac{1}{n})$ , allora la serie $\sum a_{n}$ converge assolutamente, ed è quindi convergente.

Infine, si dice che una serie è a segni alterni se ha forma

\sum {(- 1)}^{n} x_{n} con x_{n} > 0;

(1.10)

ossia se gli addendi si susseguono cambiando segno ad ogni passo. Esiste, per le serie a segni alterni, una notevole condizione suffciente di convergenza, e anche una stima per la somma della serie:

Teorema 28 (Criterio di Leibniz) Se valgono ambedue le condizioni

$lim_{n \to + \infty} x_{n} = 0$
la succesione ${x_{n}}$ è decrescente, ossia $x_{n} \geq x_{n + 1} \geq 0$ per ogni $n$

allora la serie a segni alterni (1.10) converge; inoltre, detta $s$ la somma della serie, per ogni $n$ vale:

la differenza $s - \sum_{n = 1}^{k} {(- 1)}^{n} x_{n}$
ha segno opposto ad $x_{k}$ ; ossia, l’approssimazione è per eccesso se l’ultimo termine sommato è positivo; per difetto se è negativo.
Vale la stima $|s - \sum_{n = 1}^{k} x_{n}| \leq | x_{k + 1} | .$

La dimostrazione della convergenza è nell’Appendice 1.8.2.

Esempio 29 Consideriamo la serie

\sum_{n = 1}^{+ \infty} \frac{{(- 1)}^{n}}{n} .

Questa serie si chiama serie di Mengoli Il criterio di Leibniz mostra che questa serie converge. La somma della serie è nota:

\sum_{n = 1}^{+ \infty} \frac{{(- 1)}^{n}}{n} = log 2 .

Il Teorema 28 dà anche una stima dell’errore che si commette sommando $N$ termini: l’errore è minore di $1 ∕ (n + 1)$ . _

1.4 Alcuni esempi numerici

Le figure 1.2, 1.3 e 1.4 mostrano alcuni esempi numerici di somme parziali di serie convergenti. Le serie sono specificate nelle intestazioni delle figure.

figura 1.2:

Σ_{n = 0}^{+ \infty} {(1 ∕ 2)}^{n} = 2

a sinistra,

Σ_{n = 0}^{+ \infty} {(- 1 ∕ 2)}^{n} = 2 ∕ 3

a destra

figura 1.3:

Σ_{n = 0}^{+ \infty} 1 ∕ n! = e

a sinistra,

Σ_{n = 0}^{+ \infty} {(- 1)}^{n} ∕ n = log 2

a destra

Graficamente, i diagrammi che descrivono le due serie aventi come termine n-esimo 1/n! e ( − 1)ⁿ/n e come somma e e log2, rispettivamente, sono del tutto analoghi a quelli nella figura 1.2

figura 1.4:

Σ_{n = 1}^{+ \infty} 1 ∕ n^{2} = π^{2} ∕ 6

a sinistra e

Σ_{n = 0}^{+ \infty} {(- 1)}^{n} ∕ [(2 n + 1)!] = sin (1)

a destra

Graficamente, i diagrammi che descrivono le due serie aventi come termine n-esimo 1/n² e ( − 1)^/(2n + 1)! e come somma π^/6 e log1, rispettivamente, sono del tutto analoghi a quelli nella figura 1.2

1.5 Convergenza condizionata ed incondizionata

Il concetto di serie generalizza quello di somma finita. In una somma finita il risultato non dipende dall’ordine degli addendi (proprietà commutativa dell’addizione). Nel caso delle serie, l’asserto analogo vale se si scambiano tra di loro un numero finito di termini. E’ FALSO se si scambia il posto di infiniti termini. Mostriamo un esempio:

Esempio 30 Consideriamo la serie di Mengoli $\sum_{n = 1}^{+ \infty} {(- 1)}^{n} ∕ n$ . Si sa che questa serie converge. Mostriamo che è possibile scambiare il posto di infiniti termini, in modo da ottenere una serie divergente a $+ \infty$ . Ricordiamo per questo che

\sum_{n = 1}^{+ \infty} \frac{1}{n}

diverge e quindi anche

\sum_{n = 1}^{+ \infty} \frac{1}{2 n}

diverge. Conviene vedere una dimostrazione di questo fatto, diversa da quella già vista: consideriamo

\sum_{n = k}^{5 k} \frac{1}{2 n} = \frac{1}{2} \sum_{n = k}^{5 k} \frac{1}{n} \geq \frac{1}{2} [4 k \frac{1}{5 k}] = \frac{2}{5}

(si è usato il fatto che si sommano $4 k$ termini, ciascuno dei quali è maggiore di $1 ∕ 5 k$ ). Ciò contrasta col criterio di convergenza di Cauchy, e mostra che la serie diverge. Dato che il carattere di una serie non dipende dai primi elementi, anche ciascuna delle serie

\sum_{n = R}^{+ \infty} \frac{1}{2 n}

(1.11)

è divergente. Ora consideriamo la serie di Mengoli, per semplicità cambiata di segno. Essa converge a $- log 2$ . Vogliamo riordinarne gli elementi in modo da trovare una serie divergente a $+ \infty$ . Per questo sommiamo prima i termini di indice pari, fino ad un certo indice ${\tilde{k}}_{1}$ tale che

\sum_{n = 1}^{{\tilde{k}}_{1}} \frac{1}{2 n} > 5 .

Questa è la somma parziale $s_{{\tilde{k}}_{1}}$ della serie riordinata. Sottraiamo quindi il primo termine di indice dispari, ossia $1$ ottenendo una somma parziale $s_{k_{1}}$ tale che

s_{k_{1}} > 4 .

Consideriamo ora la serie (1.11) con $R = {\tilde{k}}_{1} + 1$ . Come si è detto, questa serie diverge. Dunque, possiamo sommare ulteriori termini di indice pari alla somma parziale $s_{k_{1}}$ già ottenuta, fino a trovare una somma parziale maggiore di $9$ ; sottraiamo quindi il primo dei termini di ordine dispari non ancora usati (che è $1 ∕ 3$ , minore di $1$ ). Si trova una nuova somma parziale, diciamo $s_{k_{2}}$ , maggiore di $8$ :

s_{k_{2}} > 8 = 2^{3} .

Continuiamo a sommare termini di indice pari (e quindi positivi) fino ad avere una somma parziale maggiore di $2^{4} + 1$ e quindi sottraiamo il primo termine di indice dispari non usato (che è certamente minore di $1$ , infatti è $1 ∕ 5$ ). Si trova una somma parziale $s_{k_{3}}$ tale che

s_{k_{3}} > 2^{4} .

Procedendo in questo modo si trova un riordinamento che conduce ad una serie divergente a $+ \infty$ . _

Si potrebbe mostrare che per ogni scelta di $l$ è possibile riordinare la serie di Mengoli in modo tale da trovare una serie convergente ad $l$ , inclusi $l = + \infty$ ed $l = - \infty$ , o anche in modo da trovare una serie oscillante. Diciamo che una serie converge incondizionatamente quando una serie converge ad $l$ e inoltre quando qualunque serie ottenuta riordinandone gli elementi converge al medesimo numero $l$ . La convergenza incondizionata si caratterizza come segue:

Teorema 31 (Teorema di Dirichlet) Una serie converge incondizionatamente se e solo se converge assolutamente. Se ciò non accade è possibile riordinare gli elementi della serie in modo da cambiare il carattere della serie, e anche in modo da ottenere una serie convergente ad un qualsiasi numero assegnato, o divergente a $+ \infty$ oppure a $- \infty$ .

In particolare:

Corollario 32 Ogni serie a termini di segno costante converge incondizionatamente.

1.5.1 Serie dipendenti da un parametro e serie di funzioni

Torniamo a considerare la serie geometrica,

\sum_{n = 0}^{+ \infty} q^{n} .

Questa serie dipende dal parametro $q$ e, come si è visto, converge se $| q | < 1$ , diverge se $q \geq 1$ ed oscilla se $q \leq - 1$ . Facendo variare il parametro $q$ , ciascuno degli addendi viene ad essere una funzione di $q$ ,

f_{n} (q) = q^{n} .

Dunque, la serie geometrica può intendersi come serie di funzioni. In generale, data la successione $(f_{n} (x))$ i cui elementi sono funzioni (tutte con lo stesso dominio) si chiama serie di funzioni la serie

\sum_{n = 0}^{+ \infty} f_{n} (x) .

La somma della serie si calcola punto per punto; ossia, per ogni fissato valore di $x$ si calcola la somma della serie di numeri $\sum_{n = 0}^{+ \infty} f_{n} (x)$ . Il dominio comune alle funzioni $f (q) = q^{n}$ è $ℝ$ , ma abbiamo notato che la serie geometrica converge (ad $1 ∕ (1 - q)$ ) soltanto per $| q | < 1$ . Dunque, in generale, il dominio su cui è definita la somma di una serie di funzioni è più piccolo del dominio comune delle funzioni. Le serie di funzioni si studieranno al Capitolo 2. Va tenuta presente la loro definizione per capire alcune sottigliezze del paragrafo 1.6.

1.6 Operazioni algebriche e serie

Il concetto di “serie” estende quello di “somma finita”. Le somme finite godono di utili proprietà, come per esempio la proprietà distributiva del prodotto sulla somma, la proprietà associativa e “dissociativa”. Ci possiamo chiedere se le analoghe proprietà valgono per le serie. Per questo dobbiamo tener conto di due problemi:

la “somma di somme finite” non dipende dall’ordine degli addendi: $(a_{1} + a_{2}) + (b_{1} + b_{2}) = a_{1} + a_{2} + b_{1} + b_{2} = a_{1} + b_{1} + a_{2} + b_{2} .$
Si sa già che la somma della serie varia cambiando l’ordine dei suoi termini. Quindi dovremo aspettarci che una proprietà analoga non valga necessariamente per le serie.
la somma di serie è definita tramite il concetto di limite; le relazioni tra limiti ed operazioni sono dissimmetriche. Di ciò dobbiamo tener conto per enunciare i risultati relativi alle serie.

Queste osservazioni suggeriscono di elencare prima le relazioni tra limiti ed operazioni sia nella versione “giusta” che nella versione “sbagliata”:

\begin{matrix} giusta & sbagliata \\ 1: la somma dei limiti è uguale al limite della somma & 1: il limite della somma è uguale alla somma dei limiti \\ 2: il prodotto dei limiti è uguale al limite del prodotto & 2: il limite del prodotto è uguale al prodotto dei limiti \\ 3a: sia {γ_{n}} limitata.                       Se a_{n} \to 0 anche γ_{n} a_{n} \to 0 & 3a: Sia {γ_{n}} limitata.                       Se {γ_{n} a_{n}} converge,                 anche {a_{n}} converge. \\ 3b: Sia {γ_{n}} limitata.                       Se a_{n} \to 0 anche γ_{n} a_{n} \to 0 & 3b: Sia {γ_{n}} limitata.                       Se {a_{n}} converge,                 anche {γ_{n} a_{n}} converge. \end{matrix}

Ricordiamo brevemente perché le affermazioni a destra sono sbagliate: per esempio nel caso 1, il limite della somma di due funzioni può esistere, senza che le due funzioni individualmente abbiano limite, come è il caso del limite, per $x \to + \infty$ , quando le due funzioni sono

f (x) = x^{3} + sin x, g (x) = \frac{x + 1}{1 - x} sin x .

In questo caso,

f (x) + g (x) = \frac{2 sin x}{1 - x}, lim_{x \to + \infty} [f (x) + g (x)] = 0 .

Questo limite non è uguale a

[lim_{x \to + \infty} f (x)] + [lim_{x \to + \infty} g (x)]

per la semplice ragione che i due limiti non esistono. Il caso 2, del prodotto è analogo. Vale la pena però di vedre un caso banale che però può inndurre in errore nel caso delle serie: NON è vero che la formula seguente vale per OGNI numero reale $γ$ :

lim [γ f (x)] = γ [lim f (x)] .

Questa formula vale solo se $γ \neq 0$ oppure se $lim f (x)$ esiste finito, come mostrano gli esempi delle funzioni

f (x) = x^{3}, g (x) = sin x .

In ambedue i casi, se $γ = 0$ ,

lim_{x \to + \infty} [γ f (x)] = 0, lim_{x \to + \infty} [γ g (x)] = 0

mentre le espressioni

γ lim_{x \to + \infty} f (x), γ lim_{x \to + \infty} g (x)

non hanno senso. Vediamo ora il caso 3a. Chiaramente, da $γ_{n} a_{n} \to 0$ non si può dedurre la convergenza a zero di ${a_{n}}$ : si consideri il caso $γ_{n} \to 0$ ed $a_{n} \equiv 1$ . Il caso 3b: si consideri l’esempio della successione ${a_{n}}$ con $a_{n} = (n - 1) ∕ (n + 1)$ , convergente ad $1$ , mentre $γ_{n} = {(- 1)}^{n}$ . La successione ${γ_{n} a_{n}}$ è oscillante. Richiamato ció, definiamo:

Somma di serie

[\sum_{n = 1}^{+ \infty} a_{n}] + [\sum_{n = 1}^{+ \infty} b_{n}] = \sum_{n = 1}^{+ \infty} (a_{n} + b_{n}) .

Prodotto di una serie per un numero

α \cdot [\sum_{n = 1}^{+ \infty} a_{n}] = \sum_{n = 1}^{+ \infty} (α a_{n}) .

In queste definizioni, l’ordine degli addendi è quello indicato. Supponiamo

\sum_{n = 1}^{+ \infty} a_{n} = l, \sum_{n = 1}^{+ \infty} b_{n} = m .

Allora:

: 1) somma di serie. Vale $\sum_{n = 1}^{+ \infty} (a_{n} + b_{n}) = l + m$
purché uno almeno dei due limiti sia un numero oppure sia $l$ che $m$ siano ambedue $+ \infty$ oppure $- \infty$ .
: 2) prodotto di un numero per una serie. La definizione ha senso (e l’uguaglianza vale) solo se $α \neq 0$ oppure se la serie converge.

La definizione di prodotto di serie è più complessa e si vedrà nel paragrafo 1.7. Si potrebbe anche provare:

Teorema 33 Sia $\sum a_{n} = l \in ℝ$ e sia $a_{n} > 0$ per ogni $n$ . Sia ${γ_{n}}$ una successione limitata. Allora, la serie $\sum γ_{n} a_{n}$ converge.

Gli esempi seguenti mostrano i problemi che si possono incontrare usando le operazioni sulle serie senza le dovute cautele:

Esempio 34 Consideriamo la serie seguente:

\sum c_{n}, c_{n} = 0 .

Ovviamente la somma della serie è $0$ . Scrivendo

c_{n} = a_{n} + b_{n}, a_{n} = {(- 1)}^{n}, b_{n} = - {(- 1)}^{n}

si potrebbe essere tentati di usare una specie di “regola dello scomponendo” e scrivere

\sum c_{n} = \sum a_{n} + \sum b_{n} .

Ovviamente questo non ha senso, perché le due serie a destra non convergono; e quindi non definiscono numeri che si possano sommare. Un esempio analogo, un po’ più riposto, è quello delle serie

\sum a_{n}, \sum b_{n}, a_{n} = \frac{1}{n + 1}, b_{n} = \frac{n (\sqrt{n} - n)}{n^{3} + 8} .

Le due serie non convergono mentre la serie

\sum [a_{n} + b_{n}]

converge. _

La regula del prodotto sembra “più innocua” nel senso che sembra più diffcile sbagliare. In realtà anche questa regola è fonte di errori, come mostra l’esempio seguente:

Esempio 35 Sia $x$ un parametro reale. Studiare la convergenza della serie

\sum_{n = 1}^{+ \infty} \frac{x}{n^{1 ∕ 2} (1 + n x^{2})} .

(1.12)

Si lascia per esercizio di provare che la serie converge per ogni $x$ . Si noti che essa certamente converge per $x = 0$ perché in tal caso tutti i termini della serie sono nulli. Però, sembra del tutto naturale mettere in evidenza $x$ portandolo fuori dal segno di serie, scrivendo

x [\sum_{n = 1}^{+ \infty} \frac{1}{n^{1 ∕ 2} (1 + n x^{2})}]

e magari studiando la convergenza della serie “piú semplice”

\sum_{n = 1}^{+ \infty} \frac{1}{n^{1 ∕ 2} (1 + n x^{2})} .

Si dimentica in questo modo che il parametro $x$ può essere nullo. Se $x \neq 0$ questa serie converge e il procedimento seguito, di mettere in evidenza $x$ , è corretto. Se però $x = 0$ , l’ultima serie scritta non converge, mentre la (1.12) ovviamente converge. L’errore è consistito nel “mettere in evidenza” il fattore $0$ dai termini della serie, errore favorito dal fatto che il fattore è stato indicato col generico simbolo $x$ . _

Ci sono anche altri errori nei quali si può cadere trattando le operazioni sulle serie senza la dovuta attenzione:

Esempio 36 Un modo veloce di “calcolare” la somma della serie geometrica

S = \sum_{n = 0}^{+ \infty} q^{n}

è il seguente:

S = 1 + q [\sum_{n = 0}^{+ \infty} q^{n}] = 1 + q S

Dunque,

(1 - q) S = 1 o s s i a S = \frac{1}{1 - q} .

Questo risultato, apparentemente giusto, è in realtà sbagliato. Infatti da nessuna parte si è usata la condizione $| q | < 1$ e quindi sembrerebbe da questo calcolo che la serie geometrica converga per ogni valore di $q$ , cosa notoriamente falsa. Si lascia per esercizio di trovare l’errore in questo ragionamento. _

Infine, vediamo una diversa dimostrazione del Teorema 26 basata sulle proprietà illustrate in questo paragrafo: La serie $\sum | x_{n} |$ è una serie a termini positivi. Se essa converge, dal teorema 15 convergono anche le due serie $\sum y_{n}$ e $\sum z_{n}$ , con

y_{n} = \{\begin{matrix} x_{n} & s e & x_{n} > 0 \\ 0 & a l t r i m e n t i \end{matrix}, z_{n} = \{\begin{matrix} - x_{n} & s e & x_{n} < 0 \\ 0 & a l t r i m e n t i . \end{matrix}

Quindi, per il teorema 16, converge anche $\sum (y_{n} - z_{n})$ che è $\sum x_{n}$ .

1.7 Prodotto alla Cauchy

Il prodotto di serie può definirsi in vari modi. Quello più utile è il prodotto alla Cauchy L’espressione del prodotto alla Cauchy può sembrare macchinosa, ma se ne capisce la ragione se si considera l’esempio di un prodotto di polinomi. Consideriamo il caso del prodotto di due polinomi di grado $4$ . Il prodotto

(a_{0} + a_{1} x + a_{2} x^{2} + a_{3} x^{3} + a_{4} x^{4}) (b_{0} + b_{1} x + b_{2} x^{2} + b_{3} x^{3} + b_{4} x^{4})

è la somma di tutti i possibili addendi $a_{j} b_{k} x^{k + j}$ con $0 \leq j \leq 4$ , $0 \leq k \leq 4$ . Raccogliendo i coeffcienti degli addendi del medesimo grado il prodotto si scrive come

\begin{aligned} a_{0} b_{0} \\ + (a_{1} b_{0} + b_{0} a_{1}) x \\ + (a_{2} b_{0} + a_{1} b_{1} + a_{0} b_{2}) x^{2} \\ + (a_{3} b_{0} + a_{2} b_{1} + a_{1} b_{2} + a_{0} b_{3}) x^{3} \\ + (a_{4} b_{0} + a_{3} b_{1} + a_{2} b_{2} + a_{1} b_{3} + a_{0} b_{4}) x^{4} . \end{aligned}

Posto $x = 1$ , il prodotto

(a_{0} + a_{1} + a_{2} + a_{3} + a_{4}) (b_{0} + b_{1} + b_{2} + b_{3} + b_{4})

si trova scritto come segue:

\begin{aligned} a_{0} b_{0} \\ + (a_{1} b_{0} + b_{0} a_{1}) \\ + (a_{2} b_{0} + a_{1} b_{1} + a_{0} b_{2}) \\ + (a_{3} b_{0} + a_{2} b_{1} + a_{1} b_{2} + a_{0} b_{3}) \\ + (a_{4} b_{0} + a_{3} b_{1} + a_{2} b_{2} + a_{1} b_{3} + a_{0} b_{4}) . \end{aligned}

Ciò suggerisce le due definizioni seguenti:

Si chiama convoluzione delle due successioni $(a_{n})$ e $(b_{n})$ la successione $(c_{n})$ con $c_{n} = \sum_{r = 0}^{n} a_{n - r} b_{r} = a_{n} b_{0} + a_{n - 1} b_{1} + a_{n - 2} b_{2} + \dots a_{2} b_{n - 2} + a_{1} b_{n - 1} + a_{0} b_{n} .$

Si chiama prodotto alla Cauchy delle due serie

\sum_{n = 0}^{+ \infty} a_{n}, \sum_{n = 0}^{+ \infty} b_{n}

(1.13)

la serie

\sum_{n = 0}^{+ \infty} c_{n}, c_{n} = \sum_{r = 0}^{n} a_{n - r} b_{r} .

Osservazione 37 Se l’indice di una, o ambedue, le serie non parte da zero, la formula del prodotto alla Cauchy si intende scritta aggiungendo un numero finito di termini tutti nulli, in modo da far partire gli indici da $0$ . _

La convergenza di ambedue le serie (1.13) non implica la convergenza del loro prodotto alla Cauchy. Vale invece:

Teorema 38 Le due serie (1.13) convergano, ed abbiano somma rispettivamente $α$ e $β$ . Allora:

se le due serie convergono ambedue assolutamente, anche il loro prodotto alla Cauchy converge assolutamente ad $α β$ .
se una delle due serie converge e l’altra converge assolutamente, il prodotto alla Cauchy converge ad $α β$ , in generale non assolutamente.

Concludiamo con un esempio che mostra due serie convergenti (non assolutamente), il cui prodotto alla Cauchy non converge.

Esempio 39 Consideriamo la serie (convergente per il criterio di Leibniz)

\sum_{n = 1}^{+ \infty} \frac{{(- 1)}^{n}}{\sqrt{n}}

e calcoliamone il prodotto alla Cauchy con se stessa. Notiamo che l’indice di questa serie parte da $1$ invece che da zero e quindi la formula del prodotto alla Cauchy va lievemente modificata come detto nell’sservazione 37:

\sum_{n = 1}^{+ \infty} [\sum_{r = 1}^{n - 1} \frac{{(- 1)}^{n - r}}{\sqrt{n - r}} \frac{{(- 1)}^{r}}{\sqrt{r}}] = \sum_{n = 1}^{+ \infty} {(- 1)}^{n} [\sum_{r = 1}^{n - 1} \frac{1}{\sqrt{n r - r^{2}}}] .

Si vede facilmente che la funzione

f (x) = \frac{1}{\sqrt{n x - x^{2}}}

è crescente per $1 < x < n ∕ 2$ e decrescente per $n ∕ 2 < x < n - 1$ e quindi ha minimo per $x = 1$ e per $x = n - 1$ . Il minimo vale $1 ∕ \sqrt{n - 1}$ . Dunque

\sum_{r = 1}^{n - 1} \frac{1}{\sqrt{n r - r^{2}}} \geq \frac{n - 2}{\sqrt{n - 1}} :

il termine generale del prodotto alla Cauchy non converge a zero e quindi la serie ottenuta come prodotto alla Cauchy non converge. _

1.8 Appendici

1.8.1 Appendice: ancora sul test di MacLaurin

Il test di MacLaurin può ulteriormente precisarsi notando che la (1.8), ossia

\int_{1}^{k} g (x) d x \leq s_{k} = \sum_{n = 1}^{k} a_{n} \leq \int_{0}^{1} g (x) d x + + \int_{1}^{k} g (x) d x,

si può anche scrivere come

0 \leq [\sum_{n = 1}^{k} a_{n}] - \int_{1}^{k} g (x) d x \leq \int_{0}^{1} g (x) d x

e che, al crescere di $k$ , la successione

k \to \{[\sum_{n = 1}^{k} a_{n}] - \int_{1}^{k} g (x) d x\}

decresce. e quindi ammette limite compreso tra $0$ ed $\int_{0}^{1} g (x) d x$ . Infatti, si ha:

\begin{aligned} \{[\sum_{n = 1}^{k} a_{n}] - \int_{1}^{k} g (x) d x\} - \{[\sum_{n = 1}^{k + 1} a_{n}] - \int_{1}^{k + 1} g (x) d x\} \\ = - a_{k + 1} + \int_{k}^{k + 1} g (x) d x = \int_{k}^{k + 1} [g (x) - g (k + 1)] d x \geq 0 . \end{aligned}

Ossia, al crescere di $k$ , i valori delle somme parziali e dell’integrale “si avvicinano” anche se l’integrale improprio (e quindi anche la serie) diverge. Quest’osservazione può usarsi per ottenere “stime asintotiche” delle somme parziali della serie per grandi valori di $k$ . Mostriamo questo considerando l’esempio della serie armonica. Sia

g (x) = \{\begin{matrix} 1 & s e & 0 \leq x \leq 1 \\ 1 ∕ x & s e & 0 \leq x > 1 . \end{matrix}

La serie armonica è

\sum_{n = 1}^{+ \infty} g (n)

e quindi diverge, dal criterio di MacLaurin. E’ questo un modo di vedere che la serie armonica diverge, diverso da quello visto all’esempio 1.5. Però, il criterio di MacLaurin dà un’informazione in più:

0 \leq \sum_{n = 1}^{k} \frac{1}{n} - \int_{1}^{k} \frac{1}{x} d x \leq \int_{0}^{1} g (x) d x,

ossia

0 \leq \sum_{n = 1}^{k} \frac{1}{n} - log k \leq 1 .

E inoltre,

γ = lim_{k} [\sum_{n = 1}^{k} \frac{1}{n} - log k]

esiste, $γ \in (0, 1)$ . Il numero $γ$ così definito si chiama costante d’Eulero

1.8.2 La dimostrazione del Teorema di Leibniz

La dimostrazione di questo teorema, e di teoremi più generali di Abel e di Dirichlet che ora vedremo, è interessante perché permette di introdurre il concetto di sommazione per parti, da confrontare con quello di integrazione per parti. Nonostante che il carattere di una serie non dipenda dai primi addendi, in quest’appendice è bene specificare con cura i valori degli indici. Quindi scriveremo per esempio ${b_{n}}_{n \geq 1}$ per intendere che il valore del primo indice della successione è $1$ . Inoltre, se ${b_{n}}_{n \geq 1}$ indica una successione, con ${B_{n}}_{n \geq 1}$ intendiamo la successione delle sue somme parziali:

B_{n} = \sum_{k = 1}^{n} b_{k} .

Sia ${b_{n}}_{n \geq 1}$ una successione. Con ${Δ b_{n}}_{n \geq 1}$ intendiamo la successione ${(b_{n + 1} - b_{n})}_{n \geq 1}$ . Sia $1 \leq r < k$ . La formula di sommazione per parti è:

\sum_{n = r}^{k} (Δ b_{n}) c_{n} = [b_{k + 1} c_{k} - b_{r} c_{r}] - \sum_{n = r}^{k} b_{n + 1} Δ c_{n} .

Questa formula si dimostra facilmente scrivendo la somma per esteso:

\begin{aligned} \sum_{n = r}^{k} (Δ b_{n}) c_{n} = \\ (b_{r + 1} - b_{r}) c_{r} + (b_{r + 2} - b_{r + 1}) c_{r + 1} + (b_{r + 3} - b_{r + 2}) c_{r + 2} + \dots + (b_{k} - b_{k - 1}) c_{k - 1} + (b_{k + 1} - b_{k}) c_{k} \\ = - b_{r} c_{r} + [- b_{r + 1} (c_{r + 1} - c_{r}) - b_{r + 2} (c_{r + 2} - c_{r + 1}) - \dots - b_{k} (c_{k} - c_{k - 1})] + b_{k + 1} c_{k} \\ = b_{k + 1} c_{k} - b_{r} c_{r} - \sum_{n = r}^{k - 1} b_{n + 1} Δ c_{n} = - b_{k + 1} [c_{k + 1} - c_{k}] + b_{k + 1} c_{k + 1} - b_{r} c_{r} - \sum_{n = r}^{k - 1} b_{n + 1} Δ c_{n} \\ = b_{k + 1} c_{k + 1} - b_{r} c_{r} - \sum_{n = r}^{k} b_{n + 1} Δ c_{n} . \end{aligned}

Ci serve inoltre un risultato preliminare:

Lemma 40 Sia $\sum_{n = 1}^{+ \infty} b_{n}$ una serie tale che la successione ${B_{n}}$ delle somme parziali sia limitata e sia ${c_{n}}$ una successione positiva decrescente. Allora, la serie

\sum_{n = 1}^{+ \infty} B_{n} (Δ c_{n})

converge assolutamente.

Dim. Si noti che la successione ${c_{n}}_{n \geq 1}$ è convergente, $lim c_{n} = l$ , per il teorema della funzione monotona, e quindi limitata. Anzi,

0 \leq c_{n} \leq c_{1} .

Inoltre, $c_{n + 1} - c_{n} < 0$ . L’asserto del lemma segue perché ora proviamo che $\sum_{n = 1}^{+ \infty} | B_{n} Δ c_{n} | < + \infty$ . Infatti,

\sum_{n = 1}^{k} |B_{n} Δ c_{n}| = \sum_{n = 1}^{k} | B_{n} | (c_{n} - c_{n + 1}) \leq M \sum_{n = 1}^{k} (c_{n} - c_{n + 1}) = M (c_{1} - c_{k + 1}) \leq M c_{1} .

Osservazione 41 Si noti che il Lemma 40 non richiede la convergenza della serie $\sum_{n = 1}^{+ \infty} b_{n}$ . _

Consideriamo ora la serie $\sum_{n = 1}^{+ \infty} b_{n} c_{n}$ e notiamo che

b_{n} = B_{n} - B_{n - 1} = Δ B_{n - 1} .

Introducendo i numeri $d_{n}$ definiti da

d_{n - 1} = c_{n} ossia d_{n} = c_{n + 1}

e usando la regola di sommazione per parti con primo indice $2$ , le sue somme parziali si rappresentano come segue:

\begin{aligned} \sum_{n = 1}^{k} b_{n} c_{n} = b_{1} c_{1} + \sum_{n = 2}^{k} (Δ B_{n - 1}) c_{n} = b_{1} c_{1} + \sum_{n = 2}^{k} (Δ B_{n - 1}) d_{n - 1} \\ = B_{1} c_{1} + \sum_{n = 2}^{k} (Δ B_{n - 1}) d_{n - 1} = B_{1} c_{1} + [B_{k + 1} d_{k + 1} - B_{2} d_{2}] - \sum_{n = 2}^{k} B_{n + 1} Δ d_{n} \\ = B_{1} c_{1} + [B_{k + 1} c_{k + 2} - B_{2} c_{3}] - \sum_{n = 2}^{k} B_{n + 1} Δ c_{n + 1} . \end{aligned}

Dunque, per garantire la convergenza della serie $\sum_{n = 1}^{+ \infty} b_{n} c_{n}$ , basta dare condizioni che garantiscano l’esistenza dei due limiti

\begin{aligned} lim_{k \to + \infty} B_{k} c_{k + 1}, \end{aligned}

(1.14)

\begin{aligned} lim_{k \to + \infty} [\sum_{n = 2}^{k} B_{n + 1} Δ c_{n + 1}] . \end{aligned}

(1.15)

Un criterio per questo è dato dal Teorema di Dirichlet, che immediatamente implica il criterio di Leibniz:

Teorema 42 (Teorema di Dirichlet) Sia ${c_{n}}_{n \geq 1}$ una successione a valori positivi, decrescente e convergente a zero. Sia $\sum_{n = 1}^{+ \infty} b_{n}$ una serie tale che ${B_{n}}_{n \geq 1}$ rimane limitata. Allora, la serie $\sum_{n = 1}^{+ \infty} b_{n} c_{n}$ converge.

Dim. Infatti, il limite (1.14) è nullo perché ${B_{n}}$ è limitata e $c_{n} \to 0$ . Il limite (1.15) esiste per il Lemma 40. _ Dimostrazione del criterio di convergenza di Leibniz. La dimostrazione del criterio di Leibniz per la serie a segni alterni

\sum_{n} {(- 1)}^{n} a_{n}, a_{n} \geq 0

con ${a_{n}}$ decrescente e convergente a zero, segue immediatamente: basta definire $b_{n} = {(- 1)}^{n}$ e $c_{n} = a_{n} \to 0$ e notare che

B_{n} = \{\begin{matrix} - 1 & se n è dispari \\ + 1 & se n è pari \end{matrix}

e quindi ${B_{n}}_{n \geq 1}$ rimane limitata. Una diversa condizione per l’esistenza dei due limiti (1.14) e (1.15) è data dal teorema seguente:

Teorema 43 (Teorema di Abel) Sia ${c_{n}}_{n \geq 1}$ una successione a valori positivi e decrescente. Sia $\sum_{n = 1}^{+ \infty} b_{n}$ una serie convergente. Allora, la serie $\sum_{n = 1}^{+ \infty} b_{n} c_{n}$ converge.

Dim. Per ipotesi, esistono ambedue i limiti $lim c_{k}$ e $lim B_{k}$ . Dunque, esiste il limite (1.14). La successione ${B_{k}}$ , essendo convergente è anche limitata e quindi il limite (1.15) esiste per il Lemma 40. _

Capitolo 2
Successioni e serie di funzioni

In questo capitolo studiamo le successioni e le serie di funzioni. Studiamo quindi particolari metodi per approssimare una data funzione $f (x)$ mediante serie i cui termini sono funzioni elementari: monomi o funzioni trigonometriche.

2.1 Introduzione

Ricordiamo, dal Par. 1.5.1, che una successione di funzioni è una trasformazione che ad ogni numero naturale $n$ associa una funzione $f_{n} (x)$ definita su un dominio $I$ , lo stesso per ogni $n$ . Stando così le cose, il problema della convergenza della successione di funzioni si studia per ogni fissato $x \in I$ ; ossia si studia una successione numerica per ogni valore del parametro $x$ . Se la succesisone $(f_{n} (x))$ converge a $f (x)$ per ogni $x \in I_{0} \subseteq I$ , si dice che la successione $(f_{n} (x))$ converge puntualmente ad $f (x)$ su $I_{0}$ . In realtà questo è un modo piuttosto semplicistico di procedere. Le applicazioni richiedono infatti di studiare la convergenza rispetto ad opportuni concetti di “distanza” tra funzioni. Ciò è quanto facciamo in questo capitolo. Notazione. Da ora in poi di regola useremo una notazione meno “elementare”: per indicare una funzione invece di scrivere $f (x)$ scriveremo semplicemente $f$ . Invece, col simbolo $f (x)$ intenderemo il valore che la funzione $f$ assume nel punto $x$ . In certi casi questo può condurre ad ambiguità ed allora useremo notazioni del tipo $x \to f (x)$ per indicare la funzione che ad $x$ associa $f (x)$ . Va detto che la notazione $f$ non si può usare per specifiche funzioni: la funzione $x \to sin x$ si indicherà semplicemente con $sin x$ . Dunque, successioni e serie di funzioni di regola si indicheranno con la notazione

(f_{n}), \sum f_{n}, \sum_{n = 1}^{+ \infty} f_{n}

ecc. Invece scriveremo esplicitamente $x$ quando dovremo considerare successioni o serie di funzioni particolari, per esempio

\sum 5^{n} {(x - 1)}^{n}, \sum \frac{1}{n x^{2} + 1} \sum \frac{1}{n^{2}} sin n x .

2.2 Distanze tra funzioni

Noi considereremo funzioni definite su un fissato insieme $I$ che sarà sempre un intervallo. Specificheremo volta per volta se tale intervallo deve essere limitato e/o chiuso. Inoltre, non considereremo tutte le possibili funzioni definite su $I$ , ma le funzioni di una delle tre classi seguenti:

col simbolo $C (I)$ si intende l’insieme delle funzioni continue su $I$ . Implicitamente usando questo simbolo si intende che $I$ sia limitato e chiuso, $I = [a, b]$ .
col simbolo $ℒ^{1} (I)$ si intende l’insieme delle funzioni il cui valore assoluto è integrabile su $I$ : $\int_{I} | f (x) | d x < + \infty .$
L’insieme $I$ è ora un intervallo qualsiasi.
col simbolo $ℒ^{2} (I)$ , si intende l’insieme delle funzioni tali che $\int_{I} | f (x) |^{2} d x < + \infty .$
L’insieme $I$ è ora un intervallo qualsiasi. Si noti la presenza del segno $| \cdot |$ e del quadrato. Ovviamente, se la funzione prende valori reali, $| f (x) |^{2} = f^{2} (x)$ . Però molto spesso la funzione $f (x)$ prende valori complessi e in tal caso il segno di modulo è necessario.

Osservazione 44 L’integrale che usiamo è l’integrale di Riemann. Si ricordi che una funzione integrabile secondo Riemann è necessariamente limitata. Usando questa proprietà, si potrebbe mostrare che, se l’intervallo $I$ è limitato, i due insiemi $ℒ (I)$ ed $ℒ^{2} (I)$ hanno i medesimi elementi. I due insiemi invece sono diversi se $I$ è illimitato o se si usano concetti diversi di integrale, che permettono di integrare anche funzioni illimitate. A noi interessa sapere che:

I limitato \Rightarrow ℒ^{2} (I) \subseteq ℒ^{1} (I) .

I tre insiemi sopra definiti sono spazi lineari, nel senso visto nei corsi di geometria, rispetto alle operazioni

(f + g) (x) = f (x) + g (x), (α f) (x) = α f (x) .

In questi spazi lineari si introduce una distanza come segue:

in $C (I)$ si pone $d (f, g) = max_{x \in I} | f (x) - g (x) |$
(si noti che il massimo esiste, dal teorema di Weierstrass, perché l’intervallo $I$ è limitato e chiuso.) La distanza sopra definita si indica anche col simbolo¹
$d_{\infty} (f, g) .$
Le distanze in $ℒ^{1} (I)$ e in $ℒ^{2} (I)$ si indicano anche, rispettivamente, con i simboli $d_{1} (f, g), d_{2} (f, g)$
e sono definite da
$d_{1} (f, g) = \int_{I} | f (x) - g (x) | d x, d_{2} (f, g) = {[\int_{I} | f (x) - g (x) |^{2} d x]}^{1 ∕ 2} .$

Si noti che in questi simboli l’intervallo $I$ è sottinteso e che spesso si scrive, rispettivamente,

| | f - g | |_{\infty}, | | f - g | |_{1}, | | f - g | |_{2} .

usando il simbolo di “norma della differenza”, al posto di quello di distanza

Osservazione 45 Non ci serve essere precisi su questo. Però va detto che solamente la norma $| | \cdot | |_{\infty}$ è effettivamente una norma e che solo $d_{\infty} (f, g)$ è effettivamente una distanza. Infatti, se $I = [0, 1]$ , se $f (x) = 0$ per ogni $x$ e se $g (x) = 0$ per $x \neq 1 ∕ 2$ mentre $g (1 ∕ 2) = 1$ , allora $d_{1} (f, g) = 0$ , $d_{2} (f, g) = 0$ nonostante che $f$ e $g$ siano tra loro diverse. _

Accade che

d_{\infty} (f, g) < 𝜖

quando il grafico di $g (x)$ sta in un “tubo” di ampiezza $𝜖$ intorno a quello di $f (x)$ , come in figura 2.1. Si noti che il “tubo” può essere disegnato intorno ad una qualsiasi delle due funzioni. Ciò fatto si richiederà che il grafico dell’altra stia in tale “tubo”.

figura 2.1: Distanza

d_{\infty} (f, g)

La figura a sinistra descrive la fascia di ampiezza ε centrata nel grafico della funzione f all’interno della quale è contenuto il grafico di g. Parimenti, la figura a destra descrive la fascia di ampiezza ε centrata nel grafico della funzione g all’interno della quale è contenuto il grafico di f.

Invece, $d_{1} (f, g) < 𝜖$ quando accade che è minore di $𝜖$ l’area del trapezoide di $| f (x) - g (x) |$ , ossia l’area della superficie compresa tra i grafici delle due funzioni. La figura 2.2, a sinistra, riporta il grafico di $| f (x) - g (x) |$ ed a destra quello di $| f (x) - g (x) |^{2}$ (per le medesime due funzioni $f (x)$ e $g (x)$ ) con tratteggiata la regione la cui area deve essere “piccola” se si vuole che queste “distino di poco” rispettivamente in $ℒ^{1} (a, b)$ ed in $ℒ^{2} (a, b)$ . La figura suggerisce che la distanza, nel senso $ℒ^{1}$ , o $ℒ^{2}$ , tra due funzioni possa essere “piccola” anche se i due grafici diventano “molto distanti” per certi valori di $x$ .

figura 2.2: Le distanze

d_{1} (f, g)

d_{2} (f, g)

La prima figura rappresenta il grafico della funzione ∣f(x) − g(x)∣ la cui area è data da d₁(f, g). La seconda figura rappresenta il grafico della funzione ∣f(x) − g(x)∣²; la radice quadrata della sua area è data da d₂(f, g).

Scriviamo ora esplicitamente la definizione di convergenza rispetto alla distanza $d_{\infty}$ . Questo tipo di convergenza si chiama convergenza uniforme

La successione di funzioni

(f_{n} (x))

converge uniformemente ad

f (x)

I

se per ogni

𝜖 > 0

esiste

N_{𝜖}

tale che per ogni

n > N_{𝜖}

vale

max_{x \in I} | f_{n} (x) - f (x) | < 𝜖 p e r o g n i x \in I,

ossia, per

n > N_{𝜖}

vale

| f_{n} (x) - f (x) | < 𝜖 p e r o g n i x \in I .

Per contrasto, diamo la definizione di convergenza puntuale: la successione $(f_{n} (x))$ converge puntualmente ad $f (x)$ su $I$ quando per ogni $x \in I$ e per ogni $𝜖 > 0$ esiste un numero $N_{𝜖} (x)$ tale che se $n > N_{𝜖} (x)$ si ha, per questo particolare numero $x$ , $| f_{n} (x) - f (x) | < 𝜖$ . Cambiando il punto $x$ cambia anche il numero $N_{𝜖} (x)$ . Si ha convergenza uniforme quando si può trovare un numero $N_{𝜖}$ che va bene per ogni $x \in I$ . Diamo ora la definizione di convergenza in $ℒ^{1} (I)$ ed in $ℒ^{2} (I)$ .

La successione

(f_{n} (x))

converge ad

f (x)

ℒ^{1} (I)

se per ogni

𝜖 > 0

esiste

N_{𝜖}

tale che per ogni

n > N_{𝜖}

si ha

\int_{I} | f_{n} (x) - f (x) | d x < 𝜖 .

La successione

(f_{n} (x))

converge ad

f (x)

ℒ^{2} (I)

se per ogni

𝜖 > 0

esiste

N_{𝜖}

tale che per ogni

n > N_{𝜖}

si ha

\int_{I} | f_{n} (x) - f (x) |^{2} d x < 𝜖^{2} .

La convergenza in $ℒ^{1} (I)$ si chiama anche convergenza in media e la convergenza in $ℒ^{2} (I)$ si chiama anche convergenza in media quadratica mentre, come si è già detto, la convergenza in $C (I)$ si chiama convergenza uniforme.

Osservazione 46 Supponiamo che la successione di funzioni $(f_{n})$ sia definita su un dominio $I$ , $I = I_{1} \cup I_{2}$ . Se la successione converge uniformemente su $I$ , essa converge uniformemente sia su $I_{1}$ che su $I_{2}$ e, viceversa, se la successione converge uniformemente su $I_{1}$ e anche su $I_{2}$ , essa converge uniformemente anche su $I$ . Asserto analogo vale anche per la convergenze in media e per la convergenze in media quadratica. _

Vediamo ora due figure che illustrano il significato della convergenza uniforme e della convergenza in media. La fig. 2.3 a sinistra suggerisce la convergenza uniforme. La figura a destra vuol suggerire la convergenza in media, e vuol sottolineare che la convergenza in media non implica la convergenza puntuale. I grafici rappresentati a destra sono quelli delle funzioni $e^{- n t}$ con $n = 1$ , $5$ , $10$ , $100$ . Si provi dettagliatamente, facendo uso della definizione, che la successione $(e^{- n t})$ , $t \in [0, 1]$ , converge a zero in media ed in media quadratica, ma non uniformemente.

figura 2.3: Convergenza uniforme e convergenza in media

La figura a sinistra descrive i grafici di due funzioni che sono “molto vicini” fra loro nel senso della d_∞; la figura a destra mostra i grafici delle funzioni e⁻t, e^− 5t, e^− 10t, e^− 100t; esse sono infinitesime e descrescenti. Inoltre, per ogni n, e^− n…0 = 1.

Infine, enunciamo il lemma seguente, immediata conseguenza del teorema di confronto per i limiti. La dimostrazione è lasciata per esercizio.

Lemma 47 Sia $(f_{n})$ una successione di funzioni su un intervallo $I$ . Su tale intervallo sia anche definita una funzione $g$ . Sia $(γ_{n})$ una successione numerica tale che

lim γ_{n} = 0 .

se vale $d_{\infty} (f_{n}, g) < γ_{n}$
allora la successione $(f_{n})$ converge uniformemente a $g$ .
se vale $d_{1} (f_{n}, g) < γ_{n}$
allora la successione $(f_{n})$ converge a $g$ in $ℒ^{1} (I)$ .
se vale $d_{2} (f_{n}, g) < γ_{n}$
allora la successione $(f_{n})$ converge a $g$ in $ℒ^{2} (I)$ .

2.2.1 Il prodotto interno su $ℒ^{2} (a, b)$

Su $ℒ^{2} (a, b)$ si può definire un prodotto interno o prodotto integrale come segue: siano $f$ e $g$ due funzioni a quadrato integrabile. Si può provare che il loro prodotto è integrabile. Definiamo allora il prodotto interno delle due funzioni $f$ e $g$ ponendo²

⟨ f, g ⟩ = \int_{a}^{b} ḡ (s) f (s) d s .

Si noti che se le funzioni prendono valori reali allora il segno di coniugio non ha alcun effetto; se però esse prendono valori complessi il coniugio è importante perché è grazie ad esso che si ottiene

\sqrt{⟨ f, f ⟩} = | | f | |_{2} .

Quest’uguaglianza giustifica il termine “prodotto interno” (o “prodotto scalare”): nel caso dei “vettori ordinari” di $ℝ^{3}$ si ha infatti

∥ \vec{x} ∥ = \sqrt{x_{1}^{2} + x_{2}^{2} + x_{3}^{2}} = \vec{x} \cdot \vec{x} .

Diciamo che due funzioni $f$ e $g$ sono ortogonali in $ℒ^{2} (a, b)$ quando

⟨ f, g ⟩ = 0 .

Naturalmente, per dire che $f$ è ortogonale a $g$ , scriveremo

f ⊥ g .

Una proprietà importante del prodotto interno in $ℒ^{2} (a, b)$ è che per esso vale il teorema di Pitagora:

Teorema 48 Se $f ⊥ g$ allora $| | f + g | |^{2} = | | f | |^{2} + | | g | |^{2}$ .

Dim. Infatti si ha

| | f + g | |^{2} = ⟨ f + g, f + g ⟩ = ⟨ f, f ⟩ + ⟨ f, g ⟩ + ⟨ g, f ⟩ + ⟨ g, g ⟩ = | | f | |^{2} + | | g | |^{2} .

In particolare,

f ⊥ g \Rightarrow | | f | | \leq | | f + g | |, | | g | | \leq | | f + g | | .

Osservazione 49 Va notato esplicitamente che non esiste nessun concetto analogo a quello di prodotto interno per le distanze in $C (a, b)$ o di $ℒ^{1} (a, b)$ . _

2.2.2 Proprietà della convergenza uniforme

La sola convergenza puntuale è troppo debole per avere proprietà importanti di qualche tipo. Infatti:

esistono successioni di funzioni integrabili che convergono puntualmente a funzioni non integrabili.

Per vedere un esempio, ricordiamo che i numeri razionali sono numerabili, ossia sono immagine di una successione iniettiva. Sia $(q_{k})$ questa successione e definiamo la funzione

f_{n} (x) = \{\begin{matrix} 1 & s e & x = q_{1}, q_{2}, \dots, q_{n} \\ 0 & a l t r i m e n t i . \end{matrix}

Ciascuna delle funzioni $f_{n} (x)$ è integrabile, con integrale uguale a zero, perché $f_{n} (x)$ è zero salvo che in un numero finito di punti. La successione $(f_{n} (x))$ converge alla funzione di Dirichlet, che vale $1$ sui razionali e vale $0$ sugli irrazionali. Questa funzione non è integrabile.

esistono successioni di funzioni continue che convergono puntualmente a funzioni discontinue.

Un esempio è il seguente: sia $I = [0, 1]$ e sia $f_{n} (x) = x^{n}$ . Ciascuna funzione è continua, ma la successione di funzioni $(f_{n} (x))$ converge puntualmente su $I$ alla funzione

f (x) = \{\begin{matrix} 0 & s e & x \in [0, 1) \\ 1 & s e & x = 1 . \end{matrix}

Questa funzione è discontinua. E’ per questa ragione che vanno introdotti concetti più restrittivi di convergenza. In questo paragrafo presentiamo le relazioni tra il concetto di convergenza uniforme e le proprietà di limite, derivabilità ed integrazione³. Il teorema centrale è il seguente:

Teorema 50 Sia $(f_{n} (x))$ una successione di funzioni, definite su un intervallo $I$ , ciascuna delle quali è continua in un punto $x_{0}$ . Se la successione converge ad una funzione $f (x)$ uniformemente su $I$ allora anche la funzione $f (x)$ è continua in $x_{0}$ .

Omettiamo la dimostrazione. Ricordando che le funzioni continue su un intervallo limitato e chiuso sono integrabili si ha:

Corollario 51 Sia $(f_{n} (x))$ una successione di funzioni continue su un intervallo limitato e chiuso $I$ . La successione converga uniformemente su $I$ ad una funzione $f (x)$ . Allora, la funzione $f (x)$ è continua e quindi anche integrabile su $I$ .

Sotto le ipotesi del corollario precedente, può dirsi di più: l’integrale di $f (x)$ è il limite degli integrali delle $f_{n} (x)$ . Ossia:

Teorema 52 Sia $(f_{n} (x))$ una successione di funzioni continue su un intervallo limitato e chiuso $I$ . La successione converga uniformemente su $I$ ad una funzione $f (x)$ . Allora,

\int_{I} f (x) d x = \int_{I} [lim_{n \to + \infty} f_{n} (x)] d x = lim_{n \to + \infty} [\int_{I} f_{n} (x) d x] .

(2.1)

Dim. Ricordando la definizione di limite, dobbiamo provare che per ogni $𝜖 > 0$ esiste $N_{𝜖}$ tale che per ogni $n > N_{𝜖}$ si ha

|\int_{I} f (x) d x - \int_{I} f_{n} (x) d x| < 𝜖 .

Dalla linearità e dalla proprietà di monotonia degli integrali,

|\int_{I} f (x) d x - \int_{I} f_{n} (x) d x| \leq \int_{I} | f_{n} (x) - f (x) | d x

e quindi basta provare che

\int_{I} | f_{n} (x) - f (x) | d x < 𝜖

per $n$ suffcientemente grande. Ricordiamo che la successione $(f_{n} (x))$ converge ad $f (x)$ uniformemente su $I$ : scelto un qualunque $σ > 0$ esiste $Ñ_{σ}$ tale che, per ogni $n > Ñ_{σ}$ si ha

| f_{n} (x) - f (x) | < σ \forall x \in I

e quindi anche

\int_{I} | f_{n} (x) - f (x) | d x < σ L

con $L$ la lunghezza di $I$ . L’asserto segue scegliendo $σ = 𝜖 ∕ L$ e $N_{𝜖} = Ñ_{𝜖 ∕ L}$ . _

Osservazione 53 Ricordiamo, dall’Osservazione 46, che se $I = I_{1} \cup I_{2}$ e se la successione $(f_{n})$ converge uniformemente su $I$ , essa converge uniformemente sia su $I_{1}$ che su $I_{2}$ . D’altra parte, l’integrale su $I = I_{1} \cup I_{2}$ è la somma dei due integrali su $I_{1}$ e su $I_{2}$ . Quindi il teorema si applica facilmente anche a successioni uniformemente convergenti di funzioni continue a tratti e questo è suffciente per molte applicazioni. Si potrebbe però provare che la semplice integrabilità di ciascuna delle funzioni $f_{n} (x)$ e la convergenza uniforme della successione ad $f (x)$ implica che la $f (x)$ è integrabile e che vale l’uguaglianza (2.1). _

Sia $F_{n} (x)$ primitiva di $f_{n} (x)$ . La convergenza della successione $(f_{n})$ non implica la convergenza della successione $(F_{n})$ . Questo si vede facilmente scegliendo $f_{n} (x) = 0$ per ogni $x$ , ed $F_{n} (x) = n$ per ogni $x$ . Le cose cambiano se si assegna il comportamento che le $F_{n} (x)$ devono avere in un medesimo punto $x_{0}$ :

Teorema 54 Sia $(f_{n} (x))$ una successione di funzioni continue su un intervallo $[a, b]$ e sia

F_{n} (x) = c_{n} + \int_{a}^{x} f_{n} (s) d s .

Supponiamo che

lim_{n} c_{n} = c_{0},

e che la successione $(f_{n})$ converga uniformemente ad $f_{0}$ . In tal caso la successione $(F_{n})$ converge uniformemente alla funzione

F_{0} (x) = c_{0} + \int_{a}^{x} f_{0} (s) d s .

Dim. Ricordiamo che la funzione $f_{0} (x)$ è continua, come limite uniforme di una successione di funzioni continue. Dunque l’espressione proposta per $F_{0} (x)$ ha senso. La differenza $| F_{n} (x) - F_{0} (x) |$ si stima così:

| F_{n} (x) - F_{0} (x) | \leq | c_{n} - c_{0} | + \int_{a}^{x} |f_{n} (s) - f_{0} (s)| d s \leq | c_{n} - c_{0} | + \int_{a}^{b} |f_{n} (s) - f_{0} (s)| d s .

La successione numerica $(| c_{n} - c_{0} |)$ tende a zero per ipotesi, mentre la successione numerica

\{\int_{a}^{b} |f_{n} (s) - f_{0} (s)| d s\}

tende a zero per il Teorema 52. L’asserto segue quindi dal Lemma 47. _ Vediamo ora le relazioni tra derivazione e convergenza uniforme. E’ facile trovare esempi che mostrano che il limite uniforme di una successione di funzioni derivabili può non essere derivabile.

Esempio 55 Consideriamo la successione di funzioni

f_{n} (x) = \{\begin{matrix} | x | & s e & | x | > 1 ∕ n \\ \frac{n}{2} x^{2} + \frac{1}{2 n} & a l t r i m e n t i . \end{matrix}

Ciascuna di queste funzioni è derivabile ma la successione di funzioni converge uniformemente alla funzione non derivabile $f (x) = | x |$ . Il grafico di alcune di queste funzioni è in figura 2.4. _

figura 2.4: La convergenza uniforme non implica la convergenza della successione delle derivate

Relativamente all’intervallo [ − 1, 1], il grafico della funzione f_n è una parabola con vertice nel punto (0, 1/2n); per n → + ∞, tale grafico “tende” al grafico della funzione y = ∣x∣ (non derivabile in x = 0).

Vale però:

Teorema 56 Sia $(f_{n})$ una successione di funzioni derivabili su un intervallo $(a, b)$ . Supponiamo che:

esista un punto $x_{0}$ tale che la successione numerica $(f_{n} (x_{0}))$ converga;
la successione $(f_{n}^{'} (x))$ converga uniformemente su $I$ ad una funzione $h (x)$ .

In tal caso la successione $(f_{n})$ converge uniformemente su $I$ ad una funzione $f (x)$ che è derivabile, ed inoltre $f^{'} (x) = h (x)$ ; ossia

f^{'} (x) = lim_{n \to + \infty} f_{n}^{'} (x) .

Dim. Per ipotesi,

f_{n} (x) = f_{n} (x_{0}) + \int_{x_{0}}^{x} f_{n}^{'} (s) d s .

L’asserto segue quindi dal Teorema 54. _

2.3 Serie di funzioni

Le serie di funzioni si definiscono in modo del tutto analogo alle serie numeriche: se $(f_{n})$ é una successione di funzioni, la serie corrispondente si indica col simbolo

\sum_{n} f_{n} o p p u r e \sum_{n} f_{n} (x) .

Se é necessario indicare i valori presi dall’indice scriveremo per esempio

\sum_{n = n_{0}}^{+ \infty} f_{n} .

Il significato del simbolo di serie é il seguente: supponendo che l’indice prenda tutti i valori maggiori od uguali a $0$ , si costruisce la nuova successione

s_{0} (x) = f_{0} (x), s_{1} (x) = f_{0} (x) + f_{1} (x), s_{n} (x) = f_{0} (x) + f_{1} (x) + \dots + f_{n} (x) .

Se la successione di funzioni $(s_{n} (x))$ converge uniformemente, si dice che la serie converge uniformemente; se la successione di funzioni $(s_{n} (x))$ converge in $ℒ^{1}$ oppure in $ℒ^{2}$ , si dice che la serie converge in tal senso. Enunciamo il teorema seguente, senza dimostrarlo:

Teorema 57 Sia convergente la serie di numeri positivi

\sum γ_{n} .

Valga inoltre

d_{p} (f_{n}, 0) \leq γ_{n}

ove $p = + \infty$ oppure $p = 1$ oppure $p = 2$ . Sotto queste ipotesi, esiste una funzione $g (x)$ (rispettivamente in $C (I)$ , $ℒ^{1} (I)$ oppure $ℒ^{2} (I)$ ) tale che la serie

\sum f_{n}

converge nel senso corrispondente a $g (x)$ .

Sia $\sum f_{n}$ una serie di funzioni. Si dice che questa serie converge normalmente (in $C (I)$ oppure in $ℒ^{p} (I)$ ) quando converge la serie

\sum | | f_{n} | |_{p}

(con $p$ uguale a $1$ , $2$ ). L’asserto del teorema precedente si esprime anche dicendo che una serie che converge normalmente è anche una serie convergente. Il viceversa non vale. Nel caso di $p = + \infty$ , ossia per la convergenza uniforme, il test per la convergenza dato nel Teorema 57 si chiama anche test di Weierstrass A parte questo teorema, di dimostrazione diffcile, i teoremi visti per la convergenza delle successioni di funzioni si adattano facilmente allo studio della convergenza delle serie. Enunciamo in particolare:

Teorema 58 Una serie di funzioni continue $\sum f_{n}$ converga uniformemente su $I$ ad una funzione $f (x)$ . Allora la funzione $f (x)$ è continua e, se $I$ è limitato e chiuso, vale

\int_{I} [\sum_{n} f_{n} (x)] d x = \sum_{n} [\int_{I} f_{n} (x) d x] .

Sia $\sum_{n} f_{n} (x)$ una successione di funzioni derivabili, convergente puntualmente su $I$ ad una funzione $f (x)$ . Supponiamo che la serie $\sum_{n} f_{n}^{'} (x)$ converga uniformemente su $I$ ad una funzione $g (x)$ . Allora la funzione $f (x)$ è derivabile, con derivata $f^{'} (x) = g (x)$ ed inoltre la serie $\sum_{n} f_{n} (x)$ converge ad $f (x)$ uniformemente su $I$ .

Esempio 59 Consideriamo la serie

\sum_{n = 0}^{+ \infty} x {(1 - x)}^{n}, x \in [0, 1] .

Questa serie converge puntualmente su $[0, 1]$ . ossia converge per ogni $x \in [0, 1]$ . Infatti, se $x = 0$ ogni termine della serie è nullo e quindi la somma della serie è $0$ ; se $x \in (0, 1]$ allora è lecito scrivere

\sum_{n = 0}^{+ \infty} x {(1 - x)}^{n} = x (\sum_{n = 0}^{+ \infty} {(1 - x)}^{n}) = x \frac{1}{1 - (1 - x)} = 1 .

Dunque, si ha

\sum_{n = 0}^{+ \infty} x {(1 - x)}^{n} = \{\begin{matrix} 0 & se x = 0 \\ 1 & a l t r i m e n t i . \end{matrix}

Dunque la somma della serie non è continua e quindi la serie, pur convergendo puntualmente su $[0, 1]$ , non converge uniformemente. _

2.4 Serie di potenze

Si chiamano serie di potenze le serie di funzioni della forma

\sum_{n = 0}^{+ \infty} a_{n} {[x - x_{0}]}^{n},

(2.2)

ottenute a partire dalla successione di monomi $a_{n} {[x - x_{0}]}^{n}$ . Si noti che il primo valore dell’indice è ora $n = 0$ ma niente vieta che sia $a_{0} = 0$ ossia che la serie “parta” per esempio con indice $1$ . Se esiste $N$ tale che $a_{n} = 0$ per $n > N$ , allora la serie di potenze si riduce ad un polinomio: le serie di potenze generalizzano i polinomi. Il numero $x_{0}$ si chiama il centro della serie e la serie di potenze converge sempre per $x = x_{0}$ (e ivi converge ad $a_{0}$ ). Potrebbe non convergere in nessun altro punto.

Esempio 60 Si consideri la serie seguente, di centro $x_{0} = 0$ :

\sum_{n = 0}^{+ \infty} n^{n} x^{n} = \sum_{n = 0}^{+ \infty} {(n x)}^{n} .

Si fissi il valore di $x \neq 0$ e sia $n_{0}$ tale che $| n_{0} x | > 1$ . Allora, per $n > n_{0}$ , si ha

| n x |^{n} > | n_{0} x |^{n} \to + \infty .

Dunque, se $x \neq 0$ , il termine generale della serie non tende a zero, e quindi la serie non converge. _

Vale però:

Teorema 61 (Teorema di Abel) Una serie di potenze converga in un punto $ξ \neq x_{0}$ e sia

r = | ξ - x_{0} | > 0 .

Allora, la serie di potenze converge uniformemente in ${x | | x - x_{0} | < r^{'}}$ per ogni $r^{'} < r$ .

Dim. Si guardi la figura 2.5 per seguire questa dimostrazione.

figura 2.5: Gli intervalli che si usano nella dimostrazione del teorema di Abel

Sulla retta reale sono individuati gli intorni destri del punto x₀ di raggio r’ < r < d, rispettivamente.

Sia $| x - x_{0} | < r^{'} < r$ e sia $d \in (r^{'}, r)$ così che

r^{'} < r, r = | x - ξ | > d

e quindi

| a_{n} {(x - x_{0})}^{n} | < | a_{n} {(ξ - x_{0})}^{n} | \cdot {(\frac{r^{'}}{| ξ - x_{0} |})}^{n} \leq | a_{n} {(ξ - x_{0})}^{n} | \cdot {(\frac{r^{'}}{d})}^{n} .

La convergenza in $ξ$ implica che la successione $(| a_{n} {(ξ - x_{0})}^{n} |)$ è limitata (anzi tende a zero):

| a_{n} {(ξ - x_{0})}^{n} | < M .

Inoltre,

\frac{r^{'}}{d} < q < 1 .

Dunque, per $| x - x_{0} | < r^{'}$ si ha

| a_{n} {(x - x_{0})}^{n} | \leq γ_{n}, γ_{n} \leq M q^{n}

con $0 \leq q < 1$ e quindi con $\sum γ_{n} < + \infty$ . La convergenza uniforme segue dal criterio di Weierstrass, Teorema 57. _ Questo risultato in particolare implica che se una serie di potenze converge allora l’insieme su cui essa converge è un intervallo centrato in $x_{0}$ (e non si esclude che sia ridotto al solo $x_{0}$ , oppure che sia tutta la retta). Questo si chiama l’intervallo di convergenza della serie di potenze e si chiama raggio di convergenza la sua semiampiezza. Il raggio di convergenza può essere nullo, si veda l’esempio 60. Può essere un numero finito non nullo oppure può essere $+ \infty$ : è un numero finito non nullo nel caso particolare della serie geometrica, è $+ \infty$ nel caso in cui la serie di potenze si riduca ad un polinomio, ma non solo in tal caso:

Osservazione 62 Consideriamo la serie

\sum_{n = 0}^{+ \infty} \frac{x^{n}}{n!} .

fissato $x$ , si trova una serie numerica, convergente per ogni valore del parametro $x$ , come si vede facilmente usando il criterio del rapporto. _

Inoltre, la dimostrazione del Teorema 61 mostra che:

Teorema 63 (Teorema di Abel) Sia $0 \leq R \leq + \infty$ il raggio di convergenza di una serie di potenze e sia $x$ tale che $| x - x_{0} | < R$ . La serie di potenze converge assolutamente e quindi incondizionatamente nel punto $x$ .

Ciò mostra che l’ordine dei termini di una serie di potenze non inﬂuisce sulla somma della serie nei punti interni all’intervallo di convergenza. Invece, niente può dirsi in generale del comportamento della serie negli estremi dell’intervallo di convergenza, come mostrano gli esempi seguenti.

Esempio 64 Consideriamo la serie di potenze

\sum_{n = 1}^{+ \infty} {(- 1)}^{2} \frac{x^{n}}{n}

(2.3)

fissato $x$ si trova una serie numerica e si vede facilmente, dal criterio del rapporto, che la sere converge per ogni $x$ con $| x | < 1$ , diverge se $| x | > 1$ . Dunque il raggio di convergenza è $1$ . Se $x = - 1$ oppure $x = + 1$ si trovano rispettivamente le due serie

\sum_{n = 1}^{+ \infty} \frac{1}{n}, \sum_{n = 1}^{+ \infty} {(- 1)}^{n} \frac{1}{n} .

La prima divergente e la seconda convergente. Si è detto che la somma di una serie di potenze non dipende dall’ordine degli elementi nei punti interni dell’intervallo di convergenza. Quest’esempio mostra che, invece, può dipendere dall’ordine degli elementi se $x$ è uno degli estremi dell’intervallo di convergenza. Mostriamo ora una serie di potenze che converge in ambedue gli estremi dell’intervallo di convergenza. La serie è

\sum_{n = 1}^{+ \infty} \frac{1}{n^{2}} x^{2 n} .

(2.4)

Di nuovo, fissato $x$ , si usi il criterio del rapporto per studiare la convergenza della serie numerica che si ottiene. Si vede che si ha convergenza per $- 1 \leq x \leq 1$ , estremi inclusi, mentre la serie diverge per $| x | > 1$ . Infine, mostriamo una serie di potenze che diverge in ambedue gli estremi dell’intervallo di convergenza. Questa è la serie

\sum_{n = 0}^{+ \infty} {(- 1)}^{n} x^{2 n} .

(2.5)

Questa è una serie geometrica di ragione $- x^{2}$ e quindi converge se e solo se $- 1 < x < 1$ , estremi esclusi. Si noti che la somma di questa serie è la funzione

f (x) = \frac{1}{1 + x^{2}},

una funzione di classe $C^{\infty} (R)$ . La ragione per cui la serie corrispondente non debba convergere negli estremi sembra misteriosa, e verrà chiarita al paragrafo 2.4.2. E’ interessante vedere i grafici di alcune delle somme parziali delle tre serie introdotte sopra. L’intervallo di convergenza delle serie è $(- 1, 1)$ . I grafici delle somme parziali sono disegnati su un intervallo un po’ più grande e, punteggiato, si riporta anche il grafico della somma della serie, ovviamente solo sull’intervallo $(- 1, 1)$ . La prima e la seconda serie sono alla figura 2.6

figura 2.6: Somme parziali della serie (2.3) (a sinistra e della serie (2.4) (a destra)

A sinistra: Nel piano cartesiano sono indicate le due rette $x = - 1$ e $x = 1$ . Sono rappresentati i grafici delle funzioni $s_{1} (x) = x, s_{2} (x) = x - \frac{x^{2}}{2}, s_{3} (x) = x - \frac{x^{2}}{2} + \frac{x^{3}}{3}$ . Il grafico della retta $y = x$ è al di sopra del grafico di tutte le altre funzioni $s_{i} (x) .$ Sulla retta $x = - 1$ compaiono i termini di una serie armonica divergente a meno infinito; sulla retta $x = 1$ compaiono i termini di una serie convergente. Il grafico della funzione somma della serie illustra il fatto che la funzione somma della serie ha un asintoto orizzontale in $x = - 1$ mentre è definita in $x = 1.$

A destra: Nel piano cartesiano sono indicate le due rette $x = - 1$ e $x = 1$ . Sono rappresentati i grafici delle funzioni $s_{1} (x) = x^{2}, s_{2} (x) = x^{2} - \frac{x^{4}}{4}, s_{3} (x) = x + \frac{x^{4}}{4} + \frac{x^{6}}{9}$ . Il grafico della parabola $y = x^{2}$ è al di sotto del grafico di tutte le altre funzioni $s_{i} (x) .$ Sulla retta $x = - 1$ e sulla retta $x = 1$ compaiono i termini di una serie convergente. Il grafico della funzione somma della serie illustra il fatto che la funzione somma della serie è definita in $x = \pm 1.$

L’ultima serie è alla figura 2.7.

figura 2.7: Somma parziali della serie (2.5)

Nel piano cartesiano sono indicate le due rette $x = - 1$ e $x = 1$ . Sono rappresentati i grafici delle funzioni $s_{1} (x) = 1, s_{2} (x) = 1 - x^{2}, s_{3} (x) = 1 - x^{2} + x^{4}$ e il grafico della funzione somma della serie $s (x) = \frac{1}{1 + x^{2}}$ . Sulle rette $x = \pm 1$ compaiono i termini di una serie oscillante. La funzione somma della serie è definita su tutto $R$ ma la serie è convergente solo nellè?intervallo aperto $(- 1,1) .$

Il grafico punteggiato (tratto spesso) in questo caso rappresenta la funzione $1 ∕ (1 + x^{2})$ , che è la somma della serie sul solo intervallo $(- 1, 1)$ . E’ stato disegnato in un intervallo più grande per sottolineare che la questa funzione è regolare anche nei punti $+ 1$ e $- 1$ . _

Inoltre, la convergenza essendo uniforme, dal Teorema 50:

Corollario 65 La somma di una serie di potenze è continua nei punti interni all’intervallo di convergenza.

Si potrebbe inoltre provare che:

Teorema 66 Sia $R$ il raggio di convergenza della serie $\sum a_{n} {(x - x_{0})}^{n}$ . Le due serie di potenze

\begin{aligned} \sum \frac{d}{d x} [a_{n} {(x - x_{0})}^{n}] = \sum n a_{n} {(x - x_{0})}^{n - 1}, \\ \sum [\int_{x_{0}}^{x} a_{n} {(s - x_{0})}^{n} d s] = \sum \frac{1}{n + 1} a_{n} {(x - x_{0})}^{n + 1} \end{aligned}

hanno lo stesso raggio di convergenza e questo è uguale ad $R$ .

Le due serie in (2.6) si dicono ottenute derivando termine a termine o integrando termine a termine la serie data. Esse convergono uniformemente in $[a, b] \subseteq (x_{0} - R, x_{0} + R)$ e quindi, usando i teoremi 52 e 56, si trova l’uguaglianza

\begin{aligned} \frac{d}{d x} [\sum a_{n} {(x - x_{0})}^{n}] = \sum n a_{n} {(x - x_{0})}^{n - 1}, \\ \int_{0}^{x} [\sum a_{n} {(x - x_{0})}^{n}] = \sum \frac{1}{n + 1} a_{n} {(x - x_{0})}^{n + 1} . \end{aligned}

In particolare quindi anche la serie derivata può a sua volta venir derivata termine a termine e ciò tante volte quante si vuole. Dunque:

Corollario 67 La somma di una serie di potenze di raggio di convergenza non nullo è una funzione di classe $C^{\infty}$ nell’intervallo di convergenza.

Chiediamoci ora come sia possibile calcolare il raggio di convergenza di una serie di potenze. Esiste una formula per il raggio di convergenza, che non possiamo presentare. Possiamo però presentare due test particolari, che si ottengono per confronto con la serie geometrica. Il primo si può applicare quando si ha $a_{n} \neq 0$ per ogni $n$ (e basta che questa condizione sia soddisfatta per $n$ maggiore di un opportuno $N_{0}$ ).

Teorema 68 Supponiamo che $a_{n} \neq 0$ per ogni $n$ e che esista, finito o meno,

L = lim \frac{| a_{n + 1} |}{| a_{n} |} .

Allora il raggio di convergenza della serie è

\{\begin{matrix} 0 & s e & L = + \infty \\ \frac{1}{L} & s e & 0 < L < + \infty \\ + \infty & s e & L = 0 . \end{matrix}

Dim. Limitiamoci a considerare il caso $0 < L < + \infty$ . Applichiamo il criterio del rapporto per la convergenza della serie di numeri

\sum a_{n} {[x - x_{0}]}^{n},

con $x$ fissato. Il criterio del rapporto asserisce che condizione suffciente di convergenza è che per $n$ suffcientemente grande valga

\frac{| a_{n + 1} {[x - x_{0}]}^{n + 1} |}{| a_{n} {[x - x_{0}]}^{n} |} = \frac{| a_{n + 1} |}{| a_{n} |} | x - x_{0} | < q < 1 .

(2.6)

La serie diverge se vale la disuguaglianza opposta, con $q > 1$ . Proviamo che si ha convergenza se

| x - x_{0} | < \frac{1}{L} ossia se L | x - x_{0} | < 1 (disuguaglianze strette).

In tal caso, $\tilde{q} \in [0, 1)$ tale che

L | x - x_{0} | = \tilde{q} < 1 e quindi lim \frac{| a_{n + 1} |}{| a_{n} |} | x - x_{0} | = L | x - x_{0} | = \tilde{q} < 1 .

(2.7)

Sia $q \in (\tilde{q}, 1)$ . Il teorema di permanenza del segno mostra l’esistenza di un numero $N$ tale che per ogni $n > N$ vale

\frac{| a_{n + 1} |}{| a_{n} |} | x - x_{0} | < q .

Essendo $q \in (0, 1)$ , la serie converge (si ricordi (2.6)). In modo analogo si trattano gli altri casi. _ Ripetiamo che il teorema precedente non può usarsi se infiniti coeffcienti $a_{n}$ sono nulli. Usando il criterio della radice invece del criterio del rapporto si prova invece:

Teorema 69 Se esiste, finito o meno, il limite

lim \sqrt[n]{| a_{n} |} = L

allora il raggio di convergenza è

R = \{\begin{matrix} 0 & s e & L = + \infty \\ 1 ∕ L & s e & 0 < L < + \infty \\ + \infty & s e & L = 0 . \end{matrix}

Si noti che il Teorema 69 può usarsi anche se infiniti coeffcienti $a_{n}$ sono nulli. Mostriamo ora che esistono serie di potenze il cui raggio di convergenza non può determinarsi né col criterio del rapporto né con quello della radice⁴

Esempio 70 Si consideri la serie

\sum_{n = 0}^{+ \infty} 2^{{(- 1)}^{n} n} x^{n} .

E’

\sqrt[n]{| a_{n} |} = \{\begin{matrix} 2 & se n è pari \\ \frac{1}{2} & se n è dispari. \end{matrix}

Quindi,

lim \sqrt[n]{| a_{n} |} non esiste .

E’:

\frac{a_{n + 1}}{a_{n}} = \frac{2^{{(- 1)}^{n + 1} (n + 1)}}{2^{{(- 1)}^{n} n}} = \{\begin{matrix} 2^{- 2 n + 1} & se n è pari \\ 2^{2 n - 1} & se n è dispari \end{matrix}

e quindi

lim \frac{a_{n + 1}}{a_{n}} non esiste.

In casi di questo tipo, conviene considerare $x$ come una parametro e studiare la convergenza della serie numerica ottenuta, per ogni valore di $x$ . Usando il criterio della radice per ogni $x$ fissato, si vede che

\sqrt[n]{| a_{n} x^{n} |} < q < 1

se $2 x < q$ e quindi se $x < q ∕ 2$ , per qualche $q < 1$ . Dunque il raggio di convergenza è almeno $1 ∕ 2$ . D’altra parte, se $| x | > 1 ∕ 2$ allora per $n = 2 k$ , pari, si trova

a_{2 k} x^{2 k} = {(2 x)}^{2 k} \to + \infty .

Quindi, il termine generale non tende a zero e la serie non converge. Quindi, il raggio di convergenza è uguale ad $1 ∕ 2$ . _

2.4.1 Operazioni sulle serie di potenze

Le operazioni sulle serie di potenze si eseguono con le regole delle operazioni sulle serie numeriche, per ogni fissato valore del parametro $x$ . Ci interessa però notare esplicitamente:

Somma di serie Siano $\sum a_{n} {(x - x_{0})}^{n}$ , $\sum b_{n} {(x - x_{0})}^{n}$ due serie di potenze col medesimo centro $x_{0}$ e con raggio di convergenza rispettivamente $R_{a}$ ed $R_{b}$ . Sia

R = min {R_{a}, R_{b}} .

Allora, ambedue le serie convergono per $| x - x_{0} | < R$ e quindi la loro somma può scriversi nuovamente come serie di potenze di centro $x_{0}$ , convergente per $| x - x_{0} | < R$ :

[\sum a_{n} {(x - x_{0})}^{n}] + [\sum a_{n} {(x - x_{0})}^{n}] = \sum [a_{n} + b_{n}] {(x - x_{0})}^{n} .

Il raggio di convergenza della serie somma può essere maggiore di $R$ . Per esempio, se $b_{n} = - a_{n}$ , allora la serie somma ha raggio di convergenza $+ \infty$ anche se $R < + \infty$ . Ciò però può aversi solamente se $R_{1} = R_{2}$ . Infatti, se per esempio $R_{1} < R_{2}$ allora $R = R_{1}$ . Infatti, scrivendo

\sum a_{n} x_{n} = [\sum (a_{n} + b_{n}) x^{n}] + [\sum (- b_{n}) x^{n}]

si vede che il raggio di convergenza della prima serie è almeno uguale a

min {R, R_{2}}

e questo sarebbe maggiore di $R_{1}$ se fosse $R > R_{1}$ . L’operazione di somma può usarsi anche “al contrario” per calcolare il raggio di convergenza in certi casi nei quali falliscono sia il criterio del rapporto che quello della radice:

Esempio 71 Torniamo a considerare la serie vista all’esempio 70. La serie di quest’esempio si può vedere come somma delle due serie

[\sum a_{n} x^{n}] + [\sum b_{n} x^{n}], a_{n} = \{\begin{matrix} 2^{n} & n pari \\ 0 & altrimenti \end{matrix} b_{n} = \{\begin{matrix} 0 & n pari \\ 2^{- n} & altrimenti . \end{matrix}

Ora, rinominando $2 k$ l’indice $n$ della prima serie, si trova

\sum 2^{2 k} {[x^{2}]}^{k} .

Sostituendo $t = x^{2}$ si trova la serie di potenza

\sum 2^{2 k} t^{k},

a cui si può applicare sia il criterio del rapporto che quello della radice. Il raggio di convergenza è $4$ per la serie della variabile $t$ , e quindi $2$ per la serie della variabile $x$ . Analogamente, la seconda serie converge per $| x | < 1 ∕ 2$ . Dunque, il raggio di convergenza della serie somma è esattamente $1 ∕ 2$ . _

Unicità della serie di potenze Mostriamo che la serie di potenze che converge ad una funzione $f (x)$ , se esiste, è unica:

Teorema 72 Siano

\sum_{n = 0}^{+ \infty} a_{n} {(x - x_{0})}^{n}, \sum_{n = 0}^{+ \infty} b_{n} {(x - x_{0})}^{n}

due serie di potenze con raggio di convergenza rispettivamente $R_{1} > 0$ ed $R_{2} > 0$ . Sia $0 < R < min {R_{1}, R_{2}}$ . Se

\sum_{n = 0}^{+ \infty} a_{n} {(x - x_{0})}^{n} = \sum_{n = 0}^{+ \infty} b_{n} {(x - x_{0})}^{n}

per ogni $x$ con $| x - x_{0} | < R$ allora $a_{n} = b_{n}$ per ogni $n$ e quindi $R_{1} = R_{2}$ .

Dim. Basta provare che se

\sum_{n = 0}^{+ \infty} (a_{n} - b_{n}) {(x - x_{0})}^{n} = 0

per $| x - x_{0} | < R$ allora $a_{n} - b_{n} = 0$ . Posto $x = x_{0}$ si trova infatti $a_{0} - b_{0} = 0$ e quindi l’uguaglianza precedente si scrive

0 = \sum_{n = 1}^{+ \infty} (a_{n} - b_{n}) {(x - x_{0})}^{n} = (x - x_{0}) \sum_{n = 1}^{+ \infty} (a_{n} - b_{n}) {(x - x_{0})}^{n - 1} .

Dunque si ha anche

\sum_{n = 1}^{+ \infty} (a_{n} - b_{n}) {(x - x_{0})}^{n - 1} = 0 .

Calcolando per $x = x_{0}$ si vede $a_{1} - b_{1} = 0$ e dunque

\sum_{n = 2}^{+ \infty} (a_{n} - b_{n}) {(x - x_{0})}^{n - 1} = 0 .

Il procedimento può quindi ripetersi trovando $a_{2} - b_{2} = 0$ , e così via. _

Prodotto alla Cauchy di serie di Potenze Consideriamo le due serie di potenze col medesimo centro $x_{0}$

\sum_{n = 0}^{+ \infty} a_{n} {(x - x_{0})}^{n}, \sum_{k = 0}^{+ \infty} b_{k} {(x - x_{0})}^{k} .

Calcoliamo tutti i possibili prodotti di un termine della prima con un termine della seconda e raccogliamo i coeffcienti dei termini con la medesima potenza ${(x - x_{0})}^{r}$ . Si trova ${(x - x_{0})}^{r}$ quando si fa il prodotto di $b_{k} {(x - x_{0})}^{k}$ con tutti i termini della forma

a_{r - k} {(x - x_{0})}^{r - k} .

Ossia, il coeffciente di ${(x - x_{0})}^{r}$ viene ad essere

\sum_{k = 0}^{r} b_{k} a_{r - k} .

Ciò suggerisce la definizione di prodotto alla Cauchy, definito da

[\sum_{n = 0}^{+ \infty} a_{n} {(x - x_{0})}^{n}] [\sum_{k = 0}^{+ \infty} b_{k} {(x - x_{0})}^{k}] = \sum_{r = 0}^{+ \infty} [\sum_{k = 0}^{r} b_{k} a_{r - k}] {(x - x_{0})}^{r} .

E’ appena il caso di notare che il “nome“ degli indici non ha effetto sulla somma della serie. Si sono usati “nomi” diversi ( $n$ , $k$ ed $r$ ) solo per chiarezza. Il teorema che si può provare è il seguente:

Teorema 73 Due serie di potenze abbiamo raggio di convergenza rispettivamente $r_{1}$ ed $r_{2}$ coan $r_{1} \leq r_{2}$ . La serie prodotto alla Cauchy ha raggio di convergenza almeno uguale ad $r_{1}$ .

Osservazione 74 Consideriamo l’esempio seguente:

[\sum_{n = 0}^{+ \infty} x^{2 n}] \cdot [\sum_{k = 0}^{+ \infty} x^{5 k}]

Il prodotto alla Cauchy contiene potenze $x^{r}$ solo se $r$ può scriversi nella forma

r = 2 n + 5 k

per certi valori di $n$ e $k$ . Il coeffciente di questa potenza è la somma di tanti numeri $1$ quanti sono i modi di scrivere $r$ in tale forma. Ma ora,

\sum_{n = 0}^{+ \infty} x^{2 n} = \frac{1}{1 - x^{2}}, \sum_{k = 0}^{+ \infty} x^{5 k} = \frac{1}{1 - x^{5}}

e il loro prodotto è

\frac{1}{1 - x^{2} - x^{5} + x^{7}} .

Vedremo, al paragrafo 2.4.3, un modo diverso per rappresentare questa funzione come somma di una serie di potenze, che calcola i coeffcienti della (unica!) espansione in serie di potenze facendo derivate. precisamente vedremo che il coeffciente $c_{r}$ di $x^{r}$ è

c_{r} = \frac{1}{r!} D_{x_{0} = 0}^{r} [\frac{1}{1 - x^{2} - x^{5} + x^{7}}] .

In questo modo, dato $r$ , si calcola facilmente in quanti modi questo si può rappresentare come somma di tante “monete” di valore $2$ e tante “monete” di valore $5$ . _

2.4.2 Serie di potenze nel campo complesso

Le operazioni algebriche e le operazioni di limite possono anche calcolarsi tra numeri complessi. Quindi, le serie di potenze possono trattarsi anche nel campo complesso. Il Teorema 61 e il Teorema 63 si riformulano come segue:

Teorema 75 (Teorema di Abel) Una serie di potenze

\sum a_{n} {(z - z_{0})}^{n},

nel campo complesso, converge sempre nel punto $z_{0}$ . Se converge anche in altri punti, allora essa converge in un disco aperto di centro $z_{0}$ e raggio $R > 0$ (si scrive $R = + \infty$ se la serie converge per ogni $z$ ). La convergenza è uniforme in ogni disco di centro $z_{0}$ e raggio $R_{0} < R$ ; è assoluta in ciascun punto $z$ interno al disco di convergenza.

Per convergenza assoluta nel caso di serie di potenze a valori complessi, si intende la convergenza della serie⁵

\sum | a_{n} | \cdot | z - z_{0} |^{n} .

La dimostrazione è del tutto analoga a quella vista per le serie di potenze reali. Però, ora può mostrarsi di più: sia $f (z)$ la somma di una serie di potenze di raggio di convergenza $R$ . Esiste almeno un punto $z_{1}$ tale che $| z_{1} - z_{0} | = R$ , nel quale la funzione $f (z)$ non è regolare. Ciò chiarisce la stranezza notata all’Esempio 64. Per $| x | < 1$ vale

\frac{1}{1 + x^{2}} = \sum_{n = 0}^{+ \infty} {(- 1)}^{n} x^{2 n}

e la funzione $1 ∕ (1 + x^{2})$ è di classe $C^{\infty} (ℝ)$ . Non si vede quindi quale fenomeno possa bloccare la convergenza della serie. Se però la serie si legge nel campo complesso, allora

\frac{1}{1 + z^{2}} = \sum_{n = 0}^{+ \infty} {(- 1)}^{n} z^{2 n}

e la funzione $1 ∕ (1 + z^{2})$ non è definita nei punti $\pm i$ , che distano $1$ dal centro della serie.

2.4.3 Serie di Taylor

Sia $f (x)$ una funzione di classe $C^{\infty}$ in un intorno di $x_{0}$ . Ad essa può associarsi la serie di Taylor

\sum_{n = 0}^{+ \infty} \frac{1}{n!} f^{(n)} (x_{0}) {[x - x_{0}]}^{n} .

Questa si chiama la serie di Taylor della funzione $f$ . Questa serie può non convergere e, se converge, può non convergere alla funzione $f$ , come mostra l’esempio seguente:

Esempio 76 Sia

f (x) = \{\begin{matrix} e^{- 1 ∕ x^{2}} & s e & x \neq 0 \\ 0 & s e & x = 0 . \end{matrix}

Questa funzione è di classe $C^{\infty}$ su $ℝ$ e le sue derivate in $x_{0} = 0$ sono tutte nulle. Dunque la serie di Taylor di centro $0$ associata ad $f (x)$ ha tutti i coeffcienti nulli: converge su $ℝ$ alla funzione identicamente zero e non ad $f$ . _

Ci possiamo chiedere quindi sotto quali condizioni la serie di Taylor di $f$ effettivamente converga ad $f$ . Scrivendo la formula di Taylor di $f (x)$ arrestata all’ordine $k$ e col resto in forma di Lagrange, si vede che

f (x) = \sum_{n = 0}^{k} \frac{1}{n!} f^{(n)} (x_{0}) {[x - x_{0}]}^{n} + \frac{1}{(k + 1)!} f^{(k + 1)} (s_{k}) {[x - x_{0}]}^{k + 1}

dove $s_{k}$ dipende da $k$ ed è compreso tra $x_{0}$ ed $x$ . La serie di Taylor converge ad $f$ quando il resto converge a zero. Una condizione perché ciò accada è:

Teorema 77 Esistano $M$ , $L$ tali che

| f^{(k)} (x) | < M L^{k} \forall x \in [x_{0} - r, x_{0} + r] .

La serie di Taylor di $f (x)$ converge su $[x_{0} - r, x_{0} + r]$ e converge alla funzione $f (x)$ .

Dim. Ricordiamo che per ogni $x$ si ha

lim_{n \to + \infty} \frac{x^{n}}{n!} = 0 .

Si osservi ora che

\frac{1}{(k + 1)!} |f^{(k + 1)} (s_{k}) {[x - x_{0}]}^{k + 1}| < M \frac{{(L r)}^{k + 1}}{(k + 1)!} .

Il membro destro tende a zero e quindi, per il criterio del confronto, tende a zero uniformemente anche l’errore

|f (x) - \sum_{n = 0}^{k} \frac{1}{n!} f^{(n)} (x_{0}) {[x - x_{0}]}^{n}| = \frac{1}{(k + 1)!} |f^{(k + 1)} (s_{k}) {[x - x_{0}]}^{k + 1}| .

La condizione del Teorema 77 è soddisfatta nel caso delle funzioni di cui correntemente si usano gli sviluppi di Taylor, almeno su un opportuno intervallo. La tabella seguente riporta alcune funzioni e il raggio di convergenza della relativa serie di McLaurin (ossia, della serie di Taylor di centro $0$ ).

\begin{matrix} Funzione & Raggio di conv. & Serie \\ e^{x} & + \infty & \sum_{n = 0}^{^{\infty}} \frac{x^{n}}{n!} \\ sin x & + \infty & \sum_{n = 0}^{+ \infty} {(- 1)}^{n} \frac{x^{2 n + 1}}{(2 n + 1)!} \\ cos x & + \infty & \sum_{n = 0}^{+ \infty} {(- 1)}^{n} \frac{x^{2 n}}{(2 n)!} \\ sinh x & + \infty & \sum_{n = 0}^{+ \infty} \frac{x^{2 n + 1}}{(2 n + 1)!} \\ cosh x & + \infty & \sum_{n = 0}^{+ \infty} \frac{x^{2 n}}{(2 n)!} \\ log (1 + x) & 1 & \sum_{n = 0}^{+ \infty} (\overset{α}{n}) x^{n} \\ {(1 + x)}^{α} & 1 & \sum_{n = 0}^{+ \infty} (\overset{α}{n}) x^{n} \end{matrix}

Infine, studiamo la relazione tra parità di una funzione e sua serie di Taylor. Vale:

Teorema 78 Sia

f (x) = \sum_{n = 0}^{+ \infty} a_{n} x^{n} .

La funzione è pari se e solo se sono nulli i coeffcienti $a_{n}$ di indice dispari; la funzione è dispari se e solo se sono nulli i coeffcienti $a_{n}$ di indice pari.

Dim. Sia $f (x)$ sviluppabile in serie di Taylor. Se è dispari, essa si annulla in $0$ . Dunque $a_{0} = 0$ . La sua derivata prima è pari ma la derivata seconda è dispari e quindi $f^{″} (0) = 0$ ossia vale anche $a_{2} = 0$ . Iterando questo procedimento si vede che ogni $a_{2 k}$ è nullo. Se $f (x)$ è pari, sono dispari tutte le sue derivate di ordine dispari e quindi sono nulli gli $a_{2 k + 1}$ . Il viceversa è ovvio. _

2.4.4 Serie di potenze ed equazioni differenziali lineari

Consideriamo il problema di Cauchy

x^{'} = a x, x (0) = x_{0} .

Il coeffciente $a$ è costante. Per definizione, la soluzione $x$ è continua e quindi, dall’uguaglianza, è addiritture continuamente derivabile; e quindi

x^{″} = a x^{'} = a^{2} x .

Così proseguendo,

x^{(n)} = a^{n} x

e quindi, per $t = 0$ ,

x^{(n)} (0) = a^{n} x_{0} .

Dunque, la soluzione $x (t)$ è di classe $C^{\infty}$ e verifica le condizioni del Teorema 77 su tutti gli intervalli chiusi contenenti $x_{0}$ . Dunque, la soluzione si esprime in forma di serie di potenze

x (t) = \sum_{n = 0}^{+ \infty} \frac{1}{n!} a^{n} t^{n}

D’altra parte si verifica immediatamente che questa è la serie dell’esponenziale e quindi si ritrova il risultato noto

x (t) = e^{a t} x_{0} .

Consideriamo ora il sistema di equazioni differenziali lineari

{\vec{x}}^{'} = A \vec{x}

(2.8)

ove $\vec{x}$ è un vettore di $ℝ^{n}$ ed $A$ è una matrice $n \times n$ che è costante, ossia non dipende n’e da $t$ n’e da $x$ . Vogliamo rappresentare la soluzione di questo sistema che verifica l’ulteriore condizione

\vec{x} (t_{0}) = {\vec{x}}_{0} .

E’ facile vedere che tutto ciò che abbiamo detto sulle serie di potenze e sulle serie di Taylor si estende senza cambiamenti a funzioni a valori vettori o matrici e quindi è ancora vero che

\vec{x} (t) = (\sum_{n = 0}^{+ \infty} \frac{1}{n!} A^{n} {(t - t_{0})}^{n}) {\vec{x}}_{0} .

Questa serie si indica col simbolo

e^{A (t - t_{0})} = \sum_{n = 0}^{+ \infty} \frac{1}{n!} A^{n} {(t - t_{0})}^{n} .

(2.9)

Ciò definisce l’esponenziale di una matrice, e la (2.9) rappresenta in forma compatta le soluzioni dell’equazione differenziale lineare a coeffcienti costanti (2.8):

Osservazione 79 Va notato un fatto importante: l’esponenziale di matrice può essere un polinomio. Per esempio, se

A = [\begin{matrix} 0 & 1 \\ 0 & 0 \end{matrix}]

allora $A^{2} = 0$ e quindi

e^{A t} = [\begin{matrix} 1 & t \\ 1 & 0 \end{matrix}] :

$e^{A t}$ è un polinomio di primo grado. Si prova invece che se

A = [\begin{matrix} 0 & 1 \\ - 1 & 0 \end{matrix}]

allora

e^{A t} = [\begin{matrix} cos t & sin t \\ - sin t & cos t \end{matrix}] .

Proprietà importanti della matrice esponenziale $e^{A t}$ sono espresse dal teorema seguente, che non proviamo:

Teorema 80 Vale:

$A e^{A t} = e^{A t} A$ .
$det e^{A} = exp {\sum_{i = 1}^{n} a_{i i}} .$ Dunque, $det e^{A}$ è sempre diverso da zero: la matrice $e^{A}$ è invertibile per ogni $A$ .
${[e^{A}]}^{- 1} = e^{- A}$ .
Se $A B = B A$ allora $e^{A} e^{B} = e^{A + B}$ . In particolare, vale sempre $e^{A t} e^{A t^{'}} = e^{A (t + t^{'})}$ .
La funzione $t \to e^{A t}$ è derivabile e $\frac{d}{d t} e^{A t} = A e^{A t} .$

L’introduzione dell’esponenziale $e^{A t}$ della matrice $A t$ permette anche di rappresentare la soluzione del problema

{\vec{x}}^{'} = A \vec{x} + \vec{f} (t) \vec{x} (t_{0}) = {\vec{x}}_{0} .

Procediamo esattamente come già si è visto (nel corso di Analisi Matematica 1) per l’equazione scalare: moltiplicando i due membri per $e^{- A t}$ si trova

e^{- A t} {\vec{x}}^{'} (t) - A e^{- A t} \vec{x} (t) = e^{- A t} \vec{f} (t) .

(2.10)

La regola della derivata del prodotto si estende al prodotto di una matrice per un vettore⁶ e quindi la (2.10) è

\frac{d}{d t} (e^{- A t} \vec{x} (t)) = e^{- A t} \vec{f} (t) .

Integrando i due membri da $t_{0}$ a $t$ si trova

e^{- A t} \vec{x} (t) - e^{- A t_{0}} {\vec{x}}_{0} = \int_{t_{0}}^{t} e^{- A s} \vec{f} (s) d s .

(2.11)

Moltiplichiamo i due membri di (2.11) per $e^{A t}$ e usiamo le proprietà nel teorema 80. Si trova

\vec{x} (t) = e^{A (t - t_{0})} {\vec{x}}_{0} + \int_{0}^{t} e^{A (t - s)} \vec{f} (s) d s .

2.5 Serie di Fourier: introduzione

Oltre alle serie di potenze, nelle applicazioni si incontrano molti altri tipo di “serie di funzioni”, la cui teoria comunque è sostanzialmente più complessa e viene qui esaminata per sommi capi nel caso di gran lunga più importante delle serie di Fourier. Si chiamano serie di Fourier le serie del tipo

a_{0} + \sum_{n = 1}^{+ \infty} [a_{n} cos n \frac{π}{L} x + b_{n} sin n \frac{π}{L} x] .

(2.12)

I coeffcienti $a_{n}$ e $b_{n}$ sono reali. Se $L = π$ si trova

a_{0} + \sum_{n = 1}^{N} [a_{n} cos n x + b_{n} sin n x] .

Si noti che, usando $sin 0 x = 0$ , si potrebbe assorbire il coeffciente $a_{0}$ nella serie scritta con $n \geq 0$ invece che con $n \geq 1$ . Vedremo che c’è una buona ragione per separare $a_{0}$ dagli $a_{n}$ con $n > 0$ . Ovviamente una serie di Fourier non sempre converge. La convergenza sarà implicata da opportune proprietà dei coeffcienti $a_{n}$ e $b_{n}$ . Per esempio, certamente si ha convergenza (uniforme) quando $a_{n} = b_{n} = q^{n}$ , con $| q | < 1$ . Il problema della convergenza puntuale o uniforme delle serie di Fourier comunque è assai delicato e lo illustreremo più avanti. Per ora notiamo che se la serie converge per un $x_{0} \in [- L, L]$ allora essa converge in ogni punto $x_{0}$ di forma $x_{0} + 2 k L$ con $k$ intero; e se converge per ogni $x \in [- L, L]$ essa converge per ogni $x \in ℝ$ e converge ad una funzione peridica di periodo $T = 2 L$ . Per questa ragione, prima di studiare le serie di Fourier, vogliamo richiamare alcune proprietà delle funzioni periodiche.

2.5.1 Premesse: le funzioni periodiche

Sia $f (x)$ una funzione della variabile reale $x$ . Si dice che $f (x)$ è periodica di periodo $T$ quando:

E’ $T \neq 0$ .
la funzione $f (x)$ è definita in $x + T$ se e solo se è definita in $x$ . E’ conseguenza di questo che la funzione è definita in $x + n T$ (ove $n$ è intero qualsiasi) se e solo se è definita in $x$ .
per ogni $x$ nel dominio della funzione, si ha $f (x) = f (x + T)$ e quindi anche $f (x) = f (x + n T)$ per ogni numero intero $n$ .

Teorema 81 Sia $f (x)$ periodica di periodo $T$ e sia $S$ numero reale. La funzione $f (S x)$ ha periodo $T ∕ S$ . In particolare, se $S = T ∕ (2 π)$ , la funzione ha periodo $2 π$ .

La verifica è immediata:

f (S (x + T ∕ S)) = f (T + S x) = f (S x) .

Una funzione periodica non ha un solo periodo: se $T$ è un periodo anche $2 T$ , $- T$ , $- 2 T$ ecc. sono periodi. L’insieme dei periodi positivi ha però un estremo inferiore che può essere nullo⁷. Molto spesso, quando si parla di “periodo” di una funzione periodica si intende che esista un minimo periodo positivo, e per periodo si intende tale numero⁸. Se $T$ è il (minimo) periodo di $f (x)$ , allora $1 ∕ T$ si chiama la frequenza di $f (x)$ mentre $2 π ∕ T$ si chiama la frequenza angolare di $f (x)$ . Per esempio, le funzioni $sin ω x$ e $cos ω x$ sono funzioni periodiche di periodo $2 π ∕ ω$ ovunque definite mentre $tan ω x$ è una funzione di periodo $π ∕ ω$ , che però non è ovunque definita.

Osservazione 82 Vediamo come i concetti precedenti si applicano alla serie di Fourier (2.12). Le funzioni $cos n (π ∕ L) x$ e $sin n (π ∕ L) x$ hanno (minimo) periodo $2 L ∕ n$ e quindi tutti i termini della serie di Fourier hanno periodo (non necessariamente minimo) $T = 2 L$ . Per questa ragione potremo limitarci a studiare la serie di Fourier sull’intervallo $[- L, L]$ o su un qualsiasi altro intervallo di lunghezza $2 L$ , per esempio $[0, 2 L]$ . La frequenza di $cos n (π ∕ L) x$ e $sin n (π ∕ L) x$ è $n ∕ 2 L$ mentre la loro frequenza angolare è

2 π \frac{1}{T} = n \frac{π}{L} :

il coeffciente di $x$ nei due termini in posizione $n$ della serie di Fourier è la frequenza angolare $n π ∕ L$ . _

Vale:

Teorema 83 Sia $f (t)$ continua su $ℝ$ e periodica di periodo $T$ . Per ogni $x \in ℝ$ si ha

\int_{0}^{T} f (s) d s = \int_{x}^{x + T} f (s) d s, \int_{0}^{T} f (x + s) d s = \int_{0}^{T} f (s) d s .

Dim. Conviene provare la prima uguaglianza in due passi:

Passo 1. Proviamo che per ogni

k

intero si ha:

\int_{0}^{T} f (s) d s = \int_{k T}^{(k + 1) T} f (s) d s;

ossia proviamo l’uguaglianza richiesta nel caso particolare $x = k T$ . Per questo sostituiamo $s = k T + r$ nell’integrale a destra. Si trova

\int_{k T}^{(k + 1) T} f (s) d s = \int_{0}^{T} f (k T + r) d r = \int_{0}^{T} f (r) d r .

L’ultima uguaglianza vale perché la funzione è periodica di periodo $T$ e quindi $f (k T + r) = f (r)$ .

Passo 2. Consideriamo ora il caso generale

k T < x < (k + 1) T < x + T .

Proviamo che vale

\int_{x}^{x + T} f (s) d s = \int_{k T}^{(k + 1) T} f (s) d s .

Ciò fatto, l’uguaglianza richiesta seguirà dal passo 1. Per capire questa parte del calcolo, si guardi la figura 2.8. Come suggerito dalla figura, scriviamo

\int_{x}^{x + T} f (s) d s = \int_{x}^{(k + 1) T} f (s) d s + \int_{(k + 1) T}^{x + T} f (s) d s .

(2.13)

La sostituzione $s = T + r$ mostra che

\int_{(k + 1) T}^{x + T} f (s) d s = \int_{k T}^{x} f (T + r) d r = \int_{k T}^{x} f (r) d r .

L’ultima uguaglianza vale perché $f (x)$ è periodica di periodo $T$ e quindi $f (r) = f (T + r)$ . Tornando alla (2.13) si vede che

\int_{x}^{x + T} f (s) d s = \int_{x}^{(k + 1) T} f (s) d s + \int_{k T}^{x} f (r) d r = \int_{k T}^{(k + 1) T} f (r) d r,

come volevamo provare.

figura 2.8: Illustrazione del Teorema 83

Nel piano cartesiano è rappresentato il grafico di una funziona periodica; in particolare, sono evidenziate le parti di piano sottese dal grafico della funzione che, a motivo della periodicità, hanno la stessa area.

La seconda uguaglianza è conseguenza della prima perché

\int_{0}^{T} f (x + s) d s = \int_{x}^{x + T} f (r) d r = \int_{0}^{T} f (r) d r .

Si noti che nel teorema precedente $T$ non è necessariamente il minimo periodo. _

2.5.2 Premesse: le formule d’Eulero

Ricordiamo le formule d’Eulero, incontrate nello studio delle equazioni differenziali lineari:

e^{i x} = cos x + i sin x

e quindi

e^{- i x} = cos x - i sin x .

Osservazione 84 Le formule d’Eulero mostrano che la funzione $x \to e^{i x}$ è periodica di periodo $2 π$ . E’ anche vero che l’estensione della funzione esponenziale al piano complesso

e^{x + i y} = e^{x} (cos y + i sin y)

è periodica di periodo $2 π i$ , ossia è periodica quando il suo argomento si muove parallelamente all’asse immaginario. _

Sommando e sottraendo membro a membro, si trovano le uguaglianze

sin x = \frac{e^{i x} - e^{- i x}}{2 i}, cos x = \frac{e^{i x} + e^{- i x}}{2} .

Anch’esse vanno sotto il nome di formule d’Eulero Sostituendo queste espressioni in

a_{0} + \sum_{n = 1}^{N} [a_{n} cos n x + b_{n} sin n x]

si trova (si ricordi che $- i = 1 ∕ i$ )

a_{0} + \sum_{n = 1}^{N} \frac{a_{n} - i b_{n}}{2} e^{i n x} + \sum_{n = 1}^{N} \frac{a_{n} + i b_{n}}{2} e^{- i n x} = \sum_{n = - N}^{N} c_{n} e^{i n x}

ove ora i $c_{n}$ sono i numeri complessi

\{\begin{matrix} c_{0} = a_{0} \\ c_{n} = \frac{a_{n} - i b_{n}}{2} & s e & n > 0 \\ c_{n} = \frac{a_{n} + i b_{n}}{2} & s e & n < 0 \end{matrix}

(2.14)

e quindi tali che

c_{- n} = {\bar{c}}_{n} .

Si osservi che anche in questa scrittura il termine con $n = 0$ ha un ruolo particolare: $c_{0} = {\bar{c}}_{0}$ è reale. Sostituendo in

a_{0} + \sum_{n = 1}^{N} [a_{n} cos n \frac{π}{L} x + b_{n} sin n \frac{π}{L} x]

(2.15)

si trova

\sum_{n = - N}^{N} c_{n} e^{i n (π ∕ L) x}

(2.16)

con i coeffcienti $c_{n}$ ancora dati da (2.14) e quindi con

c_{- n} = {\bar{c}}_{n}, e c_{0} = {\bar{c}}_{0} .

(2.17)

E’ facile vedere che si fa anche il passaggio inverso: se valgono le (2.17) allora nella (2.16) i termini puramente immaginari si elidono e la somma (2.16) si riduce a (2.15), con coeffcienti reali. Un’espressione della forma (2.16) si chiama un polinomio trigonometrico Se valgono le (2.17), il polinomio trigonometrico (2.16) si può scrivere nella forma “reale” (2.15). L’espressione (2.15) è una somma parziale della serie di Fourier (2.12). Per questa ragione, la serie di Fourier (2.12) si può anche scrivere in “forma complessa”,

\sum_{n - = \infty}^{+ \infty} c_{n} e^{i n (π ∕ L) x} .

(2.18)

Il fatto importante da ricordare è che se vogliamo che questa serie corrisponda alla (2.12) le somme parziali vanno prese in modo simmetrico: le somma parziali sono

\sum_{n = - N}^{N} c_{n} e^{i n (π ∕ L) x}

(2.19)

e non

\sum_{n = - K}^{N} c_{n} e^{i n (π ∕ L) x}

(2.20)

con $K$ ed $N$ tra loro indipendenti. E infatti può accadere che per $K \to - \infty$ ed $N \to + \infty$ , indipendentemente, la (2.20) non ammetta limite nemmeno se (2.19) ammette limite per $N \to + \infty$ . Avremo bisogno di calcolare derivate e integrali di funzioni

f (x) + i g (x)

della variabile reale $x$ , a valori numeri complessi. Per definizione,

\frac{d}{d x} [f (x) + i g (x)] = f^{'} (x) + i g^{'} (x), \int_{a}^{b} [f (x) + i g (x)] d x = \int_{a}^{b} f (x) d x + i \int_{a}^{b} g (x) d x

e quindi

\int_{a}^{b} \frac{d}{d x} [f (x) + i g (x)] d x = [f (b) + i g (b)] - [f (a) + i g (a)] .

Essendo

\frac{d}{d x} e^{i n x} = i n e^{i n x},

si trova:

\{\begin{matrix} \int_{- π}^{π} cos n x cos m x d x & = & \{\begin{matrix} 2 π & s e & n = m = 0 \\ 0 & s e & n \neq m \\ π & s e & n = m \neq 0 \end{matrix} \\ \int_{- π}^{π} sin n x cos m x d x & = & 0 per ogni n, m . \\ \int_{- π}^{π} sin n x sin m x d x & = & \{\begin{matrix} 0 & s e & n \neq m \\ π & s e & n = m \end{matrix} \end{matrix}

(2.21)

Per verificare la prima delle uguaglianze precedenti (con $n \neq m$ ) calcoliamo, usando le formule d’Eulero

\begin{aligned} \int_{- π}^{π} cos n x cos m x d x = \frac{1}{4} \int_{- π}^{π} [e^{i n x} + e^{- i n x}] [e^{i m x} + e^{- i m x}] d x \\ = \frac{1}{4} \int_{- π}^{π} [e^{i (n + m) x} + e^{i (n - m) x} + e^{- i (n + m) x} + e^{- i (n - m) x}] d x . \end{aligned}

L’asserto ora segue perchè, essendo per esempio

\frac{d}{d x} e^{i (n + m) x} = i (n + m) e^{i (n + m) x},

si ha

\int_{- π}^{π} e^{i (n + m) x} d x = \frac{1}{i (n + m)} [e^{i (n + m) π} - e^{- i (n + m) π}] = \frac{2}{n + m} sin ((n + m) π) = 0 .

Le altre uguaglianze si provano in modo analogo.

Osservazione 85 a queste conclusioni si può arrivare in modo più elementare se si ricordano le formule di Werner. il primo integrale si può calcolare ricordando che

[cos n x] [cos m x] = \frac{1}{2} [cos (n + m) x + cos (n - m) x] .

Più in generale, su un intervallo $[- L, L]$ vale

\{\begin{matrix} \int_{- L}^{L} e^{i n (π ∕ L) x} d x & = & \{\begin{matrix} 2 L & s e & n = 0 \\ 0 & s e & n \neq 0 \end{matrix} \\ \int_{- L}^{L} cos n x cos m x d x & = & \{\begin{matrix} 2 L & s e & n = m = 0 \\ 0 & s e & n \neq m \\ L & s e & n = m \end{matrix} \\ \int_{- L}^{L} sin n x cos m x d x & = & 0 per ogni n, m . \\ \int_{- L}^{L} sin n x sin m x d x & = & \{\begin{matrix} 0 & s e & n \neq m \\ L & s e & n = m \end{matrix} \end{matrix}

(2.22)

Le uguaglianze precedenti mostrano che le funzioni

\frac{1}{\sqrt{2 L}}, \frac{1}{\sqrt{L}} cos n \frac{π}{L} x, \frac{1}{\sqrt{L}} sin n \frac{π}{L} x,

equivalentemente

\frac{1}{\sqrt{2 L}} e^{i n (π ∕ L) x},

sono due a due ortogonali in $ℒ^{2} (- L, L)$ e tutte di norma uguale ad $1$ . Si dice brevemente che sono sistemi ortonormali in $ℒ^{2} (- L, L)$ . Quest’osservazione suggerisce che l’ambiente in cui è più facile studiare la serie di Fourier sia lo spazio $ℒ^{2} (- L, L)$ e non lo spazio $C (- L, L)$ .

2.6 La serie di Fourier in $ℒ^{2} (- L, L)$

Non è stato possibile introdurre in modo rigoroso lo spazio $ℒ^{2} (- L, L)$ e ciò indica che lo studio della serie di Fourier è molto più complesso di quello delle serie di potenze, e può essere solo accennato. Consideriamo il polinomio trigonometrico

\sum_{n = - N}^{N} c_{n} e^{i n (π ∕ L) x}, c_{n} = {\bar{c}}_{- n}

(2.23)

equivalentemente, se $c_{n} = a_{n} + i b_{n} = {\bar{c}}_{- n}$ ,

a_{0} + \sum_{n = 1}^{N} [a_{n} cos n (π ∕ L) x + b_{n} sin n (π ∕ L) x] .

(2.24)

Indichiamo questo polinomio trigonometrico col simbolo $P (x)$ . Ovviamente, $P (x)$ è una funzione continua e periodica su $ℝ$ . Se i valori di $P (x)$ su $[- L, L]$ si conoscono, da questi si ricavano facilmente i coeffcienti $c_{n}$ ed i coeffcienti $a_{n}$ e $b_{n}$ . Infatti, moltiplicando i due membri dell’uguaglianza

P (x) = \sum_{n = - N}^{N} c_{n} e^{i n (π ∕ L) x}

per $e^{- i r (π ∕ L) x}$ e integrando su $[- L, L]$ si trova $0$ se $r \neq N$ . Altrimenti si trova

c_{r} = \frac{1}{2 L} \int_{- π}^{π} P (x) e^{- i r (π ∕ L) x} d x .

Analogamente,

\{\begin{matrix} a_{0} & = & \frac{1}{2 L} \int_{- L}^{L} P (x) d x \\ a_{k} & = & \frac{1}{L} \int_{- L}^{L} P (x) cos k (π ∕ L) x d x & (se k > 0) \\ b_{k} & = & \frac{1}{L} \int_{- L}^{L} P (x) sin k (π ∕ L) x d x . \end{matrix}

(ossia, la formula per $a_{0}$ non si ottiene da quella di $a_{k}$ ponendo $k = 0$ . Per questa ragione conviene scrivere $a_{0}$ separato dalla sommatoria). Vale inoltre:

Teorema 86 E’:

\{\begin{matrix} \frac{1}{2 L} \int_{- L}^{L} | P (x) |^{2} d x = \sum_{n = - N}^{+ N} | c_{n} |^{2} \\ \frac{1}{2 L} \int_{- L}^{L} | P (x) |^{2} d x = a_{0}^{2} + \frac{1}{2} \sum_{n = 1}^{+ \infty} (a_{n}^{2} + b_{n}^{2}) . \end{matrix}

(2.25)

L’identità precedente va sotto il nome di Identità di Parseval Si noti il significato di $a_{0}$ e di $c_{0}$ : questi numeri sono le medie integrali di $P (x)$ . Analogamente, il membro sinistro dell’identità di Parseval è la media integrale di $| P (x) |^{2}$ . Sia ora $f (x) \in ℒ [- L, L]$ . Chiamiamo coeffcienti di Fourier della funzione $f (x)$ i numeri

c_{r} = \frac{1}{2 L} \int_{- L}^{L} f (x) e^{- i r (π ∕ L) x} d x

(2.26)

(se vogliamo scrivere la serie di Fourier con gli esponenziali complessi),

\{\begin{matrix} a_{0} & = & \frac{1}{2 L} \int_{- L}^{L} f (x) d x \\ a_{k} & = & \frac{1}{L} \int_{- L}^{L} f (x) cos k (π ∕ L) x d x & (se k > 0) \\ b_{k} & = & \frac{1}{L} \int_{- L}^{L} f (x) sin k (π ∕ L) x d x \end{matrix}

(2.27)

(se vogliamo scrivere la serie di Fourier nel campo reale). Si chiama serie di Fourier associata alla funzione $f (x)$ la serie (2.12) con i coeffcienti dati da (2.27) o, equivalentemente, la serie (2.18) con i coeffcienti dati da (2.26). Per fissare le idee e scrivere formule più semplici, usiamo ora la serie di Fourier scritta mediante gli esponenziali complessi. Considerazioni del tutto analoghe valgono anche per la serie di Fourier scritta nel campo reale. Consideriamo la serie

\sum_{- \infty}^{+ \infty} c_{n} e^{i n x}

e la sua somma parziale $N$ –ma

S_{N} (x) = \sum_{- N}^{+ N} c_{n} e^{i n x} .

Si noti che $S_{N} (x)$ è il polinomio trigonometrico (2.23) e che, se $c_{n} = a_{n} + i b_{n} = {\bar{c}}_{- n}$ , allora $S_{N} (x)$ può scriversi nella forma (2.24). Si può provare:

Teorema 87 Sia $f \in ℒ^{2} (- L, L)$ . Vale:

lim_{N \to + \infty} \int_{- L}^{L} {|f (x) - S_{N} (x)|}^{2} d x = 0 o s s i a lim_{N \to + \infty} | | f - S_{N} | |_{ℒ^{2} (- L, L)} = 0 .

Inoltre, la serie converge incondizionatamente, ossia la serie converge, e sempre alla medesima funzione $f (x)$ , anche riordinandone i termini.

Dunque, la successione delle somme parziali $(S_{N} (x))$ converge ad $f (x)$ nella distanza di $ℒ^{2} (- L, L)$ . Sottolineiamo nuovamente che il teorema riguarda $S_{N} (x)$ e non per esempio una somma $\sum_{n = - K}^{n = N} c_{n} e^{i n (π ∕ L) x}$ . Anche se i $c_{n}$ sono i coeffcienti di Fourier di $f$ , niente può dirsi del comportamento di questa serie per $N \to + \infty$ , $K \to + \infty$ in modo indipendente. Diamo un’interpretazione geometrica di $S_{N} (x)$ . Consideriamo il sottospazio lineare $𝒱_{N}$ ,

𝒱_{N} = \{\sum_{n = - N}^{+ N} γ_{n} e^{i n (π ∕ L) x}, γ_{n} = {\bar{γ}}_{- n}, γ_{n} \in ℂ\}

Che è uno spazio vettoriale di dimensione $2 N + 1$ . Si ha:

Teorema 88 La somma parziale $S_{N} (x)$ di $f (x)$ è l’elemento di $𝒱_{N}$ che ha minor distanza da $f (x)$ nel senso della distanza di $ℒ^{2} (- L, L)$ .

Dim. Facciamo la dimostrazione nel caso $N = 1$ . La dimostrazione nel caso generale è analoga. Gli elementi dello spazio $𝒱_{1}$ sono le funzioni

γ_{0} + γ_{1} e^{i x} + {\bar{γ}}_{1} e^{- i x} γ_{i} \in ℂ,

equivalentemente

α_{0} + α_{1} cos (π ∕ L) x + β_{1} sin (π ∕ L) x, α_{0}, α_{1}, β_{1} \in ℝ .

Tra queste funzioni dobbiamo trovare quella che ha minima distanza da $f (x)$ . Si tratta quindi di studiare un problema di minimo al variare dei parametri complessi $γ_{0}$ e $γ_{1}$ o, equivalentemente, al variare dei parametri reali $α_{0}$ , $α_{1}$ , $β_{1}$ . Dato che i problemi di minimo che si sono studiati sono quelli di funzioni di variabile reale, conviene studiare il minimo della funzione

Φ (α_{0}, α_{1}, β_{1}) = \int_{- L}^{L} {[f (x) - α_{0} - α_{1} cos (π ∕ L) x - β_{1} sin (π ∕ L) x]}^{2} d x .

Il minimo esiste, come conseguenza del Teorema di Weierstrass, perché la funzione

(α_{0}, α_{1}, β_{1}) \to Φ (α_{0}, α_{1}, β_{1})

è continua e tende a $+ \infty$ per $| | (α_{0}, α_{1}, β_{1}) | | \to + \infty$ . Per trovarlo, annulliamo le derivate prime⁹. Si trovano le condizioni

\begin{aligned} \int_{- L}^{L} [f (x) - α_{0} - α_{1} cos (π ∕ L) x - β_{1} sin (π ∕ L) x] d x = 0 \\ \int_{- L}^{L} [f (x) - α_{0} - α_{1} cos (π ∕ L) x - β_{1} sin (π ∕ L) x] cos (π ∕ L) x d x = 0 \\ \int_{- L}^{L} [f (x) - α_{0} - α_{1} cos (π ∕ L) x - β_{1} sin (π ∕ L) x] sin (π ∕ L) x d x = 0 . \end{aligned}

Usando le uguaglianze (2.21), si trova che le tre derivate parziali si annullano solamente quando

\begin{aligned} α_{0} = (1 ∕ 2 L) \int_{- L}^{L} f (x) d x \\ α_{1} = (1 ∕ L) \int_{- L}^{L} f (x) cos x d x \\ β_{1} = (1 ∕ L) \int_{- L}^{L} f (x) sin x d x; \end{aligned}

ossia, il punto di $𝒱_{1}$ che meno dista da $f (x)$ è $S_{1} (x)$ . _ Dunque l’interpretazione della serie di Fourier in $ℒ^{2} (- L, L)$ è la seguente: per ogni $N$ si considera il sottospazio $𝒱_{N}$ di dimensione finita $2 N + 1$ di $ℒ^{2} (- L, L)$ . Si scrive la serie di Fourier di $f (x)$ e si tronca all’indice $N$ . Si trova un elemento di $𝒱_{N}$ che è proprio l’elemento che meglio approssima la funzione $f (x)$ nel senso di $ℒ^{2} (- L, L)$ . Usando una terminologia della geometria elementare, diremo che $S_{N} (x)$ è la proiezione ortogonale di $f (x)$ su $𝒱_{N}$ . Il Teorema 87 si può riassumere dicendo che la successione delle proiezioni di $f$ sui $𝒱_{N}$ converge ad $f$ in $ℒ^{2} (- L, L)$ . Diciamo infine che l’identità di Parseval vale per ogni $f (x) \in ℒ^{2} (- L, L)$ :

\frac{1}{2 L} \int_{- L}^{L} | f (x) |^{2} d x = \sum_{n = - \infty}^{+ \infty} | c_{n} |^{2}

ossia

\frac{1}{2 L} \int_{- L}^{L} | f (x) |^{2} d x = a_{0}^{2} + \frac{1}{2} \sum_{n = 1}^{+ \infty} [a_{n}^{2} + b_{n}^{2}] .

Di conseguenza:

Teorema 89 La successione dei coeffcienti di Fourier tende a zero.

L’identità di Parseval ha un’interpretazione importante per le applicazioni, che illustriamo con riferimento alla forma complessa, che scriviamo come:

\int_{- L}^{L} | f (x) |^{2} d x = 2 L [\sum_{n = - \infty}^{+ \infty} | c_{n} |^{2}] .

Interpretiamo la variabile $x$ come “posizione” ed $f (x)$ come “velocità”. Il primo integrale si interpreta come “energia” per esempio cinetica: la “somma” delle energie associate ad ogni particella del corpo. La “componente” di frequenza $n ∕ 2 L$ , ossia

c_{n} e^{i n (π ∕ L) x}

ha quindi “energia” $2 L | c_{n} |^{2}$ . Quindi,

l’energia totale ottenuta sommando le energie in tutte le posizioni è uguale alla somma delle energie delle componenti di tutte le frequenze.

Naturalmente, niente vieta che nella rappresentazione di un segnale $f (x)$ la componente di frequenza $n_{0} ∕ 2 L$ abbia “energia” nulla, ossia che $c_{n_{0}} = 0$ . Le considerazioni precedenti mostrano che l’energia di $f (x)$ si ripartisce tra i segnali $e^{i n x}$ per cui $c_{n} \neq 0$ . La successione $(n ∕ 2 L, c_{n})$ si chiama lo spettro del segnale. Infine, notiamo che l’identità di Parseval mostra che se i coeffcienti di Fourier sono tutti nulli allora la funzione è nulla, ed ovviamente vale anche il viceversa. Ossia:

Teorema 90 Due funzioni $f$ , $g$ in $ℒ^{2} (- L, L)$ con i medesimi coeffcienti di Fourier verificano

\int_{- L}^{L} {|f (x) - g (x)|}^{2} d x = 0 .

(2.28)

Se accade che le due funzioni $f (x)$ e $g (x)$ sono continue, allora la condizione (2.28) implica che esse coincidono. In generale, se vale (2.28), le due funzioni possono “considerarsi equivalenti” nel senso che danno il medesimo contributo alle espressioni integrali nelle quali figurano.

Il calcolo dei coeffcienti di Fourier

Il calcolo dei coeffcienti di Fourier richiede il calcolo di integrali piuttosto noiosi. In certi casi si possono usare dei trucchi che semplificano il calcolo. Per esempio:

Il prodotto di una funzione pari e di una dispari è dispari; e una funzione dispari ha integrale nullo su $[- L, L]$ . Dunque, se $f (x)$ è dispari, i coeffcienti $a_{n}$ sono tutti nulli. Analogamente, se $f (x)$ è pari i coeffcienti $b_{n}$ sono tutti nulli.

Si voglia calcolare la serie di Fourier della funzione

f (x) = x

. Questa è una funzione dispari e quindi vanno calcolati i soli coeffcienti

b_{n}

b_{n} = \frac{1}{L} \int_{- L}^{L} x sin n \frac{π}{L} x d x .

Questi integrali si calcolano facilmente per parti ma ciò richiede un calcolo indipendente per ogni valore di $n$ . Un modo più veloce è il seguente: si consideri la funzione

s \to x sin s x o s s i a s \to - \frac{d}{d s} cos s x .

Il numero $L b_{n}$ è il valore per $s = n π ∕ L$ della funzione¹⁰

\begin{aligned} - \int_{- L}^{L} \frac{d}{d s} cos s x d x = - \frac{d}{d s} \int_{- L}^{L} cos s x d x = \\ - \frac{d}{d s} \{\frac{2}{s} sin s L\} = \frac{2}{s^{2}} sin s L - \frac{2 L}{s} cos s L \end{aligned}

(formula valida per $s \neq 0$ ). Calcolando per $s = n π ∕ L$ e dividendo per $L$ , si trova

b_{n} = 2 {(- 1)}^{n + 1} \frac{L}{n π} .

Dunque,

x = 2 \frac{L}{π} \sum_{n = 1}^{+ \infty} \frac{{(- 1)}^{n + 1}}{n} sin n \frac{π}{L} x .

(2.29)

Procedendo in modo analogo si verifichi che

x^{2} = \frac{L^{2}}{3} - \frac{4 L^{2}}{π^{2}} [\sum_{n = 1}^{+ \infty} \frac{{(- 1)}^{n}}{n^{2}} cos n \frac{π}{L} x] .

Generalmente non è lecito derivare termine a termine una serie di Fourier. Invece, se

f (x) \in ℒ^{2} (- L, L)

, la serie di Fourier di

f (x)

può integrarsi termine a termine: se

f (x) = a_{0} + \sum_{n = 1}^{+ \infty} [a_{n} cos n (π ∕ L) x + b_{n} sin n (π ∕ L) x]

allora

\begin{aligned} F (x) = \int_{0}^{x} f (s) d s = a_{0} x + \frac{L}{π} \sum_{n = 1}^{+ \infty} \frac{b_{n}}{n} \\ + \frac{L}{π} \sum_{n = 1}^{+ \infty} [\frac{a_{n}}{n} sin n (π ∕ L) x - \frac{b_{n}}{n} cos n (π ∕ L) x] . \end{aligned}

Si noti che quella ottenuta non è una serie di Fourier, a causa del primo addendo $a_{0} x$ . Se vogliamo la serie di Fourier di $F (x)$ dobbiamo esprimere anche la funzione $x$ mediante la sua serie di Fourier, usando (2.29). In questo modo si trova

\begin{aligned} F (x) = \frac{L}{π} \sum_{n = 1}^{+ \infty} \frac{b_{n}}{n} \\ + \frac{L}{π} \sum_{n = 1}^{+ \infty} [\frac{2 {(- 1)}^{n + 1} a_{0} + a_{n}}{n} sin n (π ∕ L) x - \frac{b_{n}}{n} cos n (π ∕ L) x] . \end{aligned}

2.6.1 Estensioni pari e dispari, e serie di Fourier

Il fatto seguente si è già notato: la funzione $f (x)$ sia pari,

f (x) = f (- x) .

In questo caso, ciascuna delle funzioni

f (x) sin n x

è dispari e quindi ha integrale nullo: i coeffcienti $b_{n}$ sono tutti nulli. Ovviamente, vale anche il viceversa se i coeffcienti $b_{n}$ sono tutti nulli, la somma della serie è una funzione pari. Analogamente, se $f (x)$ è dispari,

f (x) = - f (- x),

sono nulli i coeffcienti $a_{n}$ e viceversa. Dunque:

Teorema 91 Sia

f (x) = a_{0} + \sum_{n = 1}^{+ \infty} [a_{n} cos n \frac{π}{L} x + b_{n} sin n \frac{π}{L} x] .

La funzione $f (x)$ , periodica di periodo $T = 2 L$ , è pari se e solo se $b_{n} = 0$ per ogni $n$ ; è dispari se e solo $a_{n} = 0$ per ogni $n$ .

Supponiamo ora che sia data una funzione $f (x)$ definita solamente su $[0, L]$ . Ad essa possono associarsi infinite serie di Fourier, una per ciascuna “arbitraria” estensione di $f (x)$ a $[- L, 0]$ . Tra queste estensioni due sono privilegiate: l’estensione pari e l’estensione dispari. L’estensione pari conduce ad una serie di soli coseni mentre l’estensione dispari conduce ad una serie di soli seni. Dunque:

Teorema 92 Sia $f (x) \in ℒ^{2} (0, L)$ . Essa è somma di un’unica serie di Fourier di soli seni, e di un’unica serie di Fourier di soli coseni. La prima definisce l’unica estensione dispari di $f (x)$ ad $ℝ$ , periodica di periodo $2 L$ ; la seconda definisce l’unica estensione pari di $f (x)$ ad $ℝ$ , periodica di periodo $2 L$ .

Le formule per la serie di Fourier di $f (x)$ di soli seni e di soli coseni si ottengono scrivendo nelle (2.27) le opportune estensioni di $f (x)$ . Per esempio, usando l’estensione pari, per $k \neq 0$ si trova

a_{k} = (1 ∕ L) \int_{- L}^{L} f (x) cos k (π ∕ L) x d x = \frac{2}{L} \int_{0}^{L} f (x) cos k (π ∕ L) x d x .

Dato che queste formule (e la corrispondente identità di Parsevale) sono di uso molto comune, vanno ricordate. E’ bene quindi scriverle in modo esplicito:

Sviluppo di Fourier in soli coseni

Sia $f (x) \in ℒ^{2} (0, L)$ . Si ha:

f (x) = α_{0} + \sum_{n = 1}^{+ \infty} α_{n} cos n (π ∕ L) x

con

\{\begin{matrix} α_{0} & = & (1 ∕ L) \int_{0}^{L} f (x) d x \\ α_{n} & = & (2 ∕ L) \int_{0}^{L} f (x) cos n (π ∕ L) x d x & (se n > 0) \end{matrix}

(2.30)

La corrispondente identità di Parseval è

\frac{1}{L} \int_{0}^{L} | f (x) |^{2} d x = α_{0}^{2} + \sum_{n = 1}^{+ \infty} α_{n}^{2} = \sum_{n = 0}^{+ \infty} α_{n}^{2} .

Sviluppo di Fourier in soli seni

Sia $f (x) \in ℒ^{2} (0, L)$ . Si ha:

f (x) = \sum_{n = 1}^{+ \infty} β_{n} sin n (π ∕ L) x

con

β_{n} = (2 ∕ L) \int_{0}^{L} f (x) sin n (π ∕ L) x d x .

(2.31)

La corrispondente identità di Parseval è:

\frac{1}{L} \int_{0}^{L} | f (x) |^{2} d x = \sum_{n = 1}^{+ \infty} β_{n}^{2} .

Osservazione 93 Sia $f (x) = cos (π ∕ L) x$ , definita su $[0, L]$ . Vogliamo calcolarne lo sviluppo di Fourier in soli coseni ed in soli seni. Lo sviluppo di Fourier in soli coseni è

f (x) = cos (π ∕ L) x .

Invece, per lo sviluppo di Fourier di soli seni dobbiamo calcolare i coeffcienti $b_{n}$ usando la formula (2.30). Ricordiamo la formula di Werner seguente:

(sin a) (cos b) = \frac{1}{2} [sin (a + b) + sin (a - b)] .

Si trova:

\begin{aligned} β_{n} = \frac{2}{L} \int_{0}^{L} cos (π ∕ L) x sin n (π ∕ L) x d x \\ = \frac{1}{L} \int_{0}^{L} \{sin \frac{π}{L} (n + 1) x + sin \frac{π}{L} (n - 1) x\} d x \\ = - \frac{1}{π (n + 1)} \{cos π (n + 1) - 1\} - \frac{1}{π (n - 1)} \{cos π (n - 1) - 1\} \\ = \frac{4}{π} \{\begin{matrix} \frac{n}{n^{2} - 1} & se n è pari \\ 0 & se n è dispari. \end{matrix} \end{aligned}

Dunque,

cos \frac{π}{L} x = \frac{8}{π} \sum_{k = 1}^{+ \infty} \frac{k}{4 k^{2} - 1} sin 2 k \frac{π}{L} x, 0 < x < L .

E’ questa la serie di Fourier dell’estensione per periodicità della funzione $f (x)$ seguente, il cui grafico (con $L = 3$ ) è riportato in figura 2.9.

figura 2.9: Estensione per periodicità della funzione (2.32)

Nel piano cartesiano, per $x \in (0,3)$ e per $x \in (- 3,0)$ , sono rappresentati i grafici delle due funzioni decrescenti $\pm \cos (π / 3) x$ . Essi, in base alla 3-periodicitè, hanno lo stesso andamento.

f (x) = \{\begin{matrix} cos \frac{π}{L} x & s e & 0 < x < L \\ - cos \frac{π}{L} x & s e & - L < x < 0 \end{matrix}

(2.32)

2.7 La convergenza puntuale della serie di Fourier

E’ un fatto che la convergenza nel senso della norma di $ℒ^{2} (- L, L)$ non implica la convergenza puntuale, nemmeno in un solo punto. Anzi, si prova che esistono funzioni continue e periodiche su $[- L, L]$ la cui serie di Fourier non converge. Esistono però anche casi in cui la serie di Fourier converge puntualmente. Come abbiamo detto questo accade se, per esempio, $a_{n} = b_{n} = q^{n}$ con $| q | < 1$ . Ci si può chiedere se sia possibile dare condizioni sulla funzione $f (x)$ che implichino la convergenza puntuale della serie di Fourier. Condizioni per questo sono note. In particolare si ha:

Teorema 94 Sia $(a, b) \subseteq [- L, L]$ ed esistano $M$ e $α \in [0, 1]$ tali che per ogni coppia $x$ , $y$ di punti di $(a, b)$ valga

| f (x) - f (y) | < M | x - y |^{α} .

(2.33)

Sia $[a^{'}, b^{'}] \subseteq (a, b)$ . La serie di Fourier di $f (x)$ converge ad $f (x)$ uniformemente in $[a^{'}, b^{'}]$ .

Una funzione $f (x)$ ovunque derivabile con derivata limitata,

| f^{'} (x) | < M,

in particolare verifica

| f (x) - f (y) | < M | x - y |

e quindi soddisfa alle condizioni del teorema. D’altra parte le ipotesi del teorema 94 implicano la continuità della funzione $f (x)$ e questa è una condizione eccessivamente restrittiva per molte applicazioni nelle quali interviene la serie di Fourier. Per cercare di indebolire quest’ipotesi, studiamo cosa accade vicino ad un punto di salto di $f (x)$ . Vale: Vale:

Teorema 95 La funzione $f (x) \in ℒ^{2} (- L, L)$ abbia un salto nel punto $x_{0}$ . Supponiamo inoltre che esistano $a < x_{0}$ e $b > x_{0}$ tali che $f (x)$ ammetta derivata prima continua sia su $(a, x_{0})$ che su $(x_{0}, b)$ e che esistano finiti i limiti

lim_{x \to x_{0} -} f^{'} (x), lim_{x \to x_{0} +} f^{'} (x) .

In questo caso la serie di Fourier di $f (x)$ converge in ogni punto di $(a, b)$ e inoltre:

Se $[a^{'}, b^{'}] \subseteq (a, x_{0})$ oppure se $[a^{'}, b^{'}] \subseteq (x_{0}, b)$ allora la serie converge uniformemente ad $f (x)$ su $[a^{'}, b^{'}]$ .
in $x_{0}$ la serie di Fourier converge alla media dei valori dei limiti direzionali in $x_{0}$ : $\frac{1}{2} [f (x_{0} -) + f (x_{0} +)] .$

Esempio 96 Sia

χ (x) = \{\begin{matrix} - 1 & s e & - π < x < 0 \\ 5 & s e & x = 0 \\ 1 & s e & 0 < x < π . \end{matrix}

Si noti che questa funzione differisce dalla funzione $s g n (x)$ per il valore che assume in $0$ ; ma il valore assunto in un solo punto non altera gli integrali che definiscono i coeffcienti di Fourier. Dunque le funzioni definite su $[- π, π]$ ed uguali a $χ (x)$ ed a $s g n (x)$ hanno la medesima serie di Fourier, che è la serie

\frac{4}{π} (\frac{sin x}{1} + \frac{sin 3 x}{3} + \frac{sin 5 x}{5} + \dots)

Per $x = 0$ questa serie converge e converge al valore $0$ , media dei limiti direzionali di $χ (x)$ per $x \to \pm 0$ . Per il teorema 95 la somma della serie è quindi $s g n (x)$ . La convergenza non può essere uniforme perché le somme parziali sono continue mentre la somma della serie non è continua. Se si disegnano alcune somme parziali, come in figura 2.10, si vede che le somme parziali saltano sopra e sotto il valore $\pm 1$ di una quantità che non si attenua al crescere di $N$ . Calcoli piuttosto laboriosi mostrano che

lim_{N \to + \infty} S_{N} (1 ∕ N) = d

e si può mostrare che $d$ è strettamente maggiore di $1$ : $d > 1, 089$ . E quindi al crescere di $N$ l’errore tra $S_{N} (x)$ e $s g n (x)$ non si attenua (ma si concentra sempre di più intorno al salto $x = 0$ ). _

figura 2.10: Il fenomeno di Gibbs

Nel piano cartesiano sono rappresentati il grafico della funzione $sign$ e i grafici di alcune somme parziali, che oscillano intorno ai valori $y = \pm 1$ senza attenuarsi al crescere di $N$ .

Il fenomeno appena illustrato non dipende dalla particolare funzione $s g n (x)$ usata nell’esempio. Si può provare che, nelle ipotesi del Teorema 95, esso si verifica in vicinanza di ogni salto. Tale fenomeno va sotto il nome di Fenomeno di Gibbs. Infine, riportiamo alcune serie di Fourier di funzioni $f (x)$ periodiche di periodo $2 π$ e, nelle figure seguenti, i grafici della restrizione della funzione a $(- π, π)$ , con sovrapposti i grafici di alcune somme parziali. Nella colonna di sinistra della tabella, si riporta l’espressione della funzione su $(- π, π)$ . La funzione è poi estesa ad $ℝ$ per periodicità.

figura 2.11: Le serie di Fourier delle restrizioni a

(- π, π)

f (x) = s i g n x

(sinistra sopra ), di

f (x) = | x |

(destra sopra), di

f (x) = x

(sinistra sotto) e di

f (x) = | sin x |

(destra sotto)

(riquadro in alto a sinistra) Nel piano cartesiano, relativamente a $[- π, π]$ , sono riportati il grafico della funzione di salto $f (x) = \sign (x)$ e il grafico regolare di una somma parziale. Quest'ultimo approssima il grafico della funzione data. Negli altri tre riquadri sono trattate in modo analogo le funzioni $f (x) = | x |, f (x) = x, f (x) = | \sin x | .$

Capitolo 3
Lo spazio lineare normato $ℝ^{n}$

In questo capitolo richiamiamo e precisiamo alcuni concetti che dovrebbero essere noti dai corsi precedenti, in particolare dal corso di Geometria. Tratteremo

lo spazio lineare $ℝ^{n}$ .
introdurremo “norme” e “distanze” in $ℝ^{n}$ , che permetteranno di definire i punti di accumulazione, gli insiemi aperti e gli insiemi chiusi. Ciò fatto sarà possibile studiare limiti continuità e derivabilità.
introdurremo quindi il concetto di “insieme convesso” e di “insieme connesso”.
richiameremo le trasformazioni di coordinate in $ℝ^{n}$ e la loro relazione con l’orientazione dello spazio.
introdurremo altri modi (altri “sistemi di coordinate”) per rappresentare i punti di $ℝ^{2}$ e di $ℝ^{3}$ .
studieremo le funzioni da $ℝ$ in $ℝ^{n}$ .

I casi su cui insisteremo di più saranno i casi $n = 2$ ed $n = 3$ .

3.1 Lo spazio lineare $ℝ^{n}$

Non intendiamo qui richiamare la definizione astratta di spazio lineare, vista nei corsi di Geometria. Ci limitiamo a richiamare le sole nozioni necessarie per lo studio di $ℝ^{n}$ . Gli elementi di $ℝ^{n}$ sono le $n$ -ple ordinate di numeri reali che chiameremo indifferentemente “punti” o “vettori”. E’ bene essere precisi con la notazione. Una di tali $n$ -ple si potrà scrivere come una sequenza ordinata di $n$ numeri reali $x_{1}$ , $x_{2}$ , $\dots$ , $x_{n}$ scritta in orizzontale o in verticale, ossia come

[\begin{matrix} x_{1} & x_{2} & x_{3} & \dots & x_{n} \end{matrix}] oppure [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \\ ⋮ \\ x_{n} \end{matrix}] .

Noi useremo sempre la rappresentazione in verticale. Però, talvolta sarà conveniente scrivere in orizzontale, con un apice (segno di trasposizione). Ossia intendiamo

{[\begin{matrix} x_{1} & x_{2} & x_{3} & \dots & x_{n} \end{matrix}]}^{'} = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \\ ⋮ \\ x_{n} \end{matrix}] .

Notiamo inoltre che la definizione di $ℝ^{n}$ è suggerita dalla rappresentazione del piano in coordinate cartesiane. Quando $n = 2$ oppure $n = 3$ , per indicare il punto ${[\begin{matrix} x_{1} & x_{2} & x_{3} \end{matrix}]}^{'}$ useremo anche la notazione dellla geometria analitica, $P (x_{1}, x_{2}, x_{3})$ . Gli elementi di $ℝ^{n}$ , ossia i “vettori”, si indicheranno con una lettera in grassetto:

\vec{x} = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \\ ⋮ \\ x_{n} \end{matrix}] .

Ricordiamo che nei corsi di fisica i vettori si indicano con lettere in grassetto oppure con una freccia sovrapposta, $\vec{x}$ ; talvolta con una lettera maiuscola, $X$ , oppure con una lettera sottolineata, $\underset{̲}{x}$ . I numeri $x_{i}$ si chiamano le componenti del vettore $\vec{x}$ . Il vettore le cui componenti sono tutte nulle si chiama vettore nullo e si indica col simbolo $\vec{0}$ (da non confondere col simbolo $0$ usato per l’elemento nullo di $ℝ$ ). In geometria analitica, il punto $\vec{0}$ si chiama anche origine delle coordinate e si indica col simbolo $O$ , iniziale di “origine”. Di regola, se $\vec{x}$ indica un vettore, le sue componenti si indicheranno come $x_{i}$ . Ricordiamo che spesso i vettori si indicano col simbolo $\vec{v}$ , iniziale di “vettore”, ma anche col simbolo $\vec{r}$ , iniziale di “raggio vettore”. Questo per quanto riguarda le notazioni con cui si indicano gli elementi di $ℝ^{n}$ . Lo spazio $ℝ^{n}$ però non è solo un isieme di elementi, ma è anche uno spazio vettoriale¹. Infatti gli elementi di $ℝ^{n}$ si possono moltiplicare per numeri reali (che si chiamano anche scalari) e si possono sommare tra loro. Se $α$ è un numero reale, per definizione si ha

α [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \\ ⋮ \\ x_{n} \end{matrix}] = [\begin{matrix} α x_{1} \\ α x_{2} \\ α x_{3} \\ ⋮ \\ α x_{n} \end{matrix}] .

La somma dei vettori $\vec{x}$ e $\vec{y}$ si ottiene sommando le componenti corrispondenti: $\vec{x} = {[\begin{matrix} x_{1} & x_{2} & x_{3} & \dots & x_{n} \end{matrix}]}^{'}$ , $\vec{y} = {[\begin{matrix} y_{1} & y_{2} & y_{3} & \dots & y_{n} \end{matrix}]}^{'}$ , la loro somma è

\vec{x} + \vec{y} = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \\ ⋮ \\ x_{n} \end{matrix}] + [\begin{matrix} y_{1} \\ y_{2} \\ y_{3} \\ ⋮ \\ y_{n} \end{matrix}] = [\begin{matrix} x_{1} + y_{1} \\ x_{2} + y_{2} \\ x_{3} + y_{3} \\ ⋮ \\ x_{n} + y_{n} \end{matrix}] .

Si rinvia ai corsi di Geometria per le proprietà di queste operazioni. Ricordiamo però che se $n = 3$ l’operazione di somma appena definita corrisponde alla somma di vettori con la regola del parallelogramma nota dai corsi di fisica. Come terminologia, diremo anche che $\vec{x} + \vec{y}$ è ottenuto traslando di $\vec{x}$ il vettore $\vec{y}$ o, in modo equivalente che è ottenuto traslando di $\vec{y}$ il vettore $\vec{x}$ . Si considerino ora $r$ vettori ${\vec{v}}_{1}$ , …, ${\vec{v}}_{r}$ di $ℝ^{n}$ . Il vettore

\sum_{i = 1}^{r} α_{i} {\vec{v}}_{i}

(con $α_{i}$ numeri reali) si chiama combinazione lineare dei vettori ${\vec{v}}_{i}$ . L’insieme delle combinazioni lineari si chiama s.spazio lineare generato dai vettori ${\vec{v}}_{1}$ , …, ${\vec{v}}_{r}$ di $ℝ^{n}$ . Esso contiene sempre $\vec{0}$ , che si ottiene scegliendo nulli tutti gli $α_{i}$ . Si potrebbe trovare $\vec{0}$ anche con altre scelte degli $α_{i}$ . Se ciò non accade, i vettori ${\vec{v}}_{i}$ si chiamano linearmente indipendenti Ossia, i vettori ${\vec{v}}_{i}$ sono linearmente indipendenti quando

\sum_{i = 1}^{r} α_{i} {\vec{v}}_{i} = \vec{0}

implica $α_{i} = 0$ per tutti gli indici $i$ . In questo caso l’insieme dei vettori ${\vec{v}}_{i}$ si chiama una base del s.spazio. Se $r = n$ e se i vettori ${\vec{v}}_{i}$ sono linearmente indipendenti, lo spazio da essi generato è $ℝ^{n}$ e si dice che i vettori ${\vec{v}}_{i}$ sono una base di $ℝ^{n}$ . Osserviamo che ogni s.spazio lineare è esso stesso uno spazio lineare rispetto alle operazioni di somma e di prodotto per scalari. Come base di $ℝ^{n}$ si potranno scegliere $n$ vettori indipendenti qualsiasi. Scegliendo però i vettori ${\vec{e}}_{k}$ ,

{\vec{e}}_{k} = [\begin{matrix} 0 \\ 0 \\ ⋮ \\ 1 \\ ⋮ \\ 0 \end{matrix}]

con $1$ nella posizione $k$ e gli altri elementi tutti nulli, si ha la base canonica.

Esempio 97 Si sa dalla geometria analitica che i s.spazi di $ℝ^{2}$ sono $\vec{0}$ , $ℝ^{2}$ e le rette per l’origine. Se invece $n = 3$ i s.spazi sono $\vec{0}$ , $ℝ^{3}$ , le rette per l’origine ed i piani per l’origine. _

Siano ora $X$ ed $Y$ due s.insiemi di $ℝ^{n}$ . Col simbolo $X + Y$ si intende l’insieme

X + Y = {\vec{x} + \vec{y}, \vec{x} \in X, \vec{y} \in Y} .

A noi interessa in particolare il caso in cui $Y$ è un s.spazio mentre $X$ ha l’unico elemento ${\vec{x}}_{0}$ . L’insieme $X + Y$ in questo caso si indica col simbolo

{\vec{x}}_{0} + Y

e si chiama s.spazio affne di $ℝ^{n}$ , parallelo ad $Y$ , ottenuto traslando $Y$ di ${\vec{x}}_{0}$ o anche in ${\vec{x}}_{0}$ . Si noti che:

Se ${\vec{x}}_{0} \notin Y$ allora $\vec{0} \notin {\vec{x}}_{0} + Y$ .
in generale, un s.spazio affne non è un s.spazio lineare. Lo è se e solo se si ha ${\vec{x}}_{0} + Y = Y$ e ciò avviene se e solo se ${\vec{x}}_{0} \in Y$ ;

Come terminologia, in generale chiameremo semplicemente “s.spazi” i s.spazi lineari mentre l’aggettivo “affne” non verrà mai omesso, salvo nei casi particolari seguenti, nei quali useremo i termini “retta” e “piano” propri della geometria:

Gli spazi della forma ${t {\vec{y}}_{0}}_{t \in ℝ}$ (con ${\vec{y}}_{0} \neq 0$ ) si chiamano rette per l’origine e ${\vec{x}}_{0} + t {\vec{y}}_{0}$ , $t \in ℝ$ , si chiama retta per ${\vec{x}}_{0}$ parallela ad ${\vec{y}}_{0}$ (che deve essere non nullo).
si chiama piano per l’origine in $ℝ^{n}$ l’insieme dei punti $\vec{x}$ le cui componenti $x_{1}$ , …, $x_{n}$ verificano l’equazione lineare $a_{1} x_{1} + a_{2} x_{2} + \cdot + a_{n} x_{n} = 0 .$
I parametri $a_{1}$ , … $a_{n}$ sono fissati, non tutti nulli. Se $X$ è un piano per l’origine ed $\vec{y} = {[\begin{matrix} y_{1} & \dots & y_{n} \end{matrix}]}^{'}$ un punto fissato di $ℝ^{n}$ , l’insieme $\vec{y} + X$ si chiama piano per $\vec{y}$ e si vede facilmente che le componenti dei suoi punti verificano
$a_{1} (x_{1} - y_{1}) + a_{2} (x_{2} - y_{2}) + \cdot + a_{n} (x_{n} - y_{n}) = 0 .$

Vettori colineari e rette parallele

Due vettori non nulli $\vec{v}$ e $\vec{w}$ si dicono colineari quando le componenti corrispondenti sono proporzionali, ossia quando esiste $α \in ℝ$ , $α \neq 0$ , tale che

\vec{v} = α \vec{w} .

Col linguaggio della geometria analitica, i due vettori $\vec{v}$ e $\vec{w}$ sono colineari quando identificano la medesima retta uscente dall’origine. Consideriamo ora due rette,

\{{\vec{x}}_{0} + t \vec{v}, t \in ℝ\}, \{{\vec{y}}_{0} + τ \vec{w}, τ \in ℝ\} .

(3.1)

Le due rette si dicono parallele quando i due vettori $\vec{v}$ e $\vec{w}$ sono colineari. Geometricamente questo significa che un punto $Q$ della seconda retta si ottiene da un punto $P$ della prima retta, traslandolo mediante il vettore ${\vec{y}}_{0} - {\vec{x}}_{0}$ , indipendente dai punti $P$ e $Q$ considerati. Due rette non parallele possono avere un punto comune, o meno. Nel secondo caso le rette si dicono sghembe Se le due rette hanno un punto comune, si dicono incidenti Ciò accade quando esistono $t$ e $τ$ tali che

{\vec{x}}_{0} + t \vec{v} = {\vec{y}}_{0} + τ \vec{w} o s s i a {\vec{x}}_{0} - {\vec{y}}_{0} = τ \vec{w} - t \vec{v} .

Dunque, le due rette (3.1) sono incidenti se e solo se ${\vec{x}}_{0} - {\vec{y}}_{0}$ appartiene al piano generato da $\vec{v}$ e $\vec{w}$ .

Osservazione 98 Sia $m \neq 0$ . Le due rette

{\vec{x}}_{0} + t {\vec{y}}_{0}, {\vec{x}}_{0} + t m {\vec{y}}_{0}, t \in ℝ

coincidono. _

3.1.1 Connessione e convessità

I punti di una retta hanno rappresentazione

{\vec{x}}_{0} + t {\vec{y}}_{0}, t \in ℝ .

(3.2)

Il punto ${\vec{x}}_{0}$ si ritrova scegliendo $t = 0$ . Per questo, come si è detto, questa retta si chiama “retta per ${\vec{x}}_{0}$ , parallela ad ${\vec{y}}_{0}$ ”. Sia ora ${\vec{x}}_{1}$ un secondo punto di $ℝ^{n}$ . Chiediamoci se, per qualche selta di $\vec{y}$ , la retta (3.2) contenga ${\vec{x}}_{1}$ ossia, come si dice, “passi anche per ${\vec{x}}_{1}$ ”. Ciò avviene quando per un certo valore $t_{1}$ del “parametro” $t$ si ha

{\vec{x}}_{0} + t_{1} \vec{y} = {\vec{x}}_{1} .

Questo è un insieme di $n$ equazioni nelle $n$ componenti di $\vec{y}$ . L’uguaglianza si ottiene solo quando $\vec{y}$ è dato da

\vec{y} = \frac{1}{t_{1}} [{\vec{x}}_{1} - {\vec{x}}_{0}] .

Il valore $t_{1}$ può scegliersi arbitrariamente, purché non nullo². Dunque, scelto $t_{1} = 1$ , la retta per ${\vec{x}}_{0}$ e ${\vec{x}}_{1}$ si rappresenta come

\vec{x} = {\vec{x}}_{0} + t [{\vec{x}}_{1} - {\vec{x}}_{0}] .

Il suo s.insieme

\{{\vec{x}}_{0} + t [{\vec{x}}_{1} - {\vec{x}}_{0}], t \in [0, 1]\}

si chiama segmento congiungente ${\vec{x}}_{0}$ ed ${\vec{x}}_{1}$ . I punti ${\vec{x}}_{0}$ ed ${\vec{x}}_{1}$ si chiamano gli estremi del segmento. Precisamente, ${\vec{x}}_{0}$ , ottenuto per $t = 0$ , si chiama il “primo estremo” ed ${\vec{x}}_{1}$ , ottenuto per $t = 1$ , si chiama il “secondo estremo”³. Se ${\vec{x}}_{0} = {\vec{x}}_{1}$ , il segmento degenera nel punto ${\vec{x}}_{0}$ :

{\vec{x}}_{0} = {\vec{x}}_{0} + t [{\vec{x}}_{1} - {\vec{x}}_{0}] = {\vec{x}}_{0} + t [{\vec{x}}_{0} - {\vec{x}}_{0}]

per ogni $t$ . Definiamo ora cosa si intende per “spezzata” di $ℝ^{n}$ . Questo termine indica un numero finito di segmenti che “si susseguono”; ossia tali che il secondo estremo di uno sia anche primo estremo del successivo; ossia, consideriamo un numero finito di segmenti $I_{1}$ , $I_{2}$ , …, $I_{k}$ . Se accade che per $1 < j < k$ il primo estremo di $I_{j + 1}$ coincide col secondo estremo di $I_{j}$ , l’insieme $\cup_{j = 1}^{k} I_{j}$ si dice una spezzata. Si dice che una spezzata $\cup_{j = 1}^{k} I_{j}$ congiunge i due punti $\vec{x}$ ed $\vec{y}$ quando $\vec{x}$ è il primo estremo di $I_{1}$ e $\vec{y}$ è il secondo estremo di $I_{k}$ . Se accade che tali due punti coincidono, la spezzata si dice chiusa. Sia ora $A$ un s.insieme di $ℝ^{n}$ . L’insieme $A$ si dice connesso⁴ quando ogni coppia di punti di $A$ può essere congiunta con una spezzata i cui punti appartengono ad $A$ . Inoltre, si considerano connessi anche gli insiemi costituiti da un solo punto. Un insieme che è sia aperto che connesso si chiama un dominio Può accadere che l’insieme connesso $A$ contenga un punto ${\vec{x}}_{0}$ con questa proprietà: ogni altro punto ${\vec{x}}_{1} \in A$ può essere congiunto ad ${\vec{x}}_{0}$ mediante un segmento contenuto in $A$ ; ossia mediante una spezzata costituita da un unico segmento. In tal caso l’insieme $A$ si dice stellato rispetto ad ${\vec{x}}_{0}$ . Sia ora $C$ un s.insieme di $ℝ^{n}$ . Si dice che $C$ è convesso

quando è vuoto oppure contiene un solo punto
oppure quando contiene il segmento congiungente due qualsiasi dei suoi punti.

Ossia, se a $C$ appartengono almeno due punti, allora $C$ è convesso quando è stellato rispetto a ciascuno dei suoi punti. La figura 3.1 rappresenta un insieme connesso, a sinistra, ed un insieme convesso, a destra.

figura 3.1: Insieme connesso, a sinistra, e convesso a destra.

[si riportano descrizioni giudicate più significative] Un cerchio è convesso e quindi connesso. Una corona circolare è un esempio di un esempio di insieme connesso ma non convesso. L'insieme costituito dall'unione di due cerchi disgiunti non è connesso.

Per $n = 1$ le tre definizioni di insieme connesso per archi, stellato e convesso si riducono a quella di intervallo.

3.1.2 Vettori liberi e vettori applicati

L’uso dei vettori è suggerito dalle applicazioni fisiche: un “vettore” può rappresentare, per esempio, una forza o uno spostamento. Domanda ovvia: spostamento da dove, o forza applicata dove? I vettori come $n$ -ple ordinate di numeri reali non permettono di rispondere a queste domande. Tali vettori possono usarsi per rappresentare uno “spostamento” nel senso della distanza percorsa, in una certa direzione e in un certo verso, indipendentemente da quale sia il punto di partenza; o una forza di una certa intensità diretta secondo una certa direzione e con un certo verso, indipendentemente da dove essa sia applicata. Per questa ragione, i vettori che abbiamo introdotto si chiamano in fisica vettori liberi Si può decidere di applicare tutti i vettori liberi in un punto convenzionalmente scelto. La scelta naturale è di applicarli nell’origine: i vettori liberi verranno interpretati anche come vettori applicati nell’origine e quindi, per esempio, il vettore ${[\begin{matrix} 1 & 3 & 5 \end{matrix}]}^{'}$ rappresenta lo spostamento, in linea retta, da $O$ al punto $P (1, 3, 5)$ . Se vogliamo rappresentare un vettore applicato dobbiamo dare una coppia di vettori: il primo rappresenta il punto di applicazione e il secondo rappresenta il vettore (forza, spostamento,…) in esso applicato. A noi non serve essere troppo formali a questo proposito, ma è necessario sapere che:

sui vettori applicati nel medesimo punto si fanno tutte le operazioni (sia quelle già introdotte che quelle che introdurremo) che possono farsi tra vettori liberi. Dunque, se ${[\begin{matrix} 1 & 2 & 3 \end{matrix}]}^{'}$ e ${[\begin{matrix} 4 & 5 & 6 \end{matrix}]}^{'}$ rappresentano due vettori applicati nel medesimo punto, per esempio nel punto $P (4, 4, 4)$ , la loro somma è il vettore ${[\begin{matrix} 5 & 7 & 9 \end{matrix}]}^{'}$ ancora applicato in $P (4, 4, 4)$ .
Non si fanno operazioni tra vettori applicati in punti diversi.
Un vettore $\vec{v}$ applicato in $P$ può spostarsi per parallelismo in un vettore applicato in $Q$ procedendo come segue: al vettore $\vec{v}$ applicato in $P$ si fa corrispondere il vettore $\vec{v}$ applicato in $Q$ .
Se si vogliono fare operazioni tra vettori applicati in punti diversi, bisogna prima di tutto traslarli per parallelismo, applicandoli in un punto comune.

3.2 Basi e basi ordinate

Ricordiamo che una base di $ℝ^{n}$ è un insieme di $n$ vettori linearmente indipendenti. Un insieme non cambia se si cambia l’ordine col quale se ne elencano gli elementi. Se però $B$ è un insieme finito e si stabilisce un ordine tra i suoi elementi, si dice che $B$ è un insieme ordinato e se $B$ è una base di $ℝ^{n}$ , si dice che $B$ è una base ordinata. Per esempio, se si stabilisce di elencare gli elementi della base canonica elencando $e_{j}$ al $j$ –mo posto si ha una base ordinata, ma si ha una base ordinata anche se si stabilisce di elencarne gli elementi a rovescio, oppure prima quelli di indice pari e poi quelli di indice dispari. Quando in $ℝ^{n}$ si è stabilita una base ordinata si possono fare cose che non sono possibili con basi non ordinate. Per esempio, sia $𝒜$ è una trasformazione lineare da $ℝ^{n}$ in $ℝ^{m}$ e siano rispettivamente ${{\vec{e}}_{i}}$ ed ${\vec{} ẽ_{j}}$ due basi ordinate la prima di $ℝ^{n}$ e la seconda di $ℝ^{m}$ . La trasformazione $𝒜$ si può rappresentare con una matrice come segue. Si considera l’elemento $𝒜 {\vec{e}}_{1} \in ℝ^{m}$ . Questo si rappresenta come

𝒜 {\vec{e}}_{1} = \sum_{j = 1}^{m} a_{1}^{j} \vec{} ẽ_{j} .

Si costruisce una matrice mettendo il numero $a_{1}^{j}$ nella posizione $j$ della prima colonna. La seconda colonna si costruisce in modo analogo a partire da $𝒜 {\vec{e}}_{2}$ e così via fino a costruire l’ $n$ -ma colonna. Si costruisce così una matrice $A$ che rappresenta la trasformazione lineare $𝒜$ . Se la base prescelta è quella canonica e se non si stabilisce diversamente in modo esplicito, si intende che la base canonica è una base ordinata e che gli elementi della base si susseguono nell’ordine dei loro indici:

{\vec{e}}_{1}, {\vec{e}}_{2}, \dots, {\vec{e}}_{n} .

Si dice che una base ordinata subordina un’orientazione di $ℝ^{n}$ . Visto che una base di $ℝ^{n}$ contiene $n$ elementi, ci sono $n!$ modi di elencarli e quindi si potrebbe pensare che in $ℝ^{n}$ ci siano (almeno) $n!$ orientazioni diverse. Invece non è così. Consideriamo per questo una base ordinata $B_{1}$ ed una seconda base ordinata $B_{2}$ , (che potrebbe essere ottenuta dagli stessi elementi di $B_{1}$ , ordinati in modo diverso). Si sa dal corso di Geometria che i cambiamenti di base si rappresentano mediante una matrice invertibile. Sia $P$ la matrice che trasforma ordinatamente gli elementi di $B_{1}$ in quelli di $B_{2}$ . Essendo $P$ invertibile, il suo determinante non è zero e quindi delle due l’una:

det P > 0 o p p u r e det P < 0 .

Se $det P > 0$ si dice che le due basi $B_{1}$ e $B_{2}$ subordinano la medesima orientazione di $ℝ^{n}$ , altrimenti subordinano orientazioni opposte. Dunque, in $ℝ^{n}$ si trovano due orientazioni, che si dicono opposte l’una dell’altra.

3.2.1 Il piano e lo spazio

I punti del piano si mettono in corrispondenza biunivoca con quelli di $ℝ^{2}$ procedendo come segue: si fissano due rette incidenti (e tra loro diverse) $r$ ed $s$ del piano ed un’unità di misura per le lunghezze⁵. Il punto comune alle due rette si chiama origine. Su ciascuna delle due rette si fissa un verso (che si chiama “positivo”). Il segmento $P O$ della retta $r$ ha lunghezza positiva quando un punto che parte da $O$ incontra $P$ muovendosi nel verso positivo; negativo altrimenti. In tal caso si dice che $P$ appartiene al semiasse positivo. La stessa convenzione si usa sulla retta $s$ . Si fissa quindi un ordine tra le due rette. La prima si chiama asse delle ascisse o asse $x$ e la seconda asse delle ordinate o asse $y$ Le due rette si chiamano assi coordinati Le rette del piano parallele agli assi coordinati si chiamano rette coordinate Facendo ciò, si dice che si è definita un’orientazione del piano. Si fa quindi corrispondere l’orientazione del piano con quella di $ℝ^{2}$ associando il vettore ${\vec{e}}_{1}$ al punto dell’asse delle ascisse a distanza $+ 1$ dall’origine e il vettore ${\vec{e}}_{2}$ col punto dell’asse delle ordinate a distanza $+ 1$ dall’origine. Sia $P$ un punto del piano. Si fanno passare per $P$ due rette $r_{1}$ , parallela all’asse delle ordinate, ed $r_{2}$ parallela a quella delle ascisse. Sia $P_{1}$ il punto in cui $r_{1}$ incontra l’asse delle ascisse e $P_{2}$ l’intersezione di di $r_{2}$ con quello delle ordinate. Siano $x$ ed $y$ le lunghezze, con segno, rispettivamente di $O P_{1}$ e di $O P_{2}$ . Al punto $P$ si fa corrispondere il vettore

\vec{x} = x {\vec{e}}_{1} + y {\vec{e}}_{2} .

Viceversa, ad ogni vettore $\vec{x}$ si fa corrispondere un punto del piano. Si noti che perchè ciò abbia senso, va stabilito prima quale asse scegliere come asse delle ascisse, e quale dei due elementi della base considerare per primo. Ossia, la corrispondenza biunivoca che abbiamo costruito è tra il piano, a cui abbiamo imposto un’orientazione, ed $ℝ^{2}$ , a cui abbiamo imposto un’orientazione. In pratica, si segue questa convenzione:

La base canonica di $ℝ^{2}$ si ordina scegliendo prima ${\vec{e}}_{1}$ ;
sia fissato l’asse delle ascisse e il verso su di esso. Il semiasse “positivo” delle ascisse si può sovrapporre ad uno dei semiassi delle ordinate con due rotazioni una oraria ed una antioraria. Dei due angoli, uno è minore dell’altro. L’orientazione positiva sull’asse delle ordinate si sceglie in modo che la sovrapposizione avvenga girando l’asse delle ascisse in verso antiorario e dell’angolo minore.

La figura 3.2 illustra la situazione.

figura 3.2: Senso positivo di rotazione e verso sugli assi coordinati

Due rette orientate incidenti e non ortogonali.

Il più delle volte gli assi coordinati si prendono ortogonali tra loro e l’asse delle ascisse si rappresenta orizzontale, col verso positivo verso destra. In tal caso il verso positivo dell’asse delle ordinate punta verso l’alto. La rappresentazione dello spazio è analoga. Senza entrare nei dettagli, consideriamo subito il caso di un sistema cartesiano ortogonale. Si scelgono tre rette tra loro ortogonali che si chiamano rispettivamente delle ascisse o asse $x$ , delle ordinate o asse $y$ , delle quote o asse $z$ Gli assi $x$ ed $y$ identificano un piano, il piano $(x, y)$ , a cui l’asse $z$ è ortogonale. L’orientazione sul piano $(x, y)$ si fissa come si è detto sopra. Rimane quindi da scegliere il verso positivo dell’asse $z$ . Questo si sceglie in modo che un osservatore in piedi sul piano $(x, y)$ , appoggiato all’asse $z$ e con la testa nel verso positivo veda che il semiasse $x$ positivo si riporta sul semiasse $y$ positivo ruotandolo dell’angolo minore e in verso antiorario. Consideriamo ora il punto $(1, 0, 0)$ . Ruotando l’asse delle ascisse di un’angolo giro, esso descrive una circonferenza e, se l’orientazione del piano $(x, y)$ è positiva, raggiunge il punto $(0, 1, 0)$ dopo una rotazione di un angolo retto in verso antiorario. Un insetto che parta da $(1, 0, 0)$ e si muova lungo la circonferenza verso il punto $(0, 1, 0)$ , raggiungendolo dopo la rotazione di $π ∕ 2$ , vede il disco alla sua sinistra. E’ questa la prima comparsa della regola d’Ampère per la determinazione dell’orientazione dello spazio. Ogni punto $P$ si rappresenta mediante le sue tre coordinate $x$ , $y$ e $z$ . Queste si ottengono facendo passare per $P$ tre piani, paralleli ai piani individuati dalle coppie di assi coordinati (che si chiamano piani coordinati). L’ascissa $x$ di $P$ è la distanza dall’origine dell’intersezione tra l’asse delle ascisse e il piano per $P$ paralello agli assi $y$ e $z$ , presa con segno. L’ordinata e la quota si definiscono in modo analogo. Si chiamano rette coordinate le rette dello spazio parallele agli assi cartesiani. Sia ora $P$ un punto (del piano o dello spazio), $P (x, y, x)$ . Facciamogli corrispondere il vettore $\vec{v} = x {\vec{e}}_{1} + y {\vec{e}}_{2} + z {\vec{e}}_{3}$ che si interpreta come “spostamento” percorso da un punto che partendo dall’origine raggiunge la posizione occupata da $P$ . In questo modo, lo spazio si mette in corrispondenza biunivoca con $ℝ^{3}$ , che si pensa orientato mediante la sua base canonica. Quando si lavora con un sistema di assi cartesiani ortogonali, si usano i simboli sequenti: lavorando sul piano,

\vec{i} = {\vec{e}}_{1} = [\begin{matrix} 1 \\ 0 \end{matrix}], \vec{j} = {\vec{e}}_{2} = [\begin{matrix} 0 \\ 1 \end{matrix}] .

Invece lavorando nello spazio

\vec{i} = {\vec{e}}_{1} = [\begin{matrix} 1 \\ 0 \\ 0 \end{matrix}], \vec{j} = {\vec{e}}_{2} = [\begin{matrix} 0 \\ 1 \\ 0 \end{matrix}], \vec{k} = {\vec{e}}_{3} = [\begin{matrix} 0 \\ 0 \\ 1 \end{matrix}] .

3.3 Norme e distanze

La teoria dei limiti per le funzioni di una variabile dipende in modo essenziale dalle proprietà seguenti del valore assoluto:

Per ogni $x$ reale, $| x | \geq 0$ e $| x | = 0$ se e solo se $x = 0$ ;
Il valore assoluto di un prodotto è il prodotto dei valori assoluti: $| x y | = | x | \cdot | y |$ ;
la disuguaglianza triangolare: $| x + y | \leq | x | + | y |$ .

Ricordiamo che da queste proprietà segue anche:

| | x | - | y | | \leq | x - y | .

Esaminando il corso di Analisi Matematica 1, si vede facilmente che queste sono le uniche proprietà che servono per la teoria dei limiti, eccezion fatta per quei teoremi che richiedono una relazione di ordine, come i teoremi del confronto o delle funzioni monotone. L’osservazione precedente suggerisce di definire norma su $ℝ^{n}$ una funzione definita su $ℝ^{n}$ ed a valori reali, con le proprietà che ora descriviamo. Una norma si indica col simbolo $∥ \cdot ∥$ . Con questo simbolo, le proprietà sono:

la norma prende valori non negativi: $∥ \vec{x} ∥ \geq 0$ per ogni $\vec{x}$ ;
la norma si annulla solo in $\vec{0}$ : $∥ \vec{x} ∥ = 0$ implica $\vec{x} = \vec{0}$ ;
vale $∥ t \vec{x} ∥ = | t | \cdot ∥ \vec{x} ∥$ per ogni $\vec{x}$ e per ogni numero reale $t$ . Si noti che scegliendo $t = 0$ si trova $∥ \vec{0} ∥ = 0$ .
vale la disuguaglianza triangolare: per ogni coppia di vettori $\vec{x}$ e $\vec{y}$ si ha: $∥ \vec{x} + \vec{y} ∥ \leq ∥ \vec{x} ∥ + ∥ \vec{y} ∥ .$

Non è diffcile provare:

Lemma 99 Per ogni $\vec{x}$ , $\vec{y}$ vale

| ∥ \vec{x} ∥ - ∥ \vec{y} ∥ | \leq ∥ \vec{x} - \vec{y} ∥ .

Dim. Esattamente come nel caso dei numeri, si nota che la disuguaglianza da provare equivale alle due disuguaglianze

- ∥ \vec{x} - \vec{y} ∥ \leq ∥ \vec{x} ∥ - ∥ \vec{y} ∥ \leq ∥ \vec{x} - \vec{y} ∥ .

La seconda disuguaglianza segue dalla disuguaglianza triangolare, scrivendo

∥ \vec{x} ∥ = ∥ \vec{x} - \vec{y} + \vec{y} ∥ \leq ∥ \vec{x} - \vec{y} ∥ + ∥ \vec{y} ∥ .

L’altra segue in modo analogo, scrivendo

∥ \vec{y} ∥ = ∥ \vec{y} - \vec{x} + \vec{x} ∥ \leq ∥ \vec{y} - \vec{x} ∥ + ∥ \vec{x} ∥ = ∥ \vec{x} - \vec{y} ∥ + ∥ \vec{x} ∥ .

Dunque, definita una norma, è possibile trattare la teoria dei limiti su $ℝ^{n}$ esattamente come per $n = 1$ , provando tutti i medesimi teoremi, con le stesse dimostrazioni, a parte quelli che fanno intervenire la monotonia. Mostriamo che norme su $ℝ^{n}$ esistono:

Esempio 100 Le seguenti sono norme su $ℝ^{2}$ :

{∥{[\begin{matrix} x & y \end{matrix}]}^{'}∥}_{1} = | x | + | y |, {∥{[\begin{matrix} x & y \end{matrix}]}^{'}∥}_{\infty} = max {| x |, | y |} .

Si mostri per esercizio che le due funzioni definite sopra effettivamente soddisfano alle proprietà richieste per la definizione di norma. _

Quindi, su $ℝ^{2}$ possono definirsi almeno due norme diverse. In realtà si possono definire infinite norme diverse. Infatti:

Teorema 101 Sia $p \geq 1$ e sia $ℝ^{n}$ rappresentato rispetto alla base canonica. Ciascuna delle seguenti è una norma su $ℝ^{n}$ :

∥ \vec{x} ∥_{p} = {[\sum_{i = 1}^{n} | x_{i} |^{p}]}^{1 ∕ p} .

Diciamo subito che la norma di gran lunga più importante è la norma che corrisponde al numero $p = 2$ , che si chiama norma euclidea:⁶

∥ \vec{x} ∥_{2} = \sqrt{| x_{1} |^{2} + | x_{2} |^{2} + \dots + | x_{n} |^{2}} .

Introdotta una norma si può introdurre la distanza tra i vettori,

d (\vec{x}, \vec{y}) = ∥ \vec{x} - \vec{y} ∥

e quindi definire:

Definitione 1 Sia ${\vec{x}}_{0}$ un punto di $ℝ^{n}$ e sia $r > 0$ . Si chiama intorno di ${\vec{x}}_{0}$ di raggio $r$ , o palla aperta di centro ${\vec{x}}_{0}$ e raggio $r$ l’insieme

B ({\vec{x}}_{0}, r) = {\vec{v} | ∥ {\vec{x}}_{0} - \vec{v} ∥ < r} .

Dato un insieme $A$ di $ℝ^{n}$ ed un vettore ${\vec{x}}_{0}$ , si dice che:

Un insieme è limitato quando esiste una palla che lo contiene.
${\vec{x}}_{0}$ è interno ad $A$ se esiste $r > 0$ tale che $B ({\vec{x}}_{0}, r) \subseteq A$ ;
Si dice che ${\vec{x}}_{0}$ è punto di accumulazione per $A$ se per ogni $r > 0$ esiste $\vec{a} \in A$ , $\vec{a} \neq {\vec{x}}_{0}$ , con $\vec{a} \in B ({\vec{x}}_{0}, r)$ .
Il punto $x_{0}$ è punto della frontiera di $A$ se non è interno né ad $A$ né al suo complementare.
Un insieme si dice aperto se tutti i suoi punti sono interni, oppure se è vuoto; chiuso se contiene tutti i suoi punti di accumulazione oppure se è vuoto. Si mostra facilmente che un insieme è aperto se e solo se il suo complementare è chiuso.
Si chiama successione a valori in $ℝ^{n}$ una funzione che ad ogni numero naturale associa un vettore di $ℝ^{n}$ .
Una successione è limitata quando limitata è la sua immagine.
Sia ${{\vec{v}}_{n}}$ una successione. Si dice che

$lim_{n} {\vec{v}}_{n} = {\vec{v}}_{0}$ quando, per ogni $𝜖 > 0$ esiste $N_{𝜖}$ tale che se $n > N_{𝜖}$ si ha ${\vec{v}}_{n} \in B ({\vec{v}}_{0}, 𝜖)$ .

Dato che le norme su $ℝ^{n}$ sono infinite, potrebbe sembrare che ci siano infinite teorie dei limiti tra loro diverse. Invece, fortunatamente, le proprietà di avere o non avere limite, il valore dell’evenuale limite e le proprietà dei limiti non dipendono dalla definizione di norma che si decide di usare in $ℝ^{n}$ . Prima di provare questo fatto, illustriamone la ragione intuitiva consideriamo le tre norme $∥ \cdot ∥_{1}$ , $∥ \cdot ∥_{2}$ e $∥ \cdot ∥_{\infty}$ in $ℝ^{2}$ . La figura 3.3 mostra le palle di centro $0$ e raggio $1$ relative alle tre norme. La palla relativa alla norma euclidea è un disco, in figura rappresentata come un ellisse perché l’unità di misura sui due assi non è la medesima. Le altre due palle sono quadrati (rettangoli in figura, per la ragione detta sopra). Quello con i lati paralleli agli assi coordinati è la palla nella norma $∥ \cdot ∥_{\infty}$ . Si vede da questa figura che se una successione ${\vec{v}}_{n}$ tende a zero rispetto ad una di queste norme, entra e rimane definitivamente dentro ciascuna delle tre palle; e quindi tende a zero anche rispetto alle altre norme.

figura 3.3: Sfera di centro l’origine in norme diverse

Sono rappresentate le palle di centro 0 e raggio 1 relative alle tre norme $| | \cdot | |_{1}, | | \cdot | |_{2}, | | \cdot | |_{\infty}$ . La palla relativa alla norma euclidea è un disco; le altre due palle sono quadrati. Quello con i lati paralleli agli assi coordinati è la palla nella norma $| | \cdot | |_{\infty}$ .

Il risultato generale è conseguenza delle disuguaglianze seguenti. La prima è ovvia mentre omettiamo la dimostrazione della seconda.

Lemma 102 Sia $∥ \cdot ∥_{p}$ , $1 \leq p \leq + \infty$ una norma di $ℝ^{n}$ . Valgono le due disuguaglianze seguenti:

Per ogni $i$ vale $| x_{i} | \leq ∥ \vec{x} ∥$ ;
Esiste un numero $M$ (che dipende da $n$ e da $p$ ) tale che $∥ \vec{x} ∥_{p} \leq M \sum_{i - 1}^{n} | x_{i} | = ∥ \vec{x} ∥_{1}$ .

In definitiva, per $1 \leq p \leq + \infty$ si ha

∥ \vec{x} ∥_{1} \leq n ∥ \vec{x} ∥_{p} \leq M n ∥ \vec{x} ∥_{1} .

(3.3)

Accettando questo lemma possiamo provare:

Teorema 103 In $ℝ^{n}$ , una successione $({\vec{v}}_{n})$ converge a ${\vec{v}}_{0}$ in norma $p$ se e solo se converge al medesimo limite ${\vec{v}}_{0}$ in qualsiasi altra norma $q$ . Si ha $∥ {\vec{v}}_{n} ∥_{p} \to + \infty$ se e solo se $∥ {\vec{v}}_{n} ∥_{q} \to + \infty$ .

Dim. Proviamo il primo asserto. Sostituendo ${\vec{v}}_{n}$ con ${\vec{v}}_{n} - {\vec{v}}_{0}$ si può studiare il caso della convergenza a zero. Proviamo che $∥ {\vec{v}}_{n} ∥_{p} \to 0$ se e solo se $∥ {\vec{v}}_{n} ∥_{1} \to 0$ . Questo è immediato dal teorema del confronto per i limiti (di successioni a valori reali) applicato alla disuguaglianza (3.3). Il secondo asserto si prova in modo ovvio. _ Inoltre, sia $(v_{n}^{i})$ la successione di numeri reali ottenuta considerando la componente $i$ -ma dei vettori ${\vec{v}}_{n}$ . Le disuguaglianze (3.3) mostrano:

Teorema 104 La successione $({\vec{v}}_{n})$ converge se e solo se ciascuna delle successioni di numeri reali $(v_{n}^{i})$ è convergente e il vettore $lim {\vec{v}}_{n}$ ha per i-ma componente il numero $lim v_{n}^{i}$ .

Osservazione 105 Si noti che un asserto analogo non vale per successioni divergenti ossia tali che

lim ∥ {\vec{v}}_{n} ∥ = + \infty .

Per questo basta che una delle successioni $(v_{n}^{i})$ diverga! _

3.3.1 Completezza di $ℝ^{n}$

Si chiama successione fondamentale o successione di Cauchy una successione $({\vec{v}}_{n})$ con questa proprietà:
Per ogni $𝜖 > 0$ esiste $N_{𝜖}$ tale che se $n > N_{𝜖}$ , $m > N_{𝜖}$ allora

∥ {\vec{v}}_{n} - {\vec{v}}_{m} ∥ < 𝜖 .

In simboli,

\forall 𝜖 > 0 \exists N_{𝜖} | n > N_{𝜖}, m > N_{𝜖} \Rightarrow ∥ {\vec{v}}_{n} - {\vec{v}}_{m} ∥ < 𝜖 .

Una dimostrazione analoga a quella del Teorema 103 mostra che la proprietà di essere fondamentale non dipende dalla norma usata e per questo nella definizione precedente abbiamo usato il generico simbolo di norma. Inoltre le disuguaglianze (3.3) mostrano che:

Teorema 106 La successione $({\vec{v}}_{n})$ è fondamentale se e solo se ciascuna delle sue componenti è una successione fondamentale di numeri reali.

Si sa dal corso di Analisi Matematica 1 che una successione di numeri converge se e solo se è fondamentale. E quindi quest’asserto vale anche in $ℝ^{n}$ :

Teorema 107 Una successione $({\vec{v}}_{n})$ di $ℝ^{n}$ converge se e solo se è fondamentale.

Per dire che in $ℝ^{n}$ le successioni convergenti sono tutte e sole le successioni fondamentali si dice che $ℝ^{n}$ è completo Una successione $({\vec{v}}_{n})$ si dice limitata la sua immagine è limitata, ossia quando esiste $M$ tale che

per ogni n vale ∥ {\vec{v}}_{n} ∥ < M .

Le disuguaglianze (3.3) mostrano che una successione è limitata se e solo se sono limitate le successioni delle sue componenti; e quindi anche in $ℝ^{n}$ vale il Teorema di Bolzano-Weierstrass:

Teorema 108 (di Bolzano-Weierstrass) Ogni successione limitata ammette s.successioni convergenti.

3.4 La norma euclidea

La norma di gran lunga più utile è la norma $∥ \cdot ∥_{2}$ , perché essa ha una proprietà ben particolare, che ora illustriamo. Dai corsi di Geometria si sa che è possibile definire il prodotto scalare, detto anche prodotto interno, in $ℝ^{n}$ e che quando si conoscono le componenti di due vettori rispetto alla base canonica

\vec{x} = \sum_{i = 1}^{n} α_{i} {\vec{e}}_{i}, \vec{y} = \sum_{i = 1}^{n} β_{i} {\vec{e}}_{i} .

il prodotto scalare si calcola come⁷

\vec{x} \cdot \vec{y} = \sum_{i = 1}^{n} α_{i} β_{i} .

Si vede quindi che:

∥ \vec{x} ∥_{2} = \sqrt{\vec{x} \cdot \vec{x}} .

(3.4)

Osservazione 109 Si osservi che il prodotto scalare di vettori associa a due vettori un numero (e non un vettore)! _

Diciamo infine che un vettore che ha norma euclidea uguale ad $1$ si chiama versore I particolari versori $\vec{i}$ , $\vec{j}$ , $\vec{k}$ di $ℝ^{3}$ (o di $ℝ^{2}$ se non si considera $\vec{k}$ ) si chiamano i versori degli assi coordinati. Chiamiamo ora ortogonali due vettori che hanno prodotto scalare nullo e mostriamo che vale:

Teorema 110 (Teorema di Pitagora) Se $\vec{x}$ e $\vec{y}$ sono due vettori di $ℝ^{n}$ , si ha

∥ \vec{x} + \vec{y} ∥_{2}^{2} = ∥ \vec{x} ∥_{2}^{2} + ∥ \vec{y} ∥_{2}^{2} .

Dim. Si ricordi dai corsi di geometria che il prodotto scalare gode della proprietà distributiva:

\vec{x} \cdot (\vec{y} + \vec{z}) = \vec{x} \cdot \vec{y} + \vec{x} \cdot \vec{z} = (\vec{y} + \vec{z}) \cdot \vec{x} .

Dunque,

\begin{aligned} ∥ \vec{x} + \vec{y} ∥_{2}^{2} = (\vec{x} + \vec{y}) \cdot (\vec{x} + \vec{y}) \\ = \vec{x} \cdot \vec{x} + (\vec{x} \cdot \vec{y} + \vec{y} \cdot \vec{x}) + \vec{y} \cdot \vec{y} = ∥ \vec{x} ∥_{2}^{2} + | \vec{y} ∥_{2}^{2} \end{aligned}

perché ambedue gli addendi in parentesi sono nulli. _

Quando $\vec{x}$ e $\vec{y}$ sono ortogonali, il vettore $\vec{x} + \vec{y}$ è l’ipotenusa del triangolo rettangolo di cateti $\vec{x}$ e $\vec{y}$ , si veda la figura 3.4. Dunque Il Teorema di Pitagora si interpetra dicendo che in $ℝ^{2}$ il quadrato costruito sull’ipotenusa di un triangolo rettangolo ha per area la somma delle aree dei quadrati costruiti sui cateti.

figura 3.4: Teorema di Pitagora e identità del parallelogramma

La figura a destra mostra il triangolo rettangolo avente cateti i vettori $x, y$ e ipotenusa il vettore $x - y$ . La figura a sinistra mostra il parallelogramma individuato dai vettori $x, y$ , le due diagonali sono individuate dai vettori $x + y, x - y$ .

Mostriamo ora una particolarissima proprietà della norma euclidea, che si chiama identità del parallelogramma

Teorema 111 Siano $\vec{x}$ e $\vec{y}$ due vettori di $ℝ^{n}$ . Vale

∥ \vec{x} + \vec{y} ∥^{2} + ∥ \vec{x} - \vec{y} ∥^{2} = 2 [∥ \vec{x} ∥^{2} + ∥ \vec{y} ∥^{2}] .

Dim. Usando la proprietà distributiva del prodotto scalare, calcoliamo

\begin{aligned} ∥ \vec{x} + \vec{y} ∥^{2} + | \vec{x} - \vec{y} ∥^{2} = (\vec{x} + \vec{y}) \cdot (\vec{x} + \vec{y}) + (\vec{x} - \vec{y}) \cdot (\vec{x} - \vec{y}) \\ = (\vec{x} \cdot \vec{x} + \vec{x} \cdot \vec{y} + \vec{y} \cdot \vec{x} + \vec{y} \cdot \vec{y}) \\ + (\vec{x} \cdot \vec{x} - \vec{x} \cdot \vec{y} - \vec{y} \cdot \vec{x} + \vec{y} \cdot \vec{y}) = 2 \vec{x} \cdot \vec{x} + 2 \vec{y} \cdot \vec{y} = 2 [∥ \vec{x} ∥^{2} + ∥ \vec{y} ∥^{2}] . \end{aligned}

La norma euclidea è l’unica norma che gode di questa proprietà. Per esercizio, si mostri che la proprietà del parallelogramma non vale per i vettori ${[\begin{matrix} 0 & 1 \end{matrix}]}^{'}$ e ${[\begin{matrix} 1 & 0 \end{matrix}]}^{'}$ di $ℝ^{2}$ con $∥ \cdot ∥_{\infty}$ . La figura 3.4 a destra mostra il significato dell’identità del parallelogramma in $ℝ^{2}$ : $\vec{x} + \vec{y}$ e $\vec{x} - \vec{y}$ sono le diagonali del parallelogramma identificato dai due vettori $\vec{x}$ e $\vec{y}$ e quindi l’identità del parallelogramma è un’estensione del teorema di Pitagora: in un parallelogramma, la somma delle aree dei quadrati costruiti sulle due diagonali è uguale alla somma delle aree dei quadrati costruiti sui quattro lati. Il prodotto scalare si definisce tra vettori liberi; la definizione si estende quindi al caso dei vettori applicati nel medesimo punto come si è detto al paragrafo 3.1.2.

Da ora in poi, se non si specifica esplicitamente il contrario, la norma in

ℝ^{n}

sarà la norma

| \cdot |_{2}

, che indicheremo

| \cdot |

, sottintendendo l’indice. Useremo norme diverse per fare delle dimostrazioni se questo sarà conveniente. Infatti, il fatto che la relazione di convergenza non dipenda dalla particolare norma usata per verificarla può usarsi per semplificare alcune dimostrazioni.

3.4.1 $ℝ^{2}$ e $ℝ^{3}$ con la norma euclidea

Vogliamo ora esaminare più in dettaglio il caso di $ℝ^{2}$ e di $ℝ^{3}$ con norma euclidea. Diamo però la definizione seguente che vale anche in $ℝ^{n}$ , dotato della norma euclidea e quindi del prodotto interno: due vettori $\vec{x}$ e $\vec{y}$ si dicono ortogonali quando hanno prodotto scalare nullo:

\vec{x} ⊥ \vec{y} quando \vec{x} \cdot \vec{y} = 0 .

Si fissi ora il vettore $\vec{v} = a \vec{i} + b \vec{j} \neq \vec{0}$ . Sono ad esso ortogonali i vettori ${\vec{w}}_{1} = b \vec{i} - a \vec{j}$ e ${\vec{w}}_{2} = - b \vec{i} + a \vec{j}$ . Le matrici che trasformano la base canonica rispettivamente nella base ${\vec{v}, {\vec{w}}_{1}}$ e ${\vec{v}, {\vec{w}}_{2}}$ sono rispettivamente

[\begin{matrix} a & b \\ b & - a \end{matrix}], [\begin{matrix} a & b \\ - b & a \end{matrix}] .

La prima ha determinante negativo mentre la seconda ha determinante positivo. Dunque, la base ${\vec{v}, {\vec{w}}_{2}}$ è orientata positivamente, ossia, come anche si dice, ha orientazione concorde con quella dello spazio. Per questa ragione, se non si specifica esplicitamente il contrario, come vettore ortogonale a $\vec{v}$ sceglieremo $- b \vec{i} + a \vec{j}$ . Vediamo ora di chiarire il significato geometrico dei determinanti di matrici $2 \times 2$ e $3 \times 3$ . Siano $\vec{v}$ e $\vec{w}$ due vettori, di componenti rispettivamente $(a, b)$ e $(c, d)$ rispetto alla base canonica di $ℝ^{2}$ . Questi vettori identificano i due punti del piano $P \equiv (a, b)$ e $Q \equiv (c, d)$ . Vogliamo calcolare l’area del parallelogramma in figura 3.5. Si sa che l’area è il prodotto della lunghezza di un lato per l’altezza ad esso relativa. Scegliendo come lato quello identificato dal vettore $\vec{v} = a \vec{i} + b \vec{j}$ , vogliamo calcolare

| \vec{v} | | \vec{h} |

ove $\vec{h}$ è il vettore, applicato in $Q$ , indicato in figura 3.5.

figura 3.5: Calcolo dell’area di un parallelogramma

Sono rappresentati il parallelogramma individuato dai vettori $v, w$ e l'altezza relativa al vettore $v$ .

Dividendo per $| \vec{v} |$ non è restrittivo supporre $| \vec{v} | = 1$ , ossia $a^{2} + b^{2} = 1$ . In questo caso l’area è $| \vec{h} |$ . L’altezza è il vettore

\vec{h} = \vec{w} - (\vec{w} \cdot \vec{v}) \vec{v} .

Ricordando che $a^{2} + b^{2} = 1$ , si calcola:

\begin{aligned} | \vec{h} |^{2} = [\vec{w} - (\vec{w} \cdot \vec{v}) \vec{v}] \cdot [\vec{w} - (\vec{w} \cdot \vec{v}) \vec{v}] \\ = {[c - (c a + b d) a]}^{2} + {[d - (c a + b d) b]}^{2} \\ = c^{2} - 2 a c (c a + b d) + d^{2} - 2 b d (c a + b d) + (a^{2} + b^{2}) {(c a + b d)}^{2} \\ = c^{2} (1 - a^{2}) + d^{2} (1 - b^{2}) - 2 c a b d = {(c b)}^{2} + {(d a)}^{2} - 2 c a b d \\ = {(c b - a d)}^{2} \end{aligned}

e quindi l’area è

| c b - a d | = |det [\begin{matrix} a & c \\ b & d \end{matrix}]| .

Si trova quindi un’interpretazione geometrica per il valore assoluto del determinante di una matrice $2 \times 2$ : il numero $|det [\begin{matrix} \vec{v} & \vec{w} \end{matrix}]|$ è l’area del parallelogramma identificato dai due vettori $\vec{v}$ e $\vec{w}$ (applicati nell’origine). Il determinante stesso si interpretra anche come “area con segno” del parallelogramma identificato dai vettori che sono le colonne della matrice. Si può quindi concludere che valgono le affermazioni seguenti, per ogni coppia di vettori $\vec{v}$ , $\vec{w}$ di $ℝ^{2}$ (in quest’ordine) e per la matrice

A = [\begin{matrix} \vec{v} & \vec{w} \end{matrix}] :

Condizione necessaria e suffciente perché i due vettori siano colineari è che il determinante di $A$ sia nullo;
se il determinante è non nullo, i due vettori $\vec{v}$ e $\vec{w}$ (in quest’ordine) sono una base ordinata di $ℝ^{2}$ ; il parallelogramma che essi identificano ha “area con segno” che è positiva se e solo se essi, presi nell’ordine dato, sono una base orientata positivamente;

la matrice

A

subordina una trasformazione lineare in

ℝ^{2}

. Siano

\vec{r}

{\vec{r}}^{'}

due vettori (applicati nell’origine) e

\tilde{\vec{r}} = A \vec{r}

{\tilde{\vec{r}}}^{'} = A {\vec{r}}^{'}

le loro immagini mediante la matrice

A

. Sia

R

il parallelogramma identificato dai vettori

\vec{r}

{\vec{r}}^{'}

e sia

\tilde{R}

il parallelogramma identificato dalle loro immagini. L’area del parallelogramma

\tilde{R}

è il prodotto di

| det A |

per l’area del parallelogramma

R

(area di \tilde{R}) = |det A| \cdot (area di R).

(3.5)

Risultati del tutto analoghi valgono anche in $ℝ^{3}$ . Dati tre vettori $\vec{u}$ , $\vec{v}$ e $\vec{w}$ , in quest’ordine, si costruisce la matrice

A = [\begin{matrix} \vec{u} & \vec{v} & \vec{w} \end{matrix}] .

Il valore assoluto del suo determinante è il volume del parallelepipedo identificato dai tre vettori (applicati nell’origine). La matrice $A$ identifica una trasformazione lineare. Tale trasformazione applicata ai punti di un parallelepipedo lo trasforma in un altro, il cui volume differisce da quello del primo per il fattore $| det A |$ . Il numero $det A$ si interpreta come “volume con segno”.

3.5 Il prodotto vettoriale

A differenza delle operazioni tra vettori introdotte fino ad ora, che valgono in $ℝ^{n}$ per ogni $n$ , l’operazione di prodotto vettoriale è specifica di $ℝ^{3}$ . Essa si definisce ponendo:

\begin{matrix} \vec{i} \land \vec{i} = 0, & \vec{j} \land \vec{j} = 0, & \vec{k} \land \vec{k} = 0, \\ \vec{i} \land \vec{j} = \vec{k}, & \vec{j} \land \vec{k} = \vec{i}, & \vec{k} \land \vec{i} = \vec{j}, \\ \vec{i} \land \vec{j} = - \vec{j} \land \vec{i}, & \vec{j} \land \vec{k} = - \vec{k} \land \vec{j}, & \vec{k} \land \vec{i} = - \vec{i} \land \vec{k} . \end{matrix}

Completiamo ora la definizione di prodotto vettoriale ponendo

\vec{v} \land \vec{w} = (a \vec{i} + b \vec{j} + c \vec{k}) \land (x \vec{i} + y \vec{j} + z \vec{k}) = (b z - c y) \vec{i} + (c x - a z) \vec{j} + (a y - b x) \vec{k}

formalmente ottenuta distribuendo le somme sui prodotti e facendo uso delle regole per i prodotti vettoriali degli elementi della base. Di conseguenza, si verificano le regole seguenti:

$\vec{v} \land \vec{w} = - \vec{w} \land \vec{v}$ ;
$\vec{v} \land \vec{w}$ è ortogonale sia a $\vec{v}$ che a $\vec{w}$ ;
vale: $(\vec{r} \land \vec{v}) \cdot \vec{w} = det [\begin{matrix} \vec{r} & \vec{v} & \vec{w} \end{matrix}] .$
Quindi, il valore assoluto $| (\vec{r} \land \vec{v}) \cdot \vec{w} |$ è il volume del parallelepipedo identificato dai tre vettori (pensati applicati nell’origine);
In particolare, $det [\begin{matrix} \vec{r} & \vec{v} & \vec{r} \land \vec{v} \end{matrix}] = (\vec{r} \land \vec{v}) \cdot (\vec{r} \land \vec{v}) .$
Questo numero è zero se i vettori $\vec{r}$ e $\vec{v}$ sono colineari. Altrimenti è positivo. Dunque, i tre vettori $\vec{r}$ , $\vec{v}$ , $\vec{r} \land \vec{v}$ (presi in quest’ordine e con $\vec{r}$ e $\vec{v}$ non colineari) subordinano in $ℝ^{3}$ l’orientazione positiva.

Si noti che:

Il prodotto vettoriale si definisce per vettori liberi; la definizione si estende quindi al caso dei vettori applicati nel medesimo punto come si è detto al paragrafo 3.1.2.
Il prodotto vettoriale di due vettori è un vettore. Per contrasto, il prodotto scalare di due vettori è un numero.
Il prodotto vettoriale è nullo se e solo se i due vettori sono colineari. Per contrasto, il prodotto scalare è nullo se e solo se i due vettori sono ortogonali.

Infine, si noti che le regole per il calcolo del prodotto vettoriale sono definite in modo da “mimare” quelle per il calcolo dei determinanti.

Osservazione 112 Il prodotto vettoriale può definirsi in particolare per vettori complanari, per esempio per vettori del piano $z = 0$ . In tal caso il prodotto vettoriale è un vettore “verticale”, ossia parallelo all’asse $z$ . _

Osservazione sulla notazione La notazione col punto, $\vec{v} \cdot \vec{w}$ , per indicare il prodotto scalare è oggi universalmente usata⁸. Invece, la notazione per il prodotto vettoriale non è cosìuniforme. La notazione $\vec{v} \land \vec{w}$ si trova principalmente in testi europei, mentre in testi americani (ed anche inglesi) il prodotto vettoriale è indicato $\vec{v} \times \vec{w}$ .

3.6 Coordinate curvilinee nel piano e nello spazio

Il modo più comune per rappresentare i punti del piano, o dello spazio, usa le coordinate cartesiane ortogonali. Però, punti del piano e dello spazio possono rappresentarsi, oltre che in coordinate cartesiane ortogonali mediante coordinate cartesiane oblique o anche con altri “sistemi di coordinate” che generalmente costruiscono corrispondenze biunivoche tra i punti (del piano o dello spazio) (o talvolta di opportuni loro s.insiemi) ed opportuni s.insiemi di $ℝ^{2}$ oppure di $ℝ^{3}$ . Per ragioni che vedremo, si parla in tal caso di coordinate curvilinee Noi esamineremo prima le coordinate cartesiane oblique (nel piano. La semplice estensione allo spazio è lasciata al lettore). Poi studieremo alcuni casi particolari di coordinate curvilinee: vedremo l’uso delle coordinate polari e delle coordinate ellittiche per rappresentare i punti del piano cartesiano e l’uso delle coordinate cilindriche, sferiche ed ellittiche per rappresentare i punti dello spazio, che supporremo dotato di un sistema di coordinate cartesiane ortogonali.

Coordinate cartesiane oblique nel piano (e nello spazio). fissata l’origine $O$ , tracciamo per essa due rette non coincidenti (tre rette non complanari nello spazio). Queste rette si chiamano assi cartesiani obliqui. Si decida quale è la prima retta, asse delle ascisse, la seconda, asse delle ordinate, un verso positivo su di esse e un’unità di misura (che potrebbe anche essere diversa. Noi assumeremo che sia la medesima). Da un punto $P$ facciamo uscire due rette, parallele agli assi delle ordinate e delle ascisse. La retta parallela all’asse delle ordinate interseca l’asse delle ascisse in un punto $P_{1}$ la cui distanza distanza (con segno) da $O$ si chiama l’ascissa di $P$ . In modo analogo si definisce l’ordinata di $P$ . La coppia ordinata dell’ascissa e dell’ordinata rappresenta univocamente il punto $P$ . Si veda la figura 3.6.

figura 3.6: Coordinate oblique

La figura a sinistra mostra due rette nel piano incidenti e orientate (ascisse e ordinate), un punto $P$ e le rette per $P$ parallele ad ascisse e ordinate. Analoga figura illustra tre rette e un punto nello spazio.

Un problema importante è di passare da un sistema di coordinate ad un altro. Limitiamoci a studiare il caso di due sistemi di coordinate, uno un sistema di coordinate cartesiane ortogonali del piano ed uno un sistema di coordinate oblique. Provvisoriamente indichiamo con lettere greche le coordinate oblique: $ξ$ è l’asse delle ascisse (oblique) ed $η$ quello delle ordinate. Indichiamo con $\vec{i}$ e $\vec{j}$ i versori degli assi cartesiani ortogonali e siano

{\vec{v}}_{1} = \vec{i} cos 𝜃 + \vec{j} sin 𝜃, {\vec{v}}_{2} = \vec{i} cos ϕ + \vec{j} sin ϕ

i versori degli assi obliqui, si veda la figura 3.7.

figura 3.7: Trasformazione a coordinate oblique

Sono rappresentati nel piano un sistema di assi cartesiani ortogonali $\bar{i}, \bar{j}$ , un sistema di assi obliqui $\csi, η$ aventi la stessa origine e un punto $P$ . Sono mostrati gli angoli $θ, ϕ$ tra l'asse $\bar{i}$ e l'asse $\csi$ (l'asse $η$ , rispettivamente). Le coordinate di $P$ nel sistema di assi obliqui $\csi, η$ sono $P_{1}, P_{2}$ .

Si conoscano le coordinate cartesiane ortogonali $(x, y)$ del punto $P$ . Le coordinate oblique di $P$ sono le distanze dall’origine dei vettori dei punti $P_{1}$ e $P_{2}$ , che avranno forma

ξ {\vec{v}}_{1}, η {\vec{v}}_{2}

per certe scelte dei parametri $ξ$ e $η$ . Poiché ${\vec{v}}_{1}$ e ${\vec{v}}_{2}$ sono versori, le coordinate oblique di $P$ sono proprio i numeri $ξ$ e $η$ , che ora vogliamo calcolare. Ciò si fa notando che

x \vec{i} + y \vec{j} = ξ {\vec{v}}_{1} + η {\vec{v}}_{2} = ξ (\vec{i} cos 𝜃 + \vec{j} sin 𝜃) + η (\vec{i} cos ϕ + \vec{j} sin ϕ) .

Uguagliando le componenti si ottiene immediatamente

\{\begin{matrix} ξ = \frac{y cos ϕ - x sin ϕ}{sin (𝜃 - ϕ)}, \\ η = \frac{x sin 𝜃 - y cos 𝜃}{sin (𝜃 - ϕ)}, \end{matrix} \{\begin{matrix} x = ξ cos 𝜃 + η cos ϕ \\ y = ξ sin 𝜃 + η sin ϕ . \end{matrix}

Si noti che il denominatore è non nullo perchè gli assi obliqui non coincidono. Si osservi un caso particolare: supponiamo che $ϕ - 𝜃 = π ∕ 2$ . In questo caso gli “assi obliqui” sono tra loro perpendicolari e si vuol rappresentare il medesimo punto $P$ rispetto a due sistemi di assi cartesiani ortogonali ruotati l’uno rispetto all’altro. Precisamente, il secondo sistema è ottenuto ruotando il primo dell’angolo $𝜃$ (in senso positivo o negativo). Essendo in questo caso particolare $ϕ = 𝜃 + π ∕ 2$ , le coordinate $(ξ, η)$ sono date da

\{\begin{matrix} ξ = x cos 𝜃 + y sin 𝜃 \\ η = - x sin 𝜃 + y cos 𝜃, \end{matrix} \{\begin{matrix} x = ξ cos 𝜃 - η sin 𝜃 \\ y = ξ sin 𝜃 + η cos 𝜃 . \end{matrix}

Coordinate polari nel piano. Sia $P$ il punto da rappresentare. Si rappresenta $P$ mediante la sua distanza da $O$ e mediante l’angolo $𝜃$ tra la retta $r$ che esce dall’origine $O$ e punta verso $P$ e il semiasse positivo delle ascisse. L’angolo si sceglie col segno in questo modo: si orienta la retta $r$ da $O$ verso $P$ ; si riporta il semiasse $x > 0$ sulla semiretta $r$ , ruotando dell’angolo minore. L’angolo $𝜃$ cosìottenuto si intende positivo se la rotazione è antioraria (si confronti con la regola d’Ampère).

figura 3.8: coordinate polari

Nel piano cartesiano sono rappresentati un punto $P$ , la retta $r$ congiungente l'origine con $P$ e l'angolo $θ$ individuato dall'asse delle ascisse e da $r$ .

In questo modo si stabilisce una corrispondenza biunivoca tra i punti del piano $(x, y)$ , escluso $O$ , e le coppie di numeri $(ρ, 𝜃)$ con $ρ > 0$ e $0 \leq 𝜃 < 2 π$ . Dunque, ogni punto $P$ del piano $(x, y)$ , escluso $O$ , viene identificato dalla coppia dei numeri $ρ$ e $𝜃$ , che si chiamano le coordinate polari di $P$ . L’origine invece è identificata da $(0, 𝜃)$ per ogni $𝜃$ . Si veda la figura 3.8. Il numero $ρ$ si chiama il definmodulo e $𝜃$ si chiama l’ argomento}o anomalia}o anomalia di $P$ . La relazione tra le coordinate cartesiane e le coordinate polari è data da:

x = ρ cos 𝜃, y = ρ sin 𝜃 .

nel contesto delle coordinate polari, il semiasse positivo delle ascisse si chiama anche asse polare e il suo estremo, ossia l’origine, si chiama anche polo

Osservazione 113 Va notato che la corrispondenza $(ρ, 𝜃) \mapsto (x, y)$ è suriettiva ma non iniettiva; dunque non invertibile. Si trova una corrispondenza biunivoca di $ℝ^{2} ∖ {0}$ se $(ρ, 𝜃) \in (0, + \infty) \times [0, 2 π)$ .

Coordinate polari ellittiche piano. Siano assegnati due numeri positivi $a$ e $b$ . Le coordinate polari ellittiche nel piano si ottengono rappresentando i punti $(x, y)$ mediante i numeri $(ρ, 𝜃)$ tali che

x = ρ a cos 𝜃, y = ρ b sin 𝜃 .

Le curve coordinate delle coordinate polari od ellittiche. Torniamo alle relazioni

x = ρ a cos 𝜃, y = ρ b sin 𝜃 .

Queste relazioni identificano un punto $(x, y)$ del piano per ogni scelta di $(ρ, 𝜃)$ . Si chiamano curve coordinate quelle ottenute da queste espressioni per $𝜃$ fissato al variare di $r$ (rette per l’origine) e per $r$ fissato al variare di $𝜃$ (ellissi; nel caso particolare delle coordinate polari si hanno circonferenze).

Coordinate cilindriche nello spazio. Sia $P \equiv (x, y, z)$ un punto dello spazio, riferito ad un sistema di coordinate cartesiane ortogonali. Il punto $Q \equiv (x, y, 0)$ si chiama la proiezione ortogonale di $P$ sul piano $z = 0$ . Il punto $Q$ si può rappresentare mediante le sue coordinate polari $(ρ, 𝜃)$ e quindi $P$ viene ad essere rappresentato mediante $(ρ, 𝜃, z)$ . Quando si fa uso di questa rappresentazione si dice che si rappresenta lo spazio in coordinate cilindriche, si veda la figura 3.9. Se invece delle coordinate polari, sul piano si usano le coordinate ellittiche, le corrispondenti coordinate nello spazio si chiamano cilindriche ellittiche

Le superfici coordinate delle coordinate cilindriche. Le curve coordinate sono quelle curve che si ottengono tenendo fissi i valori di due parametri e facendo variare il terzo. Sono quindi rette per l’origine, circonferenze (o ellissi) e rette verticali. Però nello spazio si possono anche definire le superfici coordinate, ottenute tenendo fisso un parametro e facendo variare gli altri due. Quindi, nel caso delle coordinate cilindriche ellittiche, le superfici coordinate sono cilindri ellittici di asse parallelo all’asse $z$ (ottenuti tenendo fisso il valore di $ρ$ ); piani per l’asse $z$ (ottenuti tenendo fisso il valore di $𝜃$ ); piani perpendicolari all’asse $z$ (ottenuti tenendo fisso il valore di $z$ ).

figura 3.9: coordinate cilindriche

Un punto $P (x, y, z)$ nello spazio è individuato mediante le coordinate cilindriche $(ρ, θ, z)$ , essendo $(ρ, θ)$ le coordinate polari della sua proiezione sul piano $(x, y)$ .

Coordinate sferiche ed ellittiche nello spazio. Le coordinate sferiche nello spazio sono l’analogo delle coordinate polari nel piano. Per rappresentare un punto $P (x, y, z)$ , si costruisce la retta congiungente $O$ con $P$ . Si rappresenta $P$ mediante $(r, 𝜃, ϕ)$ dove $r$ è la distanza di $P$ da $O$ e ancora si chiama l’argomento di $P$ ; $𝜃$ è l’argomento della proiezione $Q$ di $P$ sul piano $z = 0$ , $ϕ$ è l’angolo tra il versore $\vec{ν}$ che sulla retta da $O$ a $P$ punta verso $P$ ed il versore $\vec{k}$ . L’ampiezza di quest’angolo si intende compresa tra $0$ e $π$ .

figura 3.10: coordinate sferiche

Un punto $P (x, y, z)$ nello spazio è individuato mediante le coordinate sferiche $(ρ, θ, ϕ)$ , essendo $ρ$ la distanza di $P$ dall'origine, $θ$ l'argomento della proiezione di $P$ sul piano $z = 0$ , $ϕ$ l'angolo individuato tra la congiungente l'origine con $P$ e l'asse z.

Dunque, si veda la figura 3.10, $P$ si rappresenta anche con la terna $(r, 𝜃, ϕ)$ con

r \geq 0, 0 \leq 𝜃 < 2 π, 0 \leq ϕ \leq π .

Questi numeri si chiamano le coordinate sferiche di $P$ . La relazione tra le coordinate cartesiane e le coordinate sferiche è la seguente:

x = r cos 𝜃 sin ϕ, y = r sin 𝜃 sin ϕ, z = r cos ϕ .

Il numero $r$ si chiama ancora modulo, il numero $𝜃$ si chiama longitudine mentre il numero $ϕ$ si chiama colatitudine. Siano dati ora tre numeri positivi $a$ , $b$ e $c$ . Le coordinate ellittiche di un punto nello spazio sono le coordinate $(ρ, 𝜃, ϕ)$ che si ottengono imponendo

x = r a cos 𝜃 sin ϕ, y = r b sin 𝜃 sin ϕ, z = r c cos ϕ .

Le superfici coordinate delle coordinate sferiche ed ellittiche. Nel caso delle coordinate sferiche, le superfici coordinate sono sfere di centro l’origine (ottenute tenendo fisso il valore di $r$ ); piani per l’asse $z$ (ottenuti fissando il valore di $𝜃$ ; (semi)coni circolari di asse sull’asse $z$ (ottenuti tenendo fisso il valore di $ϕ$ ). Per esercizio, se ne identifichino le curve coordinate e si identifichino anche le curve e le superfici coordinate delle coordinate ellittiche.

3.7 Funzioni da $ℝ$ in $ℝ^{n}$

Studiamo ora le proprietà di limite e continuità delle funzioni definite su sottoinsiemi di $ℝ$ ed a valori in $ℝ^{n}$ . Sia $\vec{x} \in ℝ^{n}$ un vettore e siano $x_{i}$ le sue componenti. E’ utile tener presente le disuguaglianze seguenti (si vedano le (3.3)):

Per ogni $i$ vale $| x_{i} | \leq | \vec{x} |$ ;
Esiste un numero $M = M_{n, p}$ tale che $| \vec{x} |_{p} \leq M \sum_{i = 1}^{n} | x_{i} |$ .

Le funzioni da $ℝ$ in $ℝ$ sono state studiate nel corso di Analisi Matematica 1. E’ facile adattare gli argomenti visti nel corso di Analisi Matematica 1 al caso di funzioni a valori vettoriali. Per l’uso che a noi servirà, consideriamo funzioni definite su un intervallo $I$ , aperto o meno, limitato o meno, a valori in $ℝ^{n}$ . Dunque, si specifica la funzione assegnando ad ogni valore $t \in I$ un vettore $\vec{x} (t) \in ℝ^{n}$ , ossia assegnando le sue $n$ componenti. Si costruisce cosìuna funzione

t \to \vec{x} (t) = [\begin{matrix} x_{1} (t) \\ x_{2} (t) \\ ⋮ \\ x_{n} (t) \end{matrix}] = x_{1} (t) {\vec{e}}_{1} + x_{2} (t) {\vec{e}}_{2} + \dots + x_{n} (t) {\vec{e}}_{n} .

Nel caso di $ℝ^{2}$ o di $ℝ^{3}$ scriveremo anche

\vec{x} (t) = x (t) \vec{i} + y (t) \vec{j} + z (t) \vec{k} .

Notiamo che le componenti di $\vec{x} (t)$ sono funzioni da $ℝ$ in $ℝ$ e quindi le nozioni apprese nel corso di Analisi 1 possono essere applicate a ciascuna componente. Ora definiamo:

Limiti e continuità

Si fissi un punto $t_{0}$ . Il punto $t_{0}$ può essere un punto di $I$ o anche un estremo di $I$ che non gli appartiene.

Si dice che

lim_{t \to t_{0}} \vec{x} (t) = \vec{l}

quando assegnata una qualsiasi palla

B (\vec{l}, 𝜖)

centrata in

\vec{l}

esiste un intorno

I_{𝜖} (t_{0})

tale che se

t \in I_{𝜖} \cap I

t \neq t_{0}

, allora

\vec{x} (t) \in B (\vec{l}, 𝜖)

. In simboli,

\forall 𝜖 \exists δ | t \in I e 0 < | t - t_{0} | < δ \Rightarrow | \vec{x} (t) - \vec{l} | < 𝜖 .

t \in I

e inoltre

lim_{t \to t_{0}} \vec{x} (t) = \vec{x} (t_{0})

si dice che la funzione è continua in

t_{0}

Si lascia per esercizio di definire i limiti per $t \to + \infty$ e per $t \to - \infty$ , sulla falsariga della definizione del limite di successioni, vista al paragrafo 3.3. Si noti però che non è possibile definire limiti uguali a $\pm \infty$ . Se $\vec{x} (t)$ non rimane limitata allora possiamo definire solamente $lim | \vec{x} (t) | = + \infty$ e si ricade in un caso già trattato nel corso di Analisi Matematica 1 perch’e la funzione $t \to | \vec{x} (t) |$ è una funzione da $ℝ$ in s’e. Siano $x_{i} (t)$ le componenti di $\vec{x} (t)$ ed $l_{i}$ quelle di $\vec{l}$ . Il teorema seguente è analogo al Teorema è.

Teorema 114 Vale $lim \vec{x} (t) = \vec{l}$ se e solo se per ogni $i$ vale $lim x_{i} (t) = l_{i}$ . Una funzione $t \to \vec{x} (t)$ da $ℝ$ in $ℝ^{n}$ è continua se e solo se ciascuna sua componente è una funzione continua da $ℝ$ in $ℝ$ .

Noto ciò, è immediato dedurre il risultato seguente:

Teorema 115 Siano $t \to \vec{x} (t)$ e $t \to \vec{y} (t)$ due funzioni da $ℝ$ in $ℝ^{n}$ definite sul medesimo intervallo $I$ ed ambedue continue e sia $t \to k (t)$ una funzione da $ℝ$ in $ℝ$ definita su $I$ e continua. Le funzioni

t \to k (t) \vec{x} (t), t \to \vec{x} (t) + \vec{y} (t), t \to \vec{x} (t) \cdot \vec{y} (t)

(il punto indica il prodotto scalare calcolato per ogni valore di $t$ ) sono continue. Se $n = 3$ , anche la funzione $t \to \vec{x} (t) \land \vec{y} (t)$ è continua.

Si lascia per esercizio di enunciare i teoremi corrispondenti per i limiti.

i simboli di Landau Si dice che $\vec{x} (t)$ è un infinitesimo per $t \to t_{0}$ quando $lim_{t \to t_{0}} \vec{x} (t) = 0 .$

Siano $\vec{x} (t)$ e $\vec{y} (t)$ due funzioni definite sul medesimo intervallo $I$ e se ne vogliano studiare le relazioni per $t \to t_{0}$ . Diciamo che:

: i) $\vec{x} = \vec{O} (\vec{y})$ quando esistono un numero $M$ ed un intorno $J$ di $t_{0}$ tali che: $t \in I \cap J \Rightarrow | \vec{x} (t) | \leq M | \vec{y} (t) | .$
: ii) $\vec{x} = \vec{o} (\vec{y})$ quando $| y (t) | \neq 0$ per $t \neq t_{0}$ in un intorno di $t_{0}$ e inoltre $lim_{t \to t_{0}} \frac{| \vec{x} (t) |}{| \vec{y} (t) |} = 0 .$
In queste definizioni le due funzioni $\vec{x} (t)$ e $\vec{y} (t)$ potrebbero avere valori in spazi di dimensione diversa. In particolare, $\vec{y} (t)$ potrebbe essere una funzione a valori in $ℝ$ . Se $y (t)$ prende valori in $ℝ$ ed è costantemente uguale ad $1$ , la condizione $\vec{x} = \vec{o} (1)$ vul dire che $\vec{x} (t)$ è un infinitesimo (sottinteso, per $t \to t_{0}$ ).

La derivabilità

Sia $t_{0}$ punto interno di $I$ . Si dice che un vettore $\vec{l}$ è la derivata di $\vec{x} (t)$ quando

\vec{l} = lim_{t \to t_{0}} \frac{\vec{x} (t) - \vec{x} (t_{0})}{t - t_{0}} .

La derivata si indica con uno dei soliti simboli,

\frac{d \vec{x} (t_{0})}{d t}, {\vec{x}}^{'} (t_{0}), \dot{\vec{x}} (t_{0}), D \vec{x} (t_{0}), D_{t_{0}} \vec{x} e c c .

Se $t$ indica il tempo e se $\vec{x} (t)$ indica la posizione di un punto all’istante $t$ , allora il quoziente

\frac{\vec{x} (t) - \vec{x} (t_{0})}{t - t_{0}}

indica la velocità media del punto, nell’intervallo di tempo $(t_{0}, t)$ ; e quindi la derivata si interpreta come velocità del punto all’istante $t$ . Usando le disuguaglianzein (3.3), si vede che

Teorema 116 La funzione $\vec{x} (t)$ è derivabile in $t_{0}$ se e solo se ciascuna sua componente è derivabile in ${\vec{t}}_{0}$ e inoltre

{\vec{x}}^{'} (t_{0}) = [\begin{matrix} x_{1}^{'} (t_{0}) \\ x_{2}^{'} (t_{0}) \\ ⋮ \\ x_{n}^{'} (t_{0}) \end{matrix}] .

Dunque, una funzione derivabile in un punto $t_{0}$ è ivi continua.

In modo del tutto analogo si definiscono le derivate direzionali. Le usuali regole di calcolo delle derivate si possono applicare alle singole componenti del vettore $\vec{x} (t)$ e quindi, per esempio, vale ancora la proprietà di linearità della derivata:

D_{t_{0}} {\vec{x} (t) + \vec{y} (t)} = {\vec{x}}^{'} (t_{0}) + {\vec{y}}^{'} (t_{0}) .

Teorema 117 Siano $\vec{x} (t)$ ed $\vec{y} (t)$ derivabili in $t_{0}$ . I prodotti scalare e vettoriale⁹ sono derivabili in $t_{0}$ e valgono le uguaglianze

\begin{aligned} \frac{d}{d t} [\vec{x} (t) \cdot \vec{y} (t)] = {\vec{x}}^{'} (t) \cdot \vec{y} (t) + \vec{x} (t) \cdot {\vec{y}}^{'} (t), \\ \frac{d}{d t} [\vec{x} (t) \land \vec{y} (t)] = {\vec{x}}^{'} (t) \land \vec{y} (t) + \vec{x} (t) \land {\vec{y}}^{'} (t) . \end{aligned}

Dim. Proviamo l’asserto per il prodotto vettoriale. Bisogna calcolare

lim_{h \to 0} \frac{\vec{x} (t + h) \land \vec{y} (t + h) - \vec{x} (t) \land \vec{y} (t)}{h} .

Aggiungendo e sottraendo al numeratore $\vec{x} (t) \land \vec{y} (t + h)$ si vede che la derivata è uguale a

lim_{h \to 0} \frac{\vec{x} (t + h) - \vec{x} (t)}{h} \land \vec{y} (t + h) + lim_{h \to 0} \vec{x} (t) \land \frac{\vec{y} (t + h) - \vec{y} (t)}{h} = {\vec{x}}^{'} (t) \land \vec{y} (t) + \vec{x} (t) \land {\vec{y}}^{'} (t)

perchè

lim_{h \to 0} y (t + h) = y (t)

perché la funzione $\vec{y} (t)$ , essendo derivabile, è anche continua La dimostrazione per il prodotto scalare è simile. _

Osservazione 118 Nella regola per la derivata del prodotto vettoriale i fattori non possono scambiarsi; invece la derivata del prodotto scalare non dipende dall’ordine dei fattori. _

In particolare:

Teorema 119 Sia $\vec{x} (t)$ una funzione derivabile a valori in $ℝ^{n}$ e tale che $| \vec{x} (t) | \equiv 1$ . Allora, ${\vec{x}}^{'} (t) ⊥ \vec{x} (t)$ .

Dim. Infatti, derivando i due membri dell’uguaglianza

1 = | \vec{x} (t) |^{2} = \vec{x} (t) \cdot \vec{x} (t)

si trova

2 {\vec{x}}^{'} (t) \cdot \vec{x} (t) \equiv 0

ossia

{\vec{x}}^{'} (t) ⊥ \vec{x} (t) .

Ovviamente, se $\vec{x} (t)$ è derivabile in $t_{0}$ , vale la prima formula degli incrementi finiti

\vec{x} (t) = \vec{x} (t_{0}) + {\vec{x}}^{'} (t_{0}) (t - t_{0}) + \vec{o} (t - t_{0}) .

Osservazione 120 Va esplicitamente notato che la seconda formula degli incrementi finiti, ossia il Teorema di Lagrange, NON vale. Per rendersi conto di ciò, consideriamo la funzione $\vec{x} (t) = x (t) \vec{i} + y (t) \vec{j}$ . Il Teorema di Lagrange può applicarsi alle due componenti separatamente, ottenendo

x (t^{'}) - x (t^{″}) = x^{'} (c_{1}) (t^{'} - t^{″}), y (t^{'}) - y (t^{″}) = y^{'} (c_{2}) (t^{'} - t^{″})

e generalmente $c_{1} \neq c_{2}$ . _

Se le singole componenti di $\vec{x} (t)$ sono ciascuna derivabile $2$ volte, potremo introdurre le derivate seconde e, in generale, le derivate $k$ -me in $t_{0}$ . Se ciascuna componente ammette $k$ derivate in $t_{0}$ si può anche scrivere la formula di Taylor con resto in forma di Peano,

\vec{x} (t) = \vec{x} (t_{0}) + \sum_{j = 1}^{k} \frac{{\vec{x}}^{(j)} (t_{0})}{j!} {(t - t_{0})}^{j} + \vec{o} {(t - t_{0})}^{k} .

Integrale

Se $t \to \vec{x} (t)$ è definita su $[a, b]$ e ciascuna sua componente è integrabile, si definisce $\int_{a}^{b} \vec{x} (t) d t$ come quel vettore che ha per componenti i numeri $\int_{a}^{b} x_{i} (t) d t$ .

Capitolo 4
Funzioni da $ℝ^{n}$ in $ℝ^{m}$

Studiamo ora le funzioni di più di una variabile; ossia funzioni

\vec{F} (\vec{x})

a valori in $ℝ^{m}$ , della variabile $\vec{x} \in ℝ^{n}$ , in generale con $n \neq m$ . Ovviamente, le prime proprietà da studiare saranno le proprietà relative ai limiti ed alla continuità. Come vedremo, non si incontrano situazioni sostanzialmente diverse da quelle delle funzioni da $ℝ$ in $ℝ$ (però le proprietà relative agli estremi saranno tipiche delle funzioni a valori reali). Differenze profonde si troveranno invece nello studio della differenziabilità.

4.1 Limiti e continuità

Ricordiamo che col simbolo $| \vec{r} |$ intendiamo la norma di $\vec{r}$ , senza esplicitamente indicare la dimensione del vettore. Per esempio,

\begin{aligned} se \vec{r} = x \in ℝ allora | \vec{r} | = \sqrt{x^{2}} = | x |; \\ se \vec{r} = (x, y) allora | \vec{r} | = \sqrt{x^{2} + y^{2}}; \\ se \vec{r} = (x, y, z) allora | \vec{r} | = \sqrt{x^{2} + y^{2} + z^{2}} . \end{aligned}

Se vorremo specificare che la norma è quella di $ℝ^{n}$ allora scriveremo

| \vec{r} |_{ℝ^{n}} .

Sia $\vec{F} (\vec{r})$ una funzione definita su un insieme $Ω$ di $ℝ^{n}$ , a valori in $ℝ^{m}$ e sia ${\vec{r}}_{0}$ un punto di accumulazione di $Ω$ .

Diremo che

lim_{\vec{r} \to {\vec{r}}_{0}} \vec{F} (\vec{r}) = \vec{L}

Se per ogni

𝜖 > 0

esiste un intorno

I_{𝜖} ({\vec{r}}_{0})

del punto

{\vec{r}}_{0}

tale che

per ogni

\vec{r} \in Ω \cap I_{𝜖} ({\vec{r}}_{0})

\vec{r} \neq {\vec{r}}_{0}

si ha

| \vec{F} (\vec{r}) - \vec{L} |_{ℝ^{m}} < 𝜖 .

In simboli:

\forall 𝜖 > 0 \exists I_{𝜖} ({\vec{r}}_{0}) | \forall \vec{r} \in Ω \cap (I_{𝜖} ({\vec{r}}_{0}) - {{\vec{r}}_{0}}) \Rightarrow | \vec{F} (\vec{r}) - \vec{L} |_{ℝ^{m}} < 𝜖 .

Se $\vec{L} = 0$ allora si dice che la funzione $\vec{F} (\vec{r})$ è infinitesima per $\vec{r} \to {\vec{r}}_{0}$ . Se accade che $\vec{F} (\vec{r})$ è definita in ${\vec{r}}_{0}$ e se inoltre $lim_{\vec{r} \to {\vec{r}}_{0}} \vec{F} (\vec{r}) = \vec{F} ({\vec{r}}_{0})$ , allora si dice che $\vec{F} (\vec{r})$ è continua in ${\vec{r}}_{0}$ .

Si noti che la definizione di limite e quella di continuità sono formalmente analoghe a quelle note per funzioni di una variabile. la differenza importante da tener presente è che ora il simbolo $I_{𝜖} ({\vec{r}}_{0})$ indica una palla aperta di centro ${\vec{r}}_{0}$ . E’ un po’ diversa la definizione dei limiti infiniti o per $\vec{r}$ tendente ad infinito, perché non si definisce il limite “direzionale”. Piuttosto, si definisce

Sia

Ω

un insieme illimitato. Si dice che

lim_{| \vec{r} |_{ℝ^{n}} \to + \infty} \vec{F} (\vec{r}) = \vec{L}

se per ogni

𝜖 > 0

esiste

δ

tale che se

| \vec{r} |_{ℝ^{n}} > δ

\vec{r} \in Ω

si ha

| \vec{F} (\vec{r}) - L |_{ℝ^{m}} < 𝜖 .

Sia

{\vec{r}}_{0}

punto di accumulazione di

Ω

. Si dice che

lim_{\vec{r} \to {\vec{r}}_{0}} | \vec{F} (\vec{r}) |_{ℝ^{m}} = + \infty

se per ogni

𝜖 > 0

esiste

δ > 0

tale che se

\vec{r} \in Ω

\vec{r} \neq {\vec{r}}_{0}

| \vec{r} - {\vec{r}}_{0} |_{ℝ^{n}} < δ

si ha

| \vec{F} (\vec{r}) |_{ℝ^{m}} > 𝜖 .

In queste definizioni, per completezza, abbiamo usato gli indici $ℝ^{n}$ e $ℝ^{m}$ per indicare esplicitamente gli spazi nei quali le norme vanno lette; da ora in poi però ometteremo tali indici.

Osservazione 121 Una funzione $\vec{F} (\vec{r})$ da $ℝ^{n}$ in $ℝ^{m}$ è infinitesima (per $\vec{r} \to {\vec{r}}_{\vec{0}}$ oppure per $| \vec{r} | \to + \infty$ ) se e solo se $| \vec{F} (\vec{r}) |$ è infinitesima come funzione da $ℝ^{n}$ in $ℝ$ . _

Si rileggano i teoremi sui limiti delle funzioni di una variabile, identificando quelle dimostrazioni che, grazie alle proprietà della norma, si ripetono senza alcuna modifica nel caso delle funzioni di più variabili. Naturalmente non rientrano tra queste quelle dimostrazioni che dipendono dall’ordine tra i numeri reali, come il teorema delle funzioni monotone e le sue conseguenze. Sottolineiamo che in particolare valgono:

Il teorema di unicità del limite;
il teorema di limitatezza locale;
i teoremi che correlano i limiti e la continuità con le operazioni. Naturalmente, tra funzioni a valori vettoriali non si fanno divisioni; e il teorema del prodotto va applicato al prodotto scalare o anche, quando $m = 3$ , al prodotto vettoriale: i prodotti scalari e vettoriali di funzioni continue sono funzioni continue;
i teoremi relativi ai limiti di funzioni composte;
per funzioni a valori in $ℝ$ , il teorema di confronto per i limiti e il teorema di permanenza del segno;
il teorema di confronto per gli infiniti e gli infinitesimi.

In particolare, vale

Lemma 122 Sia

lim_{\vec{r} \to {\vec{r}}_{0}} \frac{\vec{F} (\vec{r})}{| \vec{r} - {\vec{r}}_{0} |} = 0 .

Sia

lim_{t \to t_{0}} \vec{r} (t) = {\vec{r}}_{0}

ed esista un intorno di $t_{0}$ su cui la funzione $\vec{r} (t)$ non prende valore ${\vec{r}}_{0}$ . In tal caso vale

lim_{t \to t_{0}} \frac{\vec{F} (\vec{r} (t))}{| \vec{r} (t) - {\vec{r}}_{0} |} = 0 .

Notiamo un caso particolare del teorema sulla continuità delle funzioni composte, già usato nel corso di Analisi Matematica 1, trattando le equazioni differenziali:

Teorema 123 Sia $f (\vec{x})$ un funzione da $ℝ^{n}$ in $ℝ^{m}$ , continua su un insieme $Ω$ . Sia $\vec{x} (t)$ una funzione continua della variabile reale $t \in [a, b]$ , a valori in $Ω$ . La funzione composta $f (\vec{x} (t))$ è continua su $[a, b]$ .

Come si è detto, una funzione che ha limite zero (per $\vec{r} \to {\vec{r}}_{0}$ ) si chiama ancora un infinitesimo (per $\vec{r} \to {\vec{r}}_{0}$ ); e si può istituire un confronto tra gli infinitesimi, esattamente come nel caso di funzioni di una variabile. Per esempio, il simbolo

\vec{F} = o (| \vec{r} - {\vec{r}}_{0} |)

significa

lim_{\vec{r} \to {\vec{r}}_{0}} \frac{| \vec{F} (\vec{r}) |}{| \vec{r} - {\vec{r}}_{0} |} = 0 .

Usando il linguaggio degli infinitesimi, possiamo enunciare:

Teorema 124 Si ha

lim_{\vec{r} \to {\vec{r}}_{0}} \vec{F} (\vec{r}) = \vec{L}

se e solo se la funzione $\vec{F} (\vec{r}) - \vec{L}$ è infinitesima per $\vec{r} \to {\vec{r}}_{0}$ .

Infine, notiamo che le disuguaglianze (3.3) permettono di provare:

Teorema 125 Siano $F_{i} (\vec{r})$ le componenti della funzione $\vec{F} (\vec{r})$ da $ℝ^{n}$ in $ℝ^{m}$ . Si ha $lim_{\vec{r} \to {\vec{r}}_{0}} \vec{F} (\vec{r}) = \vec{L}$ se e solo se per ogni indice $i$ vale $lim_{\vec{r} \to {\vec{r}}_{0}} F_{i} (\vec{r}) = L_{i}$ , ove $L_{i}$ sono le componenti del vettore $\vec{L}$ .

Si enunci il risulato analogo per i limiti per $| \vec{r} | \to + \infty$ . Nonostante che abbiamo insistito sulla completa corrispondenza che intercorre tra definizioni e teoremi in una e più variabili, bisogna sottolineare una importante dissimmetria, che illustriamo con riferimento a funzioni da $ℝ^{2}$ in $ℝ^{2}$ . Sia quindi

\vec{F} (x, y) = f (x, y) \vec{i} + g (x, y) \vec{j} .

\begin{aligned} | f (x, y) | \leq | \vec{F} (x, y) | \leq | f (x, y) | + | g (x, y) | \\ | g (x, y) | \leq | \vec{F} (x, y) | \leq | f (x, y) | + | g (x, y) | \end{aligned}

si vede che $\vec{F} (x, y)$ è infinitesima se e solo se ambedue le sue componenti lo sono; è continua se e solo se ambedue le sue componenti lo sono; ossia, come asserito dal Teorema 125, limiti e continuità possono studiarsi esaminando separatamente le due componenti dei valori assunti dalla funzione, ossia le due componenti $f (x)$ ed $g (x)$ di $\vec{F} (x)$ . Ciò non accade nello spazio di partenza; ossia le due componenti $x$ ed $y$ non possono trattarsi separatamente. Per vedere questo, basta considerare una sola delle componenti di $\vec{F} (x, y)$ , per esempio la funzione a valori reali $f (x, y)$ . La funzione

ϕ (x) = lim_{y \to y_{0}} f (x, y)

(4.1)

può essere definita per ogni $x$ , e può esistere $lim_{x \to x_{0}} ϕ (x)$ ; però tale limite è in generale diverso da $lim_{(x, y) \to (x_{0}, y_{0})} f (x, y)$ , come mostra l’esempio seguente:

Esempio 126 Sia

f (x, y) = \{\begin{matrix} 1 & s e & | x | < | y | \\ 0 & s e & | x | \geq | y | . \end{matrix}

La funzione $f (x, y)$ è priva di limite per $(x, y)$ tendente a zero, mentre

lim_{x \to 0} [lim_{y \to 0} f (x, y)] = 0, lim_{y \to 0} [lim_{x \to 0} f (x, y)] = 1 .

Si veda la figura 4.1.

figura 4.1: La funzione dell’esempio 126

Può anche accadere che esista

lim_{(x, y) \to (x_{0}, y_{0})} f (x, y)

ma che non esista il limite che definisce $ϕ (x)$ in (4.1), come mostra l’esempio seguente:

Esempio 127 Sia

f (x, y) = x [s g n (y)] .

Essendo $| f (x, y) | \leq | x |$ , il teorema di confronto dei limiti mostra che

lim_{(x, y) \to (0, 0)} f (x, y) = 0;

ma,

lim_{y \to 0} f (x, y)

esiste soltanto se $x = 0$ . _

Infine, ricordiamo che successione è il termine che si usa per designare una funzione definita sui numeri naturali. Una successione a valori in $ℝ^{m}$ si indicherà col simbolo $({\vec{r}}_{n})$ o, più frequentemente ${{\vec{r}}_{n}}$ ¹. Come nel caso particolare delle successioni a valori reali, le definizioni e i teoremi sui limiti delle successioni sono casi particolari di quelli relativi alle funzioni.

4.1.1 Funzioni continue su insiemi

E’ possibile provare l’analogo del Teorema di Bolzano-Weierstrass: ogni successione limitata a valori in $ℝ^{n}$ ammette sottosuccessioni convergenti. Un insieme $Ω$ si dice compatto, quando ogni successione in $Ω$ ammette sottosuccessioni convergenti a punti di $Ω$ . Si può ancora provare:

Teorema 128 Un insieme $Ω$ è compatto se e solo se è limitato e chiuso.

Grazie a ciò, si prova l’analogo del Teorema di Weierstrass con la medesima dimostrazione vista per funzioni di una variabile. Diremo che:

un punto ${\vec{r}}_{0}$ è punto di minimo, o di massimo, per una funzione $f (\vec{r})$ a valori reali, se vale, rispettivamente, $f (\vec{r}) \geq f ({\vec{r}}_{0}) o p p u r e f (\vec{r}) \leq f ({\vec{r}}_{0})$
per ogni $r \in Ω$ ;
diremo che la funzione $\vec{F} (\vec{r})$ , da $ℝ^{n}$ in $ℝ^{m}$ è uniformemente continua se per ogni $𝜖 > 0$ esiste $δ > 0$ tale che $\vec{r} \in Ω, {\vec{r}}_{0} \in Ω, | \vec{r} - {\vec{r}}_{0} | < δ i m p l i c a | \vec{F} (\vec{r}) - \vec{F} ({\vec{r}}_{0}) | < 𝜖 .$

Vale:

Teorema 129 Sia $f (\vec{r})$ una funzione a valori reali definita e continua su un compatto $K \subseteq ℝ^{n}$ . La funzione $f (\vec{r})$ ammette in $K$ sia punti di minimo che punti di massimo.

Il teorema di esistenza degli zeri, equivalentemente quello dei valori intermedi, richiede, per funzioni di una variabile, di lavorare su intervalli. Gli insiemi aperti e connessi sono gli analoghi degli intervalli aperti, nel senso che per essi vale il teorema seguente:

Teorema 130 Sia $Ω$ un insieme aperto e connesso e sia $f (\vec{r})$ una funzione a valori reali e continua su $Ω$ . Se ${\vec{r}}_{0}$ e ${\vec{r}}_{1}$ sono due punti di $Ω$ , la funzione assume ogni valore $c$ compreso tra $f ({\vec{r}}_{0})$ e $f ({\vec{r}}_{1})$ .

Dim. Sia

f ({\vec{r}}_{0}) = a, f ({\vec{r}}_{1}) = b .

Se è possibile congiungere ${\vec{r}}_{0}$ e ${\vec{r}}_{1}$ con un segmento contenuto in $Ω$ , si considera la restrizione della funzione a tale segmento. Si trova una funzione di una sola variabile, continua e definita su un intervallo, che assume i valori $a$ e $b$ . Dunque assume anche il valore intermedio $c$ . Nel caso che i due punti si congiungano con una poligonale, ossia, con un numero finito di segmenti, si procede in modo analogo sui singoli segmenti. _ Esistono versioni del teorema precedente anche per funzioni a valori vettoriali. Si veda per esempio il paragrafo 7.5.2.

4.2 Le proprietà di differenziabilità

Per lo studio di queste proprietà, conviene separare lo studio delle funzioni a valori in $ℝ$ da quello delle funzioni a valori in $ℝ^{m}$ con $m > 1$ .

4.2.1 Il differenziale delle funzioni a valori reali

Quando la funzione $f (x, y)$ dipende da due variabili, la derivata parziale rispetto ad $x$ è la funzione sia di $x$ che di $y$ definita da

lim_{h \to 0} \frac{f (x + h, y) - f (x, y)}{h} .

Per indicare questa funzione si usa uno dei simboli

\frac{\partial}{\partial x} f (x, y), f_{x} (x, y) .

In modo analogo si definisce la derivata parziale rispetto ad $y$ e quella rispetto alle ulteriori variabili nel caso che la funzione dipenda da più di due variabili. Si noti esplicitamente che trattando delle equazioni differenziali si è dovuto richiedere però non la sola esistenza delle derivate parziali, ma la loro continuità. In effetti, la sola esistenza delle derivate parziali è un concetto molto debole. Infatti:

Esempio 131 L’esistenza delle derivate parziali in un punto $(x_{0}, y_{0})$ , non implica la continuità della funzione in tale punto, come mostra l’esempio seguente:

f (x, y) = \{\begin{matrix} 0 & s e x \cdot y = 0 \\ 1 & a l t r i m e n t i, \end{matrix} (x_{0}, y_{0}) = (0, 0) .

Per contrasto, si ricordi che l’esistenza della derivata prima in un punto di una funzione di una sola variabile, implica la continuità in tale punto. Ricordiamo che la dimostrazione di ciò segue dalla prima formula degli incrementi finiti e che praticamente tutte le proprietà delle funzioni derivabili di una variabile seguono dalla prima oppure dalla seconda formula degli incrementi finiti. Dunque, se si vuol sperare di ripetere, per le funzioni di più variabili, una teoria simile a quella delle funzioni di una variabile, dovremo dare condizioni per l’esistenza di una formula analoga alla prima formula degli incrementi finiti: ossia, nel caso di funzioni di due variabili, vorremo condizioni perchè valga la formula seguente

f (x, y) - f (x_{0}, y_{0}) = a (x - x_{0}) + b (y - y_{0}) + o (| (x - x_{0}, y - y_{0}) |) .

(4.2)

Il risultato che vogliamo provare è:

Teorema 132 Sia $f (x, y)$ una funzione di due variabili. Supponiamo che essa ammetta ambedue le derivate parziali in ogni punto $(x, y)$ di un intorno di $(x_{0}, y_{0})$ e che queste siano continue in tale intorno. Esistono numeri $a$ , $b$ per i quali vale la formula (4.2), ed è:

a = f_{x} (x_{0}, y_{0}), b = f_{y} (x_{0}, y_{0}) .

La dimostrazione è in appendice. Passando al limite per $d i s t ((x, y), (x_{0}, y_{0}))$ tendente a zero in (4.2) si vede che $lim f (x, y) = f (x_{0}, y_{0})$ . Si ha quindi in particolare:

Corollario 133 Se una funzione ha derivate parziali continue un intorno di $(x_{0}, y_{0})$ , essa è continua in $(x_{0}, y_{0})$ .

Argomenti del tutto analoghi valgono per funzioni di tre o più variabili:

Teorema 134 Una funzione di $n$ variabili le cui $n$ derivate prime esistono e sono continue su un aperto $Ω$ è continua su $Ω$ e per essa vale

\begin{aligned} f (ξ^{1}, ξ^{2}, \dots, ξ^{n}) = f (x^{1}, x^{2}, \dots, x^{n}) + \sum_{i = 1}^{n} (ξ^{i} - x^{i}) f_{x^{i}} (x^{1}, x^{2}, \dots, x^{n}) \\ + o (| \vec{h} |), \vec{h} = ((ξ^{1} - x^{1}), (ξ^{2} - x^{2}), \dots, (ξ^{n} - x^{n})) . \end{aligned}

Si chiama differenziale della funzione $f$ in $\vec{r} = {[\begin{matrix} x^{1} & x^{2} & \dots & x^{n} \end{matrix}]}^{'}$ la trasformazione che al vettore $(y_{1}, \dots, y_{n})$ associa il numero

\sum_{i = 1}^{n} y_{i} f_{x^{i}} (x^{1}, x^{2}, \dots, x^{n}) .

Una funzione dotata di differenziale si chiama differenziabile. Il vettore

[\begin{matrix} f_{x^{1}} (\vec{r}) \\ f_{x^{2}} (\vec{r}) \\ ⋮ \\ f_{x^{n}} (\vec{r}) \end{matrix}] \vec{r} = [\begin{matrix} x^{1} \\ x^{2} \\ ⋮ \\ x^{n} \end{matrix}]

si chiama il gradiente della funzione $f (\vec{r})$ e si indica col simbolo $\nabla f (\vec{r})$ . Il simbolo $\nabla$ si legge “grad”, oppure “del” od anche “nabla”. Usando questo simbolo, la (4.3) si scrive

f (\vec{r}) - f ({\vec{r}}_{\vec{0}}) = \nabla f ({\vec{r}}_{\vec{0}}) \cdot (\vec{r} - {\vec{r}}_{\vec{0}}) + o (| \vec{r} - {\vec{r}}_{\vec{0}} |) .

Si chiama piano tangente al grafico di $f (\vec{r})$ nel punto ${\vec{r}}_{0} = (x_{0}^{1}, \dots, x_{0}^{n})$ il grafico della funzione

\vec{r} \to {\vec{r}}_{0} + \nabla f ({\vec{r}}_{0}) \cdot (\vec{r} - {\vec{r}}_{0}) .

Dunque, l’equazione del piano tangente è

\vec{y} = {\vec{r}}_{0} + \nabla f ({\vec{r}}_{0}) \cdot (\vec{r} - {\vec{r}}_{0}) .

Il vettore $\nabla f ({\vec{r}}_{0})$ è ortogonale al piano tangente. Per definizione, si chiama il vettore normale al grafico di $f (\vec{r})$ nel punto $({\vec{r}}_{0}, f ({\vec{r}}_{0}))$ . Si veda la figura 4.2.

figura 4.2: Piano tangente e vettore normale

Una funzione dotata di derivate parziali prime continue su un aperto $Ω$ si chiama una funzione di classe $C^{1} (Ω)$ e si scrive $f \in C^{1} (Ω)$ . Si noti che, per noi, il gradiente è un vettore colonna. D’altra parte, il differenziale, come trasformazione da $ℝ^{n}$ , dotato della base canonica, ad $ℝ$ , si rappresenta mediante una matrice $1 \times n$ , ossia mediante un vettore riga. Il vettore riga che rappresenta il differenziale è il trasposto del gradiente. Diciamo infine che si chiamano punti stazionari di $f (\vec{r})$ i punti nei quali si annulla il gradiente $\nabla f (\vec{r})$ . Tali punti si chiamano anche punti estremali o punti critici

4.2.2 Regole di derivazione

Dato che la derivata parziale rispetto ad $x$ di una funzione $f (x, y)$ si calcolano fissando prima il valore di $y$ , e lavorando con la funzione della sola $x$ , si hanno immediatamente le regole seguente:

\begin{aligned} \frac{\partial}{\partial x} a f (x, y) = a \frac{\partial}{\partial x} f (x, y) \forall a \in ℝ; \\ \frac{\partial}{\partial x} (f (x, y) + g (x, y)) = \frac{\partial}{\partial x} f (x, y) + \frac{\partial}{\partial x} g (x, y); \\ \frac{\partial}{\partial x} (f (x, y) g (x, y)) = (\frac{\partial}{\partial x} f (x, y)) g (x, y) + f (x, y) (\frac{\partial}{\partial x} g (x, y)); \\ \frac{\partial}{\partial t} f (x (t), y) = (\frac{\partial}{\partial x} f (x (t), y)) x^{'} (t) . \end{aligned}

Però nello studio della funzione composta si incontrano casi più complessi: può essere che sia $x$ che $y$ vengano a dipendere dalla medesima variabile, ossia che si voglia calcolare

\frac{d}{d t} f (x (t), y (t)) .

In questo caso si ha:

Teorema 135 Sia $f (x, y)$ differenziabile in ogni punto di una regione $Ω \subseteq ℝ^{2}$ e sia $(x (t), y (t))$ una funzione derivabile di $t \in (a, b)$ a valori in $Ω$ . Allora per ogni $t$ si ha:

\frac{d}{d t} f (x (t), y (t)) = f_{x} (x (t), y (t)) ẋ (t) + f_{y} (x (t), y (t)) ẏ (t) .

(4.3)

Dim. Si fissi un punto $t_{0}$ in cui si vuol calcolare la derivata, e si ponga $a = f_{x} (x (t_{0}), y (t_{0}))$ , $b = f_{y} (x (t_{0}), y (t_{0}))$ . Si ha:

\begin{aligned} f (x (t), y (t)) - f (x (t_{0}), y (t_{0})) = a [x (t) - x (t_{0})] + b [y (t) - y (t_{0})] \\ + o (| (x (t) - x (t_{0}), y (t) - y (t_{0})) |) \\ = [a ẋ (t_{0}) + b ẏ (t_{0})] (t - t_{0}) + o (t - t_{0}) + o (| (x (t) - x (t_{0}), y (t) - y (t_{0})) |) . \end{aligned}

Notando che

\frac{o (| (x (t) - x (t_{0}), y (t) - y (t_{0})) |)}{| (x (t) - x (t_{0}), y (t) - y (t_{0})) |} \cdot \frac{| (x (t) - x (t_{0}), y (t) - y (t_{0})) |}{t - t_{0}}

si vede che

o (| (x (t) - x (t_{0}), y (t) - y (t_{0})) |) = o (t - t_{0}) .

Infatti

\frac{o (| (x (t) - x (t_{0}), y (t) - y (t_{0})) |)}{| (x (t) - x (t_{0}), y (t) - y (t_{0})) |}

tende a zero per il Lemma 122 mentre

\frac{| (x (t) - x (t_{0}), y (t) - y (t_{0})) |}{t - t_{0}}

rimane limitata, come si vede dalla seconda formula degli incrementi finiti applicata sia ad $x (t)$ che ad $y (t)$ :

\begin{aligned} \frac{| (x (t) - x (t_{0}), y (t) - y (t_{0})) |}{t - t_{0}} = \sqrt{{(ẋ (c))}^{2} + {(ẏ (d))}^{2}} . \end{aligned}

Sia ora

g (t) = f (x (t), y (t)) .

L’uguaglianza

\begin{aligned} g (t) - g (t_{0}) = [a ẋ (t_{0}) + b ẏ (t_{0})] (t - t_{0}) + o (t - t_{0}) \\ + o (| (x (t) - x (t_{0}), y (t) - y (t_{0})) |) \\ = [a ẋ (t_{0}) + b ẏ (t_{0})] (t - t_{0}) + o (t - t_{0}) \end{aligned}

mostra che $g (t)$ è derivabile per $t = t_{0}$ , con

ġ (t) = \frac{d}{d t} f (x (t), y (t)) = a ẋ (t_{0}) + b ẏ (t_{0}) .

Osservazione 136 Si noti che usando il Lemma 122, si è implicitamente assunto che in un opportuno intorno di $t_{0}$ la funzione $(x (t), y (t))$ non prenda valore $(x (t_{0}), y (t_{0}))$ . Si provi per esercizio che questa condizione può rimuoversi. _

Naturalmente, il Teorema 135 si estende al caso di funzioni di $n$ variabili e, ricordando il Teorema 134, possiamo enunciare:

Corollario 137 Sia $f (\vec{r}) \in C^{1} (Ω)$ e sia $\vec{r} (t)$ una funzione di $t \in (a, b)$ a valori in $Ω$ , derivabile. Allora, la funzione composta $f (\vec{r} (t))$ è derivabile su $(a, b)$ ed inoltre:

\frac{d}{d t} f (\vec{r} (t)) = \nabla f (\vec{r} (t)) \cdot \dot{\vec{r}} (t)

(il simbolo $\cdot$ indica il prodotto scalare).

Sia ora $x = x (u, v)$ , $y = y (u, v)$ . Applicando il teorema precedente alla variabile $u$ , con $v$ fissato, e quindi alla variabile $v$ , con $u$ fissato si trova:

Teorema 138 Sia $f (x, y) \in C^{1} (Ω)$ . Siano $x = x (u, v)$ , $y = y (u, v)$ due funzioni definite su $\tilde{Ω}$ e di classe $C^{1} (\tilde{Ω})$ , a valori in $Ω$ . Valgono le uguaglianze

\begin{aligned} \frac{\partial}{\partial u} f (x (u, v), y (u, v)) = f_{x} (x (u, v), y (u, v)) x_{u} (u, v) + f_{y} (x (u, v), y (u, v)) y_{u} (u, v) \\ = \nabla f (x (u, v), y (u, v)) \cdot [\begin{matrix} x_{u} (u, v) \\ y_{u} (u, v) \end{matrix}], \\ \frac{\partial}{\partial v} f (x (u, v), y (u, v)) = f_{x} (x (u, v), y (u, v)) x_{v} (u, v) + f_{y} (x (u, v), y (u, v)) y_{v} (u, v) \\ = \nabla f (x (u, v), y (u, v)) \cdot [\begin{matrix} x_{v} (u, v) \\ y_{v} (u, v) \end{matrix}] \end{aligned}

(il punto indica il prodotto scalare di vettori colonna). Questa formula si chiama anche formula della derivazione a catena. Consideriamo ora un caso particolare: sia $x = t v^{1}$ , $y = t v^{2}$ . In questo caso, i punti $(x_{0} + t v^{1}, y_{0} + t v^{2})$ sono punti di una retta nella direzione del vettore $\vec{v} = (v^{1}, v^{2})$ , uscente da $(x_{0}, y_{0})$ . La derivata

\frac{d}{d t} f (x_{0} + t v^{1}, y_{0} + t v^{2})

calcolata per $t = 0$ si chiama la derivata secondo il vettore $\vec{v}$ della funzione e si indica col simbolo

\frac{\partial f}{\partial \vec{v}} (x, y) .

Dal Teorema 135 segue che, se $f (x, y)$ è di classe $C^{1}$ ,

\frac{\partial f}{\partial \vec{v}} (x, y) = f_{x} (x, y) v^{1} + f_{y} (x, y) v^{2} = \nabla f (x, y) \cdot \vec{v} .

Se $\vec{v}$ è un versore, allora si parla di derivata direzionale nella direzione $\vec{v}$ . E’ facile estendere gli argomenti precedenti a funzioni di tre o più variabili.

4.2.3 La direzione del gradiente e la direzione di massima velocità crescita

Sia $f (\vec{r})$ una funzione differenziabile a valori reali e sia ${\vec{r}}_{0}$ un punto del suo dominio, che supponiamo aperto. fissiamo un segmento uscente da ${\vec{r}}_{0}$ , dato da

\vec{r} = {\vec{r}}_{0} + t \vec{v}, t \in (- 𝜖, 𝜖) .

(4.4)

Il numero $𝜖$ si sceglie piccolo, in modo che il segmento sia contenuto nel dominio della funzione, e $\vec{v}$ è un versore. La derivata in $t = 0$ della funzione $f ({\vec{r}}_{0} + t \vec{v})$ rappresenta la velocità di variazione dei valori della restrizione di $f (\vec{r})$ al segmento (4.4). E’

\frac{d}{d t} f {({\vec{r}}_{0} + t \vec{v})}_{|_{t = 0}} = \nabla f ({\vec{r}}_{0}) \cdot \vec{v} .

Questo numero rappresenta la componente di $\nabla f ({\vec{r}}_{0})$ lungo $\vec{v}$ e quindi il suo valore assoluto è sempre minore di $| \nabla f ({\vec{r}}_{0}) |$ ; è uguale quando accade che $\vec{v}$ è il versore

\vec{v} = \frac{\nabla f ({\vec{r}}_{0})}{| \nabla f ({\vec{r}}_{0}) |} .

In questo caso si ha anche

\nabla f ({\vec{r}}_{0}) \cdot \vec{v} = | \nabla f ({\vec{r}}_{0}) |;

ossia, la funzione $f (\vec{r})$ ha massima velocità di crescita nella direzione e verso di $\nabla f ({\vec{r}}_{0})$ ; nel verso opposto essa ha massima velocità di decrescita.

4.2.4 Le funzioni definite tramite integrali

Sia $f (x, y)$ una funzione continua su un rettangolo chiuso $[a, b] \times [c, d]$ . Per ogni fissata coppia di numeri $x \in [a, b]$ e $y \in [c, d]$ si può definire il numero

ϕ (x, y) = \int_{c}^{y} f (x, s) d s .

Si trova così una seconda funzione definita su $[a, b] \times [c, d]$ . Vale:

Teorema 139 La funzione $f (x, y)$ sia continua sul rettangolo chiuso $R$ . Allora, la funzione $ϕ (x, y)$ è continua in $R$ .

Dim. Si scriva

| ϕ (x, y) - ϕ (x^{'}, y^{'}) | \leq | ϕ (x, y) - ϕ (x^{'}, y) | + | ϕ (x^{'}, y) - ϕ (x^{'}, y^{'}) | .

Vogliamo provare che per ogni $η > 0$ esiste $σ > 0$ tale che se

d ((x, y), (x^{'}, y^{'})) < σ

allora vale

\begin{aligned} | ϕ (x, y) - ϕ (x^{'}, y) | < η ∕ 2, \end{aligned}

(4.5)

\begin{aligned} | ϕ (x^{'}, y) - ϕ (x^{'}, y^{'}) | < η ∕ 2 . \end{aligned}

(4.6)

Studiamo (4.5):

\begin{aligned} | ϕ (x, y) - ϕ (x^{'}, y) | = |\int_{c}^{y} f (x, s) d s - \int_{c}^{y} f (x^{'} . s) d s| \\ = |\int_{c}^{y} [f (x, s) - f (x^{'}, s)] d s| \leq \int_{c}^{y} |f (x, s) - f (x^{'}, s)| d s \\ \leq \int_{c}^{d} |f (x, s) - f (x^{'}, s)| d s . \end{aligned}

La funzione $f (x, y)$ è continua sul rettangolo limitato e chiuso $R$ e quindi è uniformemente continua: per ogni $δ > 0$ esiste $σ > 0$ tale che

| (x, y) - (x^{'}, y^{'}) | < σ \Rightarrow | f (x, y) - f (x^{'}, y^{'}) | < δ .

La condizione

| (x, y) - (x^{'}, y^{'}) | < σ

vale in particolare se $y = y^{'} \in [c, d]$ e se $| x - x^{'} | < σ$ . Dunque,

| x - x^{'} | < σ \Rightarrow | f (x, s) - f (x^{'}, s) | < δ \Rightarrow \int_{c}^{d} |f (x, s) - f (x^{'}, s)| d s < (d - c) δ .

L’assero segue scegliendo

δ = \frac{η}{2 (d - c)} .

Studiamo il secondo addendo (4.6). Per fissare le idee sia $y < y^{'}$ :

| ϕ (x^{'}, y) - ϕ (x^{'}, y^{'}) | = |\int_{c}^{y} f (x^{'}, s) d s - \int_{c}^{y^{'}} f (x^{'}, s) d s| \leq \int_{y}^{y^{'}} |f (x^{'}, s)| d s .

La funzione $f (x, y)$ è continua sul rettangolo limitato e chiuso $R$ . Dunque, per il Teorema di Weierstrass, è limitata. Sia $| f (x, y) | < M$ . Per la monotonia dell’integrale si ha

| ϕ (x^{'}, y) - ϕ (x^{'}, y^{'}) | \leq M (y^{'} - y) .

Per avere questa differenza minore di $η ∕ 2$ basta imporre la condizione $| y^{'} - y | < η ∕ 2 M$ . _ Di conseguenza, dal teorema sulla continuità delle funzioni composte, viene ad essere continua anche la funzione

\int_{c}^{g (x, y)} f (x, s) d s,

per ogni funzione continua $g (x, y)$ . Scegliendo in particolare $g (x, y)$ costantemente uguale a $b$ si trova:

Teorema 140 Sia $f (x, y)$ continua su $[a, b] \times [c, d]$ e sia

ϕ (x) = \int_{a}^{b} f (x, y) d y .

La funzione $ϕ (x)$ è continua su $[a, b]$ .

Studiamo ora la derivabilità:

Teorema 141 Il rettangolo chiuso $R$ sia interno ad una regione $Ω$ su cui la funzione $f (x, y)$ ammette derivate parziali continue. Si ha:

\begin{aligned} \frac{\partial}{\partial x} ϕ (x, y) = \frac{\partial}{\partial x} \int_{c}^{y} f (x, s) d s = \int_{c}^{y} f_{x} (x, s) d s \\ \frac{\partial}{\partial y} ϕ (x, y) = \frac{\partial}{\partial y} \int_{c}^{y} f (x, s) d s = f (x, y) . \end{aligned}

Dim. La seconda uguaglianza è ovvia perchè il calcolo dell’integrale e quello della derivata parziale rispetto ad $y$ si fanno per ogni $x$ fissata; e quindi di fatto si lavora con funzioni della sola variabile $y$ . Proviamo la prima uguaglianza. Scriviamo

\frac{ϕ (x + h, y) - ϕ (x, y)}{h} - \int_{c}^{y} f_{x} (x, s) d s = \int_{c}^{y} [\frac{f (x + h, s) - f (x, s)}{h} - f_{x} (x, s)] d s .

Vogliamo provare che questa differenza tende a zero per $h \to 0$ . fissiamo $s \in [c, d]$ e scriviamo la formula della media per la funzione della sola variabiled $x$ :

\frac{f (x + h, s) - f (x, s)}{h} - f_{x} (x, s) = f_{x} (\tilde{x}, s) - f_{x} (x, s)

ove $\tilde{x}$ dipende sia da $h$ che da $s$ . E’ però un punto dell’intervallo $(x, x + h)$ . La funzione $f_{x} (x, y)$ è uniformemente continua su $R$ e quindi, dato $𝜖 > 0$ , esiste $δ_{𝜖} > 0$ tale che

se | h | < δ_{𝜖} v a l e | f_{x} (\tilde{x}, s) - f_{x} (x, s) | < 𝜖;

e quindi,

|\frac{ϕ (x + h, y) - ϕ (x, y)}{h} - \int_{c}^{y} f_{x} (x, s) d s| \leq \int_{c}^{y} 𝜖 d s \leq (d - c) 𝜖 .

Ciò prova che il limite per $h$ tendente a zero è nullo. _ Torniamo ora a considerare la funzione

ϕ (x) = \int_{c}^{d} f (x, y) d y .

Essendo questa funzione continua, essa può venir integrata rispetto alla variabile $x$ :

\int_{a}^{b} [\int_{c}^{d} f (x, y) d y] d x

Si chiama questo integrale iterato della funzione $f (x, y)$ . Naturalmente, si può anche introdurre un secondo integrale iterato,

\int_{c}^{d} [\int_{a}^{b} f (x, y) d x] d y

e si pone il problema di sapere se i loro valori coincidano o meno. La risposta affermativa si vedrà nel cap. 7.

4.3 Le derivate di ordine superiore

Ricordiamo che le derivate parziali sono a loro volta funzioni di più variabili, e quindi può accadere che esse siano ulteriormente derivabili. Si possono quindi definire le funzioni

f_{x x} (x, y) = \frac{\partial}{\partial x} [\frac{\partial}{\partial x} f (x, y)], f_{x y} (x, y) = \frac{\partial}{\partial x} [\frac{\partial}{\partial y} f (x, y)] f_{y y} (x, y) = \frac{\partial}{\partial y} [\frac{\partial}{\partial y} f (x, y)]

e cosìvia. Quando una funzione ammette tutte le derivate parziali continue fino all’ordine $k$ incluso su un aperto $Ω$ , si dice che essa è di classe $C^{k} (Ω)$ . La notazione

\frac{\partial^{n}}{\partial x^{n}} f (x, y)

indica la derivata $n$ –ma di $f (x, y)$ rispetto alla variabile $x$ , ossia la derivata ottenuta tenendo fisso il valore di $y$ e derivando $n$ volte rispetto ad $x$ . Significato analogo ha il simbolo

\frac{\partial^{n}}{\partial y^{n}} f (x, y) .

Le cose sono più complicate se si vogliono le derivate miste, ossia le derivate ottenute derivando alcune volte rispetto ad $x$ e anche rispetto ad $y$ perché in generale dovremo tener conto dell’ordine con cui si eseguono le derivate. Per esempio, in generale

D_{x} (D_{y} f (x, y)) = \frac{\partial}{\partial x} [\frac{\partial}{\partial y} f (x, y)] \neq \frac{\partial}{\partial y} [\frac{\partial}{\partial x} f (x, y)] = D_{y} (D_{x} f (x, y)) .

Fortunatamente, ciò non avviene nei casi più interessanti per le applicazioni. Vale infatti:

Teorema 142 (di Schwarz) Sia $f (x, y)$ una funzione delle due variabili $(x, y)$ , di classe $C^{1}$ un intorno $V$ di $(x_{0}, y_{0})$ . Supponiamo che nei punti di $V$ esistano le derivate miste $D_{x} (D_{y} f (x, y))$ ed $D_{y} (D_{x} f (x, y))$ , e supponiamo che queste siano continue. Allora, per ogni $(x, y)$ vale

D_{x} (D_{y} f (x, y)) = D_{y} (D_{x} f (x, y)) .

Esaminando la dimostrazione, in appendice, si vede facilmente che il teorema si estende al caso di funzioni di più di due variabili. Grazie a questo teorema, le due derivate miste rispetto ad $x$ ed $y$ di $f (x, y)$ si indicano semplicemente con i simboli

f_{x, y} (x, y), \frac{\partial^{2}}{\partial x \partial y} f (x, y),

senza preoccuparsi dell’ordine di derivazione. Il Teorema di Schwarz si estende a funzioni di $n$ variabili, ed a qualsiasi ordine di derivazione, come segue:

Corollario 143 Sia $f (\vec{r}) \in C^{n} (Ω)$ . Si derivi la funzione $k_{1}$ volte rispetto alla prima componente di $\vec{r}$ ; $k_{2}$ rispetto alla seconda ecc., ma con

k_{1} + k_{2} + \dots + k_{n} \leq n .

La derivata che si ottiene non dipende dall’ordine col quale si eseguono le derivate.

Indicare derivate successive di funzioni di più variabili è alquanto noioso. Un simbolo comodo si ottiene in questo modo. Sia $f (\vec{r})$ una funzione di $\vec{r} \in ℝ^{n}$ . Chiamiamo multiindice un vettore $α = (α_{1}, α_{2}, \dots, α_{n})$ le cui componenti sono numeri interi nulli o positivi. Indichiamo con $| α |$ la lunghezza del multiindice:

| α | = α_{1} + α_{2} + α_{3} + \dots + α_{n} .

Col simbolo ${\vec{r}}^{α}$ intendiamo:

{\vec{r}}^{α} = (r_{1}^{α_{1}}, r_{2}^{α_{2}}, \dots, r_{n}^{α_{n}}) .

Col simbolo

D^{α} f (\vec{r}) = \frac{\partial^{| α |}}{\partial {\vec{r}}^{α}} f (\vec{r})

si intende la derivata di $f (\vec{r})$ che si ottiene derivando la funzione $f (\vec{r})$ nell’ordine, prima $α_{1}$ volte rispetto alla prima variabile, poi $α_{2}$ volte rispetto alla seconda variabile, ecc. (intendendo che se $α_{i} = 0$ la corrispondente derivata non si esegue). Il Teorema di Schwarz assicura che se ciascuna derivata di ordine $| α |$ di $f (\vec{r})$ è continua allora le derivate miste di ordine $| α |$ non dipendono dall’ordine con cui vengono calcolate. Ciò giustifica la notazione $f \in C^{k} (Ω)$ , che si usa quando la funzione $f (\vec{r})$ ammette tutte le derivate di ordine $k$ su $Ω$ , e queste sono continue.

4.3.1 La formula di Taylor per le funzioni a valori reali

Cosìcome nel caso delle funzioni di una variabile, gli argomenti che hanno condotto alla prima formula degli incrementi finiti possono iterarsi se la funzione ammette continue le successive $N$ derivate. Senza entrare nei dettagli della dimostrazione (simile a quella del Teorema 132), limitiamoci a dare la formula che si ottiene nel caso delle derivate seconde. Quando la funzione dipende da due variabili, si trova

\begin{aligned} f (x, y) = f (x_{0}, y_{0}) \\ + [f_{x} (x_{0}, y_{0}) (x - x_{0}) + f_{y} (x_{0}, y_{0}) (y - y_{0})] \\ + \frac{1}{2} \{f_{x x} (x_{0}, y_{0}) {(x - x_{0})}^{2} + f_{x y} (x_{0}, y_{0}) (x - x_{0}) (y - y_{0}) \\ + f_{y x} (x_{0}, y_{0}) (x - x_{0}) (y - y_{0}) + f_{y y} (x_{0}, y_{0}) {(y - y_{0})}^{2}\} + R (x, y) . \end{aligned}

lim_{d ((x, y), (x_{0}, y_{0})) \to 0} \frac{R (x, y,)}{{[d ((x, y), (x_{0}, y_{0}))]}^{2}} = 0, o s s i a R (x, y) = o (| (x - x_{0}, y - y_{0}) |^{2}) .

(4.7)

Grazie al Teorema di Schwarz, la formula precedente si può scrivere

\begin{aligned} f (x, y) = f (x_{0}, y_{0}) \\ + [f_{x} (x_{0}, y_{0}) (x - x_{0}) + f_{y} (x_{0}, y_{0}) (y - y_{0})] \\ + \frac{1}{2} \{f_{x x} (x_{0}, y_{0}) {(x - x_{0})}^{2} + 2 f_{x y} (x_{0}, y_{0}) (x - x_{0}) (y - y_{0}) + f_{y y} (x_{0}, y_{0}) {(y - y_{0})}^{2}\} \\ + R (x, y) . \end{aligned}

Questa formula si chiama ancora formula di Taylor arrestata al secondo ordine perché il resto $R (x, y)$ verifica la condizione (4.7). Naturalmente, aggiungendo i termini con le derivate rispetto ad una terza variabile $z$ si trova la formula di Taylor in tre variabili e, in generale, in $n$ variabili. Si immagina facilmente che le formule divengano via via più complesse, in particolare se la funzione dipende da più di due variabili e si vuole scrivere la formula di Taylor di ordine maggiore di $2$ . E’ però possibile scrivere queste formule in modo compatto come segue. Riguardiamo il caso della formula di Taylor di $f (x, y)$ arrestata all’ordine $2$ . Si noti che il termine

f_{x} (x_{0}, y_{0}) (x - x_{0}) + f_{y} (x_{0}, y_{0}) (y - y_{0})

si può pensare ottenuto come segue:

\frac{1}{1!} [(x - x_{0}) \frac{\partial}{\partial x} + (y - y_{0}) \frac{\partial}{\partial y}] f (x, y) = \frac{1}{1!} [f_{x} (x_{0}, y_{0}) (x - x_{0}) + f_{y} (x_{0}, y_{0}) (y - y_{0})] .

Consideriamo ora il termine di ordine $2$ :

\frac{1}{2} \{f_{x x} (x_{0}, y_{0}) {(x - x_{0})}^{2} + 2 f_{x y} (x_{0}, y_{0}) (x - x_{0}) (y - y_{0}) + f_{y y} (x_{0}, y_{0}) {(y - y_{0})}^{2}\}

si può ottenere con questa regola mnemonica: si “calcola”

\frac{1}{2!} {[(x - x_{0}) \frac{\partial}{\partial x} + (y - y_{0}) \frac{\partial}{\partial y}]}^{2}

scrivendo

\frac{1}{2!} [(x - x_{0}^{2}) \frac{\partial^{2}}{\partial x^{2}} + 2 (x - x_{0}) (y - y_{0}) \frac{\partial^{2}}{\partial x \partial y} + (y - y_{0}^{2}) \frac{\partial^{2}}{\partial y^{2}}] .

Si “applica” quindi questo alla funzione $f (x, y)$ scrivendo

\begin{aligned} \frac{1}{2!} [(x - x_{0}^{2}) \frac{\partial^{2}}{\partial x^{2}} + 2 (x - x_{0}) (y - y_{0}) \frac{\partial^{2}}{\partial x \partial y} + (y - y_{0}^{2}) \frac{\partial^{2}}{\partial y^{2}}] f (x, y) \\ = \frac{1}{2!} [{(x - x_{0})}^{2} f_{x x} (x_{0}, y_{0}) + 2 (x - x_{0}) (y - y_{0}) f_{x y} (x_{0}, y_{0}) + {(y - y_{0})}^{2} f_{x x} (x_{0}, y_{0})] . \end{aligned}

Questa “regola mnemonica” si estende al caso dell’ordine maggiore di $2$ e fornisce l’espressione corretta della formula di Taylor arrestata all’ordine $k$ :

f (x, y) = \sum_{j = 0}^{k} \frac{1}{j!} {[(x - x_{0}) \frac{\partial}{\partial x} + (y - y_{0}) \frac{\partial}{\partial y}]}^{j} f (x, y) + o {(\sqrt{{(x - x_{0})}^{2} + {(y - y_{0})}^{2}})}^{k} .

In questa formula si intende che

{[(x - x_{0}) \frac{\partial}{\partial x} + (y - y_{0}) \frac{\partial}{\partial y}]}^{0} f (x, y) = f (x_{0}, y_{0}) .

L’estensione di questa formula al caso di funzioni dipendenti da più di due variabili è ovvia.

4.4 Gli estremi

La formula di Taylor, arrestata al primo ordine, ha già dato un’informazione importante. Infatti, ha condotto a provare che ogni funzione le cui derivate parziali sono ovunque continue è essa stessa continua. Daltra parte, nel caso delle funzioni di una sola variabile, la formula di Taylor si usa per dedurre regole che possono condurre ad identificare i punti di massimo o di minimo. Si può immaginare che anche per funzioni di più variabili si possa fare uno studio analogo. Per renderci conto di ciò, repetiamo la definizione degli estremi:

Definitione 2 Sia $f (\vec{r})$ una funzione da $ℝ^{n} \to ℝ$ . Un punto ${\vec{r}}_{0}$ interno al dominio di $f (\vec{r})$ si dice punto di minimo (relativo) per la funzione $f (\vec{r})$ se esiste $ν > 0$ tale che

d (\vec{r}, {\vec{r}}_{0}) < ν \Rightarrow f ({\vec{r}}_{0}) \leq f (\vec{r}) .

In modo analogo si definiscono i punti di massimo. _

La figura 4.3 (a sinistra) mostra un punto di minimo.

figura 4.3: Un punto di minimo e un punto di sella

Quando l’intorno di ${\vec{r}}_{0}$ coincide con $Ω$ , si parla di estremi assoluti o estremi globali E naturalmente a questo caso ci si può ricondurre, sostituendo $Ω$ con tale intorno. Studiamo ora il caso degli estremi relativi di funzioni di due variabili, che sono interni al dominio. Notiamo che se $(x_{0}, y_{0})$ è punto di minimo, allora la funzione $g (x)$ della sola variabile $x$ ,

g (x) = f (x, y_{0})

ha minimo in $x_{0}$ ed $x_{0}$ è punto interno al dominio. Dunque, se è derivabile, essa ha derivata nulla in $x_{0}$ , per il Teorema di Fermat. Per definizione, $g^{'} (x_{0}) = f_{x} (x_{0}, y_{0})$ . Se $(x_{0}, y_{0})$ è punto di minimo, esso è anche punto di minimo per la funzione

h (y) = f (x_{0}, y)

e quindi $h^{'} (y_{0}) = 0$ ; e naturalmente il discorso si ripete se $(x_{0}, y_{0})$ è punto di massimo per $f (x, y)$ . Dunque:

Teorema 144 Se la funzione $f (x, y)$ ammette derivate parziali prime nel punto di minimo (o di massimo) $(x_{0}, y_{0})$ interno al dominio, esse sono ambedue nulle:

f_{x} (x_{0}, y_{0}) = 0, f_{y} (x_{0}, y_{0}) = 0 .

Ossia: gli estremi di una funzione vanno ricercati tra i suoi punti stazionari. Naturalmente, un punto stazionario, ossia un punto nel quale si annulla il gradiente della funzione, non è necessariamente un estremo. Una coindizione suffciente per gli estremi si vedrà più avanti. Però, in generale la funzione può avere un comportamente quanto mai vario nei punti nei quali si annulla il gradiente. In particolare definiamo:

Definitione 3 Si dice che ${\vec{r}}_{0}$ è punto di sella se è un punto stazionario e se, inoltre, la funzione $f (\vec{r}) - f ({\vec{r}}_{0})$ cambia segno in ogni intorno ${\vec{r}}_{0}$ . _

La figura 4.3, a destra, illustra un punto di sella. Dunque il piano tangente in un punto di minimo o di massimo o di sella (interno al dominio) è orizzontale e, se la funzione è di classe $C^{2}$ , può scriversi:

\begin{aligned} f (x, y) = f (x_{0}, y_{0}) + \frac{1}{2} \{f_{x x} (x_{0}, y_{0}) {(x - x_{0})}^{2} \\ + 2 f_{x y} (x_{0}, y_{0}) (x - x_{0}) (y - y_{0}) + f_{y y} (x_{0}, y_{0}) {(y - y_{0})}^{2}\} + R (x, y) \end{aligned}

con $R (x, y) ∕ [{(x - x_{0})}^{2} + {(y - y_{0})}^{2}]$ infinitesima. Per capire se è possibile ripetere, per le funzioni di più variabili, uno studio analogo a quello delle funzioni di una variabile, consideriamo il caso particolare in cui $x_{0} = 0$ , $y_{0} = 0$ , $f_{x x} (0, 0) = 1$ , $f_{x y} (0, 0) = 0$ , $f_{y y} (0, 0) = 1$ . In questo caso,

\begin{aligned} f (x, y) = f (0, 0) + \frac{1}{2} \{f_{x x} (0, 0) x^{2} + 2 f_{x y} (0, 0) x y \\ + f_{y y} (0, 0) y^{2}\} + R (x, y) \\ = f (0, 0) + (x^{2} + y^{2}) \cdot (\frac{1}{2} + \frac{R (x, y)}{x^{2} + y^{2}} .) \end{aligned}

Il teorema della permanenza del segno mostra che per $x^{2} + y^{2}$ abbastanza piccolo,

1 + \frac{1}{2} \frac{R (x, y)}{x^{2} + y^{2}} > 0

e quindi $f (x, y)$ ha, in $(0, 0)$ , un punto di minimo relativo, cosìcome la funzione di confronto $g (x, y) = x^{2} + y^{2}$ . In generale se $f (x, y)$ è di classe $C^{2}$ e le sue derivate prime sono ambedue nulle in un punto $(x_{0}, y_{0})$ dalla formula di Taylor si ha

f (x, y) = f (x_{0}, y_{0}) + g (x - x_{0}, y - y_{0}) + o (| (x - x_{0}, y - y_{0}) |^{2})

e la funzione di confronto $g (x, y)$ ha forma

g (x, y) = \frac{1}{2} {f_{x x} (x_{0}, y_{0}) {(x - x_{0})}^{2} + 2 f_{x y} (x_{0}, y_{0}) (x - x_{0}) (y - y_{0}) + f_{y y} (x_{0}, y_{0}) {(y - y_{0})}^{2}} .

Le proprietà che il punto $(x_{0}, y_{0})$ ha per le funzioni

g (x, y) = a {(x - x_{0})}^{2} + 2 b (x - x_{0}) (y - y_{0}) + c {(y - y_{0})}^{2}

sono note dai corsi di geometria, caratterizzate mediante la matrice

H = [\begin{matrix} a & b \\ b & c \end{matrix}] .

Con una dimostrazione del tutto analoga a quella vista sopra in un caso particolare, si prova: Se questa matrice è definita positiva, il punto è di minimo; e tale proprietà è ereditada dalla funzione $f (x, y)$ ; se la matrice è indefinita il punto è di sella, e tale proprietà è ereditata dalla funzione $f (x, y)$ ; se la matrice è definita negativa, il punto è di massimo; e tale proprietà è ereditada dalla funzione $f (x, y)$ . Se invece la matrice è semidefinita positiva oppure semidefinita negativa, NIENTE PUÒ DIRSI SULLA FUNZIONE $f (x, y)$ . Ricordando i criteri introdotti nei corsi di geometria, per lo studio della definitezza delle matrici, si ha:

se $a > 0$ e $det H > 0$ la matrice $H$ è definita positiva, ed il punto è di minimo.
se $a < 0$ e $det H > 0$ si ha un punto di minimo.
se $a c = 0$ ma $det H \neq 0$ la matrice è indefinita ed il punto è di sella.
se $det H = 0$ la funzione $g (x, y)$ ha per grafico un cilindro parabolico e niente può dirsi della funzione $f (x, y)$ .

Questo risultato può estendersi a funzioni di $n$ variabili. Introduciamo per questo la matrice hessiana della funzione $f (\vec{r})$ , $\vec{r} = (x^{1}, \dots, x^{n})$ :

H (\vec{r}) = [\begin{matrix} f_{x^{1}, x^{1}} (\vec{r}) & f_{x^{1}, x^{2}} (\vec{r}) & \dots & f_{x^{1}, x^{n}} (\vec{r}) \\ f_{x^{2}, x^{1}} (\vec{r}) & f_{x^{2}, x^{2}} (\vec{r}) & \dots & f_{x^{2}, x^{n}} (\vec{r}) \\ ⋮ \\ f_{x^{n}, x^{1}} (\vec{r}) & f_{x^{n}, x^{2}} (\vec{r}) & \dots & f_{x^{n}, x^{n}} (\vec{r}) \end{matrix}] .

Vale:

Teorema 145 Siano nulle le derivate parziali prime di $f (\vec{r})$ in ${\vec{r}}_{0}$ . In tal caso:

se la matrice hessiana è definita positiva, il punto è di minimo per $f (\vec{r})$ ;
se la matrice hessiana è indefinita il punto è di sella per $f (\vec{r})$ ;
se la matrice hessiana è definita negativa, il punto è di massimo per $f (x, y)$ .

Invece, NIENTE PUÒ DIRSI se la matrice hessiana è soltanto semidefinita positiva oppure negativa.

Osservazione 146 E’ possibile dare ulteriori condizioni necessarie che devono essere soddisfatte nei punti di minimo oppure di massimo. Ricordiamo che in un punto di minimo ${\vec{r}}_{0} = (x_{0}, y_{0})$ le derivate parziali prime devono essere tutte nulle. Questa condizione necessaria si ottiene facilmente considerando la restrizione della funzione ad una delle rette coordinate passanti per il punto; ossia, considerando la funzione $f (x, y_{0})$ si trova che deve essere $f_{x} (x_{0}, y_{0}) = 0$ . Se esiste la derivata seconda, $f_{x x} (x_{0}, y_{0})$ non può essere negativa, altrimenti la funzione $f (x, y_{0})$ avrebbe in $x_{0}$ un punto di massimo, invece che di minimo. Dunque, in un punto di minimo $(x_{0}, y_{0})$ si deve avere

f_{x x} (x_{0}, y_{0}) \geq 0, f_{y y} (x_{0}, y_{0}) \geq 0 e quindi anche f_{x x} (x_{0}, y_{0}) + f_{y y} (x_{0}, y_{0}) \geq 0 .

In un punto di massimo deve aversi invece

f_{x x} (x_{0}, y_{0}) \leq 0, f_{y y} (x_{0}, y_{0}) \leq 0 e quindi anche f_{x x} (x_{0}, y_{0}) + f_{y y} (x_{0}, y_{0}) \leq 0 .

Questa condizione si generalizza immediatamente al caso di funzioni dipendenti da più variabili. Un’ulteriore condizione ancora solamente necessaria ma più precisa è la seguente: In un punto di minimo le derivate parziali prime sono nulle e inoltre la matrice hessiana è definita positiva oppure semidefinita positiva. Infatti, se la matrice hessiana fosse definita negativa si avrebbe un punto di massimo, se fosse indefinita si avrebbe un punto di sella. Analogamente, In un punto di massimo le derivate parziali prime sono nulle e inoltre la matrice hessiana è definita negativa oppure semidefinita negativa. _

4.5 Il differenziale delle funzioni a valori in $ℝ^{m}$

Sia $\vec{F} (\vec{r})$ una funzione da $ℝ^{n}$ ad $ℝ^{m}$ e sia $\vec{J} (\vec{r})$ una trasformazione lineare da $ℝ^{n}$ ad $ℝ^{m}$ . Si dice che la trasformazione lineare $\vec{J} (\vec{r})$ è il differenziale di $\vec{F} (\vec{r})$ in ${\vec{r}}_{0}$ se

| \vec{F} (\vec{r}) - \vec{F} ({\vec{r}}_{0}) - \vec{J} (\vec{r} - {\vec{r}}_{0}) | = o (| \vec{r} - {\vec{r}}_{0} |) .

Ovviamente, la $i$ –ma componente $F_{i} (\vec{r})$ è una funzione a valori reali e dalla disuguaglianza

| F^{i} | \leq | \vec{F} | s e \vec{F} = (F^{1}, F^{2}, \dots, F^{m})

segue

| F^{i} (\vec{r}) - F^{i} ({\vec{r}}_{0}) - J^{i} (\vec{r} - {\vec{r}}_{0}) | = o (| \vec{r} - {\vec{r}}_{0} |) .

ove $J^{i} (\vec{r})$ è la $i$ –ma componente di $\vec{J} (\vec{r})$ . Segue che una funzione da $ℝ^{n}$ in $ℝ^{m}$ che è differenziabile ha differenziabile, e quindi continua, ciascuna delle sue componenti:

Teorema 147 Se la funzione $\vec{F} (\vec{r})$ è differenziabile in ${\vec{r}}_{0}$ , essa è ivi continua.

Viceversa, dalle disuguaglianze (3.3), esiste un $M$ per cui

| \vec{F} (\vec{r}) - \vec{F} ({\vec{r}}_{0}) - \vec{J} (\vec{r} - {\vec{r}}_{0}) | \leq M \sum_{i = 1}^{m} | F^{i} (\vec{r}) - F^{i} ({\vec{r}}_{0}) - J^{i} (\vec{r} - {\vec{r}}_{0}) | .

Dunque:

Teorema 148 La funzione $\vec{F} (\vec{r})$ è differenziabile in ${\vec{r}}_{0}$ se e solo se ciascuna delle sue componenti lo è.

Ricordiamo che le trasformazioni lineari da $ℝ^{n}$ ad $ℝ^{m}$ (che rappresentiamo rispetto alle basi canoniche) si rappresentano mediante matrici. Sia $J$ la matrice della trasformazione lineare $\vec{J} (\vec{r})$ , differenziale in ${\vec{r}}_{0}$ della funzione $\vec{F} (\vec{r})$ . La sua $i$ –ma riga rappresenta il differenziale della componente $F^{i} (\vec{r})$ e quindi è il trasposto del gradiente della funzione $F^{i} (\vec{r})$ ; e quindi

J ({\vec{r}}_{0}) = [\begin{matrix} \frac{\partial}{\partial x^{1}} F^{1} ({\vec{r}}_{0}) & \frac{\partial}{\partial x^{2}} F^{1} ({\vec{r}}_{0}) & \dots & \frac{\partial}{\partial x^{n}} F^{1} ({\vec{r}}_{0}) \\ \frac{\partial}{\partial x^{1}} F^{2} ({\vec{r}}_{0}) & \frac{\partial}{\partial x^{2}} F^{2} ({\vec{r}}_{0}) & \dots & \frac{\partial}{\partial x^{n}} F^{2} ({\vec{r}}_{0}) \\ ⋮ \\ \frac{\partial}{\partial x^{1}} F^{m} ({\vec{r}}_{0}) & \frac{\partial}{\partial x^{2}} F^{m} ({\vec{r}}_{0}) & \dots & \frac{\partial}{\partial x^{n}} F^{m} ({\vec{r}}_{0}) \end{matrix}]

La matrice $J$ si chiama la matrice jacobiana della funzione $\vec{F} (\vec{r})$ , calcolata in ${\vec{r}}_{0}$ . Quando $n = m$ , il suo determinante si chiamo lo jacobiano della trasformazione. Per mezzo della matrice jacobiana, possiamo scrivere

\vec{F} (\vec{r}) = \vec{F} ({\vec{r}}_{0}) + J ({\vec{r}}_{0}) (\vec{r} - {\vec{r}}_{0}) + o (| \vec{r} - {\vec{r}}_{0} |) .

(4.8)

Quest’uguaglianza si chiama ancora formula degli incrementi finiti. Ovviamente, lavorando per componenti, si potrà scrivere anche una formula di Taylor per funzioni da $ℝ^{n}$ in $ℝ^{m}$ , su cui non indugiamo. Come nel caso delle funzioni a valori in $ℝ$ , la sola esistenza delle derivate parziali non implica né la continuità né la differenziabilità; ma la continuità delle derivate parziali in un insieme aperto implica la differenziabilità, su tale insieme, di ciascuna delle componenti $F^{i} (\vec{r})$ e quindi di $\vec{F} (\vec{r})$ , ossia:

Teorema 149 Le derivate parziali $\frac{\partial}{\partial x^{i}} F^{j} ({\vec{r}}_{0})$ per $1 \leq i \leq n$ , $1 \leq j \leq m$ esistano continue in un intorno di ${\vec{r}}_{0}$ . Allora, la funzione $\vec{F} (\vec{r})$ è differenziabile e quindi continua in ${\vec{r}}_{0}$ .

Rappresentiamo $ℝ^{n}$ rispetto alla base canonica e sia $J$ una trasformazione lineare di $ℝ^{n}$ in sé. Col medesimo simbolo $J$ indichiamo anche la matrice che rappresenta la trasformazione. Si sa che la trasformazione $J$ trasforma un parallelepipedo in un altro e l’area del secondo è uguale all’area del primo moltiplicata per $| det J |$ . Consideriamo ora una trasformazione differenziabile da $ℝ^{2}$ in sé:

x = x (u, v), y = y (u, v) .

fissiamo un punto ${\vec{r}}_{0} = (u_{0}, v_{0})$ ed un rettangolo $R$ con un vertice in ${\vec{r}}_{0}$ . L’immagine di $R$ è

\{[\begin{matrix} x (u, v) \\ y (u, v) \end{matrix}], (u, v) \in R\} = \{[\begin{matrix} x (u_{0}, v_{0}) \\ y (u_{0}, v_{0}) \end{matrix}] + J [\begin{matrix} u - u_{0} \\ v - v_{0} \end{matrix}] + \vec{o} (||[\begin{matrix} u - u_{0} \\ v - v_{0} \end{matrix}]||)\}

ove $J$ indica la matrice jacobiana della trasformazione. Quest’insieme non è un rettangolo. E’ un insieme dalla struttura più complicata, ma approssimato dal parallelogramma

\tilde{R} = \{[\begin{matrix} x (u_{0}, v_{0}) \\ y (u_{0}, v_{0}) \end{matrix}] + J [\begin{matrix} u - u_{0} \\ v - v_{0} \end{matrix}]\} .

Dal paragrafo 3.5

(area di \tilde{R}) = |det J| \cdot (area di R).

Asserto analogo vale per le trasformazioni di $ℝ^{3}$ . Quest’osservazione verrà utilizzata nel paragrafo 7.3.1.

Esempio 150 La figura 4.4 riporta, a sinistra, il rettangolo $R = [1, 2] \times [1, 3 ∕ 2]$ del piano $(u, v)$ e a destra la sua immagine mediante la trasformazione

x = u + {(u v)}^{2}, y = v^{2} + u v .

Il parallelogramma a destra è $\tilde{R}$ .

figura 4.4: Un parallelogramma, la sua immagine e il parallelogramma che la approssima

Osservazione 151 Si vede dalla formula degli incrementi finiti che la matrice jacobiana ha, nel caso delle funzioni da $ℝ^{n}$ in $ℝ^{m}$ , lo stesso ruolo che la derivata ha nel caso $n = m = 1$ . Per questa ragione la matrice jacobiana talvolta si indica anche col simbolo

\frac{\partial \vec{F} (\vec{r})}{\partial \vec{r}} .

Per esempio, nel caso $n = m = 2$ e $\vec{F} (x, y) = {[\begin{matrix} f (x, y) & g (x, y) \end{matrix}]}^{'}$ , la matrice jacobiana si trova anche indicata con la notazione

\frac{\partial (f (x, y), g (x, y))}{\partial (x, y)} .

Osservazione 152 (Sulle notazioni) Non esiste una notazione standard per lo jacobiano o per la matrice jacobiana. Nei testi di meccanica del continuo e di scienza delle costruzioni lo jacobiano viene indicato col simbolo $\nabla$ , come il gradiente. Si faccia attenzione però che se lo spazio d’arrivo ha dimensione $1$ allora $\nabla$ =“grad” indica un vettore colonna mentre $\nabla$ =“matrice jacobiana” indica un vettore riga². Si faccia anche attenzione a questo: nei testi di meccanica del continuo si considerano funzioni $\vec{u} = \vec{u} (\vec{X}, t)$ con $\vec{X}$ e $\vec{u}$ in $ℝ^{3}$ e $t \in ℝ$ . La notazione $\nabla \vec{u} = \nabla \vec{u} (\vec{X}, t)$ indica la matrice jacobiana fatta rispetto al vettore $\vec{X}$ , ossia

\nabla \vec{u} (\vec{X}, t) = [\begin{matrix} \frac{\partial u_{1} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{1}} & \frac{\partial u_{1} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{2}} & \frac{\partial u_{1} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{3}} \\ \frac{\partial u_{2} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{1}} & \frac{\partial u_{2} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{2}} & \frac{\partial u_{2} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{3}} \\ \frac{\partial u_{3} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{1}} & \frac{\partial u_{3} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{2}} & \frac{\partial u_{3} (X_{1}, X_{2}, X_{3}, t)}{\partial X_{3}} \end{matrix}] .

I testi di meccanica del continuo usano una notazione interessante per le derivate: le derivate si indicano con indici numerici preceduti da virgola. Per esempio, sia

\vec{u} (x_{1}, x_{2}, x_{3}) = {[\begin{matrix} u_{1} (x_{1}, x_{2}, x_{3}) & u_{2} (x_{1}, x_{2}, x_{3}) & u_{3} (x_{1}, x_{2}, x_{3}) \end{matrix}]}^{'} .

Il simbolo

{\vec{u}}_{i, j}

indica la derivata rispetto ad $x_{j}$ della componente $u_{i}$ ; ossia il numero prima della virgola specifica la componente e quello dopo specifica la variabile rispetto a cui si deriva. Questo simbolo si può iterare e per esempio

{\vec{u}}_{2, 1 3} = \frac{\partial^{2}}{\partial x_{1} \partial x_{3}} u_{2} (x_{1}, x_{2}, x_{3}) .

4.5.1 Regole di calcolo della matrice jacobiana

Usiamo il simbolo $J_{\vec{F}} (\vec{r})$ per indicare la matrice jacobiana della funzione $\vec{F}$ nel punto $\vec{r}$ . E’ immediatamente evidente che

\begin{aligned} J_{A \vec{F}} (\vec{r}) = A J_{\vec{F}} (\vec{r}) per ogni matrice costante A; \\ J_{\vec{F} + \vec{G}} (\vec{r}) = J_{\vec{F}} (\vec{r}) + J_{\vec{G}} (\vec{r}) . \end{aligned}

Supponiamo ora di esprimere $\vec{r} \in ℝ^{n}$ come funzione

\vec{r} = \vec{r} (\vec{u}), \vec{u} \in ℝ^{k} .

Vale

Teorema 153 (della derivazione a catena) Sia $\vec{F} (\vec{r})$ di classe $C^{1}$ in una regione $Ω$ di $ℝ^{n}$ ; $\vec{r} (\vec{u})$ sia di classe $C^{1}$ in una regione $\tilde{Ω} \subseteq ℝ^{k}$ , ed a valori in $Ω$ . Sia $\vec{G} (\vec{u}) = \vec{F} (\vec{r} (\vec{u}))$ . Si ha

J_{\vec{G}} ({\vec{u}}_{0}) = J_{\vec{F}} (\vec{r} ({\vec{u}}_{0})) J_{\vec{r}} ({\vec{u}}_{0}) .

Il prodotto tra matrici si intende come prodotto righe per colonne.

Omettiamo la dimostrazione.

4.6 Campi vettoriali

Nel trattare le funzioni a valori vettoriali, abbiamo sempre specificato “a valori in $ℝ^{m}$ ”. Si ricordi che $ℝ^{m}$ è uno spazio di vettori liberi, equivalentemente, applicati nell’origine. In molte applicazioni si devono considerare funzioni che associano ad un punto $\vec{r}$ di $ℝ^{n}$ un vettore ad $n$ dimensioni, applicato nel punto stesso. Ossia si devono studiare trasformazioni che trasformano $\vec{r}$ nella coppia $(\vec{r}, \vec{V} (\vec{r}))$ . Trasformazioni di questo tipo si chiamano campi vettoriali. E’ comune usare la lettera $\vec{V}$ per indicare campi vettoriali. Si scrive cioè $\vec{V} (\vec{r})$ sottintendendo che questo vettore è applicato in $\vec{r}$ , invece di scrivere la notazione completa, ma pedante, $(\vec{r}, \vec{V} (\vec{r}))$ La figura 4.5 illustra il modo con cui usualmente si rappresentano i campi vettoriali: da ciascun punto si fa uscire una freccia che indica direzione e verso del vettore. La lunghezza della freccia è proporzionale al modulo. Quando si lavora con campi vettoriali, i concetti di continuità e di differenziabilità sono concettualmente diversi da quelli incontrati per i vettori liberi, perché non si fanno operazioni tra vettori applicati in punti diversi. Per questo la definizione di continuità di un campo vettoriale si definisce confrontando il vettore $\vec{V} (\vec{r})$ , applicato in $\vec{r}$ col vettore PARALLELO a $\vec{V} ({\vec{r}}^{'})$ , anch’esso applicato in $\vec{r}$ invece che in ${\vec{r}}^{'}$ .

figura 4.5: un campo vettoriale

Fortunatamente, la somma di vettori applicati nel medesimo punto si fa operando per componenti, e queste non mutano per spostamenti per parallelismo. Si ha quindi che un campo vettoriale è continuo se e solo se sono continue le sue componenti. Discorso analogo vale per le derivate. Si fissi ${\vec{r}}_{0}$ ed un vettore libero $\vec{v}$ . Si considerino i vettori

{\vec{r}}_{0} + t \vec{v}

che sono i vettori di una retta parallela a $\vec{v}$ , passante per ${\vec{r}}_{0}$ . Si chiama derivata secondo il vettore $\vec{v}$ il limite

D_{\vec{v}} \vec{V} ({\vec{r}}_{0}) = lim_{t \to 0} \frac{\vec{V} ({\vec{r}}_{0} + t \vec{v}) - \vec{V} ({\vec{r}}_{0})}{t} .

La differenza al numeratore si calcola supponendo di traslare per parallelismo il vettore $\vec{V} ({\vec{r}}_{0} + t \vec{v})$ applicandolo nel punto ${\vec{r}}_{0}$ . Dunque, anche il vettore $D_{\vec{v}} \vec{V} ({\vec{r}}_{0})$ è applicato in ${\vec{r}}_{0}$ . Se $\vec{v}$ è il versore ${\vec{e}}_{i}$ , tale derivata si chiama anche derivata direzionale. Il teorema di derivazione della funzione composta immediatamente dà:

Teorema 154 Sia $\vec{V} (\vec{r})$ un campo vettoriale le cui componenti sono funzioni di classe $C^{1}$ . Esso ammette derivate direzionali in tutte le direzioni, e vale

D_{\vec{v}} \vec{V} ({\vec{r}}_{0}) = J_{\vec{V}} ({\vec{r}}_{0}) \vec{v}

(4.9)

In questo teorema, il simbolo $J_{\vec{V}} ({\vec{r}}_{0})$ indica la matrice jacobiana della trasformazione che al vettore libero $\vec{r}$ associa il vettore libero $\vec{V} (\vec{r})$ . Il vettore $D_{\vec{v}} \vec{V} ({\vec{r}}_{0})$ si intende applicato in ${\vec{r}}_{0}$ .

4.6.1 Operatori differenziali e campi vettoriali

Abbiamo visto che il gradiente di una funzione a valori scalari è il vettore

\nabla f (\vec{r}) = [\begin{matrix} f_{x^{1}} (\vec{r}) \\ f_{x^{2}} (\vec{r}) \\ ⋮ \\ f_{x^{n}} (\vec{r}) \end{matrix}] .

Per molte applicazioni, conviene considerare questo un vettore applicato nel punto $\vec{r}$ . Dunque il gradiente associa un campo vettoriale ad una funzione a valori scalari. Si noti che

{[\nabla_{\vec{u}} f (\vec{r} (\vec{u}))]}^{'} = {[\nabla_{\vec{r}} f (\vec{r} (\vec{u}))]}^{'} J_{\vec{r}} [\vec{u}]

ove l’apice indica la trasposizione e l’indice sotto il simbolo

\nabla

indica le variabili rispetto alle quali si calcola il gradiente.

Introduciamo una notazione comoda: sia ${{\vec{e}}_{1}, \dots, {\vec{e}}_{n}}$ la base canonica di $ℝ^{n}$ . Scriviamo in modo formale

\begin{aligned} \nabla & = & {\vec{e}}_{1} \frac{\partial}{\partial x^{1}} + {\vec{e}}_{2} \frac{\partial}{\partial x^{2}} + \dots + {\vec{e}}_{n} \frac{\partial}{\partial x^{n}} \\ = & {\vec{e}}_{1} \partial_{1} + {\vec{e}}_{2} \partial_{2} + \dots + {\vec{e}}_{n} \partial_{n} \\ = & [\begin{matrix} \partial_{1} \\ \partial_{2} \\ ⋮ \\ \partial_{n} \end{matrix}] . \end{aligned}

Allora il gradiente si ottiene formalmente “moltiplicando” il “vettore” $\nabla$ per lo “scalare” $f (\vec{r})$ , e eseguendo le operazioni di derivazione. Introdotto il simbolo $\nabla$ , viene naturale introdurre le operazioni

\nabla \cdot \vec{V} (\vec{r}), \nabla \land \vec{V} (\vec{r})

operando formalmente come se si trattasse di prodotti scalari o vettoriali (e quindi la seconda si definisce solo in $ℝ^{3}$ ). La prima dà la divergenza del campo vettoriale:

d i v \vec{V} (\vec{r}) = \frac{\partial}{\partial x^{1}} V^{1} (\vec{r}) + \frac{\partial}{\partial x^{2}} V^{2} (\vec{r}) + \dots + \frac{\partial}{\partial x^{n}} V^{n} (\vec{r}) .

Il risultato della seconda operazione, DEfiNITA SOLO IN $ℝ^{3}$ , si chiama rotore: il rotore del campo vettoriale

\vec{V} (x, y, z) = u (x, y, z) \vec{i} + v (x, y, z) \vec{j} + w (x, y, z) \vec{k}

è quindi (sottintendendo le variabili indipendenti) il campo vettoriale

r o t \vec{V} = \nabla \land \vec{V} = (w_{y} - v_{z}) \vec{i} + (u_{z} - w_{x}) \vec{j} + (v_{x} - u_{y}) \vec{k} .

Si noti che, sviluppando formalmente secondo gli elementi della prima riga,

r o t \vec{V} = [\begin{matrix} \vec{i} & \vec{j} & \vec{k} \\ \frac{\partial}{\partial x} & \frac{\partial}{\partial y} & \frac{\partial}{\partial z} \\ u & v & w \end{matrix}] .

Sia ora $u (x, y, z)$ una funzione due volte derivabile. Calcoliamo prima il gradiente di $u (x, y, z)$ e poi la divergenza del gradiente:

\nabla \cdot (\nabla u (x, y, z)) = u_{x x} (x, y, z) + u_{y y} (x, y, z) + u_{z z} (x, y, z) .

Usa definire $Δ$ , che si chiama laplaciano, ponendo

Δ u (x, y, z) = u_{x x} (x, y, z) + u_{y y} (x, y, z) + u_{z z} (x, y, z) .

Formalmente si scrive

Δ = \nabla \cdot \nabla .

Si vede facilmente che queste considerazioni valgono per funzioni di qualunque numero di variabili.

Osservazione 155 (Sulle notazioni) Proseguiamo quanto si è detto all’osservazione 152. Facendo intervenire le notazioni dei campi vettoriali, i testi di meccanica del continuo e di scienza delle costruzioni scrivono la prima formula degli incrementi finiti in questo modo. Sia $\vec{u} (\vec{x})$ una funzione di tre variabili a valori in $ℝ^{3}$ . Usando la notazione “con la virgola” introdotta all’osservazione 152, la prima formula degli incrementi finiti è

\vec{u} (\vec{x}) = \vec{u} (\vec{0}) + [\begin{matrix} u_{1, 1} (\vec{0}) & u_{1, 2} (\vec{0}) & u_{1, 3} (\vec{0}) \\ u_{2, 1} (\vec{0}) & u_{2, 2} (\vec{0}) & u_{2, 3} (\vec{0}) \\ u_{3, 1} (\vec{0}) & u_{3, 2} (\vec{0}) & u_{3, 3} (\vec{0}) \end{matrix}] [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \end{matrix}] + o (| | \vec{x} | |) .

Invece di scrivere in questo modo, viene scritto:

\vec{u} (\vec{x}) = \vec{u} (\vec{0}) + (\vec{x} \cdot \nabla) \vec{u} (\vec{0}) + o (| | \vec{x} | |)

ove $(\vec{x} \cdot \nabla)$ indica un “prodotto scalare formale” tre i due vettori colonna $\vec{x}$ e $\nabla$ ,

\vec{x} \cdot \nabla = [\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \end{matrix}] \cdot [\begin{matrix} \partial_{1} \\ \partial_{2} \\ \partial_{3} \end{matrix}] = x_{1} \partial_{1} + x_{2} \partial_{2} + x_{3} \partial_{3} .

Si trova quindi un operatore differenziale che si applica al campo vettoriale $\vec{u} (\vec{x})$ , applicandolo a ciascuna delle sue componenti:

\begin{aligned} (\vec{x} \cdot \nabla) \vec{u} (\vec{x}) = ([\begin{matrix} x_{1} \\ x_{2} \\ x_{3} \end{matrix}] \cdot [\begin{matrix} \partial_{1} \\ \partial_{2} \\ \partial_{3} \end{matrix}]) \vec{u} (\vec{x}) \\ = (x_{1} \partial_{1} + x_{2} \partial_{2} + x_{3} \partial_{3}) \vec{u} (\vec{x}) = [\begin{matrix} x_{1} u_{1, 1} + x_{2} u_{1, 2} + x_{3} u_{1, 3} \\ x_{1} u_{2, 1} + x_{2} u_{2, 2} + x_{3} u_{2, 3} \\ x_{1} u_{3, 1} + x_{2} u_{3, 2} + x_{3} u_{3, 3} \end{matrix}] \end{aligned}

proprio come si voleva ottenere. _

4.7 Appendici

4.7.1 Appendice: Rappresentazione di funzioni di due variabile

In quest’appendice mostriamo alcune funzioni di due variabili a valori reali, ed il modo di rappresentarle. Sostanzialmente, ci sono tre modi. Descriviamoli prima di tutto in astratto e poi illustriamoli su opportuni esempi. Sia $f (x, y)$ una funzione. Il modo più ovvio di rappresentarla consiste nel costruirne il grafico, ossia nel costruire l’insieme

{(x, y, z) | z = f (x, y)} \subseteq ℝ^{3} .

Naturalmente questo richiede la costruzione di un modello per esempio di gesso o di plastica. In pratica rappresenteremo il grafico su un foglio, mediante opportune tecniche di disegno, che diano l’illusione della profondità. Inoltre, talvolta conviene rappresentare, invece della superficie, solamente una famiglia di linee sulla superficie. Il secondo metodo consiste nel tagliare il grafico a quota $c$ , e quindi nel proiettare l’insieme intersezione sul piano $(x, y)$ . Si disegna cioè sul piano $(x, y)$ , l’insieme delle soluzioni dell’equazione

f (x, y) = c .

Quest’insieme si chiama insieme di livello In molti casi³ un insieme di livello è una “curva” e quindi si parla di curva di livello Disegnando “numerose” curve di livello si può avere un’informazione sul comportamento della funzione: per esempio, le curve di livello sono più fitte dove il grafico della funzione è più ripido. Il terzo metodo consiste nel colorare il piano $(x, y)$ colorandolo con colori “freddi”, per esempio blu, dove i valori della funzione sono più piccoli e con colori caldi, per esempio rosso, dove la funzione prende valori maggiori. Molto spesso conviene combinare questi metodi, attribuendo i colori alla superficie o alle sue curve di livello. Vediamo ora un esempio. Consideriamo la funzione seguente, il cui grafico è un paraboloide di rotazione:

f (x, y) = x^{2} + y^{2} .

La figura 4.6 mostra vari modi di rappresentare il grafico di questa funzione.

figura 4.6: Paraboloide di rotazione

La figura 4.7 mostra a sinistra la funzione rappresentata mediante le sue curve di livello (e quindi mediante una rappresentazione sul piano $(x, y)$ ) ed a destra il grafico (fatto con fili) della medesima funzione, sovrapposto alle curve di livello.

figura 4.7: Paraboloide di rotazione e sue curve di livello

Ciò detto, passiamo ad esaminare alcuni esempi di funzioni.

Funzioni costanti rispetto ad una variabile Può accadere che una funzione $f (x, y)$ sia “costante rispetto ad $y$ ”; ossia che valga

f (x, y) = f (x, y^{'})

per ogni scelta di $y$ e di $y^{'}$ , purché la $x$ prenda il medesimo valore a destra ed a sinistra. Vediamo le conseguenze “grafiche” di questa proprietà. La funzione è costante sulle rette verticali del piano $(x, y)$ , che pertanto sono tutte contenute in insiemi di livello. Per esempio la funzione

f (x, y) = sin x

(4.10)

ha gli insiemi di livello rappresentati nella figura 4.8 a sinistra.

figura 4.8: La funzione (4.10)

Rette del medesimo colore corrispondono al medesimo livello e quindi gli insiemi di livello in quest’esempio non sono “curve”, ma sono insiemi di (infinite) rette verticali. Dal punto di vista del grafico, il grafico della funzione è unione di rette orizzontali, e quindi tutte parallele tra loro. Il termine superficie verrà introdotto più avanti, ma è un fatto che sono “superfici” i grafici di funzioni (differenziabili). Una superficie che è unione di rette tutte tra loro parallele si chiama cilindro Dunque, i grafici di funzioni $f (x, y)$ costanti rispetto ad una variabile sono cilindri. Il cilindro corrispondente alla funzione in esame è nella figura (4.8), a destra.

Funzioni omogenee Si chiamano funzioni omogenee di grado $ν$ (non necessariamente intero) quelle funzioni che verificano l’uguaglianza

f (r x, r y) = | r |^{ν} f (x, y) .

Se $ν = 0$ la funzione è costante sulle rette che escono dall’origine, che pertanto appartengono ad insiemi di livello. Un esempio è la funzione

f (x, y) = \frac{x^{2} - y^{2}}{x^{2} + y^{2}} .

Dato che il denominatore si annulla in $(0, 0)$ , per evitare diffcoltà di tipo numerico, consideriamola nel quadrati $0, 1 \leq x \leq 1$ , $0, 1 \leq y \leq 1$ . La figura 4.9, a sinistra, presenta le curve di livello della funzione. Come si è detto, queste sono rette, ma problemi di tipo numerico vicino a $(0, 0)$ (dove si annullano sia il numeratore che il denominatore) provocano le distorsioni visibili in figura. Il valore della funzione varia da retta a retta, ma rimane costante sulle singole rette, come mostra la figura 4.9, a destra. In questa figura abbiamo rappresentato, in verde, anche il piano $z = 0$ .

figura 4.9: Una funzione omogenea

Se la funzione è omogenea di grado $1$ allora moltiplicando per $r$ sia $x$ che $y$ , il valore di $z$ viene anch’esso moltiplicato per $r$ . Dunque, se un punto $(x_{0}, y_{0}, z_{0})$ è sul grafico, anche i punti $(r x_{0}, r y_{0}, r z_{0})$ con $r > 0$ sono sul grafico. Al variare di $r$ , questi descrivono semirette passanti per l’origine: il grafico è unione di semirette passanti per l’origine. Un insieme unione di rette per un medesimo punto si chiama cono E quindi il grafico di una funzione omogenea di grado $1$ è un semicono (con vertice nell’origine). La figura 4.10, a sinistra, illustra la situazione nel caso della funzione

f (x, y) = \frac{x y}{x + y} .

La figura riporta sia il grafico della funzione sia alcune rette che escono dall’origine e che appartengono al grafico. La figura 4.10, a destra, riporta invece il grafico della funzione

f (x, y) = \frac{\sqrt{x y}}{x + y},

omogenea di grado $1 ∕ 2$ . La figura riporta anche una retta per l’origine e per un punto del grafico che, come si vede, non giace sul grafico.

figura 4.10: Funzione omogenea di grado

1 ∕ 2

Simmetrie del grafico, funzioni radiali e superfici di rotazione Il grafico di una funzione di più variabili può avere proprietà di simmetria, che estendono quelle note per le funzioni di una variable. Per esempio, diremo che una funzione $f (x, y)$ è

dispari se $f (x, y) = - f (- x, - y)$ ;
pari se $f (x, y) = f (- x, - y)$ .

Come nel caso delle funzioni di una variabile, queste proprietà corrispondono a certe simmetrie del grafico rispetto all’origine. Naturalmente, si possono avere altre possibilità che non si incontrano nel caso di funzioni di una variabile (per esempio, simmetrie rispetto ad una retta per l’origine, magari ad uno degli assi coordinati). A noi ora interessa un caso molto particolare di funzione pari di due variabili, ottenuta a partire da funzioni di una sola variabile. Si consideri la funzione $t \mapsto f (t)$ di una sola variabile definita su un intervallo⁴ $[a, b]$ e a questa si associ la funzione di due variabili

(x, y) \mapsto f (\sqrt{x^{2} + y^{2}})

ossia la funzione

z = f (\sqrt{x^{2} + y^{2}}), d o m f = \{(x, y), \sqrt{x^{2} + y^{2}} \in [a, b]\} .

I grafici di queste funzioni hanno una proprietà particolare. Sia

(x_{0}, y_{0}) \in d o m f (\sqrt{x^{2} + y^{2}}) e d r_{0} = \sqrt{x_{0}^{2} + y_{0}^{2}} .

Il numero $r_{0}$ è la distanza di $(x_{0}, y_{0})$ dall’origine. Qualunque altro punto $(x, y)$ che dista $r_{0}$ dall’origine, ossia per cui

\sqrt{x^{2} + y^{2}} = r_{0}

appartiene al dominio della funzione ed inoltre,

f (\sqrt{x^{2} + y^{2}}) = f (\sqrt{x_{0}^{2} + y_{0}^{2}}) .

Dunque il dominio della funzione è una corona circolare di centro l’origine (un disco se $a = 0$ , l’esterno di un disco se $a > 0$ ed $r = + \infty$ ), e tutte le circonferenze di centro l’origine sono curve di livello della funzione. Questo si interpreta in questo modo: se il dominio della funzione contiene un punto $P$ , esso contiene tutta la circonferenza di centro $O$ che passa per $P$ . Inoltre su tale circonferenza la funzione è costante. Ossia se il punto $P$ ruota su una circonferenza di centro $O$ il corrispondente punto del grafico ruota su una circonferenza parallela al piano $x, y$ , centrata sull’asse delle quote. Detto in altro modo, ogni piano perpendicolare all’asse delle quote se interseca il grafico della funzione lo interseca lungo una circonferenza (oppure in un solo punto). Una superficie come quella ora descritta si chiama superficie di rotazione. L’intersezione tra un piano $z = z_{0}$ e il grafico, se non è vuota, si chiama un parallelo della superficie mentre l’intersezione tra il grafico ed ogni piano passante per l’asse delle quote si chiama meridiano della superficie di rotazione: la superficie di rotazione può anche pensarsi ottenuta ruotando un meridiano intorno all’asse delle quote. Il grafico nella figura 4.11 mostra una superficie di rotazione, con indicati alcuni paralleli ed alcuni meridiani.

figura 4.11: Superficie di rotazione

Osservazione 156

Una funzione $g (x, y) = f (\sqrt{x^{2} + y^{2}})$ che definisce una superficie di rotazione si chiama anche una funzione radiale. Più in generale, si chiama funzione radiale ogni funzione su $ℝ^{n}$ il cui valore in ogni $\vec{x}$ del suo dominio dipende solo da $| \vec{x} |$ . Tale funzione si esprime come $f (| x |)$ con $f$ funzione di una variabile reale.
La funzione $g (x^{2} + y^{2})$ è una funzione radiale, anche se nella sua espressione la radice non compare. Infatti, $g (x^{2} + y^{2}) = g ({(\sqrt{x^{2} + y^{2}})}^{2}) .$

Funzioni periodiche Una funzione di due variabili, $f (x, y)$ , si dice periodica quando esiste un vettore ${\vec{v}}_{0} = (ξ_{0}, η_{0})$ tale che

f (\vec{x}) = f (x + ξ_{0}, y + η_{0}) = f (x, y)

per ogni $(x, y)$ del suo dominio. Un esempio è la funzione

f (x, y) = (sin x) (sin 2 * y) .

\vec{v} = 2 π \vec{i} + π \vec{j}

si ha

f (\vec{x} + \vec{v}) = f (x + 2 π, y + π) = [sin (x + 2 p i)] [sin (2 (y + π))] = f (x, y) .

La figura 4.12 mette a confronto il grafico della funzione $f (x, y)$ , a sinistra, con le sue curve di livello, a destra.

figura 4.12: Una funzione periodica

4.7.2 Appendice: Propagazione ondosa

In molte applicazioni si incontrano funzioni della forma

f (ϕ (\vec{x}) - v t) o p p u r e f (ϕ (\vec{x}) + v t)

con $v > 0$ . In queste applicazioni la variabile $t$ si interpreta come “tempo” mentre la variabile $\vec{x}$ indica una posizione nello spazio. Dunque la funzione $f (ϕ (\vec{x}) \pm v t)$ descrive una configurazione $f (ϕ (\vec{x}))$ che “si muove” al passare del tempo e ciò suggerisce un linguaggio particolare, che illustriamo con riferimento al caso $\vec{x} = x \in ℝ$ e $ϕ (x) = x$ oppure $ϕ (x) = m x$ . In queste applicazioni, la funzione $f (x)$ si chiama onda Potremmo pensare al suo grafico come alla configurazione all’istante $t = 0$ di un corpo elastico. Vediamo come si interpetano le due funzioni

F_{1} (x, t) = f (x - v t), F_{2} (x, t) = f (x + v t)

con $v > 0$ . Consideriamo la funzione $F_{1} (x, t)$ . fissiamo un valore $t_{0}$ . La funzione $x \to f (x - v t_{0})$ si può interpretare in due modi diversi: come la funzione $f (x)$ rappresentata rispetto ad un sistema di riferimento ottenuto traslando l’origine nella posizione $- v t_{0}$ dell’asse $x$ . Dunque in dietro, perché $v > 0$ . Questo modo di intendere le cose è il più comune nelle applicazioni geometriche. Invece, nelle applicazioni fisiche e nell’analisi si incontra più frequentemente un’interpretazione diversa: si pensa ad $f (x)$ ed $f (x - v t_{0})$ come a due diverse funzioni rappresentate rispetto al medesimo sistema di riferimento. In tal caso, il grafico della funzione $f (x - v t_{0})$ è ottenuto traslando in avanti il grafico di $f (x)$ . Se $t$ si interpreta come “tempo”, nell’unità di tempo il grafico è andato avanti di una quantità $v$ . Dunque, $v$ rappresenta la velocità dello spostamente del grafico. Pensando al grafico di $f (x)$ come ad un’“onda”, si dice che $v$ è la velocità di propagazione dell’onda. Le stesse considerazioni si possono ripetere per la funzione $F_{2} (x, t)$ con la sola differenza che ora il grafico si sposta in dietro (grazie al fatto che $v$ si è scelto positivo). Le considerazioni precedenti suggeriscono di chiamare la funzione $F_{1} (x, t) = f (x - v t)$ onda progressiva mentre la funzione $F_{1} (x, t) = f (x + v t)$ si chiama onda regressiva (ricordiamo che $v > 0$ ). La figura 4.13 riporta i grafici delle funzioni

e^{- {(x + t)}^{2}} .

(4.11)

a sinistra sono riportati i grafici delle funzioni $x \to e^{- {(x + t)}^{2}}$ nel medesimo sistema di assi cartesiani $(x, y)$ , per diversi valori di $t$ . A destra è stato costruito il grafico della funzione di due variabili $(x, t) \to e^{- {(x + t)}^{2}}$ , nello spazio riferito agli assi cartesiani $(x, t, z)$ . Questo grafico è stato sezionato con i piani $t = 0$ , $t = 2$ , $t = 3$ e $t = 4$ , e sono stati disegnati i grafici risultanti da queste sezioni.

figura 4.13: La funzione (4.11)

Il termine “onda” o “moto ondoso” usato per descrivere la situazione illustrata sopra è particolarmente intuitivo nel caso di funzioni $f (x)$ periodiche. La figura 4.14 riporta grafici analoghi a quelli della figura 4.13, ma questa volta con la funzione

f (x) = sin (m x) .

(4.12)

Si noti che questa funzione è periodica di periodo $2 π ∕ m$ . Il valore scelto nella figura per il periodo è $3$ .

figura 4.14: La funzione (4.12)

Il caso in cui $f (x) = sin (m x)$ oppure $f (x) = cos (m x)$ è particolarmente importante nelle applicazioni. Le “onde” costruite a partire da queste funzioni si dicono onde armoniche e in questo caso si usano notazioni e definizioni peculiari che verranno illustrate al paragrafo 4.7.2. Consideriamo ora la funzione $F_{1} (x, t) = f (x - v t)$ . Questa funzione prende il valore $f (k)$ in tutti i punti $(x, t)$ nei quali

x - v t = k .

Per ogni $k$ si viene cosìa descrivere una retta nei punti della quale l’onda ha il medesimo valore. Ciò suggerisce di dare un nome alla quantità $x - v t$ : questa si chiama la fase dell’onda progressiva. Al trascorrere del tempo, si rimane sulla stessa fase $k$ se si passa dal punto $x$ al punto $x + v t$ , ossia se si sposta il punto osservato $x$ in avanti con velocità $v$ . Per questa ragione, il numero $v$ si chiama anche (e più frequentemente) velocità di fase Considerazioni analoghe per le onde regressive si lasciano per esercizio. Si noti che talvolta un’onda viene scritta come

f (h x - m t) = f (h (x - (m ∕ h) t)) .

In tal caso, la velocità di fase è $v = m ∕ h$ . Se $\vec{x} \in ℝ^{2}$ oppure $\vec{x} \in ℝ^{3}$ si incontra un nuovo concetto, che illustriamo con riferimento a $\vec{x} \in ℝ^{2}$ , $\vec{x} = {[\begin{matrix} x & y \end{matrix}]}^{'}$ . Consideriamo le due onde progressive seguenti:

Φ_{1} (\vec{x}, t) = Φ_{1} (x, y, t) = f (a x + b y - v t), Φ_{2} (\vec{x}, t) = Φ_{2} (x, y, t) = f (x^{2} + y^{2} - v t) .

Ci si può chiedere su quali insiemi del piano $(x, y)$ l’onda ha la medesima fase per ogni fissato valore di $t$ . Lavorando con la funzione $Φ (\vec{x}, t)$ , fissato $t = t_{0}$ , la fase vale $k$ nei punti della retta

a x + b y = k + v t_{0};

nel caso della funzione $Φ_{2} (\vec{x}, t)$ fissato $t = t_{0}$ , la fase vale $k$ nei punti della circonferenza

x^{2} + y^{2} = k + v t_{0} .

Per questa ragione, l’onda $Φ_{1} (\vec{x}, t)$ si chiama onda piana mentre l’onda $Φ_{2} (\vec{x}, t)$ si chiama onda sferica

Onde e moto armonico

Ricordiamo che si chiama moto armonico il moto di un punto lungo una circonferenza, se questo avviene con velocità angolare costante. I punti di una circonferenza di raggio $A$ hanno coordinate

(A cos (ω t + ϕ), A sin (ω t + ϕ)) .

(4.13)

Il numero $(2 π) ∕ ω$ è il tempo necessario a descrivere una volta tutta la circonferenza e quindi

T = \frac{2 π}{ω}

è il periodo del moto mentre il suo reciproco

f = \frac{ω}{2 π}

si chiama frequenza del moto. La frequenza indica quanti giri (o parti di giro) percorre il corpo lungo la circonferenza in un’unità di tempo. Il numero di radianti di cui varia la posizione del corpo nell’unità di tempo è $ω$ e per questo il coeffciente $ω$ si chiama velocità angolare Dunque,

ω = 2 π f .

Dato che $ω = (2 π) ∕ T$ , la (4.13) si può anche scrivere (si confronti con l’osservazione 82 dove però il periodo è 2T)

(A cos \frac{2 π}{T} t, A sin \frac{2 π}{T} t) .

Questo legame col moto armonico suggerisce di chiamare onde armoniche le onde

A cos (k x - ω t + ϕ), A sin (k x - ω t + ϕ)

(e le analoghe onde regressive, il cui esame si lascia per esercizio). Consideriamo per fissare le idee l’onda progressiva

A sin (k x - ω t + ϕ) .

Il numero $A$ si chiama l’ampiezza dell’onda e il numero $k x - ω t + ϕ$ si chiama la fase Le due onde

A sin (k x - ω t + ϕ), A sin (k x - ω t + ψ)

(con gli stessi valori di $ω$ e di $k$ ) si dicono sfasate di $ϕ - ψ$ e questo numero si chiama sfasamento tra le due onde⁵. Per semplicità di scrittura, poniamo ora $ϕ = 0$ . L’onda che si trova all’istante $t = 0$ è l’onda

f (x) = sin k x,

periodica di periodo $2 π ∕ k$ . Però, i fisici riservano i termini “periodo” e “frequenza” alla variabile tempo. Il numero

λ = \frac{2 π}{k}

si chiama invece lunghezza d’onda Infatti, l’onda prende i medesimi valori nei punti che distano l’uno dall’altro di $2 π ∕ k$ . Questo può visualizzarsi in questo modo: consideriamo la funzione

f_{e} (x) = sin k x, x \in [0, 2 π ∕ k) = [0, λ) .

chiamiamola⁶ “onda elementare”. Allora il grafico di $f (x)$ si può pensare ottenuto giustapponendo i grafici di $f_{e} (x + n (2 π ∕ k))$ per ogni numero intero $n$ . La figura 4.15 illustra ciò, usando colori diversi per vedere i grafici che si sono giustapposti.

figura 4.15: Lunghezza d’onda

Il numero di onde elementari che si ripetono nell’unità di spazio è $1$ diviso per la lunghezza dell’onda elementare, che è $k ∕ 2 π$ . Il valore

\frac{1}{λ} = \frac{k}{2 π}

si chiama numero d’onde mentre $k$ si chiama numero d’onde angolare Come si è detto, i termini “periodo”, “frequenza” e “freqenza angolare” si riservano alla dipendenza dal tempo $t$ dell’onda. Ossia, si riservano alla funzione

t \to A sin (k x - ω t + ϕ)

con $x$ fissato. La terminologia è quella già illustrata nel contesto del moto armonico. Indicando con $T$ il periodo, si ha

T = \frac{2 π}{ω}, f = \frac{1}{T} = \frac{ω}{2 π}

Il numero $ω$ , che è la velocità angolare del moto armonico, nello studio delle onde armoniche si chiama frequenza angolare Studiamo infine la velocità di fase, scrivendo

sin (ω t + k x) = sin k (\frac{ω}{k} t + x) .

La velocità di fase, ossia la velocità di spostamento dell’onda, è

v = \frac{ω}{k} = \frac{λ}{T} .

Onde stazionarie

Le onde si “propagano” nello spazio, al trascorrere del tempo; questa almeno sembra l’informazione che può ricavarsi dalle considerazioni precedenti. Però, in uno stesso mezzo possono propagarsi onde diverse. Consideriamo due onde armoniche con la medesima ampiezza

f (x - v t) = A cos k (x - v t), g (x - v t) = A cos m (x - ν t) .

Se le due onde hanno il medesimo numero d’onde, $k = m$ e la medesima velocità, $v = ν$ , allora nel mezzo si vede un’onda di ampiezza doppia,

2 A cos (k x - v t) .

Altrimenti, si trova la funzione

(x, t) \to A [cos k (x - v t) + cos m (x - ν t)] .

Usando le formule di prostaferesi si trova la funzione

\begin{aligned} 2 A cos (\frac{(k + m) x - (k v + m ν) t}{2}) cos (\frac{(k - m) x + (m ν - k v) t}{2}) \\ = 2 A cos (\frac{k + m}{2} [x - \frac{k v + m ν}{k + m} t]) cos (\frac{k - m}{2} [x + \frac{m ν - k v}{k - m} t]) \end{aligned}

Supponiamo ora che la velocità di propagazione sia uguale per le due onde, $v = ν$ . In questo caso si trova il segnale

[2 A cos \frac{k - m}{2} (x - v t)] cos \frac{k + m}{2} (x - v t)

Interpretiamo questa formula: quando i due segnali hanno numero d’onde molto simile, $k \sim m$ e “molto grande”, allora $𝜖 = k - m$ è un numero piccolo relativamente sia a $k$ che ad $m$ . Tenendo fissa la posizione $x$ , al variare del tempo in questa posizione si vede passare l’onda $cos \frac{k + m}{2} (x - v t) \sim cos k (x - v t)$ , modulata dal segnale di bassa frequenza $2 A cos \frac{k - m}{2} (x - v t)$ . Se l’onda in questione è un’onda sonora, nella posizione $x$ si sente un suono di frequenza circa uguale a $k v ∕ 2 π$ , ed ampiezza $2 A cos [(k - m) (x - v t) ∕ 2]$ lentamente variabile nel tempo, con legge periodica di “piccola“ frequenza $(k - m) v ∕ (4 π)$ . Si ricordi che la minima frequenza dei suoni udibili dall’orecchio umano è $16$ Herz. Se accade che

\frac{(k - m) v}{4 π} > 16

l’orecchio sente comparire un “terzo suono”, diverso dai due suoni emessi dagli strumenti, ed in generale sgradevole. Questo suono si chiama appunto terzo suono o suono di Tartini Il caso estremo si ha quando le due onde hanno il medesimo numero d’onde e la medesima velocità, ma si propagano in verso opposto, $v = - ν$ . In tal caso si trova

2 A cos k x cos k v t .

(4.14)

In questo caso niente si propaga: la somma di onde uguali propagantesi in versi opposti genera una configurazione $A cos k x$ , stazionaria, “modulata” dal segnale sovrapposto $cos k v t$ . Nonostante che in questo caso niente si propaghi, per conservare la memoria dell’origine di questo fenomeno, si chiama ancora “onda” la funzione (4.14) e, per sottolineare che “niente si propaga”, la chiamiamo onda stazionaria

Interferenza

Consideriamo ora due onde uguali, ossia con la medesima ampiezza, numero d’onde e velocità di propagazione, ma sfasate l’una rispetto all’alta. Ossia consideriamo le due onde

f (x - v t) = A cos k (x - v t), g (x - v t) = A cos k (x - v t + ϕ) .

Se queste due onde si propagano nel medesimo mezzo, il segnale propagantesi nel mezzo è

A [cos k (x - v t) + cos k (x - v t + ϕ)] = [2 A cos \frac{k ϕ}{2}] cos (k x - v t + \frac{ϕ}{2}) .

Si ha quindi un segnale di ampiezza $2 A cos k ϕ ∕ 2$ . che può essere nulla. In pratica, la differenza di fase è dovuta alla differente lunghezza del cammino percorso dalle due onde; e quindi in realtà $ϕ$ varia cambiando posizione, $ϕ = ϕ (x)$ . Se l’onda in questione è un’onda sonora, in un punto $x$ fissato si sente un suono uguale a quello descritto da $f (x)$ , ma con una diversa intensità. L’intensità varia al variare della posizione d’ascolto e in certe posizioni può annullarsi. Questo fenomeno si chiama interferenza delle due onde.

4.7.3 Appendice: Funzioni omogenee

Una funzione $f (\vec{r})$ , con $\vec{r} \in ℝ^{n}$ , si chiama positivamente omogenea di grado $ν$ (anche non intero) se

f (t \vec{r}) = | t |^{ν} f (\vec{r}) .

Supponiamo che una funzione omogenea di grado $ν$ sia di classe $C^{1}$ per $\vec{r} \neq 0$ . Derivando rispetto a $t$ i due membri e calcolando le derivate per $t = 1$ , si trova l’uguaglianza

\nabla f (\vec{r}) \cdot \vec{r} = ν f (\vec{r}) \forall \vec{r} .

(4.15)

Questa relazione si chiama identità di Eulero e caratterizza le funzioni omogenee e di classe $C^{1}$ (per $\vec{r} \neq 0$ ) di grado $ν$ . Infatti, consideriamo il caso $t > 0$ . Derivando la funzione

t^{- ν} f (t \vec{r})

si trova

\begin{aligned} \frac{d}{d t} t^{- ν} f (t \vec{r}) = - ν t^{- ν - 1} f (t \vec{r}) + t^{- ν} (\nabla f (t \vec{r}) \cdot \vec{r}) \\ = t^{- ν - 1} [- ν f (t \vec{r}) + \nabla f (t \vec{r}) \cdot (t \vec{r})] . \end{aligned}

Per ipotesi la (4.15) vale per ogni $\vec{r}$ ; in particolare vale nel punto $t \vec{r}$ , ossia vale

ν f (t, \vec{r}) = \nabla f (t, \vec{r}) \cdot (t \vec{r});

e quindi

\frac{d}{d t} t^{- ν} f (t \vec{r}) = 0 .

Dunque,

t^{- ν} f (t \vec{r}) = c, o s s i a f (t \vec{r}) = c t^{ν}

ove $c$ è una opportuna costante. Ponendo $t = 1$ si trova $c = f (\vec{r})$ e quindi

f (t \vec{r}) = t^{ν} f (\vec{r}) .

In modo analogo si procede per $t < 0$ e quindi si trova che la funzione è omogenea di grado $ν$ .

4.7.4 Appendice: La dimostrazione del teorema 132

Dim. Per semplicità di notazioni, proviamo l’asserto con $x_{0} = 0$ , $y_{0} = 0$ . fissiamo i punti $x$ ed $y$ e consideriamo la funzione di una sola variabile

ϕ (t) = f (t x, t y) .

Si noti che $ϕ (1) = f (x, y)$ mentre $ϕ (0) = f (0, 0)$ . Scriviamo

ϕ (t) = {f (t x, t y) - f (t x, 0)} + {f (t x, 0) - f (0, 0)} .

Consideriamo la funzione della sola variabile $t$

m (t) = f (t x, 0) .

In quest’espressione, il numero $x$ si considera come un parametro il cui valore è fissato. Applichiamo ad essa la seconda formula degli incrementi finiti: esiste $c \in (0, 1)$ tale che

f (x, 0) - f (0, 0) = m (1) - m (0) = \frac{d}{d t} m {(t)}_{|_{t = c}} = x f_{x} (c x, 0) .

Si noti che si sono usate in questo calcolo solamente proprietà delle funzioni di una variabile e che, per applicare la seconda formula degli incrementi finiti, si è usata l’esistenza della derivata di $f (t x, 0)$ che, a sua volta, implica la continuità di $f (t x, 0)$ . Il numero $c$ dipende dalla particolare funzione $m (t)$ usata e quindi, in definitiva, dipende da $x$ . Dato che $c \in (0, 1)$ , si ha $| c x | < | x |$ . Usando ciò, stimiamo

\frac{|x [f_{x} (c x, 0) - f_{x} (0, 0)]|}{\sqrt{x^{2} + y^{2}}} \leq |f_{x} (c x, 0) - f_{x} (0, 0)| .

La condizione $| c x | < | x |$ e la continuità della derivata prima mostrano che il limite per $(x^{2} + y^{2})$ tendente a zero è nullo. Dunque vale

f (x, 0) - f (0, 0) = x f_{x} (0, 0) + o (x, y) .

(4.16)

Consideriamo ora la funzione $n (τ)$ , dipendente dai parametri $x$ ed $y$ ,

n (τ) = f (x, τ y) .

Applicando a questa la seconda formula degli incrementi finiti, si trova $d \in (0, 1)$ tale che

f (x, τ y) - f (x, 0) = n (1) - n (0) = \frac{d}{d τ} n {(τ)}_{|_{τ = \tilde{c}}} = y f_{y} (x, d y) .

Si noti che il numero $d$ dipende dalla particolare funzione con cui si lavora, e quindi dai parametri $x$ ed $y$ che la identificano. E’ però un numero compreso tra $0$ ed $1$ . La precedente uguaglianza vale per ogni $τ \in (0, 1)$ , in particolare essa vale se come valore di $τ$ si sceglie $1$ :

f (x, y) - f (x, 0) = y f_{y} (x, d y) = y f_{y} (0, 0) + y [f_{y} (x, d y) - f_{y} (0, 0)] .

L’ultima differenza verifica

\frac{|y [f_{y} (x, d y) - f_{y} (0, 0)]|}{\sqrt{x^{2} + y^{2}}} \leq | f_{y} (x, d y) - f_{y} (0, 0) |

e quindi tende a zero per $d i s t ((x, y), (0, 0))$ tendente a zero, per la continuità di $f_{y}$ e perchè $0 < d < 1$ . Dunque si può scrivere

f (x, y) - f (x, 0) = y f_{y} (0, 0) + o (x, y) .

(4.17)

Sommando la (4.16) e la (4.17) si trova la formula cercata. _

Osservazione 157 Si noti che per la dimostrazione è suffciente sapere che la funzione $f (x, y)$ è derivabile ed ha derivate continue in un intorno di $(x_{0}, y_{0})$ . _

4.7.5 Appendice: la dimostrazione del teorema di Schwarz

La dimostrazione del teorema di Schwarz è importante anche perché fornisce un’ulteriore rappresentazione delle derivate miste. Limitiamoci a provare il teorema assumendo $(x_{0}, y_{0}) = (0, 0)$ . Mostriamo che, se $f_{x, y} (x, y)$ ed $f_{y, x} (x, y)$ sono continue in un intorno di $(0, 0)$ allora si ha

f_{x y} (0, 0) = lim_{(h, k) \to (0, 0)} \frac{f (h, k) - f (h, 0) - f (0, k) + f (0, 0)}{h k} = f_{y, x} (0, 0) .

(4.18)

L’uguaglianza implica in particolare che le derivate miste sono uguali. Introduciamo la funzione $ϕ (x) = f (x, k) - f (x, 0)$ . Vale:

ϕ (h) - ϕ (0) = f (h, k) - f (h, 0) - f (0, k) + f (0, 0) .

Dal Teorema di Lagrange si ha

ϕ (h) - ϕ (0) = h ϕ^{'} (c) = h [f_{x} (c, k) - f_{x} (c, 0)] .

Il numero $c$ dipende sia da $h$ che da $k$ , $c = c (h, k)$ e verifica

0 < c (h, k) < k .

Si usi ora la continuità della derivata $f_{x} (x, y)$ , l’esistenza in ogni punto della derivata $f_{x y} (x, y)$ e di nuovo il Teorema di Lagrange per scrivere

ϕ (h) - ϕ (0) = h [f_{x} (c, k) - f_{x} (c, 0)] = h k [f_{x y} (c (h, k), d)] .

Il punto $d$ dipende da $k$ e da $c$ , quindi in definitiva da $h$ e da $k$ , $d = d (h, k)$ , e verifica

0 < d (h, k) < k .

Dunque, dal Teorema di confronto per i limiti,

lim_{(h, k) \to (0, 0)} c (h, k) = 0, lim_{(h, k) \to (0, 0)} d (h, k) = 0

cosìche, per la continuità della derivata seconda mista

lim_{(h, k) \to (0, 0)} \frac{ϕ (h) - ϕ (0)}{h k} = lim_{(h, k) \to (0, 0)} f_{x y} (c (h, k), d (h, k)) = f_{x y} (0, 0) .

Ciò prova la prima uguaglianza in (4.18). Per provare la seconda uguaglianza si introduca la funzione

ψ (y) = f (h, y) - f (0, y) .

Si procede in modo analogo a quanto fatto per la funzione $ϕ (x)$ e si trova:

$\begin{matrix} ψ (k) - ψ (0) = f (h, k) - f (0, k) - f (h, 0) + f (0, 0) \\ = f (h, k) - f (h, 0) - f (0, k) + f (0, 0) = ϕ (h) - ϕ (0); \end{matrix}$
$lim_{(h, k) \to (0, 0)} \frac{ψ (k) - ψ (0)}{h k} = f_{y x} (0, 0) = lim_{(h, k) \to (0, 0)} \frac{ϕ (h) - ϕ (0)}{h k} = f_{x, y} (0, 0)$

e quindi $f_{x y} (0, 0) = f_{y x} (0, 0)$ . _

Osservazione 158 Si noto che:

per la dimostrazione del teorema di Schwartz basta che la funzione sia di classe $C^{1} (V)$ , con $V$ intorno di $(x_{0}, y_{0})$ ; che esistono le derivate seconde miste in ogni punto di $V$ e che queste sono continue in $(x_{0}, y_{0})$ . Le derivate $f_{x x} (x, y)$ , $f_{y y} (x, y)$ non intervengono.
Supponiamo che la funzione dipenda da tre o più variabili e che $x$ ed $y$ denotino due delle variabili. Nel fare le derivate rispetto ad $x$ ed $y$ , tutte le altre variabili vengono tenute costanti; e quindi il teorema di Schwarz vale per funzioni di classe $C^{1}$ , qualunque sia il numero di variabili da cui la funzione dipende; e per tutte le coppie $(x, y)$ di variabili tali che le rispettive derivate seconde miste siano continue.

Capitolo 5
Funzioni implicite ed estremi vincolati

I termini “curva” o “superficie” hanno vari significati, tra loro interdipendenti. E’ comodo conoscere da subito il significato di curva o superficie parametrica: diremo che una curva è definita parametricamente quando è espressa mediante un’equazione

x = x (t), y = y (t), t \in (a, b)

(se la curva è in $ℝ^{3}$ c’è anche una terza componente, $z = z (t)$ ). Una superficie è definita parametricamente quando è definita mediante una trasformazione da una regione $Ω$ di $ℝ^{2}$ in $ℝ^{3}$ ,

x = x (u, v), y = y (u, v), z = z (u, v), (u, v) \in Ω .

Osserviamo che ogni grafico di funzione è una curva, o una superficie, definita parametricamente. Infatti, considerando la funzione $f (x)$ della variable $x \in (a, b)$ , il suo grafico è identificato dalle equazioni

x = t, y = f (t) t \in (a, b) .

In modo analogo, se la funzione dipende da due variabili $x$ ed $y$ , il suo grafico è la superficie parametrica

x = u, y = v, z = f (u, v) .

Se accade che una curva è grafico di una funzione $y = y (x)$ oppure $x = x (y)$ , diciamo che $γ$ è una curva cartesiana In modo analogo si definiscono le superfici cartesiane come quelle superfici che sono grafici di funzioni di due variabili. Chiameremo “curva” anche l’insieme immagine della parametrizzazione. Al Cap. 6 saremo più precisi su questo punto. D’altra parte, si sa che la geometria analitica definisce curve e superfici mediante equazioni: l’equazione $x^{2} + y^{2} = R^{2}$ definisce una circonferenza di raggio $R$ (se $R > 0$ ; altrimenti definisce un solo punto). In questo paragrafo vogliamo dare condizioni perché un’equazione definisca una “curva” o una “superficie” in un senso che spegheremo, e vogliamo studiare problemi di massimo e di minimo “vincolati“ a tali curve o superfici.

5.1 Insiemi di livello

Sia $F (\vec{r})$ una funzione definita su una regione $Ω \subseteq ℝ^{n}$ ed a valori in $ℝ$ e si voglia studiare l’equazione $F (\vec{r}) = c$ . Gli insiemi

ℱ_{c} = {\vec{r} | F (\vec{r}) = c}

si chiamano insiemi di livello della funzione $F (\vec{r})$ . Più precisamente, l’insieme $ℱ_{c}$ si chiama l’insieme di livello $c$ . Notiamo esplicitamente che l’insieme di livello è un sottinsieme del dominio della funzione e non del suo grafico. Per esempio se $\vec{r} = (x, y)$ l’insieme di livello si ottiene concettualmente con i tre passi seguenti:

si costruisce il grafico della funzione, che è in $ℝ^{3}$ ;
si taglia il grafico col piano $z = c$ ;
si proietta ortogonalmente la sezione ottenuta sul piano $(x, y)$ , ottenendo l’insieme $ℱ_{c}$ .

L’insieme $ℱ_{c}$ può avere la natura più varia, come mostrano gli esempi seguenti, nei quali $Ω = ℝ^{2}$ e $c = 0$ :

Esempio 1. Se $F (x, y) = x^{2} + y^{2} + 1$ , l’insieme $ℱ_{0}$ è vuoto.
Esempio 2. Se $F (x, y) = x^{2} + y^{2}$ , l’insieme $ℱ_{0}$ è costituito dal solo punto $0$ .
Esempio 3. Se la funzione $F (x, y)$ è identicamente nulla, $ℱ_{0}$ è $ℝ^{2}$ ;
Esempio 4. Se $F (x, y) = (s g n x) + 1$ allora $ℱ_{0}$ è il semipiano ${(x, y) | x < 0}$ ;
Esempio 5. Se $F (x, y) = 1 + (s g n y) (s g n x)$ l’insieme di livello è l’unione del secondo e quarto quadrante (assi coordinati esclusi).
Esempio 6. Se $F (x, y) = y - x^{2}$ allora $ℱ_{0}$ è la parabola $y = x^{2}$ , e quindi è una curva definita parametricamente da $x = t$ , $y = t^{2}$ .
Esempio 7. se $F (x, y) = x^{2} + y^{2} - 1$ allora $ℱ_{0}$ è la circonferenza $x^{2} + y^{2} = 1$ . Quest’insieme è anche immagine della curva parametrizzata da $x = cos t, y = sin t, t \in [0, 2 π) .$

Esaminiamo più in dettaglio l’esempio 7. Come si è visto, si tratta di una curva parametrica. Se $(x_{0}, y_{0})$ è una soluzione, ossia un punto di $ℱ_{0}$ , allora anche $(x_{0}, - y_{0})$ è soluzione; e quindi l’insieme delle soluzioni non è un grafico di funzione (univoca). E’ però vero che se $| y_{0} | \neq 0$ , tagliando l’insieme delle soluzioni con una striscia

y_{0} - 𝜖 < y < y_{0} + 𝜖,

con $𝜖$ abbastanza piccolo, si trova il grafico di una funzione $y = y (x)$ . Si veda la figura (5.1), a sinistra.

figura 5.1: Esistenza o non esistenza della funzione implicita

In questo caso particolare è facile determinare esplictamente la funzione, perché

y (x) = \sqrt{1 - x^{2}} s e y_{0} > 0, y (x) = - \sqrt{1 - x^{2}} s e y_{0} < 0 .

Se invece $y_{0} = 0$ , l’insieme

{(x, y) | y_{0} - 𝜖 < y < y_{0} + 𝜖} \cap {(x, y) | x^{2} + y^{2} = 1}

non è grafico di una funzione $y = y (x)$ . E’ però grafico di una funzione $x = x (y)$ . Per contrasto, vediamo l’esempio seguente:

Esempio 8 E’ ancora $c = 0$ mentre la funzione $F (x, y)$ è $x^{2} - y^{2} = 0 .$
Quest’equazione è soddisfatta dai punti di ambedue le bisettrici e l’intersezione delle bisettrici con un intorno di $O$ non è un grafico, né di una funzione $y = y (x)$ né di una funzione $x = x (y)$ , si veda la figura (5.1), a destra.

Si pone quindi questo problema: supponiamo che l’insieme $ℱ_{c}$ sia non vuoto, e se ne conosca un suo punto ${\vec{r}}_{0}$ . Vogliamo dare condizioni sotto le quali esiste un intorno $W$ di ${\vec{r}}_{0}$ tale che $W \cap ℱ_{c}$ sia una curva o una superficie cartesiana. Limitandoci al caso $n = 2$ oppure $n = 3$ . Se $n = 2$ , vogliamo capire se l’equazione

F (x, y) = c

si può “risolvere” rispetto per esempio ad $y$ , intendendo $x$ come “parametro libero” ottenendo come grafico della funzione $(x, y (x))$ l’insieme $W \cap ℱ_{c}$ ; Se $n = 3$ , vogliamo capire se l’equazione

F (x, y, z) = c

si può “risolvere” rispetto per esempio a $z$ , intendendo $(x, y)$ come “parametro libero” ottenendo come grafico della funzione $(z, z (x, y))$ l’insieme $W \cap ℱ_{c}$ . Quando ciò accade, si dice che l’equazione considerata definisce implicitamente la funzione, rispettivamente $y = y (x)$ oppure $z = z (x, y)$ . Ciò si vedrà nel prossimo paragrafo, nel quale illustreremo anche il caso di un sistema di due equazioni in tre variabili:

F_{1} (x, y, z) = c_{1}, F_{2} (x, y, z) = c_{2} .

Ci si chiede se, in un opportuno intorno di un punto $(x_{0}, y_{0}, z_{0})$ , è possibile risolvere questo sistema rispetto a due “incognite” per esempio $y$ e $z$ , intendendo $x$ come “parametro libero”. Se ciò può farsi diremo che si è definita implicitamente una funzione, che si interpreta come curva ottenuta come intersezione di due superfici.

5.2 Il teorema della funzione implicita

Ricordiamo il problema: si ha un’equazione (o un sistema di equazioni) di cui si conosce una soluzione: si vuol sapere se l’insieme delle soluzioni è, localmente in un intorno di tale punto, una curva o una superficie cartesiana. Considereremo con qualche dettaglio il caso di equazioni $F (x, y) = c$ mentre ci limiteremo ad enunciare i risultati in due casi più generali.

5.2.1 Curve piane definite implicitamente

Ricordiamo il problema che si vuole studiare: Consideriamo l’equazione Sia $(x_{0}, y_{0})$ una soluzione dell’equazione

F (x, y) = c .

(5.1)

Vogliamo dare condizioni suffcienti per l’esistenza di un intorno $W$ di $(x_{0}, y_{0})$ e di una funzione $y = y (x)$ oppure $x = x (y)$ tali che

{(x, y) \in W | f (x, y) = c} = {(x, y) \in W | y = y (x)}

oppure

{(x, y) \in W | f (x, y) = c} = {(x, y) \in W | x = x (y)} .

La condizione che stiamo cercando è data dal teorema seguente:

Teorema 159 (della funzione implicita) Teorema della funzione implicita Sia $F (x, y)$ una funzione di classe $C^{1} (Ω)$ e sia $(x_{0}, y_{0}) \in Ω$ . Se

\nabla F (x_{0}, y_{0}) \neq \vec{0}

esiste un intorno $W$ di $(x_{0}, y_{0})$ tale che

W \cap {(x, y) | F (x, y) = F (x_{0}, y_{0})}

è grafico di una funzione $y = y (x)$ , oppure $x = x (y)$ . Più precisamente, se $F_{y} (x_{0}, y_{0}) \neq 0$ allora l’equazione (5.1) definisce implicitamente una funzione $y = y (x)$ di classe $C_{1}$ , e vale

y^{'} (x_{0}) = - \frac{F_{x} (x_{0}, y_{0})}{F f_{y} (x_{0}, y_{0})};

Se $F_{x} (x_{0}, y_{0}) \neq 0$ allora l’equazione (5.1) definisce implicitamente una funzione $x = x (y)$ di classe $C_{1}$ , e vale

x^{'} (y_{0}) = - \frac{F_{y} (x_{0}, y_{0})}{F_{x} (x_{0}, y_{0})} .

Se ambedue le componenti di $\nabla F (x_{0}, y_{0})$ sono non nulle, allora l’equazione $F (x, y) = f (x_{0}, y_{0})$ definisce implicitamente sia una funzione $y = y (x)$ che una funzione $x = x (y)$ .

Presentiamo (una parte della) dimostrazione di questo teorema, fissando l’attenzione sul caso $F_{y} (x_{0}, y_{0}) \neq 0$ . Il punto $(x_{0}, y_{0})$ è uno dei punti nel quale vale l’uguaglianza (5.1), ossia si ha

F (x, y) = c = F (x_{0}, y_{0}) .

(5.2)

In tal caso, proviamo Si ha:

Teorema 160 Valga $F (x_{0}, y_{0}) = c$ . Sia $F (x, y)$ di classe $C^{1}$ e sia $F_{y} (x_{0}, y_{0}) \neq 0$ . Sotto queste condizioni, esistono un intorno $U$ di $x_{0}$ ed un intorno $V$ di $y_{0}$ ed esiste un’unica funzione $y = y (x)$ definita in $U$ ed a valori in $V$ che ha per grafico l’insieme (5.2) ossia tale che

$y (x_{0}) = y_{0}$ ,
$F (x, y (x)) = c$ per ogni $x \in U$ ,
$y (x) \in V$ .

Questa funzione è di classe $C^{1}$ e inoltre

y^{'} (x_{0}) = - \frac{F_{x} (x_{0}, y_{0})}{F_{y} (x_{0}, y_{0})} .

(5.3)

Dim. Per seguire questa dimostrazione, si guardi la figura 5.2. In questa figura, $x_{0} = y_{0} = 3$ e il punto $(x_{0}, y_{0})$ è indicato con un asterisco.

figura 5.2: La dimostrazione del teorema della funzione implicita

Per il teorema della permanenza del segno, vale $F_{y} (x, y) > 0$ in un intorno $W$ di $(x_{0}, y_{0})$ . Siano $Ũ_{0}$ un intorno di $x_{0}$ e $Ṽ_{0}$ un intorno di $y_{0}$ tali che se $x \in Ũ_{0}$ , $y \in Ṽ_{0}$ allora $(x, y) \in W$ . Limitiamoci a considerare le coppie $(x, y)$ con $x \in Ũ_{0}$ , $y \in Ṽ_{0}$ . Siano $y_{1}$ , $y_{2}$ elementi di $Ṽ_{0}$ tali che

y_{1} < y_{0} < y_{2} .

Consideriamo la funzione $ϕ (y) = F (x_{0}, y)$ . Questa funzione è continua e strettamente crescente e $ϕ (y_{0}) = c$ . Dunque, $ϕ (y_{1}) < c$ , $ϕ (y_{2}) > c$ . Il Teorema della permanenza del segno mostra l’esistenza di un intorno $U \subseteq Ũ_{0}$ di $x_{0}$ tale che

F (x, y_{1}) < c, F (x, y_{2}) > c \forall x \in U;

e, per ogni fissato $x \in U$ , la funzione $y \to F (x, y)$ è strettamente crescente. Dunque, per $x$ fissato, esiste un unico numero $y = y (x) \in Ṽ$ tale che

F (x, y (x)) = c .

Ciò prova l’esistenza della funzione $y (x)$ . Omettiamo la dimostrazione della regolarità. Accettando il fatto non provato che $y (x)$ è derivabile, si derivino i due membri dell’uguaglianza

F (x, y (x)) = 0 .

Si trova, per il Teorema 135,

0 = F_{x} (x, y (x)) + F_{y} (x, y (x)) y^{'} (x)

e quindi

y^{'} (x) = - \frac{F_{x} (x, y (x))}{F_{y} (x, y (x))} .

Calcolando per $x = x_{0}$ si trova la (5.3) _ La funzione $y = y (x)$ cosìcostruita si dece definita implicitamente dall’equazione (5.1).

5.2.2 Superfici definite implicitamente

Consideriamo ora l’equazione

F (x, y, z) = c = F (x_{0}, y_{0}, z_{0}) .

(5.4)

Vogliamo dare condizioni sotto le quali sia possibile considerare due delle tre variabili come “parametri liberi” e risolvere rispetto alla terza, ottenendo quindi per esempio una funzione implicita

z = z (x, y)

che interpretiamo come equazione cartesiana di una superficie. Limitiamoci ad enunciare il teorema che dà una condizione solamente suffciente per l’esistenza della funzione implicita.

Teorema 161 Sia $F (\vec{r}, z)$ una funzione a valori reali della variabile $(\vec{r}, z) \in ℝ^{n}$ ( $z$ indica l’ultima componente del vettore $(\vec{r}, z)$ e pertanto è un numero reale). Supponiamo che la funzione sia di classe $C^{1}$ e che valga

F ({\vec{r}}_{0}, z_{0}) = c, F_{y} ({\vec{r}}_{0}, z_{0}) \neq 0 .

Esiste un intorno $W$ di $({\vec{r}}_{0}, z_{0})$ ed esiste un’unica funzione $z = z (\vec{r})$ tale che

{(\vec{r}, z) \in W | F (\vec{r}, z) = c = F ({\vec{r}}_{0}, z_{0})} = {(\vec{r}, z) \in W | z = z (\vec{r})} .

La funzione $z (\vec{r})$ è di classe $C^{1}$ ed il suo gradiente è (indicando con $x^{1}$ ,…, $x^{n - 1}$ le componenti di $\vec{r}$ )

- \frac{1}{F_{z} ({\vec{r}}_{0}, z_{0})} {[\begin{matrix} F_{x^{1}} ({\vec{r}}_{0}, z_{0}) & F_{x^{2}} ({\vec{r}}_{0}, z_{0}) & \dots & F_{x^{n - 1}} ({\vec{r}}_{0}, z_{0}) \end{matrix}]}^{'} .

Nel caso particolare $\vec{r} = (x, y)$ la funzione che si trova è

z = z (x, y),

ossia la rappresentazione parametrica di una superficie cartesiana.

Osservazione 162 Il teorema precedente si può applicare ad una qualsiasi delle variabili, purché la derivata parziale relativa sia non nulla; per esempio, si potrà applicare alla prima invece che all’ultima componente. _

5.2.3 Curve intersezione di due superfici

Studiamo ora un sistema di due equazioni in tre incognite. Consideriamo prima di tutto un esempio:

Esempio 163 Studiamo il problema

x^{2} + y = 1, y - x + z = 0 .

Questo sistema può scriversi come

z = x^{2} + x - 1, y = 1 - x^{2},

ossia il sistema ha infinite soluzioni, una per ogni valore di $x$ . Diremo che questo sistema definisce implicitamente le due funzioni $z (x) = x^{2} + x - 1$ e $y (x) = 1 - x^{2}$ o meglio diremo che definisce una funzione della variabile reale $x$ , a valori in $ℝ^{2}$ . _

Consideriamo in generale il sistema delle due equazioni in tre incognite

f (x, y, z) = c, g (x, y, z) = d .

(5.5)

Supponiamo che $(x_{0}, y_{0}, z_{0})$ risolva questo sistema e, fissato $x_{0}$ , consideriamo la funzione $\vec{F} (y, z)$ da $ℝ^{2}$ in $ℝ^{2}$

\vec{F} (y, z) = [\begin{matrix} F (x_{0}, y, z) \\ G (x_{0}, y, z) \end{matrix}] .

Lo jacobiano di questa trasformazione è

j (x_{0}, y, z) = det [\begin{matrix} F_{y} (x_{0}, y, z) & F_{z} (x_{0}, y, z) \\ F_{y} (x_{0}, y, z) & F_{z} (x_{0}, y, z) \end{matrix}] .

Vale:

Teorema 164 Siano $F (x, y, z)$ e $F (x, y, z)$ funzioni di classe $C^{1}$ e sia

j (x_{0}, y_{0}, z_{0}) \neq 0 .

Esiste un intorno $W$ di $(x_{0}, y_{0}, z_{0})$ ed una unica funzione di classe $C^{1}$

[\begin{matrix} y \\ z \end{matrix}] = [\begin{matrix} ϕ (x) \\ ψ (x) \end{matrix}]

(5.6)

da $ℝ$ in $ℝ^{2}$ , tale che

{(x, y, z) \in W, soluzioni di (5.5)} = {(x, y, z) | y = ϕ (x), z = ψ (x)} .

La derivata della funzione $x \to {[\begin{matrix} ϕ (x) & ψ (x) \end{matrix}]}^{'}$ è

\frac{d}{d t} [\begin{matrix} ϕ (x_{0}) \\ ψ (x_{0}) \end{matrix}] = - {[\begin{matrix} F_{y} (x_{0}, y_{0}, z_{0}) & F_{z} (x_{0}, y_{0}, z_{0}) \\ G_{y} (x_{0}, y_{0}, z_{0}) & G_{z} (x_{0}, y_{0}, z_{0}) \end{matrix}]}^{- 1} [\begin{matrix} F_{x} (x_{0}, y_{0}, z_{0}) \\ G_{x} (x_{0}, y_{0}, z_{0}) \end{matrix}] .

Omettiamo la dimostrazione. Naturalmente diremo che la funzione (5.6) è definita implicitamente dal sistema di equazioni (5.5).

5.3 Il teorema della funzione inversa ed i cambiamenti di variabili

Il teorema della funzione inversa si può vedere come ulteriore caso del teorema della funzione implicita, nel caso in cui l’equazione da risolvere sia

\vec{F} (\vec{r}) = \vec{x}, \vec{r} \in ℝ^{n}, \vec{x} \in ℝ^{n}

ma conviene vederlo come studio dei cambiamenti di variabile Cominciamo ad illustrarlo nel caso più semplice $n = 1$ . Abbiamo quindi una funzione $F (x)$ di una sola variabile $x$ definita su un intervallo $(a, b)$ ed ivi di classe $C^{1}$ . Se la sua derivata non si annulla, si ha $F^{'} (x) > 0$ oppure $F^{'} (x) < 0$ in ogni punto di $(a, b)$ e quindi $F (x)$ è strettamente monotona su $(a, b)$ . Dunque è invertibile. E’ naturale investigare se l’osservazione precedente possa estendersi al caso di funzioni di più variabili. Lo studio di questo problema conduce al “teorema della funzione inversa”, di cui ora illustriamo l’interesse. Abbiamo visto che talvolta conviene rappresentare i punti di $ℝ^{3}$ mediante coordinate sferiche oppure, a seconda delle applicazioni, cilindriche. In altri casi si usano coordinate ellittiche che, sul piano, sono date dalle trasformazioni

x = r a cos 𝜃, y = r b sin 𝜃, r > 0, 𝜃 \in [0, 2 π) .

In generale si ha questa situazione: si hanno due regioni $Ω$ ed $Ω^{'}$ di $ℝ^{n}$ (conviene considerarle in due “copie diverse” di $ℝ^{n}$ ) e una trasformazione invertibile $\vec{x} = \vec{F} (\vec{r})$ da $Ω^{'}$ con immagine uguale ad $Ω$ . In questo caso i punti di $Ω$ si possono rappresentare, invece che con le loro coordinate cartesiane, con quelle del punto $\vec{r}$ di $Ω^{'}$ che univocamente gli corrisponde. Per esempio lavorando con coordinate polari nel piano,

\vec{r} = (r, 𝜃) \in (0, + \infty) \times [- π, π), \vec{x} = (x, y) : \{\begin{matrix} x = r cos 𝜃 \\ y = r sin 𝜃 . \end{matrix}

Questa è una trasformazione invertibile dalla striscia $Ω = (0, + \infty) \times (- π, π)$ alla regione $Ω$ che è il piano $ℝ^{2}$ privato del semiasse ${(x, y), x \leq 0}$ . Per molte applicazione è necessario che la trasformazione sia oltre che invertibile anche differenziabile e con inversa essa stessa differenziabile. In pratica non è diffcile riconoscere che la trasformazione con cui si lavora è differenziabile, e spesso anche riconoscere che è invertibile; è più diffcile calcolare esplicitamente l’inversa e verificare che essa è differenziabile. Fortunatamente il teorema seguente dà una condizione suffciente per l’invertibilità (si noti: solamente locale) e per la differenziabilità della funzione inversa.

Teorema 165 (teorema della funzione inversa) Sia $\vec{x} = \vec{F} (\vec{r})$ una funzione definita su un aperto $Ω^{'} \subseteq ℝ^{n}$ ed a valori in $ℝ^{n}$ , di classe $C^{1} (Ω^{'})$ . Sia ${\vec{r}}_{0} \in Ω^{'}$ un punto in cui il determinante jacobiano è diverso da zero:

det J_{\vec{F}} ({\vec{r}}_{0}) \neq 0 .

Sotto tali condizioni esistono un aperto $A$ contenente ${\vec{r}}_{0}$ ed un aperto $B$ contenente ${\vec{x}}_{0} = \vec{F} ({\vec{r}}_{0})$ con queste proprietà:

la funzione $\vec{F} (\vec{r})$ è biunivoca su $A$ , con immagine uguale a $B$ . La restrizione di $\vec{F} (\vec{r})$ all’aperto $A$ ammette quindi funzione inversa definita sull’aperto $B$ . Indichiamola col simbolo $\vec{G} (\vec{x})$ .
La funzione $\vec{G} (\vec{x})$ è di classe $C^{1} (B)$ ;

vale

J_{\vec{G}} ({\vec{x}}_{0}) = {[J_{\vec{F}} ({\vec{r}}_{0})]}^{- 1}, {\vec{x}}_{0} = \vec{F} ({\vec{r}}_{0}) .

(5.7)

Ossia, la matrice jacobiana delle funzione inversa $\vec{G} (\vec{x})$ calcolata in ${\vec{x}}_{0}$ è ${[J_{\vec{F}} ({\vec{r}}_{0})]}^{- 1}$ .

Si noti che, accettando la differenziabilità della funzione inversa, la formula per $J_{\vec{G}} ({\vec{x}}_{0})$ discende dalla formula di derivazione a catena. Infatti, sia $\vec{G} (\vec{x})$ la funzione inversa di $\vec{F} (\vec{r})$ e supponiamo di sapere che la funzione $\vec{G} (\vec{x})$ è differenziabile. Per la definizione di funzione inversa,

\vec{G} (\vec{F} (\vec{r})) = \vec{r} .

La matrice jacobiana della trasformazione $\vec{r} \to \vec{r}$ è $I$ , la matrice identità. Dunque, dalla formula di derivazione a catena,

I = J_{\vec{G}} ({\vec{x}}_{0}) J_{\vec{F}} ({\vec{r}}_{0}), x_{0} = \vec{F} ({\vec{r}}_{0})

ossia

J_{\vec{G}} ({\vec{x}}_{0}) = {[J_{\vec{F}} ({\vec{r}}_{0})]}^{- 1} .

E’ importante notare che il teorema della funzione inversa afferma:

l’invertibilità locale;
la regolarità dell’inversa.

Invece, l’invertibilità su tutta $Ω$ generalmente non vale, come prova il caso delle coordinate polari nel piano. Per esse, lo jacobiano è uguale ad $r$ e quindi non nullo per $r > 0$ e qualunque $𝜃$ ; ma se vogliamo una trasformazione biunivoca dobbiamo imporre a $𝜃$ di appartenere ad un intervallo di lunghezza non maggiore di $2 π$ . Il teorema della funzione inversa ha numerose dimostrazioni, tutte interessanti. In appendice mostriamo una dimostrazione nel caso di una trasformazione da $ℝ^{2}$ in sé, basata sul teorema della funzione implicita.

In questo capitolo assumeremo che

F

sia di classe

C^{1}

e che gli zeri di

\nabla F

siano isolati. Ricordiamo che i punti nei quali

\nabla F (x_{0}, y_{0}) = 0

si chiamano punti critici della funzione

F

5.4 Ulteriori esempi

Ricordiamo che il Teorema della funzione implicita dà una condizione suffciente perchè un insieme di livello sia localmente grafico di una funzione: se $F (x, y)$ è di classe $C^{1}$ , se esiste $(x_{0}, y_{0})$ tale che $F (x_{0}, y_{0}) = c$ e se $F_{y} (x_{0}, y_{0}) \neq 0$ , allora esiste un intorno $W$ di $(x_{0}, y_{0})$ la cui intersezione con l’insieme di livello è grafico di una (unica) funzione

y = y (x) .

Analogo risultato vale se $F_{x} (x_{0}, y_{0}) \neq 0$ . In questo caso la funzione è $x = x (y)$ . Si ricordi che questa condizione è solamente suffciente, e non necessaria, come prova l’esempio seguente:

Esempio 166 La funzione $F (x, y) = {(x - y)}^{2}$ definisce implicitamente la funzione $x = y$ . Ma in $(0, 0)$ le sue derivate sono identicamente nulle. _

fissiamo un punto $(x_{0}, y_{0})$ tale che $\nabla F (x_{0}, y_{0}) \neq 0$ . Chiamiamo curva di livello o curva definita implicitamente l’insieme

γ = {(x, y) | F (x, y) = F (x_{0}, y_{0})} .

Si noti che potrebbero esistere punti $(x, y) \in γ$ nei quali il gradiente si annulla. Noi abbiamo richiesto solamente che $\nabla F (x_{0}, y_{0}) \neq 0$ . Ovviamente, ogni grafico di funzione è una curva definita implicitamente dall’equazione

F (x, y) = y - f (x) = 0 .

Si ricordi che avevamo già notato che gni grafico di funzione è anche curva definita parametricamente. Se $\nabla F (x_{0}, y_{0}) \neq 0$ , esiste un intorno $W$ di $(x_{0}, y_{0})$ tale che $W \cap γ$ è grafico di una funzione. Per esempio di una funzione $y = y (x)$ . E’ quindi possibile definire la tangente in $(x_{0}, y (x_{0})) = (x_{0}, y_{0})$ a tale grafico. Per definizione, la chiamiamo tangente alla curva $γ$ nel punto $(x_{0}, y_{0})$ . La retta tangente è

\begin{aligned} y = y (x_{0}) + y^{'} (x_{0}) (x - x_{0}) \\ = y (x_{0}) - \frac{F_{x} (x_{0}, y_{0})}{F_{y} (x_{0}, y_{0})} (x - x_{0}) . \end{aligned}

Essendo $F (x, y (x))$ identicamente nulla, la sua derivata è zero. La derivata per $x = x_{0}$ è

\nabla F (x_{0}, y_{0}) \cdot [\begin{matrix} 1 & y^{'} (x_{0}) \end{matrix}],

ossia, $\nabla F (x_{0}, y_{0})$ è ortogonale alla tangente. Per definizione, diremo che il gradiente è ortogonale alla curva. Si ha quindi: Dunque:

Teorema 167 Sia $γ$ è una curva di livello di una funzione $F (x, y)$ di classe $C^{1}$ . Il gradiente di $F (x, y)$ in ciascuno dei punti di $γ$ che non sono punti cretici di $F$ , è ortogonale alla curva stessa.

Per concludere, mostriamo che niente può dirsi nei punti nei quali le condizioni del teorema della funzione implicita non valgono. Abbiamo già visto (esempio 166) una funzione che non soddisfa alle condizioni del teorema della funzione implicita, ma che definisce implicitamente una funzione regolare. D’altra parte:

Esempio 168 Consideriamo l’equazione

F (x, y) = y^{2} - x^{2} = 0 .

Le due derivate parziali si annullano in $(0, 0)$ . L’equazione si risolve facilmente, trovando le soluzioni

y = x, y = - x .

La figura 5.3 a sinistra mostra che l’insieme di livello non è una curva cartesiana in nessun intorno dell’origine. A destra mostra la superficie (un paraboloide a sella) di cui si considera l’insieme di livello. Consideriamo ora l’equazione

F (x, y) = y^{3} - x^{2} = 0

Ancora si annullano le due derivate parziali di $F (x, y)$ in $(0, 0)$ . L’equazione definisce però un’unica funzione,

y = \sqrt[3]{x^{2}} .

Questa funzione non è derivabile in $y = 0$ . Il suo grafico è nella figura 5.4, a destra mentre a sinistra è rappresentata la funzione di cui si calcola la curva di livello. _

figura 5.3: Il grafico della funzione

y = \sqrt[3]{x^{2}}

figura 5.4: Esiste la funzione implicita anche se le condizioni del teorema non sono soddisfatte

Infine, consideriamo l’esempio seguente

Esempio 169 La funzione che si considera è

f (x, y) = {[{(x - 2)}^{2} + y^{2}] [{(x + 2)}^{2} + y^{2}]}^{1 ∕ 5},

(5.8)

il cui grafico è riportato nella figura 5.5, a sinistra. A destra si riportano alcune delle sue curve di livello, corrispondenti a varie quote.

figura 5.5: Il grafico della funzione (5.8)

Si noti che, per quote basse, la “curva di livello” si spezza in due curve e per quota uguale a $0$ si riduce a due punti (i due punti di minimo della funzione). La funzione ha un punto di sella di coordinate (0,0, 1). La curva di livello $1$ ha un “punto doppio” in $(0, 0)$ . _

Il teorema della funzione implicita asserisce che se $\nabla f (x_{0}, y_{0}) \neq 0$ (ed $f (x, y)$ è di classe $C^{1}$ ) allora in un intorno di $(x_{0}, y_{0})$ la curva di livello

f (x, y) = f (x_{0}, y_{0})

è grafico di una funzione $y = y (x)$ oppure $x = x (y)$ . Si sa già che curva di livello può essere un grafico anche se $\nabla f (x_{0}, y_{0}) = 0$ . L’esempio seguente ribadisce questo fatto.

Esempio 170 La funzione è

f (x, y) = y^{3} - x^{2} y^{2} + x^{2} y - x^{4}

e il punto $(x_{0}, y_{0})$ è $(0, 0)$ . E’: $\nabla f (0, 0) = 0$ . Ciò nonostante, la curva di livello $f (x, y) = f (0, 0) = 0$ è la parabola $y = x^{2}$ perché

f (x, y) = (y - x^{2}) (y^{2} + x^{2}) .

La figura 5.6 mostra a sinistra il grafico di $z = f (x, y)$ e la sua intersezione col piano $z = 0$ ; a destra varie curve di livello della funzione.

figura 5.6: Gradiente nullo ma curva di livello regolare

5.4.1 Superfici assegnate in modo implicito e curve intersezione di due superfici

Cosìcome le curve, anche le superfici possono assegnarsi in modo implicito. Sia $F (\vec{r}) = F (x, y, z)$ una funzione di tre variabili, di classe $C^{1}$ , e si voglia risolvere l’equazione

F (x, y, z) = c .

Sia ${\vec{r}}_{0} = (x_{0}, y_{0}, z_{0})$ un punto che verifica l’equazione. Dal Teorema delle funzioni implicite si sa che se

F_{z} ({\vec{r}}_{0}) \neq 0

allora esiste un intorno $W$ di ${\vec{r}}_{0}$ ed esiste una funzione $z = ϕ (x, y)$ per cui

{(x, y, z) \in W | F (x, y, z) = c} = {(x, y, z) \in W | z = ϕ (x, y)} .

Ossia, localmente l’insieme delle soluzioni è il grafico della funzione $z = ϕ (x, y)$ . Discorso analogo vale se una delle altre due derivate parziali è non nulla. Di conseguenza, se $\nabla F (x, y, z)$ non si annulla, ogni insieme di livello di $F (\vec{r})$ è “fatto di tanti pezzi di grafici, e quindi di superfici”. Usa considerare anche un tale insieme una superficie definita però in modo implicito. Si abbiano ora due superfici definite in modo implicito da

f (x, y, z) = c, g (x, y, z) = d .

I punti $(x, y, z)$ che appartengono all’intersezione dei due sostegni risolvono il sistema

f (x, y, z) = c, g (x, y, z) = d .

(5.9)

Sia $(x_{0}, y_{0}, z_{0})$ una soluzione di questo sistema. Se lo jacobiano

det [\begin{matrix} f_{y} (x_{0}, y_{0}, z_{0}) & g_{y} (x_{0}, y_{0}, z_{0}) \\ f_{z} (x_{0}, y_{0}, z_{0}) & g_{z} (x_{0}, y_{0}, z_{0}) \end{matrix}]

non è nullo, si sa (dal Teorema 164) che l’insieme delle soluzioni di (5.9) che appartiene ad un opportuno intorno $W$ di $(x_{0}, y_{0}, z_{0})$ ha forma

y = ϕ (x), z = ψ (x)

e quindi è una curva cartesiana di $ℝ^{3}$ ; ossia, localmente l’insieme delle soluzioni di (5.9) è una curva. Chiameremo ancora curva l’insieme di tali soluzioni e, più precisamente, diremo che si tratta di una curva ottenuta come intersezione di due superfici. La figura 5.7 illustra l’intersezione dei due cilindri $z = x^{2}$ e $z = y^{2}$ .

figura 5.7: Intersezione di due cilindri

5.5 Estremi vincolati

Diremo che un punto ${\vec{r}}_{0}$ , rispettivamente o di $γ$ o di $Σ$ , è un massimo relativo, oppure un minimo relativo, di $g (\vec{r})$ vincolato a $γ$ o a $Σ$ quando è un massimo o un minimo della restrizione di $g (\vec{r})$ alla curva $γ$ o, rispettivamente, alla superficie $Σ$ . In questo capitolo vogliamo dare condizioni necessarie per gli estremi vincolati, che estendano la condizione “derivata prima nulla nei punti estremi”.

Osservazione 171 Daremo condizioni solamente necessarieche devono venir soddisfatte da un punto ${\vec{r}}_{0}$ di massimo o di minimo vincolato ad una curva $γ$ o ad una superficie $Σ$ , definite implicitamente come curve, rispettivamente superficie, di livello di una funzione di classe $C^{1}$ . Quindi interessa solamente considerare il comportamento di $F$ e di $g$ in un intorno di ${\vec{r}}_{0}$ . Dunque, non sarà necessario assumere che il gradiente di $F$ sia ovunque diverso da zero. Basterà assumere che sia $\nabla F ({\vec{r}}_{0}) \neq 0$ . Per continuità, il gradiente $\nabla F (\vec{r})$ sarà diverso da zero in un intorno di ${\vec{r}}_{0}$ . _

Esamineremo con qualche dettaglio il caso degli estremi vincolati ad una curva piana e, per sommi capi, il caso degli estremi vincolati ad una superficie ed ad una curva dello spazio.

5.5.1 Estremi vincolati ad una curva piana

Considerando ancora il caso di funzioni di due variabili, vogliamo studiare gli estremi di una funzione $g (x, y)$ vincolati ad una curva $γ$ ; ossia, considerando i punti di minimo¹, vogliamo studiare quei punti $(x_{0}, y_{0})$ del sostegno di $γ$ con questa proprietà: esiste un intorno $I$ di $(x_{0}, y_{0})$ tale che se $(x, y) \in I$ appartiene anche al sostegno di $γ$ allora si ha

g (x_{0}, y_{0}) \leq g (x, y) .

Ovviamente, un caso è banale: se la curva $γ$ è descritta parametricamente,

x = x (t), y = y (t) t \in (a, b)

il problema si riduce a studiare i punti di minimo relativo della funzione di una sola variabile $t \to g (x (t), y (t))$ . Il caso interessante è il caso in cui la curva è descritta in modo implicito. Il problema di caratterizzare i punti di minimo ha carattere locale e, come si è detto, nell’intorno di un punto nel quale il gradiente non si annulla, ogni curva di livello può scriversi in forma parametrica. Però, in pratica, trovarne l’espressione parametrica è tutt’altro che facile. Vogliamo quindi dare una condizione necessaria soddisfatta dai punti di minimo, senza dover esplicitare la curva di livello. Ricapitolando, è data una una funzione $F (x, y)$ di classe $C^{1}$ e un punto $(x_{0}, y_{0})$ . Assumiamo

\nabla F (x_{0}, y_{0}) \neq 0 .

E’ data una funzione $g (x, y)$ di classe $C^{1}$ e supponiamo che $(x_{0}, y_{0})$ sia punto di minimo della $g (x, y)$ vincolato alla curva di livello

F (x, y) = F (x_{0}, y_{0}) .

Una condizione necessaria che deve essere soddisfatta è data dal teorema seguente.

Teorema 172 Siano $F (x, y)$ e $g (x, y)$ funzioni di classe $C^{1}$ su una regione $Ω$ e sia $(x_{0}, y_{0}) \in Ω$ un punto tale che

\nabla F (x_{0}, y_{0}) \neq 0 .

Sia $γ$ la curva di livello

F (x, y) = F (x_{0}, y_{0}) .

Sia $(x_{0}, y_{0})$ un punto di massimo o di minimo di $g (x, y)$ , vincolato alla curva $γ$ . In tal caso esiste un numero $λ$ tale che

\nabla g (x_{0}, y_{0}) = λ \nabla F (x_{0}, y_{0}) .

Il numero $λ$ si chiama moltiplicatore di Lagrange e quando si usa il teorema precedente per la ricerca degli estremi vincolati si diche che si usa il metodo dei moltiplicatori di Lagrange. Posponiamo la dimostrazione formale del teorema e presentiamone prima di tutto una giustificazione di tipo geometrico.

Considerazioni geometriche che giustificano il metodo dei moltiplicatori di Lagrange. fissiamo l’attenzione sul punto $(x_{0}, y_{0})$ di $γ$ e consideriamo la curva di livello $σ$ di $g (x, y)$ ,

σ : g (x, y) = g (x_{0}, y_{0}) .

Il punto $(x_{0}, y_{0})$ appartiene sia a $γ$ che a $σ$ . Supponiamo che la $γ$ passi da una parte all’altra di $σ$ . In questo caso la $γ$ passa da una parte del piano in cui vale

g (x, y) < g (x_{0}, y_{0})

ad una parte del piano in cui vale

g (x, y) > g (x_{0}, y_{0})

e quindi il punto $(x_{0}, y_{0})$ non è né di massimo né di minimo. Dunque, nei punti di massimo e di minimo vincolati, le due curve di livello $γ$ e $σ$ si toccano senza attraversarsi. La fig. 5.8 illustra questo caso.

figura 5.8: Estremi vincolati e curve di livello

Usando gli sviluppi di Taylor si prova che le due curve $γ$ e $σ$ si attraversano nel loro punto comune $(x_{0}, y_{0})$ se le tangenti in tale punto si attraversano. Dunque nei punti di massimo e di minimo vincolato le due curve devono avere la medesima retta tangente e quindi la medesima retta normale. Questo caso è illustrato dalla figura 5.9 a sinistra mentre la figura 5.9 a destra mostra che le due curve di livello possono attraversarsi anche nel caso in cui le tangenti coincidono.

figura 5.9: Grafici tangenti e estremi vincolati

Sappiamo che la normale ad una curva di livello è nella direzione del gradiente della funzione e quindi nei punti di massimo oppure di minimo vincolato, $\nabla F (x_{0}, y_{0})$ e $\nabla g (x_{0}, y_{0})$ sono vettori colineari: esiste un numero $λ$ tale che $\nabla g (x_{0}, y_{0}) = λ \nabla F (x_{0}, y_{0})$ . Dunque, studiando il sistema della tre equazioni

\{\begin{matrix} F (x, y) = 0 \\ λ F_{x} (x, y) = g_{x} (x, y) \\ λ F_{y} (x, y) = g_{y} (x, y) \end{matrix}

(5.10)

nelle tre incognite $λ$ , $x$ ed $y$ , si determinano dei punti tra i quali necessariamente si trovano gli estremi vincolati di $g (x, y)$ .

Osservazione 173 Gli argomenti di tipo geometrico che abbiamo usato non sono rigorosi e inoltre fanno intervenire la curva di livello $σ$ . Dunque implicitamente richiedono di lavorare in punti nei quali il gradiente della funzione $g (x, y)$ non si annulla. Il teorema vale però anche se $\nabla g (x_{0}, y_{0}) = 0$ . Infatti, la dimostrazione analitica presentata più avanti non fa uso di condizioni sul gradiente di $g (x, y)$ . I punti nei quali si annulla il gradiente di $g (x, y)$ si trovano dalle (5.10) scegliendo $λ = 0$ . _

Alcuni esempi

Esempio 174 Si voglia calcolare il punto su una curva piana, più vicino all’origine; ossia si voglia minimizzare sulla curva la funzione

g (x, y) = x^{2} + y^{2} .

Consideriamo il caso delle quattro curve seguenti:

la curva è implicitamente definita da $y^{2} - x + 1 = 0$
ed è rappresentata in figura 5.10.

figura 5.10:

E’ facile vedere geometricamente che il punto del sostegno più vicino all’origine è il punto $(1, 0)$ e questo è l’unico punto per cui esiste un $λ$ tale che
$\{\begin{matrix} y^{2} - x + 1 = 0 \\ - 1 + 2 λ x = 0 \\ y + λ y = 0 . \end{matrix}$
Il valore di $λ$ è $1 ∕ 2$ .
Se $F (x, y) = {(y^{2} - x + 1)}^{2}$ si ha il medesimo problema; ma ora il metodo dei moltiplicatori di Lagrange non è applicabile perchè le derivate parziali di $F (x, y)$ si annullano contemporaneamente. Tentando ugualmente di scrivere il sistema (5.10) si trova $\{\begin{matrix} {(y^{2} - x + 1)}^{2} = 0 \\ - (y^{2} - x + 1) + λ x = 0 \\ 2 (y^{2} - x + 1) + λ = 0 . \end{matrix}$
Questo sistema non dà informazioni perché scegliendo $λ = 0$ si vede che ogni $(x, y)$ per cui $y^{2} - x + 1 = 0$ risolve le tre equazioni.
Sia invece $F (x, y) = x^{2} + y^{2} - 1$ . Ovviamente, ogni punto della circonferenza minimizza la distanza. Però le due derivate parziali di $F (x, y)$ si annullano in $(0, 0)$ . Dato che $(0, 0)$ non appartiene alla curva, il metodo dei moltiplicatori di Lagrange può usarsi. Il sistema (5.10) è ora $\{\begin{matrix} x^{2} + y^{2} - 1 = 0 \\ 2 x + 2 λ x = 0 \\ 2 y + 2 λ y = 0 . \end{matrix}$
Ogni valore $(x, y)$ per cui $x^{2} + y^{2} = 1$ risolve questo sistema (con $λ = - 1$ ).
Sia $F (x, y) = 2 x^{2} + y^{2} - 1$ . Ancora, ambedue le derivate parziali di $F (x, y)$ si annullano in $(0, 0)$ , che però non appartiene alla curva. Dunque, il metodo dei moltiplicatori di Lagrange può usarsi. Il sistema (5.10) diviene: $\{\begin{matrix} 2 x^{2} + y^{2} - 1 = 0 \\ 2 x + λ x = 0 \\ y + λ y = 0 . \end{matrix}$
Le soluzioni sono ora
$\begin{matrix} x = 0 & y = \pm 1 & con λ = - 1 \\ y = 0 & x = \pm 1 ∕ \sqrt{2} & con λ = - 2 . \end{matrix}$
Dato che $f (x, y)$ è l’ellisse in figura 5.8, i punti $(\pm \sqrt{2}, 0)$ sono di minimo mentre $(0, \pm 1)$ sono di massimo. Il metodo dei moltiplicatori di Lagrange, essendo solo basato sullo studio delle derivata prima, non permette di distinguere un caso dall’altro. _

Infine, applichiamo il metodo dei moltiplicatori di Lagrange per il calcolo dei punti estremi di una funzione di una sola variabile.

Esempio 175 Sia $g_{0} (x)$ una funzione derivabile della sola variable $x \in ℝ$ . Introduciamo la funzione $g (x, y)$ di due variabili, costante rispetto ad $y$ , data da

g (x, y) = g_{0} (x) .

Calcolare i punti estremi di $g_{0} (x)$ è come calcolare i punti estremi della funzione $g (x, y)$ vincolati alla curva

F (x, y) = 0 ove F (x, y) = y .

Si noti che la funzione $F (x, y)$ è di classe $C^{1}$ ed ha gradiente non nullo:

\nabla F (x, y) = [\begin{matrix} 0 \\ 1 \end{matrix}] .

Quindi i punti estremi si possono calcolare mediante il metodo dei moltiplicatori di Lagrange, ossia risolvendo il sistema seguente nelle tre incognite $x$ , $y$ e $λ$ :

\{\begin{matrix} F (x, y) = 0 & o s s i a & y = 0 \\ \nabla g (x, y) = λ \nabla F (x, y) & o s s i a & \{\begin{matrix} g_{0}^{'} (x) = 0 \cdot λ \\ 0 = 1 \cdot λ \end{matrix} \end{matrix}

La prima riga impone di limitarsi a considerare punti dell’asse delle ascisse. Dall’ultima riga si vede che deve essere $λ = 0$ . La penultima impone di guardare i valori di $x$ per cui $g_{0}^{'} (x) = 0$ . Si ritrova quindi la condizione che la derivata prima deve annullarsi nei punti estremi. _

Dimostrazione analitica del Teorema di Lagrange

Vediamo ora una dimostrazione analitica del metodo dei moltiplicatori di Lagrange, che si presta a ulteriori generalizzazioni. Valgano le ipotesi del teorema e sia $(x_{0}, y_{0})$ un punto di estremo di $g (x, y)$ vincolato alla curva di livello

F (x, y) = c = F (x_{0}, y_{0}) .

Dato che la funzione $F (x, y)$ è di classe $C^{1}$ e che $\nabla F (x_{0}, y_{0}) \neq 0$ , l’equazione $F (x, y) = c$ definisce una curva piana, in un opportuno intorno di $(x_{0}, y_{0})$ che si può esprime localmente mediante l’equazione $y = y (x)$ oppure $x = x (y)$ . Per fissare le idee supponiamo che valga la rappresentazione $y = y (x)$ cosìche

F (x, y (x)) = c .

(5.11)

Il punto $(x_{0}, y_{0}) = (x_{0}, y (x_{0}))$ è un punto di minimo vincolato per la funzione $g (x, y)$ . Questo vuol dire che esiste un intorno $I$ di $x_{0}$ tale che se $x \in I$ allora vale

F (x, y (x)) = 0, g (x_{0}, y_{0}) \leq g (x, y (x)) .

Imponendo che sia nulla la derivata prima di $g (x, y (x))$ per $x = x_{0}$ si trova

0 = \frac{d g (x_{0}, y (x_{0}))}{d x} = g_{x} (x_{0}, y_{0}) + g_{y} (x_{0}, y_{0}) y^{'} (x_{0}) .

Si ha quindi

0 = g_{x} (x_{0}, y_{0}) + g_{y} (x_{0}, y_{0}) y^{'} (x_{0}) .

(5.12)

Dal Teorema della funzione implicita si sa che

y^{'} (x_{0}) = - \frac{F_{x} (x_{0}, y_{0})}{F_{y} (x_{0}, y_{0})} .

Sostituendo in (5.12) si trova

g_{x} (x_{0}, y_{0}) + \frac{- g_{y} (x_{0}, y_{0})}{F_{y} (x_{0}, y_{0})} F_{x} (x_{0}, y_{0}) = 0 .

Dunque, posto

λ = \frac{g_{y} (x_{0}, y_{0})}{F_{y} (x_{0}, y_{0})},

si vede che

g_{x} (x_{0}, y_{0}) = λ F_{x} (x_{0}, y_{0}) .

Anche le derivate rispetto ad $y$ verificano l’uguaglianza analoga,

g_{y} (x_{0}, y_{0}) = λ F_{y} (x_{0}, y_{0}),

col medesimo valore di $λ$ . Infatti,

g_{y} (x_{0}, y_{0}) - λ F_{y} (x_{0}, y_{0}) = g_{y} (x_{0}, y_{0}) + \frac{- g_{y} (x_{0}, y_{0})}{F_{y} (x_{0}, y_{0})} F_{y} (x_{0}, y_{0}) = 0 .

Ciò completa la dimostrazione.

5.5.2 Estremi vincolati ad una superficie

Siano $F (x, y, z)$ e $g (x, y, z)$ due funzioni di classe $C^{1}$ , definite in un intorno $U$ di $(x_{0}, y_{0}, z_{0})$ . Supponiamo che sia $F (x_{0}, y_{0}, z_{0}) = c$ . Si ricordi che $(x_{0}, y_{0}, z_{0})$ è punto di minimo di $g (x, y, z)$ , vincolato a $F (x, y, z) = c$ se

F (x, y, z) = c i m p l i c a g (x_{0}, y_{0}, z_{0}) \leq g (x, y, z) .

La definizione si estende facilmente ai punti di massimo vincolato. Vale:

Teorema 176 Sia $(x_{0}, y_{0}, z_{0})$ un punto di minimo o di massimo, vincolato a $F (x, y, z) = c$ . Supponiamo che il gradiente di $F (x, y, z)$ non si annulli in $(x_{0}, y_{0}, z_{0})$ . Allora esiste un numero $λ$ per cui

λ \nabla F (x_{0}, y_{0}, z_{0}) = \nabla g (x_{0}, y_{0}, z_{0}) .

(5.13)

Dim. Studiamo il caso del punto di minimo. Per fissare le idee, supponiamo che sia $F_{z} (x_{0}, y_{0}, z_{0}) \neq 0$ . Si espliciti $F (x, y, z)$ rispetto alla variabile $z$ . Il punto $(x_{0}, y_{0}, z_{0})$ è di minimo vincolato alla condizione $z - z (x, y) = 0$ , ossia, la funzione

g (x, y, z (x, y))

ha minimo libero in $(x_{0}, y_{0})$ . Dunque, ambedue le sue derivate parziali sono nulle:

\begin{aligned} \frac{\partial}{\partial x} g (x_{0}, y_{0}, z (x_{0}, y_{0})) = g_{x} (x_{0}, y_{0}, z (x_{0}, y_{0})) + g_{z} (x_{0}, y_{0}, z (x_{0}, y_{0})) z_{x} (x_{0}, y_{0}) = 0 \\ \frac{\partial}{\partial y} g (x_{0}, y_{0}, z (x_{0}, y_{0})) = g_{y} (x_{0}, y_{0}, z (x_{0}, y_{0})) + g_{z} (x_{0}, y_{0}, z (x_{0}, y_{0})) z_{y} (x_{0}, y_{0}) = 0 . \end{aligned}

Avendo supposto $F_{z} (x_{0}, y_{0}, z_{0}) \neq 0$ , si ha

z_{x} (x_{0}, y_{0}) = - \frac{F_{x} (x_{0}, y_{0})}{F_{z} (x_{0}, y_{0})}, z_{y} (x_{0}, y_{0}) = - \frac{F_{y} (x_{0}, y_{0})}{F_{z} (x_{0}, y_{0})}

ossia

\begin{aligned} g_{x} (x_{0}, y_{0}, z_{0}) + \frac{- g_{z} (x_{0}, y_{0}, z_{0})}{F_{z} (x_{0}, y_{0}, z_{0})} F_{x} (x_{0}, y_{0}, z_{0}) = 0 \\ g_{y} (x_{0}, y_{0}, z_{0}) + \frac{- g_{z} (x_{0}, y_{0}, z_{0})}{F_{z} (x_{0}, y_{0}, z_{0})} F_{y} (x_{0}, y_{0}, z_{0}) = 0 . \end{aligned}

Naturalmente vale anche

g_{z} (x_{0}, y_{0}, z_{0}) + \frac{- g_{z} (x_{0}, y_{0}, z_{0})}{F_{z} (x_{0}, y_{0}, z_{0})} F_{z} (x_{0}, y_{0}, z_{0}) = 0 .

Definendo

λ = - \frac{g_{z} (x_{0}, y_{0}, z_{0})}{F_{z} (x_{0}, y_{0}, z_{0})}

si trova che vale la (5.13). _

5.5.3 Estremi vincolati ad una curva dello spazio

Sia $F (\vec{r}) = F (x, y, z)$ una funzione di classe $C^{1}$ in una regione $Ω \subseteq ℝ^{3}$ e sia $γ$ una curva in $Ω$ . Vogliamo dare una condizione necessaria che deve valere se un punto ${\vec{r}}_{0}$ è punto di estremo di $F (\vec{r})$ vincolato alla curva $γ$ . Se la curva $γ$ è data in forma parametrica il probema si riduce immediatamente alla ricerca degli estremi di una funzione di una sola variabile. Quindi consideriamo il caso in cui $γ$ è data implicitamente, come intersezione di due superfici:

γ : g_{1} (x, y, z) = c, g_{2} (x, y, z) = d .

Sia ${\vec{r}}_{0} = (x_{0}, y_{0}, z_{0})$ un punto di $γ$ , che è massimo oppure minimo di $F (\vec{r})$ vincolato a $γ$ . Supponiamo che in ${\vec{r}}_{0}$ valga la condizione del teorema della funzione implicita. Privilegiando, per esempio, la variabile $x$ , supponiamo che si abbia

det (\begin{matrix} g_{1, y} (x_{0}, y_{0}, z_{0}) & g_{1, z} (x_{0}, y_{0}, z_{0}) \\ g_{2, y} (x_{0}, y_{0}, z_{0}) & g_{2, z} (x_{0}, y_{0}, z_{0}) \end{matrix}) \neq 0 .

(5.14)

Si ricordi che sotto questa condizione la curva $γ$ si rappresenta, in un intorno di $(x_{0}, y_{0}, z_{0}),$ in forma cartesiana, come

y = y (x), z = z (x)

y_{0} = y (x_{0}), z_{0} = z (x_{0}) .

Dunque, la funzione della sola variabile $x$

F (x, y (x), z (x))

ha un punto di estremo in $x_{0}$ e quindi la sua derivata prima è ivi nulla:

0 = F_{x} (x_{0}, y_{0}, z_{0}) + F_{y} (x_{0}, y_{0}, z_{0}) y^{'} (x_{0}) + F_{z} (x_{0}, y_{0}, z_{0}) z^{'} (x_{0}) .

Usando questa condizione, si potrebbe provare il teorema seguente:

Teorema 177 Sia ${\vec{r}}_{0} = (x_{0}, y_{0}, z_{0})$ punto di estremo della funzione $F (x, y, z)$ vincolato alla curva

γ : g_{1} (x, y, z) = c, g_{2} (x, y, z) = d .

Valga inoltre la condizione (5.14). In tal caso esistono due numeri $λ_{1}$ e $λ_{2}$ tali che il punto ${\vec{r}}_{0} = (x_{0}, y_{0}, z_{0})$ è punto estremale libero della funzione

F (x, y, z) + λ_{1} g_{1} (x, y, z) + λ_{2} g_{2} (x, y, z) .

Ossia, nel punto $(x_{0}, y_{0}, z_{0})$ valgono contemporaneamente le condizioni seguenti:

\begin{aligned} g_{1} (x_{0}, y_{0}, z_{0}) = c, \\ g_{2} (x_{0}, y_{0}, z_{0}) = d, \\ F_{x} (x_{0}, y_{0}, z_{0}) + λ_{1} g_{1, x} (x_{0}, y_{0}, z_{0}) + λ_{2} g_{2, x} (x_{0}, y_{0}, z_{0}) = 0, \\ F_{y} (x_{0}, y_{0}, z_{0}) + λ_{1} g_{1, y} (x_{0}, y_{0}, z_{0}) + λ_{2} g_{2, y} (x_{0}, y_{0}, z_{0}) = 0, \\ F_{z} (x_{0}, y_{0}, z_{0}) + λ_{1} g_{1, z} (x_{0}, y_{0}, z_{0}) + λ_{2} g_{2, z} (x_{0}, y_{0}, z_{0}) = 0 . \end{aligned}

La coppia $(λ_{1}, λ_{2})$ si chiama ancora moltiplicatore di Lagrange (vettoriale) ed i due numeri si chiamano moltiplicatori di Lagrange

5.5.4 Osservazione importante

Il metodo dei moltiplicatori di Lagrange dà condizioni necessarie che devono essere soddisfatte da un punto di estremo vincolato, senza necessità di esplicitare preventivamente l’equazione del vincolo. In ciascuno dei tre casi esaminati, le condizioni possono scriversi come segue: si introduce la funzione

L (\vec{r}) = F (\vec{r}) + λ \cdot g (\vec{r}) .

Nei primi due casi esaminati, $λ$ è un numero e $g (\vec{r})$ è una funzione a valori reali; nell’ultimo caso $λ$ è un vettore a due dimensioni, $g (r) = [\begin{matrix} g_{1} (\vec{r}) & g_{2} (\vec{r}) \end{matrix}]$ e il punto indica il prodotto scalare. In tutti i casi la ricerca del minimo o massimo vincolato di $F (\vec{r})$ si riconduce alla ricerca dei punti estremali di $L (\vec{r})$ . L’osservazione importante è questa: in generale gli estremi vincolati di $F (\vec{r})$ sono solamente punti estremali di $L (\vec{r})$ . Non sono nè punti di massimo n’e punti di minimo di $L (\vec{r})$ . La funzione $L (\vec{r})$ sopra introdotta si chiama lagrangiana del problema (di minimo, oppure di massimo).

5.6 Appendice: la dimostrazione del teorema 165

La dimostrazione come conseguenza del Teorema della funzione implicita. Come si è detto, consideriamo il caso $n = 2$ . Scriviamo in componenti la relazione

\vec{x} = (x, y) = \vec{F} (\vec{r}) = [\begin{matrix} ϕ (u, v) \\ ψ (u, v) \end{matrix}], \vec{r} = (u, v) \in Ω^{'} .

Ossia scriviamo quest’uguaglianza come

x = ϕ (u, v), y = ψ (u, v) .

(5.15)

Vogliamo considerare questa come un sistema di equazioni nelle incognite $(u, v)$ . Per ipotesi si sa che

ϕ (u_{0}, v_{0}) = x_{0}, ψ (u_{0}, v_{0}) = y_{0} .

Si sa inoltre che $ϕ (x, y)$ e $ψ (x, y)$ sono di classe $C^{1}$ e che

J_{\vec{F}} ({\vec{r}}_{0}) = ϕ_{u} (u_{0}, v_{0}) ψ_{v} (u_{0}, v_{0}) - ϕ_{v} (u_{0}, v_{0}) ψ_{u} (u_{0}, v_{0}) \neq 0 .

(5.16)

Consideriamo la prima equazione in (5.15), che scriviamo come

0 = f (u, v, x) = ϕ (u, v) - x .

(5.17)

La (5.16) mostra che $f_{u} (u_{0}, v_{0}, x_{0}) = ϕ_{u} (u_{0}, v_{0}) \neq 0$ oppure $f_{v} (u_{0}, v_{0}, x_{0}) = ϕ_{v} (u_{0}, v_{0}) \neq 0$ . Sia per esempio

ϕ_{u} (u_{0}, v_{0}) = f_{u} (u_{0}, v_{0}, x_{0}) \neq 0 .

In tal caso si può risolvere l’equazione (5.17) rispetto alla variabile $u$ ottenendo, in un opportuno aperto $W$ contenente $(u_{0}, v_{0}, x_{0})$ ,

\begin{aligned} u = U (v, x), U (v_{0}, x_{0}) = u_{0}, ϕ (U (v, x), v) = x, \\ U_{v} (v_{0}, x_{0}) = - \frac{f_{v} (u_{0}, v_{0}, x_{0})}{f_{u} (u_{0}, v_{0}, x_{0}} = - \frac{ϕ_{v} (u_{0}, v_{0})}{ϕ_{u} (u_{0}, v_{0})} . \end{aligned}

Quando $(u, v, x) \in W$ allora si ha $(v, x) \in H$ , aperto contenente $(v_{0}, x_{0})$ ed $u$ appartiene ad un intorno di $u_{0}$ . Consideriamo ora l’equazione seguente, nell’aperto $H \times ℝ$ :

0 = g (v, x, y) = ψ (U (v, x), v) - y .

Quest’uguaglianza è soddisfatta nel punto $(v_{0}, x_{0}, y_{0})$ . Mostreremo in seguito che $g_{v} (v_{0}, x_{0}, y_{0}) \neq 0$ . Accettando ciò, il teorema della funzione implicita mostra che l’equazione si può risolvere rispetto a $v$ , ottenendo una funzione $V (x, y)$ di classe $C^{1}$

v = V (x, y) .

Questa uguaglianza vale per $(v, x, y)$ in un opportuno aperto $K$ contenente $(v_{0}, x_{0}, y_{0})$ e la funzione $V (x, y)$ è di classe $C^{1}$ . Sostituendo $v = V (x, y)$ nell’uguaglianza $u = U (v, x)$ (si veda la (5.18)) si ottiene la soluzione del sistema (5.15)

u = U (V (x, y), x), v = V (x, y)

e, ricordiamo, le funzioni $U (x, y)$ e $V (x, y)$ sono di classe $C^{1}$ . Vediamo ora quali restrizioni sono state imposte ai punti $(u, v)$ ed $(x, y)$ . Questi sono rappresentati dalle condizioni

(u, v, x) \in W, (v, x, y) \in H \times ℝ, (v, x, y) \in K .

Si identifica così un aperto di $ℝ^{4}$ , contenente il punto $(u_{0}, v_{0}, x_{0}, y_{0})$ . L’aperto $A$ detto nel teorema è la proiezione di quest’aperto sul piano $(u, v)$ mentre l’aperto $B$ è la proiezione sul piano $(x, y)$ . Per completare la dimostrazione, proviamo che $g_{v} (v_{0}, x_{0}, y_{0}) \neq 0$ . Usando l’espressione di $U_{v} (v_{0}, x_{0})$ in (5.18) si trova

\begin{aligned} g_{v} (v_{0}, x_{0}, y_{0}) = ψ_{u} (U (v_{0}, x_{0}), v_{0}) U_{v} (v_{0}, x_{0}) + ψ_{v} (U (v_{0}, x_{0}), v_{0}) \\ ψ_{u} (u_{0}, v_{0}) [- \frac{ϕ_{v} (u_{0}, v_{0})}{ϕ_{u} (u_{0}, v_{0})}] + ψ_{v} (u_{0}, v_{0}) \\ = \frac{1}{ϕ_{u} (u_{0}, v_{0})} [ϕ_{u} (u_{0}, v_{0}) ψ_{v} (u_{0}, v_{0}) - ϕ_{v} (u_{0}, v_{0}) ψ_{u} (u_{0}, v_{0})] \\ = \frac{1}{ϕ_{u} (u_{0}, v_{0})} J_{\vec{F}} ({\vec{r}}_{0}) \neq 0 . \end{aligned}

Capitolo 6
Curve e superfici

Le curve e le superfici in forma implicita sono già state incontrate. In questo capitolo studiamo le proprietà delle curve e delle superfici definite parametricamente. Saremo precisi nella definizione di curva mentre le “superfici” verranno definite in modo meno formale e preciso.

6.1 Curve parametriche

Conviene procedere per gradi nella definizione di curva. Una prima definizione, che verrà resa più precisa in seguito, è la seguente: Una trasformazione continua da un intervallo $I$ in $ℝ^{n}$ si chiama curva parametrica. Nella definizione di curva l’intervallo può essere chiuso o meno, limitato o meno. Se però l’intervallo è chiuso e limitato la curva si chiama un arco. Una curva a valori in $ℝ^{3}$ si rappresenta in coordinate cartesiane nella forma

\vec{r} (t) = x (t) \vec{i} + y (t) \vec{j} + z (t) \vec{k} t \in I .

La curva si dice piana quando la sua immagine appartiene ad un piano di $ℝ^{3}$ , ossia quando esistono numeri $a$ , $b$ , $c$ , $d$ , indipendenti da $t$ , tali che per ogni valore di $t$ valga

a x (t) + b y (t) + c z (t) = d .

Quando la curva è piana ed appartiene al piano $z = 0$ essa si rappresenta semplicemente come

\vec{r} (t) = x (t) \vec{i} + y (t) \vec{j} .

Notazione analoga quando la curva appartiene agli altri piani coordinati. Una curva si indica con una lettera greca minuscola:

γ : t \to \vec{r} (t) t \in I .

In seguito noi ci limiteremo a considerare curve che hanno le seguenti proprietà di regolarità: la funzione $t \to \vec{r} (t)$ è derivabile su $(a, b)$ con l’eccezione di un numero finito di punti $t_{i}$ . Si richiede che in questi punti (ed anche in $a$ e in $b$ se l’intervallo è limitato) esistano i limiti direzionali di ${\vec{r}}^{'} (t)$ . Inoltre si richiede che per $t \neq t_{i}$ si abbia ${\vec{r}}^{'} (t) \neq 0$ . Una curva con tali proprietà si chiama regolare a tratti e si parla di curva regolare quando essa è ovunque derivabile, con ${\vec{r}}^{'} (t) \neq 0$ per ogni $t$ . Sia $γ$ una curva regolare e sia ${\vec{r}}_{0} = \vec{r} (t_{0})$ un punto della sua immagine. Una almeno delle componenti di $\vec{r} (t)$ , per esempio la prima componente $x (t)$ , è invertibile in un intorno di $t_{0}$ . Dunque l’immagine della restrizione di $\vec{r} (t)$ a tale intorno è anche immagine di una funzione di $x$ . Si osservi che questo non implica che l’immagine di $\vec{r} (t)$ debba essere grafico di funzione, perch’e niente possiamo dire nei punti di $t$ “lontani” da $t_{0}$ . Questo è illustrato dalla figura 6.1, a sinistra, che riporta l’immagine, diciamo $γ$ , della funzione

(sin t) \vec{i} + t (π^{2} - t^{2}) \vec{j}, t \in [- π, π] .

(6.1)

Si vede che quest’immagine non è grafico di funzione in nessun intorno di $(0, 0)$ nonostante che la funzione $x = sin t$ sia invertibile. La sua inversa è

t = a r c sin x

(6.2)

e quindi la relazione tra $x$ ed $y$ è la funzione

y = [a r c sin x] \{π^{2} - {[a r c sin x]}^{2}\} .

Il suo grafico è la parte spessa dell’immagine. Non esaurisce tutta la $γ$ perché i valori di $t$ ottenuti da (6.2) sono solamente quelli dell’intervallo $[- π ∕ 2, π ∕ 2]$ . E’ appena il caso di notare che una curva, oltre che in coordinate cartesiane, può rappresentarsi, per esempio, in coordinate polari.

Esempio 178 La curva

x = t cos t, y = t sin t, t > 0

(6.3)

rappresenta una spirale, si veda la figura 6.1 a destra. Essa può anche rappresentarsi in coordinate polari, come

𝜃 = t, ρ = t, t > 0 .

figura 6.1: Le curve (6.1) e (6.3)

Consideriamo una curva piana. Questa si chiama curva cartesiana se è rappresentata mediante una parametrizzazione della forma

t \to t \vec{i} + y (t) \vec{j}

oppure

t \to x (t) \vec{i} + t \vec{j} .

Più in generale, se $t \to \vec{r} (t)$ è una curva in $ℝ^{n}$ , si dice che questa è una curva cartesiana quando una delle componenti della funzione $\vec{r} (t)$ ha la rappresentazione $x_{i} (t) = t$ . Un arco si dice chiuso quando una sua parametrizzazione $\vec{r} (t)$ , $t \in [a, b]$ verifica $\vec{r} (a) = \vec{r} (b)$ . Una curva, oppure un arco, si dice semplice quando $\vec{r} (t^{'}) = \vec{r} (t^{″})$ vale solamente per $t^{'} = t^{″}$ oppure se $t^{'} = a$ , $t^{″} = b$ . L’interpretrazione fisica del concetto di curva parametrica è suggerita dai problemi della meccanica: il parametro $t$ rappresenta il tempo ed il punto $\vec{r} (t)$ rappresenta la posizione all’istante $t$ di un punto massa mobile nel tempo. Quest’interpretazione spiega la condizione di continuità posta nella definizione di curva (un punto massa non fa salti). La funzione $t \to \vec{r} (t)$ si chiama in fisica la legge del moto e il vettore ${\vec{r}}^{'} (t)$ rappresenta la velocità del punto all’istante $t$ . Si noti che la velocità può essere discontinua, per esempio quando si verificano urti. Introduciamo ora il “verso di percorrenza” su una curva parametrica semplice: Il parametro $t$ di una curva appartiene ad un intervallo $(a, b)$ di $ℝ$ e $ℝ$ è un insieme ordinato. Dunque possiamo introdurre un ordine su una curva semplice $γ$ di parametrizzazione $\vec{r} (t)$ dicendo che il punto $\vec{r} (t^{'})$ viene prima del punto $\vec{r} (t^{″})$ quando $t^{'} < t^{″}$ ; ossia quando un punto mobile sulla curva traversa prima $\vec{r} (t^{'})$ e poi $\vec{r} (t^{″})$ . Si dice anche che, in tal caso, il punto $\vec{r} (t^{'})$ precede $\vec{r} (t^{″})$ . Nel caso che la curva sia semplice e chiusa, il punto $\vec{r} (a)$ coincide col punto $\vec{r} (b)$ e quindi sfugge alla definizione data di ordine.

Osservazione 179 La definizione di curva parametrica è una definizione soddisfacente per alcune applicazioni della fisica, ma non per tutte, ed è del tutto insoddisfacente per la geometria. Infatti, privilegia un modo di misurare il trascorrere del tempo. Ora, due orologi diversi possono segnare ore diverse perché sono stati azzerati in istanti diversi e anche perché uno va più velocemente dell’altro. Quindi il medesimo moto viene ad avere rappresentazioni diverse, a seconda dell’orologio che si usa per descriverlo. Dobbiamo quindi migliorare la definizione di curva, tenendo conto di ciò. Osservare una proprietà cruciale del tempo: il tempo non si ferma e va in una sola direzione. Questo vuol dire che se indico con $τ$ il tempo segnato da un orologio, al medesimo istante un secondo orologio segnerà un diverso numero, diciamo $t$ . La corrispondenza che a $τ$ fa corrispondere $t$ è continua (perché il tempo non fa salti) e monotona strettamente crescente (perché il tempo non si ferma e va in una sola direzione). Quest’osservazione è la chiave per capire la definizione generale di curva che daremo al prossimo paragrafo. _

6.1.1 I cambiamenti di parametro e la definizione di curva

Vogliamo ora completare la definizione di curva, tenendo conto delle ragioni esposte nell’osservazione 179. Si dice che si cambia parametrizzazione della curva $γ$ quando si opera la sostituzione $t = t (τ)$ purché la funzione $τ \to t (τ)$ sia continua e strettamente crescente da un intervallo $J$ sull’intervallo $I$ . In pratica noi assumeremo anche che questa trasformazione sia derivabile (e quindi che sia $t^{'} (τ) \geq 0$ ). Talvolta basterà supporre che la trasformazione sia derivabile a tratti. Rendendo più precisa la definizione di curva, si dice che $\vec{r} (t)$ , $t \in I$ e $\tilde{\vec{r}} (τ)$ , $τ \in J$ sono due diverse parametrizzazioni della stessa curva quando $\tilde{\vec{r}} (τ) = \vec{r} (t (τ))$ con la funzione $τ \to t (τ)$ strettamente crescente e suriettiva.¹ Questa definizione corrisponde al concetto fisicamente intuitivo che una stessa “curva” può descriversi con leggi orarie diverse. Sia ora

γ : t \to \vec{r} (t), t \in (a, b)

e si consideri la trasformazione

t \to b + a - t, t \in (a, b) .

Questa trasformazione è monotona decrescente e quindi la curva di parametrizzazione

t \to \vec{r} (b - a - t), t \in (a, b)

è diversa dalla $γ$ . Intuitivamente, la seconda curva si ottiene “percorrendo la $γ$ all’indietro”. Quando si effettua questa trasformazione sul parametro della curva, si dice che “si è cambiato il verso di percorrenza della curva” e la curva cosìottenuta a partire dalla $γ$ si indica col simbolo

- γ .

(6.4)

Ora, alcune proprietà che dovremo studiare cambieranno al cambiare della parametrizzazione, ossia della legge del moto. Altre non dipenderanno dalla parametrizzazione. Le considereremo proprietà “geometriche” della curva. Vediamo alcuni casi:

Teorema 180 Parametrizzazioni diverse della medesima curva hanno la stessa immagine.

L’immagine comune a tutte le parametrizzazioni di una curva $γ$ si chiama il sostegno di $γ$ . Dunque il sostegno è una proprietà geometrica della curva. Lo stesso dicasi della proprietà di essere curva chiusa o curva semplice:

Teorema 181 Siano $I$ e $J$ due intervalli e siano $\vec{r} (t)$ , $t \in I$ , $\tilde{\vec{r}} (τ)$ due curve parametriche. Sia $t (τ)$ una trasformazione strettamente monotona da $J$ in $I$ , suriettiva, tale che

\tilde{\vec{r}} (τ) = \vec{r} (t (τ)) .

Allora, la curva parametrica $\vec{r} (t)$ è chiusa se e solo se la curva parametrica $\tilde{\vec{r}} (τ)$ lo è; $\vec{r} (t)$ è semplice se e solo se $\tilde{\vec{r}} (τ)$ lo è.

Ossia, le proprietà di essere chiusa, o di essere semplice, non dipendono dalla particolare rappresentazione parametrica di una curva ma solo dalla curva stessa: sono quindi proprietà geometriche della curva. E’ importante notare che le proprietà appena dette non cambiano nemmeno cambiando il senso di percorrenza della curva. Ossia:

La curva

γ

e la curva

- γ

hanno il medesimo sostegno. L’una è

semplice
chiusa
semplice e chiusa

se e solo se l’altra lo è.

Inoltre,

Teorema 182 l’ordine sulla curva non muta cambiando parametrizzazione.

E’ proprio per ottenere ciò che si è imposto che i cambiamenti di parametro debbano essere strettamente crescenti. L’ordine su $- γ$ è invece l’opposto di quello su $γ$ . Quando la trasformazione $t (τ)$ da un intervallo $J$ su un intervallo $I$ è continua e strettamente monotona (crescente o meno) allora $I$ è sia limitato che chiuso se e solo se $J$ lo è. Dunque diremo che una curva è un arco quando una sua parametrizzazione è definita su un intervallo limitato e chiuso: la proprietà di essere un arco è una proprietà geometrica della curva e non cambia cambiando verso di percorrenza sulla curva, ossia essa è comune sia a $γ$ che a $- γ$ . invece, dipendono dalla parametrizzazione sia la velocità ${\vec{r}}^{'} (t)$ che la proprietà di essere una curva cartesiana. Si consideri ora l’esempio seguente:

Esempio 183 le due curve

t \to (cos t) \vec{i} + (sin t) \vec{j}, t \in (0, 2 π] e t \to (cos t) \vec{i} + (sin t) \vec{j}, t \in (0, 4 π)

hanno il medesimo sostegno (la circonferenza $x^{2} + y^{2} = 1$ ). Le due parametrizzazioni però non possono ricondursi l’una all’altra mediante un cambiamento di parametro (che deve essere strettamente crescente) perché la prima curva è semplice e l’altra non lo è. _

Gli archi semplici² hanno molte proprietà importanti. Tra queste:

Teorema 184 Sia

γ : t \to \vec{r} (t), t \in (a, b)

un arco semplice (chiuso o meno). Esiste soltanto un diverso arco che ha il medesimo sostegno, e questo è l’arco $- γ$ .

Grazie a questo risultato, trattando di archi semplici, possiamo usare un linguaggio più informale: se si sa che un insieme $S$ è sostegno di un’arco semplice, possiamo parlare di “arco $S$ ” intendendo uno dei due archi che hanno $S$ per sostegno. In generale si intende anche di aver fissato un verso di percorrenza su $S$ , e in tal caso si sceglie quello dei due archi che corrisponde a tale verso. Per esempio, sia

S = {(x, y, z) | x^{2} + y^{2} + z^{2} = 1, x + y + z = 0} .

L’insieme $S$ è una circonferenza nello spazio. Possiamo parlare dell’“arco $S$ ” intendendo implicitamente di considerare $S$ come sostegno di un arco semplice e di scegliere una qualsiasi delle parametrizzazioni che corrispondono a tale arco. Se si stabilisce un verso di percorrenza su $S$ , si viene a scegliere uno solo dei due archi che hanno $S$ per sostegno. Si noti però che in generale non esiste un modo unico per la scelta del verso di percorrenza e quindi questo linguaggio informale non identifica univocamente l’arco. Vedremo che questa diffcoltà si risolve nel caso delle curve semplici e chiuse.

6.1.2 Lunghezza di un arco

Studiamo il problema di definire un numero che rappresenti la “lunghezza” di un arco in $ℝ^{n}$ . Consideriamo per questo un arco (che indichiamo col simbolo $γ$ ) di parametrizzazione $t \to \vec{r} (t)$ , $t \in [a, b]$ . Si sa che la tangente al grafico della funzione $t \to \vec{r} (t)$ nel punto $(t_{0}, \vec{r} (t_{0}))$ ha equazione

\vec{r} = \vec{r} (t_{0}) + {\vec{r}}^{'} (t_{0}) (t - t_{0}) .

Dividiamo l’intervallo $[a, b]$ mediante i punti $t_{n}$ , equidistanti, $t_{0} = a$ ,…, $t_{N} = b$ e approssimiamo l’arco con tanti segmenti di tangente, si veda la figura 6.2: l’arco $\vec{r} (t)$ , $t \in [t_{i}, t_{i + 1}]$ si approssima mediante il segmento di tangente

\vec{r} (t_{0}) + {\vec{r}}^{'} (t_{0}) (t - t_{0}), t \in [t_{i}, t_{i + 1}] .

figura 6.2: La definizione di lunghezza: una curva e i suoi vettori approssimanti

Sommiamo le lunghezze dei singoli segmenti di tangente. Ripetendo questo procedimento per ogni $N$ si costruisce una successione di numeri $(L_{N})$ . Se esiste $L = lim L_{N}$ , si sceglie questo numero $L$ come “lunghezza” dell’arco $γ$ . Più precisamente, supponiamo che la funzione $\vec{r} (t)$ sia di classe $C^{1}$ e supponiamo che essa ammetta le derivate direzionali finite in ambedue gli estremi $a$ e $b$ . Per definire la lunghezza del’arco, si divide l’intervallo $[a, b]$ in $N$ parti uguali mediante i punti $\frac{k T}{N}$ , $0 \leq k < N$ e $T = b - a$ . Il segmento di tangente al grafico nel punto $(\frac{k T}{N}, \vec{r} (\frac{k T}{N}))$ ottenuto per $t \in (\frac{k T}{N}, \frac{(k + 1) T}{N})$ ha lunghezza

||{\vec{r}}^{'} (\frac{k T}{N})|| \cdot \frac{T}{N} .

La lunghezza totale dei segmenti di tangente è il numero

L_{N} = \sum_{k = 0}^{N - 1} ||{\vec{r}}^{'} (\frac{k T}{N})|| \cdot \frac{T}{N} .

Se esiste, il numero $L = lim L_{N}$ è l’integrale della funzione $||{\vec{r}}^{'} (t)||$ sull’intervallo $[a, b]$ . Dunque, definiamo la lunghezza dell’arco ponendo

L_{γ} = \int_{a}^{b} ||{\vec{r}}^{'} (t)|| d t .

(6.5)

Osservazione 185 Al numero $L$ siamo giunti scegliendo di dividere l’intervallo $[a, b]$ in parti uguali. Non è diffcile mostrare che allo stesso numero $L$ si perviene considerando una qualsiasi partizione di $[a, b]$ , la cui finezza tende a zero. Ci si può chiedere però a quale numero si giunge se, invece di “approssimare” il grafico con segmenti di tangente, si sceglie di approssimarlo con segmenti di secante. E’ possibile provare che si giunge al medesimo numero $L$ , dato da (6.5). _

Teorema 186 La lunghezza di un arco non muta cambiando parametrizzazione.

Dim. Sia $t = t (τ)$ una trasformazione crescente da $[α, β]$ su $[a, b]$ . Sia inoltre essa ovunque derivabile cosìche $t^{'} (τ) \geq 0$ . Sia $\tilde{\vec{r}} (τ) = \vec{r} (t (τ))$ . La regola di cambiamento di variabile mostra che

\begin{aligned} L & = & \int_{a}^{b} ||\frac{d}{d t} \vec{r} (t)|| d t = \int_{α}^{β} ||\frac{d}{d t} \vec{r} (t (τ))|| t^{'} (τ) d τ \\ = \int_{α}^{β} ||\frac{d}{d t} \vec{r} (t (τ)) t^{'} (τ)|| d τ = \int_{α}^{β} ||\frac{d}{d τ} \tilde{\vec{r}} (τ)|| d τ . \end{aligned}

Dunque, il numero che esprime la lunghezza di un arco è una proprietà geometrica dell‘arco. Vale inoltre:

Teorema 187 La lunghezza di un arco non muta cambiando il verso di percorrenza sulla curva. Ossia:

L_{γ} = L_{- γ} .

Dim. Infatti, se $t^{'} (τ) < 0$ allora

\int_{a}^{b} ||\frac{d}{d t} \vec{r} (t)|| d t = \int_{β}^{α} ||\frac{d}{d t} \vec{r} (t (τ))|| t^{'} (τ) d τ = \int_{α}^{β} ||\frac{d}{d t} \vec{r} (t (τ))|| (- t^{'} (τ)) d τ

e $- t^{'} (τ) = | t^{'} (τ) |$ . Dunque anche in questo caso vale

L = \int_{α}^{β} ||\frac{d}{d t} \vec{r} (t (τ)) t^{'} (τ)|| d τ = \int_{α}^{β} ||\frac{d}{d τ} \tilde{\vec{r}} (τ)|| d τ .

Osservazione 188

Un’interpretazione della formula (6.5) è la seguente: la parametrizzazione $t \to \vec{r} (t)$ si intende come legge del moto di un punto che percorre la curva. Allora, ${\vec{r}}^{'} (t)$ è il vettore velocità del punto mobile all’istante $t$ . La (6.5) si interpreta dicendo che l’integrale del modulo della velocità dà la lunghezza del cammino percorso.
Sia $γ$ una curva cartesiana, ossia $γ : \vec{r} (t) = t \vec{i} + f (t) \vec{j} .$
In questo caso,
${\vec{r}}^{'} (t) = \vec{i} + f^{'} (t) \vec{j}, | \vec{r} (t) | = \sqrt{1 + {[f^{'} (t)]}^{2}} .$ (6.6)

La lunghezza dell’arco ottenuto quando $t \in [a, b]$ è quindi data da
$L_{γ} = \int_{a}^{b} \sqrt{1 + {[f^{'} (t)]}^{2}} d t .$

Definiamo ora la funzione $s (t)$

s (t) = \int_{a}^{t} ||{\vec{r}}^{'} (ν)|| d ν t \in [a, b] .

Se l’arco $γ$ è regolare, $s^{'} (t) > 0$ per ogni $t$ . Ossia la trasformazione $t \to s (t)$ da $[a, b]$ su $[0, L]$ è un cambiamento di parametro per l’arco $γ$ . Il numero $s \in [0, L]$ si chiama per questo il parametro d’arco. Se come parametro di $γ$ si sceglie $s$ si trova una nuova parametrizzazione dell’arco $γ$ , che indichiamo con $\vec{r} (s)$ e che si chiama la parametrizzazione canonica dell’arco. La sua proprietà importante è che

|\frac{d}{d s} \vec{r} (s)| = 1 .

Infatti, essendo $s (ν)$ la funzione inversa di $ν (s)$ , si ha:

\begin{aligned} \frac{d}{d s} \vec{r} (s) = \frac{d}{d s} \vec{r} (ν (s)) = [\frac{d}{d ν} \vec{r} (ν (s))] ν^{'} (s) \\ = [\frac{d}{d ν} \vec{r} (ν (s))] \frac{1}{s^{'} (ν (s))} = [\frac{d}{d ν} \vec{r} (ν (s))] \frac{1}{| (d ∕ d ν) \vec{r} (ν (s)) |} . \end{aligned}

Dunque, quando la curva è data mediante la sua parametrizzazione canonica, la formula per la lunghezza si riduce a:

L = \int_{0}^{L} 1 d s .

Il parametro d’arco si presta allo studio delle proprietà geometriche delle curve. Però la parametrizzazione mediante il parametro d’arco è spesso piuttosto complicata e spesso non si presta a fare calcoli concreti. Concludiamo dicendo che in fisica la funzione $s = s (t)$ si chiama legge oraria del moto.

6.1.3 Proprietà differenziali delle curve piane e dello spazio

Studiamo prima di tutto il caso delle curve piane. Supponiamo che l’arco $γ$ sia parametrizzata dalla sua lunghezza,

γ : s \to \vec{r} (s), s \in [0, L]

e supponiamo che sia regolare a tratti; ossia che la funzione $s \to \vec{r} (s)$ sia ovunque continua; inoltre supponiamo che essa sia derivabile, con $| {\vec{r}}^{'} (s) | \neq 0$ su $[0, L]$ , con la possibile eccezione di un numero finito di valori $s_{1}$ ,…, $s_{k}$ di $s$ . In tali punti richiediamo che esistano finiti³ i limiti direzionali i limiti direzionali di ${\vec{r}}^{'} (s)$ . Il versore

\vec{t} (s) = \frac{d}{d s} \vec{r} (s)

applicato nel punto $\vec{r} (s)$ si chiama il versore tangente alla curva nel punto $\vec{r} (s)$ . Il versore tangente è definito salvo che in un numero finito di valori di $s$ . Per ogni $s$ nel quale $\vec{t} (s)$ è definito, introduciamo il versore $\vec{n} (s)$ ortogonale a $\vec{t} (s)$ e diretto in modo tale che la coppia $(\vec{t} (s), \vec{n} (s))$ sia orientata positivamente (ossia, possa sovrapporsi ordinatamente ai versori $\vec{i}$ e $\vec{j}$ degli assi coordinati mediante una rotazione e una traslazione di assi). Il versore $\vec{n} (s)$ si chiama il versore normale alla curva $γ$ . Vale:

Teorema 189 Sia $γ$ una curva regolare, la cui parametrizzazione è di classe $C^{2}$ . Allora il vettore $\vec{n} (s)$ è derivabile e in ogni punto è colineare col vettore ${\vec{t}}^{'} (s)$ .

Dim. Infatti, $| | \vec{t} (s) | | = 1$ per tutti gli $s$ e quindi $\vec{t} (s) \cdot {\vec{t}}^{'} (s) = 0$ per ogni $s$ . Dunque, $\vec{n} (s) = \pm \frac{{\vec{t}}^{'} (s)}{| | {\vec{t}}^{'} (s) | |}$ . Ciò mostra che per ogni valore di $s$ i due vettori $\vec{t} (s)$ ed $\vec{n} (s)$ sono colineari. fissiamo ora un valore $s_{0}$ in cui $\vec{r} (s)$ ammette derivata continua e supponiamo⁴ che sia $\vec{n} (s_{0}) = + \frac{{\vec{t}}^{'} (s_{0})}{| | {\vec{t}}^{'} (s_{0}) | |}$ . Ciò vuol dire che

det [\begin{matrix} \vec{t} (s_{0}) & + \frac{{\vec{t}}^{'} (s_{0})}{| | {\vec{t}}^{'} (s_{0}) | |} \end{matrix}] > 0 .

Per continuità, la disuguaglianza si conserva in un intorno di $s_{0}$ e ciò mostra che in un intorno di $s_{0}$ vale

\vec{n} (s) = + \frac{{\vec{t}}^{'} (s)}{| | {\vec{t}}^{'} (s) | |} .

Il denominatore non si annulla e quindi $\vec{n} (s)$ è derivabile. _

Osservazione 190 Si ricordi che la derivata del versore $\vec{t} (s)$ è il limite del rapporto incrementale

\frac{\vec{t} (s + h) - \vec{t} (s)}{h},

applicato in $\vec{r} (s)$ . _

Supponiamo ora di lavorare con parametrizzazioni di classe $C^{2}$ di curve regolari, e studiamo ${\vec{t}}^{'} (s)$ . Si è visto nella dimostrazione del Teorema 189, che ${\vec{t}}^{'} (s)$ è parallelo al versore $\vec{n} (s)$ . Esiste quindi un numero $k (s)$ tale che

{\vec{t}}^{'} (s) = k (s) \vec{n} (s) .

(6.7)

Il numero $k (s)$ , che può essere positivo o negativo, si chiama la curvatura di $γ$ nel punto $\vec{r} (s)$ . Prendendo la norma dei vettori ai due membri di (6.7) si trova

| k (s) | = | | {\vec{t}}^{'} (s) | | .

L’esempio seguente mostra che la curvatura può cambiare segno da punto a punto di una medesima curva; e mostra anche che per calcolare tangenti, normali e curvatura non è necessario parametrizzare preventivamente la curva col parametro d’arco.

Esempio 191 Sia $\vec{r} (x) = (x, f (x))$ cosìche

\frac{d s (x)}{d x} = \sqrt{1 + {f^{'}}^{2} (x)} .

Dalla formula per la derivata della funzione inversa

\vec{t} (s) = \frac{d \vec{r} (s)}{d s} = \frac{\vec{} d r (x (s))}{d x} x^{'} (s) = \frac{1}{\sqrt{1 + {f^{'}}^{2} (s)}} \frac{d}{d x} \{\frac{1}{\sqrt{1 + {f^{'}}^{2} (x)}} (1, f^{'} (x))\} .

Dunque,

\begin{aligned} \frac{d \vec{t} (x)}{d s} = \frac{1}{\sqrt{1 + {f^{'}}^{2} (x)}} \frac{d}{d x} [\frac{(1, f^{'} (x))}{\sqrt{1 + {f^{'}}^{2} (x)}}] \\ \frac{1}{\sqrt{1 + {f^{'}}^{2} (x)}} \frac{1}{1 + {f^{'}}^{2} (x)} [(0, f^{″} (x)) \sqrt{1 + {f^{'}}^{2} (x)} - (1, f^{'} (x)) \frac{f^{'} (x) f^{″} (x)}{\sqrt{1 + {f^{'}}^{2} (x)}}] \\ = \frac{f^{″} (x)}{{(1 + {f^{'}}^{2} (x))}^{2}} (- f^{'} (x), 1) = k (x) \frac{1}{\sqrt{1 + {f^{'}}^{2} (x)}} (- f^{'} (x), 1) . \end{aligned}

Si trova da qui

k (x) = \frac{f^{″} (x)}{{(1 + {f^{'}}^{2} (x))}^{3 ∕ 2}} .

La curvatura ha quindi il segno di $f^{″} (x)$ . Si confronti con la definizione di curvatura data al par. 6.3 del testo di Analisi Matematica 1. _

Osserviamo ora che $\vec{t} (s) \cdot \vec{n} (s) = 0$ e quindi, derivando,

0 = {\vec{t}}^{'} (s) \cdot \vec{n} (s) + \vec{t} (s) \cdot {\vec{n}}^{'} (s) = k (s) \vec{n} (s) \cdot \vec{n} (s) + \vec{t} (s) \cdot {\vec{n}}^{'} (s) = k (s) + \vec{t} (s) \cdot {\vec{n}}^{'} (s) .

(6.8)

D’altra parte, ${\vec{n}}^{'} (s)$ è ortogonale ad $\vec{n} (s)$ (perch’e $| | \vec{n} (s) | | = 1$ ) e quindi

{\vec{n}}^{'} (s) = α (s) \vec{t} (s) .

Sostituendo nella (6.8) si vede che $α (s) = - k (s)$ . Ne viene che le due funzioni $\vec{t} (s)$ ed $\vec{n} (s)$ risolvono il sistema di equazioni differenziali

{\vec{t}}^{'} (s) = k (s) \vec{n} (s), {\vec{n}}^{'} (s) = - k (s) \vec{t} (s) .

(6.9)

Queste equazioni si chiamano Equazioni di Frenet per le curve piane. Il sistema di riferimento dato dai due versori $\vec{t} (s)$ , $\vec{n} (s)$ (in quest’ordine) applicati nel punto $\vec{r} (s)$ si chiama il riferimento mobile sulla curva. La figura 6.3 illustra il riferimento mobile nel caso in cui la curva venga percorsa in due versi opposti.

figura 6.3: Versore tangente e versore normale

Studiamo ora il caso delle curve di $ℝ^{3}$ . Intendiamo ancora che la curva sia parametrizzata dal parametro d’arco. La definizione del versore tangente $\vec{t} (s)$ è ancora

\vec{t} (s) = \frac{d}{d s} \vec{r} (s) .

Invece, la curvatura deve essere trattata in modo diverso. Assegnato il vettore $\vec{t} (s)$ tangente alla curva $γ$ e di modulo $1$ , è ancora vero che ${\vec{t}}^{'} (s)$ è ortogonale a $\vec{t} (s)$ . Dunque privilegeremo, tra le infinite direzioni normali a $\vec{t} (s)$ , la direzione di ${\vec{t}}^{'} (s)$ ; ma non c’è alcun modo di privilegiare un verso su tale direzione. Dunque decidiamo di scegliere come versore normale il versore

\vec{n} (s) = \frac{{\vec{t}}^{'} (s)}{| | {\vec{t}}^{'} (s) | |} .

(6.10)

Chiamiamo questo il versore normale alla curva $γ$ . Chiamiamo curvatura il numero $k (s)$ tale che

{\vec{t}}^{'} (s) = k (s) \vec{n} (s) o s s i a k (s) = | | {\vec{t}}^{'} (s) | | = {\vec{t}}^{'} (s) \cdot \vec{n} (s) .

In questo modo,

k (s) \geq 0 \forall s .

Osservazione 192 Se una curva regolare è piana, il suo versore normale è ovunque definito. Invece, una curva nello spazio potrebbe essere priva di versore normale su tutto un arco o addirittura ovunque. Ciò avviene se ${\vec{t}}^{'} (s)$ è nullo. In particolare, può accadere che ${\vec{t}}^{'} (s)$ sia identicamente zero su un intervallo. In questo caso, l’arco corrispondente è piano, parametrizzato da

\vec{r} (s) = s {\vec{r}}_{0} + {\vec{r}}_{1} .

La definizione di versore normale data in $ℝ^{3}$ non si applica in questo caso. _

6.2 Curve piane

E’ importante sapere che vale il teorema seguente, di enunciato del tutto intuitivo ma di dimostrazione molto complessa:

Teorema 193 (teorema di Jordan) Sia $γ$ una curva piana chiusa e semplice. Il complementare del sostegno di $γ$ è unione di due regioni. Una di esse è illimitata (e si dice esterna alla curva) mentre l’altra è limitata e si dice la regione interna alla curva.

Il teorema è illustrato nella figura 6.4, a sinistra.

figura 6.4: Le regioni interna ed esterna e la normale esterna

Il sostegno di $γ$ è la frontiera sia della regione interna che della regione esterna di $γ$ (si veda il paragrafo 3.3 per la definizione di frontiera).

Esempio 194 La curva

x = 3 cos 𝜃, y = 2 sin 𝜃

ha per sostegno un’ellisse. La sua regione interna è la parte di piano delimitata dall’ellisse. La regione esterna è quella dei punti che “stanno fuori” dall’ellisse. _

Ovviamente, non esiste alcun “teorema di Jordan” per curve dello spazio! Usa chiamare regione di Jordan la regione interna ad una curva piana semplice e chiusa. Se $γ$ indica la curva, conviene indicare con $Ω_{γ}$ la sua regione interna. Vale:

Teorema 195 Sia $γ$ una curva semplice e chiusa. E’:

Ω_{γ} = Ω_{- γ} .

La regione interna ad una curva piana semplice e chiusa può essere assai complicata; ma nella maggior parte dei casi che si incontrano nelle applicazioni sarà facile identificarla. Nel paragrafo 6.1 abbiamo usato l’ordinamento su $ℝ$ per definire un ordine sulla curva $γ$ . Nel par. 3.2.1 abbiamo notato che il piano può venire orientato con la regola seguente: la coppia dei vettori $\vec{v}$ e $\vec{w}$ applicati in $O$ e presi in quest’ordine, è orientata positivamente quando la semiretta identificata da $\vec{v}$ deve ruotare in verso antiorario per portarsi su quellaidentificata da $\vec{w}$ , percorrendo l’angolo minore possibile. Si veda la figura 6.5 a sinistra. Questa definizione può anche riformularsi mediante la regola d’Ampère: una persona stando in piedi nell’origine del piano $x y$ con la testa nel verso positivo dell’asse delle quote vede la semiretta muoversi in verso antiorario, e quindi la vede passare dalla sua destra alla sua sinistra.

figura 6.5: Regola d’Ampère per una curva piana

Sia ora $γ$ una curva piana semplice e chiusa. Ricordiamo che il suo sostegno è sostegno, oltre che di $γ$ , soltanto della seconda curva $- γ$ , che si ottiene “andando all’indietro”. Diciamo che $γ$ è orientata in modo concorde a $ℝ^{2}$ , o anche che è orientata positivamente, se vale la regola d’Ampère: una persona in piedi in un punto della regione interna alla curva, stando in piedi come l’asse delle quote positivo, vede un punto mobile sulla curva passare dalla sua destra alla sua sinistra. In modo equivalente, si può anche dire che un insetto che segue il punto mobile su una curva semplice e chiusa vede la regione interna alla sua sinistra, si veda la figura 6.5 a destra. Altrimenti, diciamo che è orientata negativamente. Vale:

Teorema 196 Delle due curve semplici e chiuse, $γ$ e $- γ$ , una è orientata positivamente e l’altra è oreintata negativamente.

Supponiamo ora che la curva piana semplice e chiusa $γ$ sia anche regolare, cosìche si possono definire sia il vettore tangente $\vec{t} (s)$ che il vettore normale $\vec{n} (s)$ . Il vettore normale $\vec{n} (s)$ può puntare sia verso la regione interna che verso la regione esterna alla curva. Per il seguito avremo bisogno del vettore normale che punta verso la regione esterna alla curva $γ$ (si veda la figura 6.4, a destra). Lo indicheremo col simbolo

{\vec{n}}_{\vec{e}} (s)

e lo chiameremo la normale esterna.

Osservazione 197 Al paragrafo 6.1.3 si è definito il vettore $\vec{n} (s)$ come il vettore normale a $\vec{t} (s)$ , orientato in modo tale che la coppia ordinata $(\vec{t} (s), \vec{n} (s))$ costituisca un sistema di riferimento positivo. Dunque $\vec{n} (s)$ punta verso la sinistra di $\vec{t} (s)$ . Quando la curva è orientata positivamente, allora $\vec{n} (s)$ punta verso la regione interna alla curva. Quindi, in questo caso si ha $\vec{n} (s) = - {\vec{n}}_{e} (s)$ . _

Torniamo ad usare il fatto che il sostegno di una curva semplice e chiusa è sostegno anche di una seconda curva, che si ottiene dalla prima “girando in verso opposto”. Quest’osservazione permette di introdurre un linguaggio più informale, che tuttavia è limitato alle curve piane. Supponiamo che si sappia che un certo insieme del piano è il sostegno di una curva semplice e chiusa. Per esempio un quadrato o una circonferenza. Invece di scrivere esplicitamente la parametrizzazione della curva, possiamo indicare il sostegno e implicitamente intendere di scegliere quella curva semplice che ha il sostegno dato e che è orientata positivamente, senza dover esplicitamente scrivere una sua parametrizzazione. In particolare, se $Ω$ è la regione interna ad una curva semplice e chiusa $γ$ , e se vogliamo che $γ$ sia orientata positivamente, potremo semplicemente indicarla come “frontiera di $Ω$ ”, $\partial Ω$ .

Osservazione 198 Con questa convenzione, se $γ$ è un sostegno di curva semplice e chiusa, si indica con $γ$ (o, per ridondanza, $+ γ$ ) la curva semplice e chiusa che ha il dato sostegno e che è orientata positivamente, e con $- γ$ quella che ha il dato sostegno ed è orientata negativamente. _

6.3 Le superfici

Studiamo ora le superfici in $ℝ^{3}$ . Considerazioni analoghe a quello che hanno condotto a definire prima le curve parametriche e poi le curve come “oggetti geometrici” si possono ripetere per le superfici. Però sono alquanto complesse e quindi ci limiteremo a definire le superfici parametriche, mostrando quando certe proprietà che ci interessano sono indipendenti dalla parametrizzazione scelta.

6.3.1 Superfici definite parametricamente

Nel definire le curve è stato naturale partire da funzioni continue definite su intervalli. Per definire le superfici dobbiamo considerare funzioni continue di due variabili, definite quindi su un dominio contenuto in $ℝ^{2}$ . richiederemo che il dominio sia una regione. Una funzione continua

\vec{r} (u, v) = x (u, v) \vec{i} + y (u, v) \vec{j} + z (u, v) \vec{k}

(6.11)

il cui dominio è una regione di $Ω$ si chiama una superficie definita parametricamente. L’immagine della funzione $\vec{r} (u, v)$ si chiama il sostegno della superficie mentre il punto $(u, v)$ variabile in $Ω$ si chiama il parametro della superficie. Una superficie si dice semplice quando valori diversi del parametro hanno per immagine punti diversi del sostegno. Una superficie si dice chiusa quando il suo sostegno è la frontiera di una regione di $ℝ^{3}$ . Sia

Σ : (u, v) \to x (u, v) \vec{i} + y (u, v) \vec{j} + z (u, v) \vec{k}

una superficie. Diremo che la superficie è regolare quando la trasformazione (6.11) è di classe $C^{1}$ e inoltre la matrice jacobiana della trasformazione

[\begin{matrix} x_{u} (u, v) & x_{v} (u, v) \\ y_{u} (u, v) & y_{v} (u, v) \\ z_{u} (u, v) & z_{v} (u, v) \end{matrix}]

(6.12)

ha rango $2$ , ossia il massimo possibile, in ogni punto della regione $Ω$ . Cosìcome nel caso delle curve, una stessa superficie può parametrizzarsi in più modi. Senza entrare in eccessivi dettagli, diremo che una trasformazione

[\begin{matrix} α \\ β \end{matrix}] \to [\begin{matrix} u (α, β) \\ v (α, β) \end{matrix}]

è un cambiamento di parametro quando è definita su una regione $\tilde{Ω}$ , a valori in $Ω$ ; è iniettiva e suriettiva; è di classe $C^{1}$ e inoltre conserva l’orientazione di $ℝ^{2}$ , ossia il suo jacobiano è positivo in ogni punto:

det [\begin{matrix} u_{α} (α, β) & u_{β} (α, β) \\ v_{α} (α, β) & v_{β} (α, β) \end{matrix}] > 0 .

Si noti l’analogia con la nozione di cambiamento di parametro per una curva. Anche nel caso delle curve il cambiamento di parametro deve conservare l’orientazione, in tal caso l’orientazione di $ℝ$ . E’ ovvio che cambiando parametro non si cambia il sostegno di una superficie. Diremo equivalenti, e le identificheremo, due superfici che differiscono solamente per la parametrizzazione. Le funzioni definite su $Ω$ , a valori in $ℝ^{3}$ , sono particolari superfici, rappresentate da

Σ : (x, y) \to x \vec{i} + y \vec{j} + z (x, y) \vec{k} .

Esse si chiamano superfici cartesiane. Il sostegno in questo caso è il grafico della funzione $z (x, y)$ . Sia ora $Ω_{Γ}$ una regione di Jordan e sia $\vec{r} (u, v)$ una funzione continua sull’insieme chiuso costituito dall’unione della regione $Ω_{Γ}$ e del supporto di $Γ$ . In tal caso la funzione $\vec{r} (u, v)$ si chiama calotta Ovviamente, la restrizione di $\vec{r} (u, v)$ ad $Ω_{Γ}$ è una superficie. Conviene estendere la definizione di calotta in questo modo. Siano date, oltre alla $Γ$ , anche le curve di Jordan $γ_{1}$ , $γ_{2}$ ,…, $γ_{n}$ i cui sostegni non si intersecano. Supponiamo che ciascuna di queste curve abbia sostegno in $Ω_{Γ}$ . Indichiamo con $K$ l’insieme chiuso i cui punti sono quelli del sostegno di $Γ$ e della sua regione interna $Ω_{Γ}$ , esclusi i punti della regione interna a ciascuna $γ_{i}$ (e quindi inclusi i punti dei sostegni delle $γ_{i})$ . La figura 6.6 mostra in tratteggio un esempio di insieme $K$ .

figura 6.6: Insieme su cui si proietta una calotta

Se la funzione $\vec{r} (u, v)$ in (6.11) è continua su $K$ essa si chiama calotta. Si chiama sostegno della calotta l’immagine della funzione $\vec{r} (u, v)$ . L’insieme dei punti interni di $K$ è ancora una regione (anche se non più una regione di Jordan) e quindi la restrizione di $\vec{r} (u, v)$ a tale insieme è una superficie. Parleremo di calotta chiusa se accade che la calotta è frontiera di un insieme aperto di $ℝ^{3}$ .

Osservazione 199 Non si confonda il concetto di “insieme chiuso” con quello di “superficie chiusa” o di “calotta chiusa”. La calotta di parametrizzazione

x = u, y = v, z = u + v

definita sul disco $u^{2} + v^{2} \leq 1$ ha per sostegno un insieme chiuso; ma la calotta stessa è contenuta nel piano $z = x + y$ e quindi non è una calotta chiusa. _

Una superficie, oppure una calotta, si indica con una lettera greca maiuscola, come per esempio $Σ$ o $Γ$ . Il concetto seguente è molto delicato e noi ci limitiamo a darne una definizione grossolana. Supponiamo di avere una calotta $Σ$

\vec{r} (u, v) = x (u, v) \vec{i} + y (u, v) \vec{j} + z (u, v) \vec{k}, (u, v) \in K .

Supponiamo che la calotta sia semplice ossia che

x (u^{'}, v^{'}) = x (u, v), y (u^{'}, v^{'}) = y (u, v), z (u^{'}, v^{'}) = z (u, v)

possa aversi solo se $u = u^{'}$ e $v = v^{'}$ . In tal caso si chiama bordo della calotta $Σ$ l’immagine della frontiera dell’insieme $K$ ; ossia l’immagine delle singole curve che delimitano l’insieme $K$ . La figura 6.7 mostra una calotta e il suo bordo.

figura 6.7: Una calotta ed il suo “bordo”

Esempio 200 Si è detto che la definizione di bordo è insoddisfacente. Quest’esempio ne mostra la ragione. Consideriamo la calotta definita come segue. La funzione $\vec{r} (𝜃, v)$ è

Σ : x = cos 𝜃, y = sin 𝜃, z = v .

(6.13)

Il dominio della funzione è

0 \leq v \leq 1, 𝜖 \leq 𝜃 \leq 2 π

con $𝜖 > 0$ . Si tratta di un cilindro a cui è stata tolta una striscetta, come in figura 6.8.

figura 6.8: Ancora una calotta col suo “bordo”

Questa calotta è una calotta semplice e il suo bordo è costituito dai due archi di circonferenza (archi della circonferenza di sopra e di quella di sotto, alle quali è tolto l’arco che corrisponde a $0 < 𝜃 < 𝜖$ ) e dai bordi del taglio che le congiungono. Supponiamo ora di mandare $𝜖$ a zero. In tal caso si trova un cilindro intero. La sua parametrizzazione non è più semplice, e quindi non possiamo più parlare di “bordo” secondo la nostra definizione, anche se appare naturale considerare le due circonferenze come il bordo del cilindro. Mentre il contributo dei due bordi del taglio “scompare”. Quest’esempio mostra che dovremmo dare un modo per definire il “bordo” anche per calotte che non sono semplici. Per esempio anche nel caso del cilindro ottenuto scegliendo $𝜃 \in [0, 2 π]$ . La soluzione ovvia è quella di scegliere come bordo l’immagine della frontiera dell’insieme $K$ , in quest’esempio l’immagine del perimetro del rettangolo $[0, 1] \times [0, 2 π]$ . In questo modo si otterrebbe come bordo l’insieme delle due circonferenze ed anche il segmento verticale dei punti di coordinate $(1, 0, v)$ , $0 \leq v \leq 1$ . Questa soluzione però non è accettabile. Infatti lo stesso cilindro si parametrizza anche scegliendo come dominio della funzione (6.13) l’insieme

0 \leq v \leq 1, - π \leq v \leq π

e con questa parametrizzazione si trova un’altro insieme come “bordo”: l’insieme costituito dalle due circonferenze e dal segmento dei punti $(- 1, 0, v)$ , $0 \leq v \leq 1$ . Ossia, il bordo cosìdefinito viene a dipendere dalla particolare parametrizzazione che si sceglie. Ci sono vari modi per risolvere questa diffcoltà: uno, più astratto, consiste nel considerare tutte le parametrizzazioni della calotta, ciascuna definita su un proprio insieme $K$ . Si considerano quindi le immagini di tutte le frontiere di questi insiemi $K$ e se ne fa l’intersezione. Noi seguiremo una via “più concreta” che si adatta ai casi semplici che incontreremo nelle applicazioni e che sarà illustrata al paragrafo 8.5.2. _

6.3.2 Il piano tangente e la normale a una superficie

Sia

Σ : (u, v) \to x (u, v) \vec{i} + y (u, v) \vec{j} + z (u, v) \vec{k} (u, v) \in Ω

una superficie regolare e semplice. fissiamo l’attenzione su un punto ${\vec{r}}_{0}$ del sostegno. Dato che la superficie è semplice, questo proviene da un unico punto $(u_{0}, v_{0})$ del dominio:

{\vec{u}}_{0} = (u_{0}, v_{0}), {\vec{r}}_{0} = x (u_{0}, v_{0}) \vec{i} + y (u_{0}, v_{0}) \vec{j} + z (u_{0}, v_{0}) \vec{k} .

Consideriamo ora il segmento per ${\vec{u}}_{0}$ , parallelo all’asse delle ascisse, ossia la curva

γ : t \to (u_{0} + t, v_{0})

Questo identifica una curva sulla superficie, parametrizzata da

t \to x (u_{0} + t, v_{0}) \vec{i} + y (u_{0} + t, v_{0}) \vec{j} + z (u_{0} + t, v_{0}) \vec{k} .

La tangente a questa curva calcolata per $t = 0$ , ossia in ${\vec{r}}_{0}$ , è identificata dal vettore ${\vec{v}}_{1}$ (applicato in ${\vec{r}}_{0}$ )

{\vec{v}}_{1} = x_{u} (u_{0}, v_{0}) \vec{i} + y_{u} (u_{0}, v_{0}) \vec{j} + z_{u} (u_{0}, v_{0}) \vec{k} .

(6.14)

Analogamente, considerando un segmento per ${\vec{u}}_{0}$ parallelo all’asse delle ordinate, si trova una curva sulla superficie, la cui tangente in ${\vec{r}}_{0}$ è identificata dal vettore ${\vec{v}}_{2}$ (applicato in ${\vec{r}}_{0}$ ):

{\vec{v}}_{2} = x_{v} (u_{0}, v_{0}) \vec{i} + y_{v} (u_{0}, v_{0}) \vec{j} + z_{v} (u_{0}, v_{0}) \vec{k} .

(6.15)

In generale, il segmento

t \to (u_{0} + a t, v_{0} + b t)

identifica una curva sulla superficie, il cui vettore tangente è identificato dal vettore

a {\vec{v}}_{1} + b {\vec{v}}_{2} (applicato in {\vec{r}}_{0}) .

I vettori ${\vec{v}}_{1}$ e ${\vec{v}}_{2}$ dipendono da $(u_{0}, v_{0})$ :

{\vec{v}}_{1} (u_{0}, v_{0}), {\vec{v}}_{2} (u_{0}, v_{0})

e sono le due colonne della matrice jacobiana (6.12) e quindi sono linearmente indipendenti (infatti abbiamo assunto che la superficie sia regolare). Dunque al variare di $a$ e di $b$ in $ℝ$ , i vettori $a {\vec{v}}_{1} + b {\vec{v}}_{2}$ applicati in ${\vec{r}}_{0} = \vec{r} (u_{0}, v_{0})$ descrivono un piano per ${\vec{r}}_{0}$ , che si chiama il piano tangente alla superficie nel punto ${\vec{r}}_{0}$ . Si noti esplicitamente che intendiamo di scegliere come sistema di riferimento cartesiano (in generale, obliquo) in questo piano le rette identificate al vettore ${\vec{v}}_{1} (u_{0}, v_{0})$ per primo e quindi ${\vec{v}}_{2} (u_{0}, v_{0})$ . E’ su questi assi cartesiani si sceglie per verso positivo quello dei rispettivi vettori. Dunque sul piano tangente è definita un’orientazione. Definiamo ora il vettore normale $\vec{N} (u_{0}, v_{0})$ ponendo

\vec{N} (u_{0}, v_{0}) = {\vec{v}}_{1} (u_{0}, v_{0}) \land {\vec{v}}_{2} (u_{0}, v_{0}) .

Il vettore $\vec{N} (u_{0}, v_{0})$ si intende applicato nel punto ${\vec{r}}_{0} = \vec{r} (u_{0}, v_{0})$ . E’ ovvio:

Teorema 201 Se la superficie semplice $Σ$ è regolare, sia i vettori ${\vec{v}}_{1} (u_{0}, v_{0})$ , ${\vec{v}}_{2} (u_{0}, v_{0})$ che il vettore normale $\vec{N} (u_{0}, v_{0})$ dipendono con continuità da $(u_{0}, v_{0})$ .

Si ricordi che la superficie si è supposta semplice. Quindi ogni ${\vec{r}}_{0}$ proviene da un unico punto $(u_{0}, v_{0}) \in Ω$ . Dunque in ogni punto di una superficie regolare e semplice il vettore normale $\vec{N}$ sopra definito è unico e questo vettore si potrà considerare come funzione del punto della superficie: $\vec{N} = \vec{N} (\vec{r})$ . Si è cosìdefinito un campo vettoriale sulla superficie. I concetti appena esposti sono illustrati nella figura 6.9.

figura 6.9: Il piano tangente e la normale ad una superficie

Se la superficie è cartesiana si ha:

{\vec{v}}_{1} (x_{0}, y_{0}) = [\begin{matrix} 1 \\ 0 \\ z_{x} (x_{0}, y_{0}) \end{matrix}], {\vec{v}}_{2} (x_{0}, y_{0}) = [\begin{matrix} 0 \\ 1 \\ z_{y} (x_{0}, y_{0}) \end{matrix}] \vec{N} (x_{0}, y_{0}) = [\begin{matrix} - z_{x} (x_{0}, y_{0}) \\ - z_{y} (x_{0}, y_{0}) \\ 1 \end{matrix}] .

Per il seguito è importante ricordare la formula per

| | \vec{N} (\vec{r}) | |

nel caso di una superficie cartesiana:

| | \vec{N} (x_{0}, y_{0}) | | = \sqrt{1 + {[z_{x} (x, y)]}^{2} + {[z_{y} (x, y)]}^{2}} .

(6.16)

Si confronti questa formula con la (6.6). Studiamo ora come cambiano i vettori ${\vec{v}}_{1} (u_{0}, v_{0})$ , ${\vec{v}}_{2} (u_{0}, v_{0})$ e il vettore $\vec{N} (u_{0}, v_{0})$ sotto l’azione dei cambiamenti di parametro. Sia $u = u (t, s)$ , $v = v (t, s)$ una trasformazione biunivoca (e di classe $C^{1}$ ) da una regione $Ω^{'}$ su $Ω$ e consideriamo la parametrizzazione

\vec{r} (t, s) = x (u (t, s), v (t, s)) \vec{i} + y (u (t, s), v (t, s)) \vec{j} + z (u (t, s), v (t, s)) \vec{k} .

Le derivate rispetto ad $t$ ed $s$ si calcolano mediante la regola di derivazione a catena. Poniamo:

a = u_{t} (t, s), b = v_{t} (t, s), c = u_{s} (t, s), d = v_{s} (t, s) .

Per semplicità di notazioni, scriviamo $x_{u}$ invece di $x_{u} (u (t, s), v (t, s))$ (e analoga notazione per le derivate di $y$ e di $z$ , e per le derivate rispetto a $v$ ). Si ha:

\begin{aligned} {\vec{r}}_{t} (t, s) & = & [x_{u} a + x_{v} b] \vec{i} + [y_{u} a + y_{v} b] \vec{j} + [z_{u} a + z_{v} b] \vec{k} \\ {\vec{r}}_{s} (t, s) & = & [x_{u} c + x_{v} d] \vec{i} + [y_{u} c + y_{v} d] \vec{j} + [z_{u} c + z_{v} d] \vec{k} \end{aligned}

La componente lungo il versore $\vec{k}$ del prodotto vettoriale ${\vec{r}}_{t} (t, s) \land {\vec{r}}_{s} (t, s)$ è

\begin{aligned} [(x_{u} y_{u} a c + x_{v} y_{v} b d + x_{u} y_{v} a d + x_{v} y_{u} b c) - (y_{u} x_{u} a c + y_{v} x_{v} b d + y_{u} x_{v} a d + y_{v} x_{u} b c)] \\ = (x_{u} y_{v} - x_{v} y_{u}) (a d - b c) . \end{aligned}

Proseguendo in modo analogo al calcolo delle altre componenti si trova:

Teorema 202 Vale:

{\vec{r}}_{t} (u (t, s), v (t, s)) \land {\vec{r}}_{s} (u (t, s), v (t, s)) = (a d - b c) {\vec{r}}_{u} (u (t, s), v (t, s)) \land {\vec{r}}_{v} (u (t, s), v (t, s)) .

Il numero $a b - b c$ è lo jacobiano del cambiamento di parametro. Esso è positivo per la definizione di cambiamento di parametro.

Teorema 203 effettuando un cambiamento di parametro la normale alla superficie non cambia né direzione né verso.

Per questa ragione si dice che i cambiamenti di parametro (che hanno jacobiano positivo) lasciano invariata l’orientazione della superficie. Si dice che cambiano l’orientazione della superficie quelle trasformazioni che hanno jacobiano negativo.

6.4 Appendici

6.4.1 Appendice: le formule di Frenet per curve nello spazio

Torniamo a considerare le curve nello spazio e completiamo le considerazioni svolte al paragrafo 6.1.3. In quel paragrafo abbiamo definito la tangente $\vec{t} (s)$ e la normale $\vec{n} (s)$ ad una curva. Il piano identificato dai vettori $\vec{t} (s)$ e $\vec{n} (s)$ , applicati in $\vec{r} (s)$ , si chiama il piano osculatore alla curva nel punto $\vec{r} (s)$ . Notiamo ora che $\vec{t} (s) \cdot \vec{n} (s)$ è identicamente zero e quindi ha derivata nulla. Dunque,

\vec{t} (s) \cdot {\vec{n}}^{'} (s) = - {\vec{t}}^{'} (s) \cdot \vec{n} (s) = - k (s) .

(6.17)

Introduciamo ora il versore $\vec{b} (s)$ , definito da

\vec{b} (s) = \vec{t} (s) \land \vec{n} (s) .

Il versore $\vec{b} (s)$ è quindi ortogonale a $\vec{t} (s)$ e $\vec{n} (s)$ ed orientato in modo tale che la terna $(\vec{t} (s), \vec{n} (s), \vec{b} (s))$ sia orientata positivamente. Si veda la figura 6.10 per un esempio. Il sistema di assi cartesiano ortogonali che abbiamo descritto varia da punto a punto della curva. Per questa ragione si chiama sistema di riferimento mobile sulla curva.

figura 6.10: Riferimento mobile su una curva nello spazio

Il vettore $\vec{b} (s)$ si chiama il versore binormale alla curva. La derivata di $\vec{b} (s)$ è ortogonale a $\vec{b} (s)$ perché $| | \vec{b} (s) | | = 1$ per ogni $s$ e quindi appartiene al piano di $\vec{t} (s)$ e $\vec{n} (s)$ per ogni $s$ . Si ha quindi

{\vec{b}}^{'} (s) = α (s) \vec{t} (s) + β (s) \vec{k} (s) .

D’altra parte,

{\vec{b}}^{'} (s) = [{\vec{t}}^{'} (s)] \land \vec{n} (s) + [\vec{t} (s)] \land {\vec{n}}^{'} (s) .

Ora, ${\vec{t}}^{'} (s)$ è colineare con $\vec{n} (s)$ e quindi il loro prodotto vettoriale è nullo. Rimane quindi

{\vec{b}}^{'} (s) = [\vec{t} (s)] \land {\vec{n}}^{'} (s) .

Il vettore $[\vec{t} (s)] \land {\vec{n}}^{'} (s)$ è ortogonale sia a $\vec{t} (s)$ che a ${\vec{n}}^{'} (s)$ . E’ quindi un multiplo di $\vec{n} (s)$ . Dunque, per ogni $s$ esiste un numero $τ (s)$ tale che

{\vec{b}}^{'} (s) = - τ (s) \vec{n} (s) .

(6.18)

Da qui si trova

τ (s) = - {\vec{b}}^{'} (s) \cdot \vec{n} (s) .

Essendo $\vec{b} (s) \cdot \vec{n} (s)$ identicamente zero, derivando si trova anche che

τ (s) = \vec{b} (s) \cdot {\vec{n}}^{'} (s) .

(6.19)

Il numero $τ (s)$ può essere positivo negativo o nullo. Esso si chiama la torsione della curva. Cerchiamo ora di esprimere ${\vec{n}}^{'} (s)$ mediante $\vec{t} (s)$ e $\vec{b} (s)$ . Ciò è possibile perchè ${\vec{n}}^{'} (s)$ , essendo ortogonale a $\vec{n} (s)$ , è nel piano di $\vec{t} (s)$ e di $\vec{b} (s)$ . Dunque

{\vec{n}}^{'} (s) = γ (s) \vec{t} (s) + δ (s) \vec{b} (s) .

(6.20)

Moltiplicando scalarmente i due membri di (6.20) per $\vec{t} (s)$ ed usando (6.17) si trova

γ (s) = - k (s) .

Analogamente, moltiplicando scalarmente (6.20) per $\vec{b} (s)$ ed usando (6.19) si trova

δ (s) = {\vec{n}}^{'} (s) \cdot \vec{b} (s) = τ (s) .

Si trova quindi che i versori $\vec{t} (s)$ , $\vec{n} (s)$ , $\vec{b} (s)$ verificano

\{\begin{matrix} {\vec{t}}^{'} (s) & = & k (s) \vec{n} (s) \\ {\vec{n}}^{'} (s) & = & - k (s) \vec{t} (s) + τ (s) \vec{b} (s) \\ {\vec{b}}^{'} (s) & = & - τ (s) \vec{n} (s) . \end{matrix}

Si chiamano queste le equazioni di Frenet per curve di $ℝ^{3}$ . Il sistema di riferimento dato dai tre versori $\vec{t} (s)$ , $\vec{n} (s)$ , $\vec{b} (s)$ applicati in $\vec{r} (s)$ si chiama ancora il riferimento mobile sulla curva.

6.4.2 Appendice: Curve in $ℝ^{n}$

La maggior parte delle considerazioni che abbiamo svolto si estendono senza alcuna diffcoltà a curve

γ : t \to \vec{r} (t), \vec{r} \in ℝ^{n} .

Per esempio è ancora vero che una curva in $ℝ^{n}$ che è semplice è identificata dal suo sostegno a meno dell’orientazione; si definisce ancora la lunghezza dell’arco $γ$ ponendo

L_{γ} = \int_{a}^{b} | | \dot{\vec{r}} (t) | | d t;

è quindi possibile definire il parametro d’arco. La tangente e la normale si definiscono ancora nel medesimo modo come per le curve in $ℝ^{3}$ . Non esiste invece una unica “binormale”. Per completare il il riferimento mobile sulla curva si devono introdurre, oltre alla tangente ed alla normale, altri $n - 2$ vettori e quindi le equazioni di Frenet diventano più complesse.

Capitolo 7
Integrazione delle funzioni di più variabili

In questo capitolo introdurremo gli integrali di funzioni di due o tre variabili. Le idee che si seguono per definire l’integrale sono simili a quelle che si usano per definire l’integrale delle funzioni di una sola variabile e quindi le illustreremo per sommi capi¹. Una differenza importante tra le definizione di integrali per le funzioni di una o più variabili è nella scelta dei domini di integrazione. Per le funzioni di una variabile è naturale scegliere gli intervalli. Per le funzioni di più variabili c’è molta più libertà. Noi sceglieremo come domini di integrazione gli insiemi che sono delimitati da grafici di funzioni continue (si veda più avanti per una definizione più precisa). Tali insiemi si chiameranno domini di integrazione. Studieremo la definizione dell’integrale di di una classe di funzioni che saranno costruite a partire da funzioni continue su insiemi chiusi e limitati.

Dovremo usare la seguente proprietà delle funzioni che sono continue su un qualsiasi insieme insieme chiuso e limitato

𝒟

per ogni

𝜖 > 0

esiste

δ > 0

con questa proprietà:se

R

è un qualsiasi rettangolo contenuto in

𝒟

le cui diagonali hanno lunghezza minore di

δ

allora

0 \leq max_{R} f - min_{R} f \leq 𝜖 .

La proprietà importante è che la posizione di $R$ in $𝒟$ non ha importanza. Inoltre, non abbiamo indicato esplicitamente le variabili della funzione perché questo risultato vale per funzioni di un qualsiasi numero di variabili (anche per funzioni di una sola variabile. In questo caso $R = [a, b]$ , nonostante che questo risultato non sia stato provato nel corso di Analisi Matematica 1.) Questa proprietà delle funzioni continue su insiemi chiusi e limitati si chiama continuità uniforme.

Introduciamo prima l’integrale di funzioni di due variabili, che presenteremo con maggiori dettagli, e poi l’integrale delle funzioni di tre variabili, che presenteremo in modo più conciso.

7.1 Integrazione delle funzioni di due variabili

Chiameremo dominio di integrazione semplice un insieme che ha una delle proprietà seguenti:

è trapezoide di una funzione $y = g (x)$ continua definita su un intervallo limitato e chiuso (dell’asse delle ascisse) oppure $x = g (y)$ continua su un intervallo limitato e chiuso (dell’asse delle ordinate);
oppure è differenza insiemistica di trapezoidi.

Va notato esplicitamente che ogni dominio di integrazione semplice è limitato, per il Teorema di Weiestrass. Inoltre, assumiamo che il dominio di integrazione semplice sia chiuso, ossia contenga i punti della sua frontiera. Nel caso specifico di un dominio di integrazione semplice compreso tra due grafici di funzioni della variabile

x \in [a, b]

, includeremo nel dominio sia i due grafici che i due segmenti che lo delimitano a destra (punti di ascissa

a

) ed a sinistra (punti di ascissa

b

Un insieme chiuso e limitato $𝒟$ si chiama dominio di integrazione quando si può rappresentare come unione di domini di integrazione semplici in modo tale che due qualsiasi di essi non abbiano punti interni comuni (ossia, gli eventuali punti comuni a due domini di integrazione semplici appartengono alle rette o ai grafici che li delimitano)². Per brevità un dominio di integrazione semplice si chiamerà “dominio semplice” ma è importante ricordare che è un caso speciale di dominio di integrazione. In conclusione, un dominio di integrazione si rappresenta (non in modo unico) come unione di domini semplici

𝒟 = D_{1} \cup D_{2} \cup \dots \cup D_{n} D_{i} \cap D_{j} privo di punti interni.

(7.1)

La figura 7.1 mostra esempi di domini di integrazione. Quello a sinistra è la parte del trapezoide di una funzione $y = g (x)$ $x \in [a, b]$ che è sopra alla retta orizzontale $y = m$ ed automaticamente sotto alla retta $y = M = max g (x)$ . E’ quindi la differenza insiemistica tra il trapezoide di $g (x)$ e quello della funzione che vale costantemente $m$ . Il dominio di integrazione a destra è più complesso, suddiviso mediante grafici di varie funzioni $y = y (x)$ , oppure $x = x (y)$ , ciascuna continua e definita su un opportuno intervallo limitato e chiuso.

figura 7.1: Domini di integrazione

Osservazione 204 Si noti che:

un dominio di integrazione è un insieme chiuso e limitato. Questo implica che una funzione continua definita su un dominio di integrazione è limitata.
Come abuso di linguaggio, se $Ω$ è un dominio di integrazione, talvolta chiameremo dominio di integrazione l’insieme dei suoi punti interni; ossia l’insieme $Ω$ privato delle curve che lo delimitano. Anche in questo caso, le funzioni continue che integreremo dovranno avere estenzione continua alla frontiera dell’insieme.
uno stesso dominio di integrazione può rappresentarsi in più modi come unione di insiemi semplici: per esempio il trapezoide della funzione $sin x$ , $0 \leq x \leq π$ è un dominio di integrazione semplice che può rappresentarsi anche come $𝒟_{1} \cup 𝒟_{2}$ con $𝒟_{1}$ il trapezoide di $sin x$ , $0 \leq x \leq π ∕ 2$ e $𝒟_{2}$ quello di $sin x$ , $π ∕ 2 \leq x \leq π$ .
Si potrebbe provare che la chiusura di una regione di Jordan delimitata da una curva regolare è un dominio di integrazione; e quindi anche l’insieme ottenuto togliendogli la regione delimitata da una seconda curva di Jordan regolare lo è. _

Introduciamo ora la classe di funzioni per cui definiremo l’integrale³. Chiamiamo integrabile una funzione $f (x, y)$ definita su un dominio di integrazione $𝒟$ (o almeno nei suoi punti interni) e con questa proprietà: E’ possibile trovare una rappresentazione di $𝒟$ come in (7.1) in modo tale che per ogni indice $i$ la funzione $f_{|_{D_{i}}} (x, y)$ ammetta estensione continua al dominio semplice $D_{i}$ . Ossia, gli eventuali punti di discontinuità della funzione $f (x, y)$ devono essere sulle rette o grafici che delimitano i domini semplici che compongono $𝒟$ .

7.1.1 La definizione di integrale

Sia $f (x, y)$ una funzione integrabile. Per definirne l’integrale, procediamo in questo modo: definiamo l’integrale di $f (x, y)$ su ciascuna dei domini semplici $D_{i}$ e quindi definiamo l’integrale su $𝒟$ come somma degli integrali sui domini $D_{i}$ . Si noti che il dominio $𝒟$ si potrà decomporre in più modi e quindi andrebbe provato che l’integrale di $f (x, y)$ non dipende dalla decomposizione scelta per il dominio. Questo è vero ma noi non lo proveremo. Per semplicità limitiamoci a illustrare la definizione dell’integrale di $f (x, y)$ sul dominio semplice rappresentato nella figura 7.1 a sinistra. Indichiamo con $T$ tale dominio semplice,

T = {(x, y), 0 \leq a \leq b, m \leq g (x) \leq M}

Si segua il procedimento guardando la figura 7.2.

figura 7.2: Suddivisione in rettangoli di un dominio di integrazione

Dividiamo $[a, b]$ in $N$ parti uguali con i punti $a_{0} = a$ , $a_{k} = k \frac{b - a}{N}$ . Consideriamo quindi i segmenti verticali i cui punti hanno ascissa $a_{k}$ e che sono contenuti in $T$ , come in fig. 7.2, a sinistra. Suddividiamo ora anche il segmento $[m, M]$ dell’asse delle ordinate in $L$ tratti uguali. Le rette orizzontali i cui punti hanno ordinata uguale ai punti di suddivisione dell’intervallo $[m, M]$ disegnano una divisione dell’insieme $T$ in rettangoli completamente contenuti in $T$ , e inoltre certi sottoinsiemi a lati non rettilinei, che escludiamo. Si guardi la figura 7.2, a destra. In questo modo il trapezoide della funzione viene ad essere approssimato da una rete di al più $N L$ rettangolini, che indichiamo con $R_{i, j}$ , $0 \leq i \leq N - 1$ , $0 \leq j \leq L - 1$ . Ciascuno di questi rettangoli ha area $\frac{b - a}{N} \frac{M - m}{L}$ . Indichiamo con $U_{-}$ la loro unione. Notiamo che nessuno dei rettangolini è a cavallo del grafico di $g (x)$ e che $U_{-} \subseteq T$ . Per ipotesi, la funzione $f (x, y)$ appartiene alla classe delle funzioni integrabili e quindi la sua restrizione a $T$ ammette estensione continua a tutti i punti del dominio di integrazione $T$ , che è chiuso e limitato. Indichiamo ancora con $f (x, y)$ tale estensione, che è uniformemente continua. Costruiamo ora le somme

\begin{aligned} s_{N, L} = \sum_{i, j} min_{(x, y) \in R_{i, j}} f (x, y) \cdot \frac{M - m}{L} \cdot \frac{b - a}{N} \\ S_{N, L} = \sum_{i, j} max_{(x, y) \in R_{i, j}} f (x, y) \cdot \frac{M - m}{L} \cdot \frac{b - a}{N} \end{aligned}

Queste somme sono estese a tutti i rettangoli che appartengono ad $U_{-}$ . Ora usiamo l’uniforme continuità di $f (x, y)$ . Si fissi un qualsiasi $𝜖 > 0$ e il corrispondente $δ > 0$ . Se $N$ ed $L$ sono abbastanza grandi, diciamo $N \geq N_{0}$ , $L \geq L_{0}$ , la diagonale di ciascuno dei rettangoli costruiti misura meno di $δ$ e quindi per $N \geq N_{0}$ , $L \geq L_{0}$ si ha

0 \leq [max_{R_{i, j}} f (x, y) - min_{R_{i, j}} f (x, y)] < 𝜖 .

In particolare

0 \leq S_{N_{0}, L_{0}} - s_{N_{0}, L_{0}} \leq \{somma delle aree dei rettangoli\} 𝜖 \leq [(b - a) (M - m)] 𝜖 .

Ma,

\begin{aligned} 0 \leq inf {S_{N, L}} - sup {s_{N, L}} \leq S_{N_{0}, L_{0}} - s_{N_{0}, L_{0}} \leq \\ \leq \{somma delle aree dei rettangoli\} 𝜖 \leq [(b - a) (M - m)] 𝜖 . \end{aligned}

Dunque

inf {S_{N, L}} = sup {s_{N, L}}

e questo numero si chiama l’integrale di $f (x, y)$ sul trapezoide $T$ . Esso si indica col simbolo

\int_{T} f (x, y) d x d y .

In modo analogo si definisce l’integrale su ogno altro dominio $D_{i}$ . Si definisce quindi

\int_{𝒟} f (x, y) d x d y = \sum_{i} \int_{D_{i}} f (x, y) d x d y .

(7.2)

Osservazione 205 E’ ovvio dalla costruzione che abbiamo fatto che se $f (x, y) \geq 0$ allora il suo integrale si interpreta come il volume del solido compreso tra l’insieme $𝒟$ del piano $z = 0$ ed il grafico della funzione. Se in particolare si sceglie $f (x, y)$ identicamente uguale ad $1$ , si trova una numero che ha senso interpretare come area del dominio di integrazione. Ossia per definizione:

area di 𝒟 = \int_{𝒟} 1 d x d y .

(7.3)

Se accade che $𝒟$ è grafico di una funzione $y = g (x) \geq 0$ continua su $[a, b]$ abbiamo due diverse definizioni di area: quella appena scritta e quella data durante il corso di Analisi Matematica 1: area del trapezoide di una funzione positiva uguale (per definizione!) al suo integrale. Si tratta di due definizioni diverse ma vedremo che conducono al medesimo numero. Un fatto da sottolineare è questo: $\int_{a}^{b} g (x) d x$ è l’area del trapezoide solo se $g (x) \geq 0$ . Invece, la (7.3) dà il valore dell’area anche quando $𝒟$ è trapezoide di una funzione che cambia segno. _

Talvolta, un integrale di una funzione di due variabili si chiama anche integrale doppio Per contrasto, l’integrale di una funzione di una sola variabile,

\int_{a}^{b} f (x) d x

si chiama anche integrale semplice

7.1.2 Le proprietà dell’integrale

Le proprietà dell’integrale sono le stesse come nel caso degli integrali semplici:

la linearità: se $α$ e $β$ sono numeri e $f (x, y)$ , $g (x, y)$ sono funzioni continue sullo stesso dominio di integrazione $𝒟$ , vale $\int_{𝒟} [α f (x, y) + β g (x, y)] d x d y = α \int_{𝒟} f (x, y) d x d y + β \int_{𝒟} g (x, y) d x d y;$
additività: se il dominio di integrazione $𝒟$ è unione di due, $𝒟 = 𝒟_{1} \cup 𝒟_{2}$
e se la funzione $f (x, y)$ è integrabile sia su $𝒟_{1}$ che su $𝒟_{2}$ , allora è anche integrabile su $𝒟$ , e viceversa; e inoltre
$\int_{𝒟} f (x, y) d x d y = \int_{𝒟_{1}} f (x, y) d x d y + \int_{𝒟_{2}} f (x, y) d x d y .$
monotonia: $f (x, y) \leq g (x, y)$ per ogni $(x, y) \in 𝒟$ implica $\int_{𝒟} f (x, y) d x d y \leq \int_{𝒟} g (x, y) d x d y .$
Dalla monotonia si deduce $|\int_{𝒟} f (x, y) d x d y| \leq \int_{𝒟} | f (x, y) | d x d y .$

Anche il teorema della media si può riformulare. Indichiamo con $A (𝒟)$ l’area di $𝒟$ , calcolata sommando le aree delle singole regioni che la compongono. Vale:

A (𝒟) \cdot (min_{(x, y) \in 𝒟} f (x, y)) \leq \int_{𝒟} f (x, y) d x d y \leq A (𝒟) \cdot (max_{(x, y) \in 𝒟} f (x, y)) .

Ne segue:

Teorema 206 Se $𝒟_{𝜖}$ è una circonferenza di raggio $𝜖$ e centro fissato vale

lim_{𝜖 \to 0} \int_{𝒟_{𝜖}} f (x, y) d x d y = 0 .

7.1.3 Domini di integrazione definiti mediante curve di Jordan

Sia

γ : t \to x (t) \vec{i} + y (t) \vec{j}

una curva di Jordan regolare. Applicando il Teorema della funzione implicita si vede che il sostegno è localmente un grafico e si potrebbe provare che il sostegno è grafico di un numero finito di funzioni. Dunque, l’unione della regione $Ω_{γ}$ , interna alla curva $γ$ e del suo sostegno è un dominio di integrazione. Come si è notato all’osservazione 204, diremo che la regione $Ω_{γ}$ stessa è un dominio di integrazione e quindi è possibile:

integrare una funzione su una regione di Jordan, se la funzione è continua sulla chiusura della regione;
assegnare un’area ad una regione di Jordan (ciò che si fa integrando la funzione identicamente uguale ad $1$ );
approssimare l’area di una regione di Jordan mediante la somma delle aree di un numero finito di rettangoli con lati paralleli agli assi coordinati.

Con lo stesso abuso di linguaggio illustrato all’osservazione 204, diremo ancora che una regione di Jordan si può approssimare mediante rettangoli.

7.1.4 Riduzione di integrali doppi ad integrali iterati

Torniamo a considerare le somme $s_{N, L}$ ed $S_{N, L}$ che servono per definire l’integrale doppio. Consideriamo per esempio le $s_{N, L}$ :

s_{N, L} = \sum_{i, j} [min_{(x, y) \in R_{i, j}} f (x, y)] \cdot \frac{M - m}{L} \cdot \frac{b - a}{N} .

Calcoliamo le somme prima di tutto sommando i termini che corrispondono a rettangolini che appartengono alla stessa striscia verticale, ossia scrivendo

\begin{aligned} s_{N, L} = \sum_{i, j} [min_{(x, y) \in R_{i, j}} f (x, y)] \cdot \frac{M - m}{L} \cdot \frac{b - a}{N} \\ = \sum_{i} \{\sum_{j} [min_{(x, y) \in R_{i, j}} f (x, y)] \cdot \frac{M - m}{L}\} \cdot \frac{b - a}{N} . \end{aligned}

fissiamo un punto $x_{i}$ in ciascuno degli intervalli $[a_{i}, a_{i + 1})$ . Si mostra che per $L \to + \infty$ tende a zero la differenza tra la parentesi graffa e l’integrale

\int_{0}^{g (x_{i})} f (x_{i}, y) d y

ove $x_{i}$ è un qualsiasi punto dell’intervallo $[a_{i}, a_{i + 1})$ ; e quindi che

\begin{aligned} s_{N, L} = \sum_{i, j} [min_{(x, y) \in R_{i, j}} f (x, y)] \cdot \frac{M - m}{L} \cdot \frac{b - a}{N} \\ = \sum_{i} \frac{b - a}{N} \int_{0}^{g (x_{i})} f (x_{i}, y) d y + 𝜖 (L, N) \end{aligned}

con

lim 𝜖 (L, N) = 0;

Ma, per $N \to + \infty$ , le somme

\sum_{i = 0}^{N - 1} \frac{b - a}{N} \int_{0}^{g (x_{i})} f (x_{i}, y) d y

convergono all’integrale della funzione di $x$

\int_{0}^{g (x)} f (x, y) d y,

ossia all’integrale iterato di $f (x, y)$ . Dunque, per calcolare $\int_{𝒟} f (x, y) d x d y$ si può procedere come segue:

Si proietta ortogonalmente $𝒟$ sull’asse delle ascisse, ottenendo un intervallo $[a, b]$ ;
Si traccia la retta parallela all’asse delle ordinate e che passa da $x \in [a, b]$ . Si indica con $𝒮_{x}$ l’intersezione di tale retta con $𝒟$ . L’insieme $𝒮_{x}$ è unione di un numero finito di intervalli.
Si ha: $\int_{𝒟} f (x, y) d x d y = \int_{a}^{b} [\int_{𝒮_{x}} f (x, y) d y] d x .$

Si veda la figura 7.3

figura 7.3: Riduzione di un integrale doppio

Naturalmente la stessa procedura vale anche scambiando il ruolo dell’asse delle ascisse con quello dell’asse delle ordinate. Consideriamo un caso particolare: supponiamo che $𝒟$ sia il trapezoide della funzione $k (x)$ , $x \in [a, b]$ , e che la funzione integranda sia identicamente uguale ad $1$ . Sia inoltre $k (x)$ non negativa. In tal caso,

\int_{𝒟} 1 d x d y = \int_{a}^{b} [\int_{0}^{k (x)} 1 d y] d x = \int_{a}^{b} k (x) d x

in accordo con quanto detto nell’osservazione 205. Il metodo visto “riduce” il calcolo di un integrale doppio a quello di un integrale iterato, e quindi a quello di due integrali semplici. Però esso può anche usarsi al contrario, per ricondurre il calcolo di un integrale iterato calcolato prima rispetto ad $x$ e poi rispetto ad $y$ al calcolo di un integrale doppio; e quindi al calcolo di un integrale iterato calcolato prima rispetto ad $y$ e poi rispetto ad $x$ . Quando si opera in questo modo su un integrale iterato si dice che si scambia l’ ordine d’integrazione.

7.2 Integrazione delle funzioni di tre variabili

L’integrazione delle funzioni di tre variabili si introduce in modo del tutto analogo a quella relativa a funzioni di due variabili. Prima di tutto si scelgono i domini di integrazione semplici: questi sono i solidi delimitati dai grafici di due funzioni, per esempio

ϕ (x, y) \leq z \leq ψ (x, y)

con $(x, y) \in 𝒟$ , dove $𝒟$ è un dominio di integrazione semplice per funzioni di due variabili. Anche i domini di integrazioni semplici per funzioni di tre variabili sono insiemi chiusi. Come dominio di integrazione per funzioni di tre variabili intendiamo l’unione di un numero finito di tali domini semplici, purché l’intersezione tra due qualsiasi di essi non contenga punti interni. Definiamo ora l’insieme delle funzioni integrabili. Una funzione definita su un dominio di integrazione si dice integrabile quando la sua restizione all’interno di ciascuno dei domini semplici ammette estensione continua al dominio semplice stesso. Ciò detto è facile dividere un dominio di integrazione in “piccoli” parallelepipedi e costruire le analoghe delle somme $s_{N}$ ed $S_{N}$ e quindi definire

\int_{𝒟} f (x, y, z) d x d y d z

come estremo comune ai due insiemi ${s_{N, L, K}}$ ed ${S_{N, L, K}}$ che ora verranno a dipendere da tre indici $N$ , $L$ , $K$ . Si ottiene cosìun integrale che si chiama anche integrale triplo

Osservazione 207 Per definizione, il volume di un dominio di integrazione $𝒟 \subseteq ℝ^{3}$ è

\int_{𝒟} 1 d x d y d z .

Le proprietà elencate al paragrafo 7.1.2 per gli integrali doppi valgono anche per gli integrali tripli. Per gli integrali tripli, il Teorema 210 si riformula come segue:

Teorema 208 Sia $(u, v, w) \mapsto (x (u, v, w), y (u, v, w), z (u, v, w))$ una trasformazione continua da un dominio di integrazione $𝒟_{1}$ ad un dominio di integrazione $𝒟$ . Supponiamo che la trasformazione ammetta derivate parziali continue nei punti interni di $𝒟_{1}$ e che le derivate abbiano estensione continua alla frontiera, e che il suo determinante jacobiano $J (u, v, w)$ non si annulli. Per ogni funzione $f (x, y, z)$ continua su $𝒟$ si ha:

\int_{𝒟} f (x, y, z) d x d y d z = \int_{𝒟_{1}} f (x (u, v, w), y (u, v, w), z (u, v, w)) J (u, v, w) d u d v d w .

Invece, il metodo di riduzione va esaminato esplicitamente.

7.3 Formula di riduzione per gli integrali tripli

Il calcolo degli integrali tripli si può ricondurre al calcolo di integrali iterati. Illustriamo il metodo nel caso particolare in cui il dominio di integrazione $𝒟$ è compreso tra due grafici

𝒟 = {(x, y, z) | ϕ (x, y) \leq z \leq ψ (x, y)} .

Indichiamo con

𝒟_{z} = {(x, y) | \exists w per cui (x, y, w) \in 𝒟}

ossia la proiezione ortogonale di $𝒟$ sul piano $z = 0$ . Dunque:

se $(x, y) \notin 𝒟_{z}$ allora la retta verticale per $(x, y)$ non interseca $𝒟$ ;
se $(x, y) \in 𝒟_{z}$ allora la retta verticale per $(x, y)$ interseca $𝒟$ nel segmento verticale di estremi $(x, y, ϕ (x, y))$ e $(x, y, ψ (x, y))$ . Si noti che questo segmento potrebbe essere ridotto ad un punto.

Vale:

\int_{𝒟} f (x, y, z) d x d y d z = \int_{𝒟_{z}} [\int_{ϕ (x, y)}^{ψ (x, y)} f (x, y, z) d z] d x d y .

In questo modo il calcolo dell’integrale triplo si è ricondotto al calcolo di un integrale semplice, seguito da quello di un integrale doppio⁴. Si veda la figura 7.4, a sinistra.

figura 7.4: Riduzione per fili e per strati di un integrale triplo

Si può anche procedere in modo diverso: supponiamo di sapere che $𝒟_{z}$ sia delimitato da due grafici, per esempio

𝒟_{z} = {(x, y) | h (y) \leq x \leq k (y)}

e sia $[a, b]$ il dominio comune ad $h (y)$ e $k (y)$ . Allora vale:

\int_{𝒟} f (x, y, z) d x d y d z = \int_{a}^{b} [\int_{{\tilde{𝒟}}_{y}} f (x, y, z) d x d z] d y

dove ${\tilde{𝒟}}_{y}$ è l’intersezione di $𝒟$ col piano parallelo agli assi $x$ e $z$ , passante per il punto $(0, y, 0)$ ⁵. Si veda la figura 7.4, a destra.

7.3.1 Integrazione e Cambiamento di variabili

Nel caso degli integrali semplici, sotto opportune ipotesi si prova la formula

\int_{a}^{b} f (x) d x = \int_{ϕ^{- 1} (a)}^{ϕ^{- 1} (b)} f (ϕ (t)) ϕ^{'} (t) d t .

Si noti però che $ϕ^{- 1} (a)$ può anche essere maggiore di $ϕ^{- 1} (b)$ , ciò che è lecito perché nel caso degli integrali semplici abbiamo definito l’integrale orientato. D’altra parte, questa formula non si prova usando direttamente le proprietà dell’integrale. Piuttosto si prova che questa formula vale per il calcolo delle primitive, e quindi anche per il calcolo dell’integrale grazie al teorema fondamentale del calcolo integrale. Mostriamo come a questa formula, sotto opportune ipotesi, si possa anche giungere direttamente dalla definizione di integrale semplice. Sia $f (x)$ una funzione continua definita su in intervallo $[a, b]$ e sia $x = ϕ (t)$ una funzione monotona strettamente crescente da un intervallo $[α, β]$ su $[a, b]$ , che è anche derivabile. Bisogna ricordare questi fatti:

nella definizione di integrale la suddivisione dell’intervallo $[a, b]$ non è necessariamente fatta mediante punti equidistanti;
nella definizione di integrale, si possono considerare le somme
$\sum_{i = 1}^{n} f (ξ_{i}) [a_{i + 1} - a_{i}]$ (7.4)

con punti $ξ_{i} \in (a_{i}, a_{i + i})$ qualsiasi.

Quando la finezza della partizione tende a zero, le somme (7.4) tendono all’integrale

\int_{a}^{b} f (x) d x .

Essendo la funzione $ϕ$ monotona e suriettiva, ogni $a_{i}$ proviene da un unico $α_{i}$ ,

a_{i} = ϕ (α_{i}) .

Dunque la somma (7.4) è anche uguale a

\sum_{i = 1}^{n} f (ξ_{i}) [ϕ (α_{i + 1}) - ϕ (α_{i})] .

Questa non è una somma di quelle che conducono alla definizione di un integrale, ma ad essa facilmente si riconduce. Infatti, dal Teorema di Lagrange, esiste un punto $c_{i}$ tale che

[ϕ (α_{i + 1}) - ϕ (α_{i})] = ϕ^{'} (c_{i}) (α_{i + 1} - α_{i}) .

Ricordando che i numeri $ξ_{i}$ si possono scegliere in modo arbitrario, scegliamo $ξ_{i} = ϕ (c_{i})$ . La monotonia di $ϕ$ mostra che $c_{i} \in (α_{i}, α_{i + 1})$ . In questo modo la (7.4) diviene

\sum_{i = 1}^{n} f (ϕ (c_{i})) ϕ^{'} (c_{i}) [α_{i + 1} - α_{i}] .

(7.5)

La finezza della partizione di $[a, b]$ tende a zero se e solo se tende a zero la finezza della partizione di $[α, β]$ . Quando la finezza della partizione tende a zero, le somme (7.4) tendono all’integrale di $f (x)$ , quelle di (7.5) tendono all’integrale di $f (ϕ (t)) ϕ^{'} (t)$ . D’altra parte le due somme hanno lo stesso valore e quindi si trova

\int_{a}^{b} f (x) d x = \int_{α}^{β} f (ϕ (t)) ϕ^{'} (t) d t .

Osservazione 209 Notiamo esplicitamente:

in questo calcolo la crescenza di

ϕ

si è usata: è

α_{i} < α_{i + 1}

proprio perchè

ϕ

è crescente. Se invece

ϕ

decresce, sarà

β < α

e in (7.5) si ha

α_{i + 1} < α_{i}

e quindi al limite si trova

\int_{a}^{b} f (x) d x = \int_{α}^{β} f (ϕ (t)) ϕ^{'} (t) d t .

Ma ora $β < α$ e quindi riordinando l’ordine degli estremi di integrazione si trova

\begin{aligned} \int_{a}^{b} f (x) d x = - \int_{β}^{α} f (ϕ (t)) ϕ^{'} (t) d t \\ = \int_{β}^{α} f (ϕ (t)) [- ϕ^{'} (t)] d t = \int_{β}^{α} f (ϕ (t)) | ϕ^{'} (t) | d t . \end{aligned}

il ruolo del numero $ϕ^{'} (c)$ : è il coeffciente che trasforma la lunghezza di $[α_{i}, α_{i + 1}]$ nella lunghezza di $[a_{i}, a_{i + 1}]$ . Si noti che se $ϕ^{'}$ non si annulla su $[a, b]$ (estremi inclusi) esistono numeri $m$ , $M$ tali che $m | α_{i} - α_{i + 1} | \leq | a_{i} - a_{i + 1} | \leq M | α_{i} - α_{i + 1} | .$
Nel caso degli integrali semplici, la formula vale anche senza richiedere la monotonia di $ϕ$ perchè, intuitivamente, se per $t$ che percorre $[α, β]$ il punto $ϕ (t)$ percorre più volte un intervallo $[x^{'}, x^{″}] \subseteq [a, b]$ , deve percorrerlo un numero dispari di volte, in versi opposti; e grazie all’esistenza dell’integrale orientato, i contributi dei passaggi $2$ e $3$ si elidono, lo stesso per i passaggi $4$ e $5$ ecc. Un fenomeno analogo non potrà aversi per funzioni di più variabili e quindi in tal caso dovremo imporre a $ϕ$ di essere biunivoca. _

Vediamo ora quali problemi si incontrano nel cercare di estendere il ragionamento appena fatto a funzioni di più variabili. In questo caso dovremo avere $f (x, y)$ definita su un dominio di integrazione $𝒟$ e dovremo avere una trasformazione $(x, y) = Φ (u, v) = (ϕ_{1} (u, v), ϕ_{2} (u, v))$ da un dominio di integrazione $𝒟^{'}$ nel dominio di integrazione $𝒯$ . La $Φ$ dovrà essere biunivoca da $𝒟^{'}$ su $𝒟$ e differenziabile (un’ulteriore condizione si dirà in seguito). L’integrale di $f (x, y)$ si definisce suddividendo $𝒟$ in tanti piccoli rettangoli, diciamo $R_{i}$ . Un rettangolo $R_{i}$ è immagine mediante $Φ$ di un sottoinsieme $R_{i}^{'}$ di $𝒟^{'}$ che però non è un rettangolo. Se la $Φ$ è lineare $R^{'}$ è un parallelogramma, altrimenti è una figura più complessa. Ciò nonostante, si potrà tentare di ripetere gli argomenti visti sopra se:

si potrà trovare una relazione tra l’area di $R_{i}$ e quella di $R_{i}^{'}$ ;
l’area dei rettangoli $R_{i}$ tende a zero se e solo se l’area degli insiemi $R_{i}^{'}$ tende a zero.

La relazione tra l’area di $R_{i}$ e quella di $R_{i}^{'}$ è nota nel caso in cui la trasformazione $Φ$ sia lineare: è

(area di R_{i}) = | det Φ | (area di R_{i}^{'}) .

Qui $Φ$ indica la matrice della trasformazione $Φ$ , calcolata rispetto a coordinate ortogonali. Nel caso non lineare una formula analoga alla precedente ancora vale, con un errore che è di ordine superiore rispetto all’area di $R^{'}$ , quando questa tende a zero. Questo risponde alla prima questione. La seconda richiesta, l’area degli $R_{i}$ tende a zero se e solo se l’area degli $R_{i}^{'}$ tende a zero, è soddisfatta quando $det Φ \neq 0$ su $𝒟^{'}$ . Con queste informazioni, nel caso in cui $Φ$ sia una trasformazione lineare è relativamente facile provare il risultato seguente, mimando la dimostrazione vista sopra per il caso di funzioni di una variabile. Nel caso in cui $Φ$ sia non lineare, il risultato seguente vale ancora ma la dimostrazione è piuttosto complessa:

Teorema 210 Siano $𝒟$ e $𝒟^{'}$ due domini di integrazione. Sia

(x, y) = Φ (u, v) = (ϕ_{1} (u, v), ϕ_{2} (u, v))

una trasformazione invertibile da $𝒟^{'}$ su $𝒟$ . Supponiamo che questa trasformazione sia di classe $C^{1}$ su una regione $Ω$ che contiene $𝒟^{'}$ . Sia $det J (u, v)$ lo jacobiano della trasformazione. Supponiamo che $det J (u, v)$ non si annulli su $𝒟^{'}$ . Sotto queste condizioni vale:

\int_{𝒟} f (x, y) d x d y = \int_{𝒟^{'}} f (ϕ_{1} (u, v), ϕ_{2} (u, v)) \cdot | det J (u, v) | d u d v .

Come abbiamo detto, questo teorema estende il teorema di cambiamento di variabili negli integrali semplici. Nell’uso però esso ha un ruolo diverso. Nel caso degli integrali semplici il metodo di cambiamento di variabili si usa per trasformare la funzione in una di cui sia più facile trovare la primitiva. Nel caso degli integrali doppi si usa la trasformazione di variabili per passare da un dominio più complicato ad uno più semplice. Per esempio, si voglia calcolare

\int_{𝒟} \sqrt{x^{2} + y^{2}} d x d y

con $𝒟$ la circonferanza $x^{2} + y^{2} \leq 1$ . Esprimendo $x$ ed $y$ mediante le coordinate polari $ρ$ e $𝜃$ , si trova

x = ρ cos 𝜃, y = ρ sin 𝜃, 0 \leq ρ \leq 1, 0 \leq 𝜃 \leq 2 π .

Notando che lo jacobiano della trasformazione è semplicemente $ρ$ , il calcolo richiesto si riduce a quello dell’integrale iterato

\int_{0}^{2 π} [\int_{0}^{1} ρ^{2} d ρ] d 𝜃 = \frac{2}{3} π .

Osservazione 211 Si noti che lo jacobiano della trasformazione a coordinate polari si annulla nell’origine e quindi il Teorema 210 a rigore non può applicarsi. Si applichi però il teorema ad una corona circolare $𝜖 \leq ρ \leq 1$ e poi si mandi $𝜖$ a zero. Il Teorema 206 mostra che il contributo della circonferenza di raggio $𝜖$ tende a zero e ciò giustifica l’uso delle coordinate polari per il calcolo precedente. _

7.4 Alcuni jacobiani che è importante ricordare

Le trasformazioni di coordinate che si usano più comunemente sono le trasformazioni a coordinate polari o ellittiche nel piano, a coordinate cilindriche o sferiche nello spazio. Si ha:

Si noti che nella formula di cambiamento di coordinate per gli integrali multipli compare il valore assoluto dello jacobiano, mentre la tavola precedente riporta lo jacobiano per sottolineare che i sistemi di coordinate che abbiamo introdotto, con le coordinate che si susseguono nell’ordine indicato nella definizione delle coordinate, hanno jacobiano positivo. Dunque la matrice jacobiana di tali trasformazioni non altera l’orientazione di $ℝ^{3}$ .

7.4.1 Volumi delimitati da superfici di rotazione

Consideriamo il grafico di una funzione sul piano $(y, z)$ , descritto dall’equazione $z = f (y)$ . Per fissare le idee, supponiamo che la funzione sia definita (e continua) su $[0, Y]$ e che prenda valori positivi. Facendo ruotare i punti del grafico intorno all’asse $z$ , si trova la superficie descritta dall’equazione

z = f (\sqrt{x^{2} + y^{2}}) .

Si vuol calcolare il volume dell’insieme

V = \{(x, y, z) | 0 \leq z \leq f (\sqrt{x^{2} + y^{2}})\};

ossia il volume dell’insieme compreso tra il piano $z = 0$ e la superficie. Vogliamo quindi calcolare

\int_{V} d x d y d z .

Passiamo a coordinate cilindriche

\{\begin{matrix} x & = & r cos 𝜃 \\ y & = & r sin 𝜃 \\ z & = & z . \end{matrix}

Si calcola facilmente che lo jacobiano della trasformazione è $r$ . Dunque va calcolato

\int_{ℛ} r d r d z d 𝜃 .

L’insieme $ℛ$ è ora

ℛ = \{(r, 𝜃, z) | 0 \leq 𝜃 \leq 2 π, 0 \leq r \leq Y, 0 \leq z \leq f (r)\} .

Dunque, riducendo l’integrale triplo ad integrali iterati si trova

V = \int_{0}^{2 π} [\int_{0}^{Y} [\int_{0}^{f (r)} 1 \cdot r d z] d r] d 𝜃 = 2 π \int_{0}^{Y} r f (r) d r .

(7.6)

Supponiamo invece che il grafico che si fa ruotare sia dato mediante una funzione $y = f (z)$ , $0 \leq z \leq Z$ . Passando a coordinate cilindriche

\{\begin{matrix} x & = & r cos 𝜃 \\ y & = & r sin 𝜃 \\ z & = & z, \end{matrix}

si deve integrare ora sull’insieme

\tilde{ℛ} = \{(r, 𝜃, z) | 0 \leq 𝜃 \leq 2 π, 0 \leq z \leq Z, 0 \leq r \leq f (z)\} .

Dunque,

V = \int_{V} 1 d x d y d z = \int_{0}^{2 π} [\int_{0}^{z} (\int_{0}^{f (z)} 1 \cdot r d r) d z] d 𝜃 = π \int_{0}^{Z} f^{2} (z) d z .

(7.7)

Questa formula si chiama Formula di Guldino L’interpretazione geometrica di queste formule si capisce facilmente approssimando gli integrali semplici mediante le somme di Riemann, che conducono alla definizione stessa degli integrali. Consideriamo prima di tutto l’integrale (7.6). Consideriamo una partizione dell’intervallo $[0, Y]$ mediante i punti $y_{i}$ . Le somme di Riemann inferiori hanno forma

2 π [\sum r_{i} f (r_{i}) (y_{i + 1} - y_{i})]

ove $r_{i}$ è un punto di minimo della funzione $r f (r)$ nell’intervallo $[y_{i + 1}, y_{i}]$ . Il punto $(0, r_{i}, 0)$ dell’assse delle ordinate ruota, per descrivere la superficie, sulla circonferenza di raggio $r_{i}$ . Dunque, $2 π r_{i} (y_{i + 1} - y_{i})$ è circa l’area della corona circolare descritta, durante la rotazione, dal segmento $[y_{i + 1}, y_{i}]$ . Dunque, $2 π r_{i} (y_{i + 1} - y_{i}) f (r_{i})$ è (circa) il volume del più alto “guscio cilindrico” che insiste su tale corona circolare, e che è sotto al grafico della funzione. Invece, le somme di Riemann dell’integrale (7.7) si ottengono dividendo il segmento $[0, Z]$ con i punti $z_{i}$ . Le somme di Riemann sono

π [\sum f^{2} ({\tilde{z}}_{i}) (z_{i + 1} - z_{i})], {\tilde{z}}_{i} \in [z_{i}, z_{i + 1}] .

Ciascun addendo $π f^{2} ({\tilde{z}}_{i}) (z_{i + 1} - z_{i})$ rappresenta circa il volume di un cilindretto di raggio $f ({\tilde{z}}_{i})$ e base sul segmento $[z_{i + 1}, z_{i}]$ : in questo caso il volume si approssima come somma dei volumi di tali cilindretti. La figura 7.5 illustra a sinistra il primo ed a destra il secondo caso (il volume da calcolare è quello del solido compreso tra la parte di paraboloide disegnata ed il piano $z = 0$ ).

figura 7.5: Volume di una superficie di rotazione

7.5 Appendici

7.5.1 Appendice: Integrali impropri

Nel caso degli integrali di una variabile, è stato naturale definire

\int_{0}^{+ \infty} f (x) d x = lim_{R \to + \infty} \int_{0}^{R} f (x) d x .

Una definizione analoga nel caso di integrali doppi è è molto più delicata. Per vedere la ragione, consideriamo una funzione $f (x, y)$ definita su un insieme illimitato $I$ , che interseca ogni disco

D_{R} = {(x, y) | x^{2} + y^{2} \leq R^{2}}

in un dominio di integrazione. Allora, si può definire

\int_{I} f (x, y) d x d y = lim_{R \to + \infty} \int_{I \cap D_{R}} f (x, y) d x d y .

Però questa definizione privilegia i dischi. Niente garantisce che si giunga al medesimo limite se, invece di dischi, si considerano i quadrati

Q_{R} = {(x, y) | | x | \leq R, | y | \leq R} .

L’esempio seguente mostra che in generale usando dischi od usando quadrati si trovano comportamenti diversi.

Esempio 212 L’insieme $I$ è il primo quadrante e la funzione che si considera è

f (x, y) = sin (x^{2} + y^{2}) .

L’integrale si $D_{R}$ si calcola immediatamente passando a coordinate polari:

\int_{D_{R}} f (x, y) d x d y = \frac{π}{4} (1 - cos R^{2}),

privo di limite per $R \to + \infty$ . L’integrale su $Q_{R}$ si calcola in coordinate cartesiane:

\begin{aligned} \int_{Q_{R}} f (x, y) d x d y = \int_{Q_{R}} (sin x^{2} cos y^{2} + cos x^{2} sin y^{2}) d x d y \\ = [\int_{0}^{R} sin x^{2} d x] [\int_{0}^{R} cos y^{2} d y] + [\int_{0}^{R} cos x^{2} d x] [\int_{0}^{R} sin y^{2} d y] . \end{aligned}

Questi integrali non possono calcolarsi in modo esplicito, ma è possibile provare che il limite per $R \to + \infty$ è finito. Infatti, si consideri per esempio

\int_{0}^{R} cos x^{2} d x = \int_{0}^{1} cos x^{2} d x + \int_{1}^{+ \infty} cos x^{2} d x .

Integrando per parti, proviamo che è finito il limite⁶:

lim_{R \to + \infty} \int_{1}^{R} cos x^{2} d x .

\begin{aligned} \int_{1}^{R} cos x^{2} d x = \int_{1}^{R} [2 x cos x^{2}] \frac{1}{2 x} d x = \int_{1}^{R} \frac{1}{2 x} d sin x^{2} \\ = \frac{1}{2 R} sin R^{2} - sin 1 + \int_{1}^{R} \frac{1}{2 x^{2}} sin x^{2} d x . \end{aligned}

E ora,

lim_{R \to + \infty} \frac{1}{2 R} sin R^{2} = 0

mentre

lim_{R \to + \infty} \int_{1}^{R} \frac{1}{2 x^{2}} sin x^{2} d x

esiste finito perché $| \frac{1}{2 x^{2}} sin x^{2} | < M ∕ x^{2}$ ed

\int_{1}^{+ \infty} 1 ∕ x^{2} d x = 1 .

Si può però provare che se esiste finito

lim_{R \to + \infty} \int_{D_{R}} | f (x, y) | d x d y

(7.8)

allora esiste finito

lim_{R \to + \infty} \int_{D_{R}} f (x, y) d x d y .

Sia inoltre $𝒟_{n}$ una successione di domini di integrazione con questa proprietà: esiste un disco di raggio $R_{n}$ contenuto in $𝒟_{n}$ , ed $R_{n} \to + \infty$ . Se vale (7.8) allora

lim_{R \to + \infty} \int_{𝒟_{R}} f (x, y) d x d y = lim_{R \to + \infty} \int_{D_{R}} f (x, y) d x d y .

Questo numero si chiama integrale improprio su $ℝ^{2}$ e la condizione (7.8) assicura che l’integrale improprio non dipende dal modo con cui viene calcolato, usando gli insiemi $𝒟_{n}$ con la proprietà suddetta⁷, che $𝒟_{n}$ contiene un disco di raggio $R_{n} \to + \infty$ . Considerazioni del tutto analoghe valgono anche nel caso in cui si consideri una funzione $f (x, y)$ definita su un dominio di integrazione $𝒟$ , ma tale che

lim_{(x, y) \to (x_{0}, y_{0})} | f (x, y) | = + \infty .

Sia $D_{𝜖}$ un dico di raggio $𝜖 > 0$ e centro $(x_{0}, y_{0})$ e supponiamo che $f (x, y)$ sia integrabile su $𝒟 - D_{𝜖}$ . Supponiamo che

lim_{𝜖 \to 0} \int_{𝒟 - D_{𝜖}} | f (x, y) | d x d y = L < + \infty .

(7.9)

Allora esiste finito anche il limite seguente, che si chiama l’integrale improprio di $f (x, y)$ su $𝒟$ :

lim_{𝜖 \to 0} \int_{𝒟 - D_{𝜖}} f (x, y) d x d y .

Anche in questo caso, la condizione (7.9) assicura che i dischi non hanno ruolo privilegiato nella definizione dell’integrale.

Esempio 213 Sia $D$ il disco di centro $(0, 0)$ e raggio $1$ e sia

f (x, y) = \frac{1}{{[\sqrt{x^{2} + y^{2}}]}^{γ}} .

Vogliamo capire per quali valori di $γ$ la funzione $f (x, y)$ è integrabile su $D$ . Si deve quindi calcolare

\int_{D - D_{𝜖}} \frac{1}{{[\sqrt{x^{2} + y^{2}}]}^{γ}} d x d y .

Passando a coordinate polari, è immediato calcolare che quest’integrale è

2 π \int_{𝜖}^{1} ρ \frac{1}{ρ^{γ}} d ρ .

Il limite per $𝜖 \to 0$ esiste finito se e solo se

1 - γ > - 1 ossia se γ < 2 .

Si confronti col caso delle funzioni di una variabile:

\int_{0}^{1} \frac{1}{x^{γ}} d x

esiste se e solo se $γ < 1$ .

Considerazioni del tutto analoghe valgono per gli integrali tripli. In particolare, si consideri l’analogo dell’esempio 213 e si provi che

\int_{x^{2} + y^{2} + z^{2} < 1} \frac{1}{{[\sqrt{x^{2} + y^{2} + z^{2}}]}^{γ}} d x d y d z

esiste finito se e solo se $γ < 3$ .

7.5.2 Appendice: Teorema dei valori intermedi e Teorema di Brower

Il Teorema dei valori intermedi per funzioni a valori reali e continue su una regione connessa è stato provato al cap. 4, si veda il Teorema 130. Mostriamo che la formula di cambiamento di variabili per gli integrali impropri permette di provare un teorema dei valori intermedi anche per funzioni da $ℝ^{3}$ in sé:

Teorema 214 (dei valori intermedi) Sia $ϕ (\vec{r})$ una funzione che trasforma la palla

B = {\vec{r} = (x, y, z) | | | \vec{r} | |^{2} = x^{2} + y^{2} + z^{2} \leq 1}

in se stessa e che inoltre

è biunivoca;
è di classe $C^{1}$
verifica $ϕ (\vec{r}) = \vec{r}$ nei punti della frontiera di $B$ ; ossia nei punti tali che $| | \vec{r} | | = 1$ .

Sotto queste ipotesi, la trasformazione $ϕ (\vec{r})$ è suriettiva.

Dim. Per assurdo, supponiamo che esista un punto ${\vec{r}}_{0}$ che non appartiene all’immagine di $ϕ$ . Mostreremo in seguito che esiste una sferetta⁸ $B_{1}$ di centro ${\vec{r}}_{0}$ nessuno dei cui punti appartiene all’immagine di $ϕ$ . Sia $𝜖 > 0$ il raggio di $B_{1}$ . Sia $f (\vec{r})$ la funzione cosìdefinita:

$f (\vec{r}) = 1$ se $\vec{r} \in B$ , $| | \vec{r} - {\vec{r}}_{0} | | < 𝜖 ∕ 2$ ;
$f (\vec{r}) = 0$ altrimenti.

La funzione $f (\vec{r})$ non è continua ma è integrabile e

\int_{B} f (x, y, z) d x d y d z > 0 .

Calcoliamo quest’integrale usando la formula di sostituzione di variabile: L’integrale è anche uguale a

\int_{B} f (ϕ (x, y, z)) J_{ϕ} (x, y, z) d x d y d z .

Quest’integrale però è nullo, perché $ϕ (x, y, z)$ prende valori solo nell’insieme in cui la funzione $f (x, y, z)$ è nulla. Questa contraddizione prova che il punto ${\vec{r}}_{0}$ non può esistere. Per completare la dimostrazione, mostriamo ora l’esistenza della palla $B_{𝜖}$ . Proviamo che se la palla $B_{𝜖}$ non esiste allora anche ${\vec{r}}_{0}$ appartiene all’immagine di $ϕ$ . Supponiamo quindi che ogni palla di centro ${\vec{r}}_{0}$ contenga punti dell’immagine di $ϕ$ . In tal caso, esiste una successione ${{\vec{r}}_{n}}$ di punti di $B$ tale che $ϕ ({\vec{r}}_{n}) \to {\vec{r}}_{0}$ . Per il Teorema di Bolzano-Weierstrass, la successione ${{\vec{r}}_{n}}$ ammette una s.successione convergente: ${\vec{r}}_{n_{k}} \to \hat{\vec{r}}$ e

lim_{k} ϕ ({\vec{r}}_{n_{k}}) = ϕ ({\vec{r}}_{0}) .

Dunque, per continuità si ha

ϕ (\hat{\vec{r}}) = ϕ ({\vec{r}}_{0}) .

Ciò completa la dimostrazione. _ Naturalmente, la dimostrazione precedente può applicarsi al caso di funzioni definite su $ℝ^{2}$ .

Osservazione 215 E’ possibile provare che il teorema precedente vale supponendo solamente che la funzione $ϕ (\vec{r})$ sia continua e verifichi $ϕ (\vec{r}) = \vec{r}$ se $| | \vec{r} | | = 1$ , senza richiedere né l’esistenza delle derivate né la biunivocità. _

Un corollario importante è il seguente:

Corollario 216 Non esiste una funzione $ϕ (\vec{r})$ continua in $B$ e tale che

$ϕ (\vec{r}) = \vec{r}$ se $| | \vec{r} | | = 1$ ;
$| | ϕ (\vec{r}) | | = 1$ per ogni $\vec{r} \in B$ .

Dim. Infatti, una tale funzione violerebbe il teorema dei valori intermedi. _ Il teorema precedente ha una conseguenza importante, che va sotto il nome di Teorema di punto fisso di Brower

Teorema 217 Sia $ψ (\vec{r})$ una funzione continua che trasforma la palla (chiusa) $B$ in se stessa. Esiste un punto ${\vec{r}}_{0} \in B$ tale che

ψ ({\vec{r}}_{0}) = {\vec{r}}_{0} .

Dim. Accenniamo alla dimostrazione. Supponiamo che tale punto non esista. Allora, per ogni $\vec{r} \in B$ si ha $ψ (\vec{r}) \neq \vec{r}$ . Consideriamo la semiretta di estremo $ψ (\vec{r})$ e che passa per $\vec{r}$ . Questa semiretta taglia la superficie della sfera in un punto che dipende da $\vec{r}$ . Associando ad $\vec{r}$ tale punto, si costruisce una funzione $ϕ (\vec{r})$ che verifica

\begin{aligned} | ϕ (\vec{r}) | = 1 per ogni \vec{r}, \\ ϕ (\vec{r}) = \vec{r} s e | | \vec{r} | | = 1 . \end{aligned}

Inoltre, si potrebbe provare che la funzione $ϕ (\vec{r})$ è continua. Il Corollario 216 mostra che tale funzione non può esistere. Si noti che la funzione $ϕ (\vec{r})$ non è biunivoca e nemmeno di classe $C^{1}$ . Però, abbiamo detto che il Teorema 214 vale con la sola ipotesi che la $ϕ (\vec{r})$ sia continua, si veda l’osservazione 215. E quindi questa è la sola ipotesi necessaria per il Corollario 216. _

Capitolo 8
Integrali di curva e di superficie

Studiamo ora gli integrali definiti, invece che su intervalli o su parti di piano, su curve e su superfici. Conviene premettere alcune considerazioni sui limiti di funzioni definite su curve e, successivamente, su superfici.

In questa parte introdurremo certe notazioni e anche certi termini che non sono affatto standardizzati. Riassumiamo alcuni termini nella tabella seguente

\begin{matrix} Termine che uso io & Altri termini \\ integrale di curva di prima specie & ntegrale curvilineo; integrale curvilineo di prima specie. \\ integrale di curva di seconda specie & integrale di linea; integrale di linea di seconda specie. \\ integrale di superficie di prima specie & integrale superficiale. \\ integrale di superficie di seconda specie & integrale di superficie; integrale di ﬂusso. \end{matrix}

Il fatto da ricordare è questo: gli integrali di prima specie integrano funzioni (a valori reali) definite su curve o su superfici; gli integrali di seconda specie integrano campi vettoriali definiti su curve o su superfici.

N.B. Per ragioni tipografiche, alcune figure di questo capitolo si trovano alla fine del capitolo stesso.

8.1 Funzioni definite su curve: la densità

Funzioni definite su curve, anche a valori vettoriali, si sono già incontrate: abbiamo incontrato il campo vettoriale che ad ogni punto di una curva associa la tangente oppure la normale alla curva nel punto stesso. Queste funzioni possono intendersi come funzioni definite, per esempio, su $ℝ^{3}$ , con dominio il sostegno della curva. La definizione dei limiti per tali funzioni presenta però una particolarità che va evidenziata. Sia $γ$ una curva semplice e regolare, parametrizzata da

t \to \vec{r} (t), t \in [a, b] .

La curva è semplice. Dunque, ogni coppia di punti ${\vec{r}}_{0}$ e ${\vec{r}}_{1}$ di $γ$ individua un arco

\vec{r} (t), s \in [t_{0}, t_{1}],

con $t_{0}$ ed $t_{1}$ gli unici valori del parametro che verificano

{\vec{r}}_{0} = \vec{r} (t_{0}), {\vec{r}}_{1} = \vec{r} (t_{1}) .

Introduciamo la notazione $γ_{{\vec{r}}_{0}, {\vec{r}}_{1}}$ per indicare quest’arco e la notazione $L_{γ ({\vec{r}}_{0}, {\vec{r}}_{1})}$ per indicarne la lunghezza (si veda il paragrafo (6.1.2):

L_{γ ({\vec{r}}_{0}, {\vec{r}}_{1})} = \int_{t_{0}}^{t_{1}} | {\vec{r}}^{'} (ν) | d ν .

Sia $f (\vec{r})$ una funzione definita nei punti del sostegno di $γ$ . Chiamiamo densità della funzione $f$ nel punto ${\vec{r}}_{0} = \vec{r} (t_{0}) \in γ$ il limite seguente:

ρ_{f} ({\vec{r}}_{0}) = lim_{h \to 0} \frac{f (\vec{r} (t_{0} + h)) - f (\vec{r} (t_{0}))}{L_{γ (\vec{r} (t_{0}), \vec{r} (t_{0} + h))}} .

(8.1)

Notare che il rapporto incrementale ha per denominatore non lo scarto $h$ del parametro, ma la lunghezza dell’arco che congiunge $\vec{r} (t_{0})$ con $\vec{r} (t_{0} + h)$ . Naturalmente, il denominatore è lo scarto del parametro se il parametro è $s$ , il parametro d’arco. Se l’arco rappresenta un “filo” di materiale non omogeneo e se $f (\vec{r})$ rappresenta la massa totale tra l’estremo $\vec{r} (a)$ e il punto $\vec{r}$ della curva, allora il limite precedente, se esiste, rappresenta la usuale densità di massa del “filo”. Però, la funzione $f (\vec{r})$ non è necessariamente positiva, e potrebbe essere una componente di un campo vettoriale, caso che si è già incontrato definendo la normale a $γ$ in ${\vec{r}}_{0}$ . Infatti, la definizione di limite (8.1) è quella usata nella definizione del versore normale.

8.2 Gli integrali di curva

Integrali di funzioni definite su curve possono definirsi in vari modi. Per dare definizioni significative, è necessario avere come guida degli esempi tratto dalla fisica. Prendiamo come guida il problema di calcolare la massa totale di un “filo”, nota la sua densità e il problema di calcolare il lavoro di una campo di forze su un punto che si muove lungo una curva. Il primo esempio conduce alla definizione di integrale di curva di prima specie mentre il secondo esempio conduce alla definizione di integrale di curva di seconda specie.

8.2.1 Integrali di curva di prima specie

Consideriamo l’esempio seguente:

Esempio 218 supponiamo che $t \to \vec{r} (t)$ , $t \in [a, b]$ parametrizzi un arco realizzato con un materiale non omogeneo, di densità $ρ (\vec{r})$ . Ricordando la definizione di densità, la massa dell’arco si approssima dividendolo in segmenti di lunghezza $δ$ , molto piccola, e sommando la massa dei singoli pezzetti. Il modo migliore di fare ciò, anche se non necessariamente il più semplice dal punto di vista del calcolo, consiste nel ricondursi alla parametrizzazione canonica, rappresentando l’arco come $s \to \vec{r} (s)$ , $s \in [0, L]$ ; dividere $[0, L]$ con $N$ punti $s_{i}$ , $s_{i} = i L ∕ N$ e quindi costruire

\sum_{i = 0}^{N - 1} ρ (\vec{r} (s_{i})) [s_{i + 1} - s_{i}] = \sum_{i = 0}^{N - 1} ρ (\vec{r} (s_{i})) L ∕ N .

Studiare quindi il comportamente di queste somme per $N \to + \infty$ , ossia quando la finezza della suddivisione dell’arco tende a zero. Questa è niente altro che la costruzione dell’integrale della funzione $s \to ρ (\vec{r} (s))$ sull’intervallo $[0, L]$ . _

Sia ora $f (\vec{r})$ una generica funzione, per semplicità continua. L’esempio precedente suggerisce di definire

\int_{γ} f (\vec{r}) d s

come segue: prima rappresentiamo l’arco in forma canonica, ossia mediante il parametro d’arco e quindi definiamo

\int_{γ} f (\vec{r}) d s =_{d e f} \int_{0}^{L} f (\vec{r} (s)) d s .

(8.2)

Questa definizione richiede che l’arco $γ$ sia regolare, ed è suggerita dal significato fisico che vogliamo attribuire all’integrale. Per il calcolo pratico conviene però evitare di rappresentare in forma canonica l’arco. Conviene di più lavorare con la parametrizzazione $\vec{r} (t)$ , $t \in [a, b]$ , inizialmente assegnata. Notiamo che si passa dalla parametrizzazione $\vec{r} = \vec{r} (t)$ alla parametrizzazione canonica per mezzo del cambiamento di variabile $t = t (s)$ . Dunque l’integrale a destra di (8.2) è, in realtà,

\int_{0}^{L} f (\vec{r} (t (s))) d s .

Ossia, in (8.2), solo per semplicità di notazioni, abbiamo sostituito il simbolo $\vec{r} (s)$ alla notazione più completa $\vec{r} (t (s))$ . La funzione $s = s (t)$ , ossia la funzione inversa della funzione $t (s)$ , è derivabile, con derivata

s^{'} (t) = | {\vec{r}}^{'} (t) | .

La sostituzione di variabile $s = s (t)$ nell’integrale a destra di (8.2) mostra che vale:

\int_{γ} f (\vec{r}) d s = \int_{a}^{b} f (\vec{r} (t)) | {\vec{r}}^{'} (t) | d t .

(8.3)

Se l’arco è in $ℝ^{3}$ , quest’integrale è

\int_{a}^{b} f (\vec{r} (t)) \sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}} d t .

Se l’arco è cartesiano, parametrizzata da

y = y (x), z = z (x), x \in [a, b]

allora

\int_{γ} f (\vec{r}) d s = \int_{a}^{b} f (x, y (x), z (x)) \sqrt{1 + {[y^{'} (x)]}^{2} + {[z^{'} (x)]}^{2}} d x .

L’integrale appena definito si chiama integrale di curva di prima specie. La definizione stessa mostra che esso non dipende dalla parametrizzazione scelta per rappresentare la curva. Più ancora, se si cambia la variabile $t$ mediante la trasformazione $t = t (τ) = b + a - τ$ , $τ \in [a, b]$ , il valore dell’integrale non cambia, ossia:

Teorema 219 l’integrale di curva di prima specie non cambia né cambiando la parametrizzazione né cambiando il verso di percorrenza dell’arco.

Il fatto che l’integrale di curva di prima specie non dipenda dalla parametrizzazione mostra che, per ogni fissata funzione $f (τ)$ , esso è una proprietà geometrica della curva. Il fatto che l’integrale di curva di prima specie non cambi valore cambiando il verso di percorrenza si scrive come segue:

\int_{- γ} f (\vec{r}) d s = \int_{γ} f (\vec{r}) d \vec{s}

Notiamo infine la disuguaglianza seguente:

Teorema 220 Sia $f (\vec{r})$ una funzione continua e sia $| f (\vec{r}) | < M$ in ogni punto $\vec{r}$ del sostegno di $γ$ . Allora,

|\int_{γ} f (\vec{r}) d s| \leq M L_{γ} .

In particolare, si consideri un arco $γ$ parametrizzato da

γ : t \to \vec{r} (t), t \in [a, b]

ed una sua parte $γ_{𝜖}$ parametrizzata da

γ_{𝜖} : t \to \vec{r} (t), t \in [a, 𝜖] .

Vale

lim_{𝜖 \to a +} \int_{γ_{𝜖}} f (\vec{r}) d s = 0 .

(8.4)

Notiamo infine che se si divide un arco $γ$ $γ_{1}$ e $γ_{2}$ ,

\begin{aligned} γ : t \to \vec{r} (t), t \in [a, c] \\ γ_{1} : t \to \vec{r} (t), t \in [a, b]; γ_{2} : t \to \vec{r} (t), t \in [b, c]; \end{aligned}

allora vale

\int_{γ} f (\vec{r}) d s = \int_{γ_{1}} f (\vec{r}) d s + \int_{γ_{2}} f (\vec{r}) d s .

(8.5)

Osservazione 221 La definizione di integrale di curva di prima specie è stata data assumendo che l’arco sia regolare. La (8.5) mostra come definire l’integrale nel caso di un arco regolare a tratti: se l’arco $γ$ si “decompone” in (per esempio) due sottoarchi $γ_{1}$ e $γ_{2}$ regolari, si sceglie la (8.5) come definizione di integrale su $γ$ . _

8.2.2 Integrali di curva di seconda specie

La definizione che ora andiamo a dare generalizza quella che si usa in fisica per il calcolo di un lavoro.

Esempio 222 Supponiamo che in ogni punto $\vec{r}$ dello spazio agisca una forza $\vec{F} (\vec{r}) = \vec{F} (x, y, z) = f (x, y, z) \vec{i} + g (x, y, z) \vec{j} + h (x, y, z) \vec{k}$ . Un punto materiale di massa $m$ sia vincolato a descrivere un arco $\vec{r} (t)$ , $t \in [a, b]$ . Il parametro $t$ rappresenta ora il tempo. Si vuol valutare il lavoro compiuto dalla forza. Dividendo ancora il percorso del punto in tanti “piccoli pezzetti”, interessa ora valutare il prodotto scalare della forza agente su ciascun “pezzetto” per lo spostamento del punto. Lo spostamento è un vettore, a differenza della lunghezza percorsa che è un numero. Quando $t$ varia da $t_{i}$ a $t_{i + 1}$ lo spostamento è circa ${\vec{r}}^{'} (t_{i}) (t_{i + 1} - t_{i})$ e quindi il lavoro compiuto è circa

[\vec{F} (\vec{r} (t_{i})) \cdot {\vec{r}}^{'} (t_{i})] (t_{i + 1} - t_{i}) .

La somma di tutti questi “lavori elementari” è

\sum_{i = 0}^{N - 1} [\vec{F} (\vec{r} (t_{i})) \cdot {\vec{r}}^{'} (t_{i})] (t_{i + 1} - t_{i})

e, per calcolare il lavoro della forza bisogna studiare il comportamento di queste somme, quando la finezza della suddivisione dell’intervallo $[a, b]$ tende a zero. Si sa che in questo modo si arriva a calcolare l’integrale su $[a, b]$ della funzione

\vec{F} (\vec{r} (t)) \cdot {\vec{r}}^{'} (t) .

Seguendo il suggerimento dell’esempio precedente definiamo l’integrale di curva di seconda specie come segue: si assegna un campo vettoriale $\vec{V} (\vec{r})$ e un arco $γ$ , parametrizzato da $\vec{r} (t)$ , $t \in [a, b]$ . Si definisce

\int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} =_{d e f} \int_{a}^{b} \vec{V} (\vec{r} (t)) \cdot {\vec{r}}^{'} (t) d t .

(8.6)

Nel caso particolare $n = 3$ e $\vec{V} (x, y, z) = f (x, y, z) \vec{i} + g (x, y, z) \vec{j} + h (x, y, z) \vec{k}$ si trova:

\begin{aligned} \int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{a}^{b} [f (x (t), y (t), z (t)) x^{'} (t) \\ + g (x (t), y (t), z (t)) y^{'} (t) + h (x (t), y (t), z (t)) z^{'} (t)] d t . \end{aligned}

Osservazione 223 Una curva semplice e chiusa si chiama anche un circuito e l’integrale di un campo vettoriale $\vec{V} (\vec{r})$ lungo una curva chiusa si chiama anche la circuitazione del campo vettoriale lungo $γ$ . Quando la curva $γ$ è semplice e chiusa, l’integrale su $γ$ si indica anche col simbolo

\oint_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} .

E’ immediato verificare, usando la formula di cambiamento di variabili:

Teorema 224 Il valore dell’integrale di curva di seconda specie non muta cambiando parametrizzazione; cambia di segno cambiando verso di percorrenza.

La prima affermazione mostra che, per ogni fissato campo vettoriale $\vec{V} (\vec{R})$ , l’integrale di curva di seconda specie è una proprietà geometrica della curva. La seconda affermazione si esprime scrivendo

\int_{- γ} \vec{V} (\vec{r}) \cdot d \vec{r} = - \int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} .

E’ ovvio inoltre che se si divide un arco $γ$ in due archi $γ_{1}$ e $γ_{2}$ ,

\begin{aligned} γ : t \to \vec{r} (t), t \in [a, c] \\ γ_{1} : t \to \vec{r} (t), t \in [a, b]; γ_{2} : t \to \vec{r} (t), t \in [b, c]; \end{aligned}

allora vale

\int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1}} V (\vec{r}) \cdot d \vec{r} + \int_{γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} .

(8.7)

Esattamente come nell’osservazione 221, la (8.7), può usarsi per estendere la definizione di integrale di curva di seconda specie ad archi regolari a tratti. L’arco $γ$ ottenuto percorrendo prima $γ_{1}$ e poi $γ_{2}$ si indica col simbolo $γ_{1} + γ_{2}$ . Questo simbolo non indica soltanto l’unione insiemistica dei sostegni perché per il calcolo dell’integrale bisogna anche specificare il verso di percorrenza. Con questa notazione, la (8.7) si scrive anche

\int_{γ_{1} + γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1}} V (\vec{r}) \cdot d \vec{r} + \int_{γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} .

Quest’osservazione suggerisce la notazione seguente: siano $γ_{1}$ e $γ_{2}$ due archi, non necessariamente “sottoarchi” del medesimo. Col simbolo $γ_{1} + γ_{2}$ intendiamo di percorrere prima l’arco $γ_{1}$ , preso col suo verso di percorrenza, e quindi l’arco $γ_{2}$ preso col suo verso di percorrenza. Col simbolo $γ_{1} - γ_{2}$ si intende di percorrere prima l’arco $γ_{1}$ , col suo verso di percorrenza, e poi l’arco $γ_{2}$ col verso di percorrenza negativo. Definiamo quindi

\begin{aligned} \int_{γ_{1} + γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1}} \vec{V} (\vec{r}) \cdot d \vec{r} + \int_{γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r}, \\ \int_{γ_{1} - γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1}} \vec{V} (\vec{r}) \cdot d \vec{r} + \int_{- γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} \\ = \int_{γ_{1}} \vec{V} (\vec{r}) \cdot d \vec{r} - \int_{γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} . \end{aligned}

Consideriamo ora la figura 8.1. La figura a sinistra rappresenta due archi, $γ_{1}$ e $γ_{2}$ tali che né $γ_{1} + γ_{2}$ né $γ_{1} - γ_{2}$ rappresentano un arco. La figura a destra rappresenta due archi, ciascuno col proprio verso di percorrenza, tali che $γ_{1} + γ_{2}$ rappresenta un arco mentre $γ_{1} - γ_{2}$ non rappresenta un arco.

figura 8.1: “Operazioni” sugli archi

La figura 8.2 rappresenta a sinistra l’arco $γ_{1}$

γ_{1} : x = {(1 - t)}^{2}, y = {(1 - t)}^{3}, t \in [0, 1]

(8.8)

e, nel medesimo piano, l’arco $γ_{2}$ :

γ_{2} : x = t, y = t, t \in [1, 2]

(8.9)

ciascuno con indicato il verso di percorrenza. E’ chiaro che $γ_{1} + γ_{2}$ non è un arco, mentre $γ_{1} - γ_{2}$ lo è. La figura a destra rappresenta un caso tipico, che useremo più volte. Si noti che la curva “esterna” e la curva “interna” sono percorse in verso opposto.

figura 8.2: Gli archi (8.8) e (8.9) a sinistra. A destra una regione delimitata da due archi

Per gli integrali di curva di seconda specie può darsi un risultato analogo alla (8.4). Usando le medesime notazioni, si ha:

lim_{𝜖 \to a +} \int_{γ_{𝜖}} \vec{V} (\vec{r}) \cdot d \vec{r} = 0,

(8.10)

fatto che si prova facilmente introducendo la parametrizzazione dell’arco¹. Ricordando però che l’integrale di curva di seconda specie cambia segno cambiando il verso di percorrenza, si possono enunciare due risultati che non hanno analogo per gli integrali di curva di prima specie. Supponiamo che un arco ripassi due volte su un arco $γ_{1}$ , percorrendolo in versi opposti. Allora, nel calcolo dell’integrale $γ_{1}$ non dà contributo. In particolare, si consideri la figura 8.3. Nella figura, i due lati affancati vanno pensati sovrapposti e sono il sostegno dell’arco $γ_{1}$ . Sono stati disegnati soltanto affancati per chiarezza.

figura 8.3: Archi che “si elidono”

Indichiamo con $γ_{s}$ la curva il cui sostegno è il quadrato di sinistra e con $γ_{d}$ quella il cui sostegno è il quadrato di destra. Nella somma

\int_{γ_{s}} \vec{V} (\vec{r}) \cdot d \vec{r} + \int_{γ_{d}} \vec{V} (\vec{r}) \cdot d \vec{r}

il contributo di $γ_{1}$ si elide e si trova

\int_{γ_{s} + γ_{d}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{s}} \vec{V} (\vec{r}) \cdot d \vec{r} + \int_{γ_{d}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r}

(8.11)

ove $γ$ è la curva il cui sostegno è il rettangolo che si ottiene sopprimendo il lato comune ai due quadrati, col verso di percorrenza indicato. Naturalmente nelle considerazioni precedenti il fatto che le curve siano ottenute per mezzo di segmenti rettilinei non ha alcuna importanza. Una seconda osservazione, semplice ma importante, è la seguente: siano $γ_{0}$ e $γ_{τ}$ ( $τ$ è un parametro) due segmenti

γ : \vec{r} = {\vec{r}}_{0} + t {\vec{u}}_{0}, t \in [0, a] γ_{τ} : \vec{r} = \vec{r} + t \vec{u}, t \in [0, b] .

Supponiamo che

| | {\vec{u}}_{0} | | = 1, | | \vec{u} | | = 1 .

e consideriamo i due integrali

\int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r}, \int_{γ_{τ}} \vec{V} (\vec{r}) \cdot d \vec{r} .

Supponiamo che il campo vettoriale sia continuo e che “il segmento $γ_{τ}$ tenda a sovrapporsi a $γ_{0}$ ”. Questo vuol dire che il secondo segmento dipende da un parametro, diciamo $τ \in [0, 1]$ , ossia che

\vec{r} = \vec{r} (τ), \vec{u} = \vec{u} (τ), b = b (τ) .

Assumiamo che queste funzioni dipendano da $τ$ in modo continuo e che sia

\vec{r} (0) = {\vec{r}}_{0}, \vec{u} (0) = {\vec{u}}_{0}, b (0) = a .

In tal caso:

Teorema 225 Si ha:

lim_{τ \to 0} \int_{γ_{τ}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{0}} \vec{V} (\vec{r}) \cdot d \vec{r} .

La dimostrazione è ovvia. Infatti,

Φ (t, τ) = [\vec{V} (\vec{r} (τ) + t \vec{u} (τ))] \cdot \vec{u} (τ)

è una funzione continua delle due variabili $t$ e $τ$ e inoltre

Φ (t, 0) = \vec{V} ({\vec{r}}_{0} + t {\vec{u}}_{0}) \cdot {\vec{u}}_{0} .

Dunque,

lim_{τ \to 0} \int_{γ_{τ}} \vec{V} (\vec{r}) \cdot d \vec{r} = lim_{τ \to 0} \int_{0}^{b (τ)} Φ (t, τ) d t = \int_{0}^{a} Φ (t, 0) d 1 = \int_{γ} \vec{V} (\vec{r}) \cdot \vec{r},

si veda il paragrafo 4.2.4. In particolare,

lim_{τ \to 0} \int_{- γ_{τ}} \vec{V} (\vec{r}) \cdot d \vec{r} = - \int_{γ_{0}} \vec{V} (\vec{r}) \cdot d \vec{r} .

Dunque,

Corollario 226 Nelle ipotesi dette sopra si ha

lim_{τ \to 0} [\int_{- γ_{τ}} \vec{V} (\vec{r}) \cdot d \vec{r} + \int_{γ_{0}} \vec{V} (\vec{r}) \cdot d \vec{r}] = 0 .

Ossia, Il contributo dei due integrali tende ad elidersi. Questo è il corollario che useremo più avanti. Ora, usiamo sia la (8.10) che il Corollario 226 per giustificare l’uso della notazione

\int_{γ_{1} + γ_{2}}

anche nel caso in cui $γ_{1} + γ_{2}$ non è un arco. Torniamo a considerare la figure 8.1 a sinistra. Si confronti questa figura con la figura 8.4, a sinistra.

figura 8.4: Integrali di curva di seconda specie ed archi che “si elidono”

La figura di sinistra rappresenta una curva semplice e chiusa, chiamiamola $γ_{𝜖}$ , dipendente dal parametro $𝜖$ , lunghezza degli archi (indicati con $A_{1, 𝜖}$ , $A_{2, 𝜖}$ ) “rimossi” dalle ellissi di destra e di sinistra, che chiamiamo rispettivamente $γ_{1}$ e $γ_{2}$ . Dunque,

\begin{aligned} \int_{γ_{𝜖}} \vec{V} (\vec{r}) \cdot d \vec{r} - \int_{γ_{1} + γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} \\ = \int_{S_{1}} \vec{V} (\vec{r}) \cdot d \vec{r} + \int_{S_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} \\ - \int_{A_{1, 𝜖}} \vec{V} (\vec{r}) \cdot d \vec{r} - \int_{A_{2, 𝜖}} \vec{V} (\vec{r}) \cdot d \vec{r} . \end{aligned}

Facendo tendere $𝜖$ a zero, l’integrale sugli archi $A_{1, 𝜖}$ , $A_{2, 𝜖}$ tende a zero per la (8.10), mentre la somma degli integrali sui due segmenti tende a zero per il Corollario 226. Dunque,

lim_{𝜖 \to 0} \int_{γ_{𝜖}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1} + γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} .

Ciò spega perché è necessario considerare espressioni del tipo

\int_{γ_{1} + γ_{2}}

anche nel caso in cui $γ_{1} + γ_{2}$ non è un arco. La figura 8.4, a destra, mostra una spiegazione analoga nel caso illustrato nella figura 8.1, a destra.

Osservazione 227 Si noti che in ambedue gli esempi, gli archi i cui integrali approssimano quello su $γ_{1} + γ_{2}$ sono semplici. fissato il verso di percorrenza su $γ_{1}$ , quello su $γ_{2}$ viene automaticamente determinato se si vuol avere un’approssimazione con un arco semplice. In particolare, nel caso delle due curve di Jordan, una nella regione interna dell’altra, usa prendere la curva più esterna orientata positivamente e quindi quella più interna orientata negativamente. Più avanti vedremo la ragione di tale scelta. _

Infine, supponiamo di avere due curve $γ_{1}$ e $γ_{2}$ , non necessariamente semplici:

γ_{1} : t \to \vec{r} (t) t \in [a, b]; γ_{2} : τ \to \vec{ρ} (τ) τ \in [α, β] .

Diciamo che le due curve hanno gli stessi estremi quando

\vec{r} (a) = \vec{ρ} (α), \vec{r} (b) = \vec{ρ} (β) .

In questa definizione si è tenuto conto del verso di percorrenza delle curve: i due “primi estremi” devono coincidere ed i due “secondi estremi” devono coincidere. In tal caso:

Lemma 228 Nelle ipotesi dette sopra, $γ_{1} - γ_{2}$ è una curva chiusa e

\int_{γ_{1} - γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1}} \vec{V} (\vec{r}) \cdot d \vec{r} - \int_{γ_{2}} \vec{V} (\vec{r}) \cdot d \vec{r} .

8.2.3 Integrali di curva di prima e di seconda specie

E’ interessante confrontare le definizioni degli integrali di curva di prima e seconda specie nel caso particolare in cui $\vec{V} (\vec{r}) = f (\vec{r}) \vec{i}$ . In questo caso

\int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{a}^{b} f (x (t), y (t), z (t)) x^{'} (t) d t

mentre

\int_{γ} f d s = \int_{a}^{b} f (x (t), y (t), z (t)) \sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}} d t .

Questi due integrali non si riconducono l’uno all’altro nemmeno nel caso in cui $y (t)$ e $z (t)$ sono identicamente zero. Infatti, in tal caso essi vengono ad essere, rispettivamente,

\int_{a}^{b} f (x (t), y (t), z (t)) x^{'} (t) d t, \int_{a}^{b} f (x (t), y (t), z (t)) | x^{'} (t) | d t .

Ciò nonostante, esiste una relazione tra gli integrali di prima e seconda specie, che ora mostriamo. Consideriamo l’arco

γ : x (t) \vec{i} + y (t) \vec{j} + z (t) \vec{k}, t \in [a, b]

Ricordiamo che con $\vec{t} (\vec{r})$ si è indicato il versore tangente alla curva nel punto $\vec{r}$ :

\begin{aligned} \vec{t} (\vec{r} (t)) = \frac{{\vec{t}}^{'} (t)}{| {\vec{r}}^{'} (t) |} = \frac{x^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \vec{i} \\ + \frac{y^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \vec{j} + \frac{z^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \vec{k} \end{aligned}

Sia

\vec{V} (\vec{r}) = V_{1} (\vec{r}) \vec{i} + V_{2} (\vec{r}) \vec{j} + V (\vec{r}) \vec{k}

un campo vettoriale definito sulla curva $γ$ . Introduciamo la funzione

\begin{aligned} f (t) = \vec{V} (\vec{r} (t)) \cdot \{\frac{x^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \vec{i} \\ + \frac{y^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \vec{j} + \frac{z^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \vec{k}\} . \end{aligned}

Si ha

\int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ} f (\vec{r}) d s .

(8.12)

Talvolta questa formula si trova scritta in modo diverso. Notiamo che

\begin{aligned} n_{1} = \frac{x^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \\ n_{2} = \frac{y^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \\ n_{3} = \frac{z^{'} (t)}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2} + {[z^{'} (t)]}^{2}}} \end{aligned}

sono i coseni direttori della tangente $\vec{t} (\vec{r} (t))$ . Per questo la formula (8.12) si trova anche scritta come segue:

\int_{γ} \vec{V} (\vec{r}) \cdot d \vec{r} = \int_{γ} [V_{1} n_{1} + V_{2} n_{2} + V_{3} n_{3}] d s .

Notiamo infine che la (8.10) si può derivare dalla (8.4), usando la (8.12).

8.2.4 Integrali di curva di seconda specie e forme differenziali

L’integrale di curva di seconda specie si calcola quando è dato un campo vettoriale $\vec{V} (\vec{r})$ . Dunque, possiamo vedere il campo vettoriale come operante sulla curva $γ$ : il campo vettoriale $\vec{V} (\vec{r})$ associa un numero alla curva $γ$ . Vedremo che altri campi vettoriali si usano per associare numeri alle superfici. Dunque conviene distinguere i due casi, introducendo termini e notazioni diverse. Nel caso che stiamo considerando, il campo vettoriale agisce su una curva. Invece di indicarlo col simbolo $\vec{V} (x, y, z) = f (x, y, z) \vec{i} + g (x, y, z) \vec{j} + h (x, y, z) \vec{k}$ , indichiamolo col simbolo²

f (x, y, z) d x + g (x, y, z) d y + h (x, y, z) d z .

(8.13)

Non vogliamo dare nessun significato particolare ai simboli $d x$ , $d y$ e $d z$ . Essi, come si è notato, sono suggeriti dalla formula (8.7). Ricordiamo però che nel caso dell’integrale su un intervallo, si conserva la notazione “ $d x$ ” perché questa aiuta a ricordare certe formule. Come vedremo, qualcosa di analogo accade anche in questo caso. La (8.13) si chiama 1–forma differenziale (il numero $1$ ricorda che si agisce su una curva, un oggetto che, intuitivamente³, ha dimensione $1$ , come un segmento o un filo). L’integrale di curva di seconda specie si chiama anche l’integrale di curva della 1–forma differenziale e si indica anche col simbolo

\int_{γ} f d x + g d y + h d z

(sottintendendo la dipendenza di $f$ , $g$ e $h$ da $x$ , $y$ e $z$ ). Una regola mnemonica per ottenere la formula (8.7), per esempio nel caso $n = 3$ è la seguente: si ricordi che le funzioni $f$ , $g$ ed $h$ dipendono da $(x, y, z)$ . Allora, si sostituisca $x$ con $x (t)$ , $y$ con $y (t)$ , $z$ con $z (t)$ ovunque queste lettere compaiono; e si interpreti “ $d$ ” come segno di derivata; e quindi $d x$ si sostituisce con $x^{'} (t) d t$ , $d y$ con $y^{'} (t) d t$ e $d z$ con $z^{'} (t) d t$ . Infine, si integri da $a$ fino a $b$ , ottenendo la (8.7). Questa è una prima buona ragione per usare la notazione delle forme differenziali. Più avanti ne vedremo altre. Una forma differenziale si indica spesso con una lettera greca minuscola tratta dalla fine dell’alfabeto, come $ω$ ,

ω = f d x + g d y + h d z .

Con tale notazione l’integrale della forma differenziale si indica

\int_{γ} ω .

Infine, diciamo che la forma differenziale

ω = f d x + g d y + h d z

è di classe $C^{1}$ quando sono di classe $C^{1}$ i suoi coeffcienti, ossia le funzioni $f (x, y, z)$ , $g (x, y, z)$ , e $h (x, y, z)$ .

Osservazione 229 Si noti che il simbolo $d x$ è una forma differenziale: quella di coeffcienti $f = 1$ e $g = h = 0$ . Questa forma differenziale si chiama anche il differenziale della variabile $x$ . Questo termine “differenziale” ha un significato diverso da quello introdotto al Cap. 4. Esistono relazioni tra questi due diversi concetti, che però non illustriamo. _

8.2.5 Il ﬂusso

Sia

\vec{V} (x, y) = f (x, y) \vec{i} + g (x, y) \vec{j} + h (x, y) \vec{k}

un campo vettoriale che ad ogni punto del piano $z = 0$ associa un vettore di $ℝ^{3}$ . Sia $𝒟$ un dominio di integrazione e supponiamo che $\vec{V} (x, y)$ sia continuo sulla chiusura di $𝒟$ . Possiamo pensare che il piano $z = 0$ sia immerso in un ﬂuido che scorre in modo che quando una particella si trova nel punto $(x, y, 0)$ ivi abbia la velocità $\vec{V} (x, y)$ e mantenga tale velocità dopo che ha lasciato il piano $z = 0$ . Il ﬂusso attraverso $𝒟$ è la quantità di ﬂuido che traversa $𝒟$ nell’unità di tempo. Per calcolarla⁴ procediamo in questo modo. Approssimiamo $𝒟$ mediante un numero finito di rettangoli $R_{i}$ , come nella definizione dell’integrale doppio. Una particella che si trova in un punto $(x, y, 0) \in R_{i}$ descrive nell’unità di tempo il segmento rettilineo che congiunge $(x, y, 0)$ con $V (x, y)$ . Infatti, abbiamo detto che la velocità non cambia dopo che la particella ha lasciato il piano $z = 0$ . Dunque, nell’unità di tempo le particelle che escono dal rettangolo $R_{i}$ riempiono una specie di parallelepipedo, con “faccia superiore” non piana, di base $R_{i}$ . L’altezza varia da punto a punto, come in figura 8.5, a sinistra.

figura 8.5: Il ﬂusso

Se il rettangolo è “piccolo” l’altezza sarà circa uguale a $\vec{k} \cdot \vec{V} (x_{i}, y_{i})$ ove $(x_{i}, y_{i})$ è per esempio il vertice in basso a sinistra del rettangolo $R_{i}$ . Dunque il volume di questo solido è approssimato da

h (Area di R_{i}) = [\vec{k} \cdot \vec{V} (x_{i}, y_{i})] (Area di R_{i}).

Si noti che l’area di $R_{i}$ è positiva mentre l’altezza può anche essere negativa; ossia, il volume si prende “con segno” perché non è indifferente che il ﬂuido scorra verso l’alto o verso il basso. Sommiamo ora i contributi di tutti i singoli rettangoli. Si trova una somma integrale di quelle che definiscono l’integrale

\int_{𝒟} \vec{V} (x, y) \cdot \vec{k} d x d y .

Scegliamo quindi questa formula come definizione di ﬂusso attraverso il dominio di integrazione $𝒟$ . Più avanti vedremo la definizione di ﬂusso attraverso una superficie non piana. Ora, definiamo il ﬂusso di un campo piano attraverso una curva. Supponiamo che uno strato liquido riempia il piano $(x, y)$ e che il campo vettoriale

\vec{V} (x, y) = f (x, y) \vec{i} + g (x, y) \vec{j}

rappresenti la velocità con cui una particella traversa la posizione $(x, y)$ . Sia $γ$ un arco regolare, parametrizzata da

γ : x = x (t), y = y (t), t \in [a, b] .

Si chiama ﬂusso del campo $\vec{V}$ attraverso la curva $γ$ la quantità di ﬂuido che nell’unità di tempo traversa la curva. Per calcolarlo, dividiamo la curva in archi $γ_{i}$ mediante i punti ${\vec{r}}_{i}$ . Supponiamo per semplicità che questi archi abbiano tutti la medesima lunghezza $l$ . Supponiamo che la particella che traversa il punto $(x, y) \in γ$ mantenga la velocità $\vec{V} (x, y)$ anche dopo aver traversato la curva. Se gli archi sono “molto piccoli”, la velocità delle singole particelle di liquido che traversano l’arco $γ_{i}$ si potrà approssimare mediante $\vec{V} (x_{i}, y_{i})$ . Nell’unità di tempo, queste particelle di liquido riempiono una parte di piano che all’incirca è un parallelogramma la cui base misura $l$ e la cui altezza misura $[\vec{V} (x_{i}, y_{i}) \cdot \vec{n} (x_{i}, y_{i})]$ ove $\vec{n} (x_{i}, y_{i})$ è la normale a $γ$ nel punto ${\vec{r}}_{i}$ , si veda la figura 8.5, a destra. La somma

\sum_{i} [\vec{V} (x_{i}, y_{i}) \cdot \vec{n} (x_{i}, y_{i})] l

è una somma integrale che per $l \to 0$ approssima

\int_{γ} [\vec{V} (\vec{r}) \cdot \vec{n} (\vec{r})] d s .

Si sceglie quindi quest’integrale come definizione di ﬂusso di un campo vettoriale attraverso una curva. Il ﬂusso cambia segno cambiando il verso di percorrenza lungo la curva perché cambiando verso di percorrenza cambia il verso sulla normale. Supponiamo ora che la curva $γ$ sia semplice e chiusa. In questo caso, usa privilegiare la normale esterna ${\vec{n}}_{e}$ :

{\vec{n}}_{e} = \frac{1}{\sqrt{{[x^{'} (t)]}^{2} + {[y^{'} (t)]}^{2}}} [y^{'} (t) \vec{i} - x^{'} (t) \vec{j}]

e quindi il ﬂusso uscente dalla regione $Ω_{γ}$ delimitata da $γ$ è

\int_{a}^{b} [f (x (t), y (t)) y^{'} (t) - g (x (t), y (y)) x^{'} (t)] d t = \int_{γ} - g d x + f d y .

8.3 Analisi vettoriale nel piano

Mostriamo che calcolare l’integrale di certi campi vettoriali equivale al calcolo di integrali multipli. Questo studio va sotto il nome di analisi vettoriale.

8.3.1 Una considerazione preliminare

Consideriamo una funzione

y = f (x), x \in [a, b] .

Questa funzione identifica la curva semplice

γ_{f} : x = t, y = f (t), t \in [a, b] .

Sia ora $F (x, y)$ una funzione (continua) delle due variabili $x$ ed $y$ e consideriamo l’integrale

\int_{a}^{b} F (x, f (x)) d x .

Questo è l’integrale

\int_{γ_{f}} \vec{V} (\vec{r}) \cdot d \vec{r}

ove

\vec{V} (\vec{r}) = \vec{V} (x, y) = F (x, y) \vec{i} + 0 \vec{j} .

Col linguaggio delle forme differenziali,

\int_{a}^{b} F (x, y (x)) d x = \int_{γ_{f}} F d x .

Infatti, $x^{'} (t) = 1$ . Analogamente, se

x = h (y), y \in [α, β],

sia $γ_{h}$ la curva identificata da questo grafico. Si ha

\int_{α}^{β} F (h (y), y) d y = \int_{γ_{h}} \vec{W} \cdot d r

ove ora $\vec{W} = 0 \vec{i} + F (x, y) \vec{j}$ . E’ importante esaminare la figura 8.6 e rendersi conto dei versi di percorrenza scelti su queste curve.

figura 8.6: Versi di percorrenza

8.3.2 Formula di Green

Siano ora $γ_{f}$ e $γ_{g}$ due curve cartesiane definite sul medesimo intervallo,

y = f (x) x \in [a, b]

y = g (x) x \in [a, b] .

Supponiamo inoltre che per ogni $x \in (a, b)$ sia⁵

g (x) > f (x) .

figura 8.7: Formula di Green

Indichiamo con $Ω$ la regione delimitata dai due grafici e dai segmenti verticali per $x = a$ e per $x = b$ congiungenti i due grafici. Il segmento si considera nel caso in cui l’uguaglianza non valga in uno dei due estremi. Si veda la figura 8.7, a sinistra. Si noti che la frontiera $\partial Ω$ di $Ω$ è sostegno di una curva chiusa. Ricordando le nostre convenzioni, indicheremo col medesimo simbolo sia la curva che il suo sostegno; e quindi la indicheremo col simbolo $\partial Ω$ e, sempre per le nostre convenzioni, $\partial Ω$ è orientata in senso antiorario. Vogliamo calcolare

\int_{Ω} F_{y} (x, y) d x d y .

Quest’integrale si calcola come segue:

\int_{a}^{b} [\int_{f (x)}^{g (x)} F_{y} (x, y) d y] d x = \int_{a}^{b} [F (x, g (x)) - F (x, f (x))] d x = \int_{γ_{g}} \vec{V} d \vec{r} - \int_{γ_{f}} \vec{V} d \vec{r}

ove

\vec{V} (x, y) = F (x, y) \vec{i} + 0 \vec{j} .

Guardando i versi di percorrenza, si vede che

\int_{Ω} F_{y} (x, y) d x = \int_{\partial Ω} [- \vec{V}] \cdot d \vec{r} .

(8.14)

Si noti che in questo calcolo il segmento verticale dà contributo nullo. Sia ora $G (x, y)$ una funzione derivabile. Si vuol calcolare

\int_{Ω} G_{x} (x, y) d x d y .

Proiettando la regione $Ω$ sull’asse delle ordinate si trova un segmento $[α, β]$ . La frontiera di $Ω$ è ancora grafico di due funzioni, la funzione $ϕ (x)$ e la funzione $ψ (x)$ , si veda la figura 8.7, a destra. I pallini con la freccia servono ad indicare i punti nei quali i due grafici si congiungono. Il grafico di $ψ (x)$ include il segmento verticale. Calcoliamo

\begin{aligned} \int_{Ω} G_{x} (x, y) d x d y = \int_{α}^{β} [\int_{ϕ (y)}^{ψ (y)} G_{x} (x, y) d x] d y \\ = \int_{α}^{β} [G (ψ (y), y) - G (ϕ (y), y)] d y \\ = \int_{γ_{ψ}} \vec{W} \cdot d \vec{r} - \int_{γ_{ϕ}} \vec{W} \cdot d \vec{r} = \int_{\partial Ω} \vec{W} d \vec{r} \end{aligned}

con

\vec{W} (x, y) = 0 \vec{i} + G (x, y) \vec{j} .

Si noti che in questo calcolo il segmento verticale dà contributo non nullo, mentre darebbe contributo nullo un eventuale segmento orizzontale sulla frontiera di $Ω$ . Combinando i due calcoli precedenti si trovano le due formule seguenti:

\int_{Ω} [G_{x} (x, y) - F_{y} (x, y)] d x d y = \int_{\partial Ω} [F d x + G d y],

(8.15)

ottenuta sottraendo la (8.14) con la (8.15). Sommandole si trova invece

\int_{Ω} [G_{x} (x, y) + F_{y} (x, y)] d x d y = \int_{\partial Ω} [- F d x + G d y] .

(8.16)

Osservazione importante

Le formule (8.15) e (8.16) valgono anche se la regione con cui si lavora è delimitata da più di due grafici e più in generale essa vale per qualsiasi regione di Jordan

Ω_{γ}

, delimitata da una curva

γ

regolare a tratti. Quindi non c’è più ragione di fare intervenire i trapezoidi delle funzioni

f (x)

g (x)

, e quindi di indicare con lettere maiuscole le funzioni da integrare. Per questo, da ora in poi useremo la notazione più usuale

\begin{aligned} \int_{Ω} [g_{x} (x, y) - f_{y} (x, y)] d x d y = \int_{\partial Ω} [f d x + g d y], \\ \int_{Ω} [g_{x} (x, y) + f_{y} (x, y)] d x d y = \int_{\partial Ω} [- f d x + g d y], \end{aligned}

con le lettere minuscole. Le due formule precedenti sono tra loro equivalenti (si passa dall’una all’altra cambiando

f

- f

). Hanno però due diversi significati fisici, e per questo è bene conservarle ambedue. Inoltre, ambedue la formula hanno un equivalente nello spazio

ℝ^{3}

, ma in tal caso le due formule che si ottengono non possono ridursi l’una all’altra con una semplice trasformazione.

La formula

\int_{Ω} [g_{x} (x, y) - f_{y} (x, y)] d x d y = \int_{\partial Ω} f d x + g d y .

(8.17)

si chiama formula di Green.

Osservazione 230 Si noti che $[g_{x} (x, y) - f_{y} (x, y)]$ è la componente lungo il versore $\vec{k}$ del rotore del campo vettoriale $\vec{V} (x, y) = f (x, y) \vec{i} + g (x, y) \vec{j} + 0 \vec{k}$ . La formula (8.17) si scrive quindi come

\int_{Ω} (r o t \vec{V}) \cdot \vec{k} d x d y = \int_{\partial Ω} \vec{V} \cdot d \vec{r} = \int_{\partial Ω} f d x + g d y .

(8.18)

Col linguaggio dei campi vettoriali la formula si interpreta come segue: il ﬂusso del rotore del campo vettoriale $\vec{V} (x, y)$ attraverso la superficie piana $Ω$ è uguale alla circuitazione del campo vettoriale stesso lungo $\partial Ω$ . Naturalmente si sottintende che $\partial Ω$ sia positivamente orientata. _

Osservazione 231 Torniamo a considerare la formula

\int_{Ω} [g_{x} (x, y) + f_{y} (x, y)] d x d y = \int_{\partial Ω} [- f d x + g d y] .

(8.19)

Quest’uguaglianza si chiama Teorema della divergenza nel piano Come si è detto, essa è una diversa formulazione della formula di Green. Come tale, esso sotto le medesime condizioni, ma ha una diversa interpretazione fisica, che ora illustriamo. Consideriamo il campo vettoriale

\vec{W} (x, y) = g (x, y) \vec{i} + f (x, y) \vec{j} .

A destra della (8.19) figura il ﬂusso del campo vettoriale $\vec{W}$ , uscente dalla regione $Ω$ (regione interna alla curva regolare a tratti $\partial Ω$ ). A sinistra figura la divergenza di $\vec{W}$ . Dunque la (8.19) si scrive anche come

\int_{Ω} d i v \vec{W} (x, y) d x d y = \int_{Ω} \nabla \cdot \vec{W} (x, y) d x d y = \int_{\partial Ω} \vec{W} \cdot {\vec{n}}_{e} d s .

(8.20)

Essa si interpretra come segue: il ﬂusso uscente da $γ$ del campo vettoriale $\vec{W}$ è uguale all’integrale su $Ω$ della divergenza di $\vec{W}$ . Quest’interpretazione in particolare spiega l’uso del termine “divergenza”. _

8.3.3 Formula di Green e forme differenziali

Si è detto che il simbolo “ $d$ ” si conserva dentro il simbolo di integrale perché aiuta a ricordare le formule. In apparenza ciò non accade per la formula di Green. E’ però possibile introdurre dei simboli comodi come segue. Se $f (x, y)$ è una funzione, con $d f (x, y)$ indichiamo la forma differenziale

d f (x, y) = f_{x} (x, y) d x + f_{y} (x, y) d y .

Se $ω$ è una 1–forma differenziale, definiamo

d ω = d \{f d x + g d y\} = f_{x} d x d x + f_{y} d y d x + g_{x} d x d y + g_{y} d y d y .

Ora introduciamo le regole seguenti:

d x d x = 0, d y d y = 0, d y d x = - d x d y,

(8.21)

suggerite dalle regole con le quali si calcola il prodotto vettoriale, (esplicitamente usato nella formula (8.18)):

\vec{i} \land \vec{i} = 0, \vec{j} \land \vec{j} = 0, \vec{j} \land \vec{i} = - \vec{i} \land \vec{j} .

In questo modo si trova

d ω = [- f_{y} + g_{x}] d x d y

(8.22)

e questo è proprio l’integrando dell’integrale doppia in (8.17). Dunque, un modo per ricordare la (8.17) è di scriverla come

\int_{\partial Ω} ω = \int_{\partial Ω} [f d x + g d y] = \int_{Ω} d [f d x + g d y] = \int_{Ω} d ω .

(8.23)

Osservazione 232 Introdurremo più avanti il Teorema di Stokes in $ℝ^{3}$ , che vale per curve che sono bordo di calotte. Il Teorema di Green è il caso particolare del Teorema di Stokes in $ℝ^{3}$ che si ottiene quando la curva è una curva di Jordan e quando la superficie è la regione interna alla curva. _

La $2$ -forma differenziale $d ω$ si chiama anche il differenziale esterno (o più brevemente il differenziale) della $1$ -forma $ω$ .

8.3.4 Le forme differenziali e le aree piane

Scriviamo la formula di Green scegliendo come forma differenziale la seguente:

ω = - y d x + x d y

Si trova

\int_{γ} - y d x + x d y = \int_{Ω_{γ}} 2 d x d y

e l’integrale a destra è il doppio dell’area di $Ω_{γ}$ . Si trova quindi:

Teorema 233 Sia $γ$ una curva di Jordan orientata positivamente e sia $Ω_{γ}$ la sua regione interna. L’area di $Ω_{γ}$ è data da

\frac{1}{2} \int_{γ} - y d x + x d y .

Questa formula è un caso particolare del Teorema di Green e quindi si prova calcolando

\int_{Ω_{γ}} 1 d x d y

mediante successive integrazioni per parti. E’ però interessante vedere un’argomento geometrico che conduce a questa formula. Sia $γ$ : $t \to \vec{r} (t)$ , $t \in [a, b]$ un arco piano regolare, semplice e chiuso e sia $Ω_{γ}$ la sua regione interna. Per semplicità di esposizione, assumiamo che l’origine degli assi appartenga alla regione interna $Ω_{γ}$ (caso a cui ci si può sempre ricondurre mediante una traslazione).

figura 8.8: Area di una regione di Jordan

Si consideri la figura 8.8. Il punto $\vec{r} (t)$ varia sull’arco. Dividiamo l’intervallo $[a, b]$ in “piccoli” intervalli, dividendolo con i punti $t_{i}$ (equidistanti per semplicità). Approssimiamo l’arco $\vec{r} (t)$ , $t \in [t_{i}, t_{i + 1}]$ col segmento di tangente

\vec{r} = \vec{r} (t_{i}) + {\vec{r}}^{'} (t_{i}) (t - t_{i}), t \in [t_{i}, t_{i + 1}]

come in figura 8.8. Consideriamo i triangoli di vertici l’origine, il punto $\vec{r} (t_{i})$ e il secondo estremo del segmento di tangente. Si potrebbe provare che quando la finezza della partizione di $[a, b]$ tende a zero, la somma delle aree di questi triangoli tende all’area di $Ω_{γ}$ , pur di intendere l’area di tali triangoli con segno, in modo da cancellare eventuali parti di area coperte più volte. L’area (con segno) di ciascuno di questi triangoli è la metà della componente lungo l’asse $z$ del prodotto vettoriale dei vettori $\vec{r} (t_{i})$ e ${\vec{r}}^{'} (t_{i}) (t_{i + 1} - t_{i})$ . Per approssimare l’area di $Ω_{γ}$ dobbiamo quindi sommare la componenti lungo l’asse verticale di

\frac{1}{2} \vec{r} (t_{i}) \land {\vec{r}}^{'} (t_{i}) (t_{i + 1} - t_{i}) .

Si trova così

\frac{1}{2} \sum_{i = 0}^{N - 1} [x (t_{i}) y^{'} (t_{i}) - y (t_{i}) x^{'} (t_{i})] (t_{i + 1} - t_{i}) .

Al tendere a zero della finezza della partizione queste somme approssimano

\frac{1}{2} \int_{a}^{b} [x (t) y^{'} (t) - y (t) x^{'} (t)] d t = \frac{1}{2} \int_{γ} [- y d x + x d y] .

(8.24)

L’argomento precedente non è rigoroso, ma può pienamente giustificarsi. Chiediamoci ora se l’integrale precedente restituisce l’area di $Ω_{γ}$ , oppure l’area col segno negativo. Si vede subito dalla figura 8.8 che la somma delle aree dei triangoli viene positiva quando l’orientazione della curva è concorde con quella di $ℝ^{2}$ ; ossia quando la curva è orientata positivamente.

8.3.5 Le estensioni

La formula di Green è stata provata per una regione molto particolare. Si è già notato che essa vale sotto condizioni molti più generali. E infatti:

Teorema 234 Le uguaglianze (8.18) e (8.16) valgono per ogni regione $Ω_{γ}$ , con $γ$ curva regolare a tratti e per ogni coppia di funzioni $f (x, y)$ , $g (x, y)$ di classe $C^{1} (Ω_{γ})$ , continue sulla chiusura di $Ω_{γ}$ .

Mostriamo ora un’estensione importante di queste formule. Quest’estensione è suggerita dalla figura (8.4). Si tratta di un’estensione di queste formule a regioni delimitate da più curve, come nel caso rappresentato dalla figura 8.9, a sinistra, dove le curve sono due, $γ_{1}$ e $γ_{2}$ , il sostegno dell’una contenuto nella regione interna all’altra.

figura 8.9: Estensione della formula di Green

Chiamiamo $Ω$ la regione delimitata dalle curve $γ_{1}$ e $γ_{2}$ e sia $\vec{V} (x, y) \in C^{1} (Ω)$ un campo vettoriale continuo sulla chiusura di $Ω$ . Introduciamo due segmenti, $S_{1}$ ed $S_{2}$ , come nella figura a destra, e due piccoli tagli uno su $γ_{1}$ e l’altro su $γ_{2}$ , in corrispondenza a tali segmenti. Si ottiene in questo modo una curva $\tilde{γ}$ che verifica sia le condizioni della formula di Green che quelle della formula della divergenza. Vale quindi

\begin{aligned} \int_{Ω_{\tilde{γ}}} [g_{x} (x, y) - f_{y} (x, y)] d x d y = \int_{\tilde{γ}} f d x + g d y, \\ \int_{Ω_{\tilde{γ}}} [g_{x} (x, y) + f_{y} (x, y)] d x d y = \int_{\tilde{γ}} \vec{V} \cdot {\vec{n}}_{e} d s . \end{aligned}

Quando $S_{1}$ ed $S_{2}$ tendono l’uno all’altro gli integrali lungo i due segmenti si elidono, gli integrali sui due tagli tendono a zero (si ricordino la (8.10) e il Teorema 226.) e l’integrale sulla regione interna a $\tilde{γ}$ tende all’integrale su $Ω$ . Si trova quindi

\begin{aligned} \int_{Ω} (r o t \vec{V}) \cdot \vec{k} d x d y = \int_{γ_{2}} \vec{V} \cdot d \vec{r} - \int_{γ_{1}} \vec{V} \cdot d \vec{r}, \\ \int_{Ω} d i v \vec{V} d x d y = \int_{γ_{2}} \vec{V} \cdot {\vec{n}}_{e} d s - \int_{γ_{1}} \vec{V} \cdot {\vec{n}}_{e} d s . \end{aligned}

Si noti che il segno negativo viene perchè la curva interna va considerata orientata negativamente, mentre abbiamo convenuto che nel simbolo $\int_{γ}$ la curva chiusa debba essere orientata positivamente. Nel caso particolare in cui si abbia

d i v \vec{V} (\vec{r}) = \nabla \cdot \vec{V} (\vec{r}) = 0,

La formula precedente mostra che Se la divergenza di un campo vettoriale è nulla, il ﬂusso del campo vettoriale entrante attraverso $γ_{1}$ è uguale a quello uscente attraverso $γ_{2}$ . Si discutano risultati analoghi ai precedenti, nel caso in cui la regione delimitata dalla curva più esterna contenga vari “buchi”, ciascuno delimitato da una curva di Jordan regolare a tratti.

Osservazione 235 Si osservi che se il campo vettoriale è di classe $C^{1} (Ω_{γ_{1}})$ allora le relazioni precedenti si ottengono semplicemente per differenza:

\begin{aligned} \int_{Ω} \nabla \cdot \vec{V} (\vec{r}) \cdot d x d y = \int_{Ω_{γ_{1}}} \nabla \cdot \vec{V} (\vec{r}) \cdot d x d y - \int_{Ω_{γ_{2}}} \nabla \cdot \vec{V} (\vec{r}) \cdot d x d y \\ = \int_{γ_{1}} \vec{W} \cdot {\vec{n}}_{e} d s - [\int_{γ_{2}} \vec{W} \cdot {\tilde{\vec{n}}}_{\vec{e}} d s] . \end{aligned}

In questa formula, ${\tilde{\vec{n}}}_{\vec{e}}$ è la normale esterna ad $Ω_{γ_{2}}$ e quindi interna ad $Ω$ ; e $γ_{2}$ è percorsa in senso positivo ripetto a $Ω_{γ_{2}}$ e quindi in senso negativo rispetto a $Ω$ . _

8.4 Integrali di superficie

La lunghezza di un arco è stata definita nel paragrafo 6.1.2. Invece, non si è definita l’area di una calotta. Questo è il primo argomento che ora studiamo. Definiremo poi l’integrale su una calotta. Come nel caso delle curve, vedremo che serve definire due tipi diversi di integrali.

8.4.1 Area di una calotta

Consideriamo una calotta $\vec{r} (u, v)$ con $(u, v)$ variabili in una regione $Ω_{γ}$ delimitata da una curva semplice chiusa $γ$ , regolare a tratti. Sia inoltre $\vec{r} (u, v)$ di classe $C^{1} (Ω_{γ})$ . Ricordiamo che la chiusura di $Ω_{γ}$ è un dominio di integrazione. Dunque, è possibile approssimare la regione $Ω_{γ}$ mediante tanti piccoli rettangoli con i lati paralleli agli assi coordinati, si vedano l’osservazione 204 e il paragrafo 7.1.3. fissiamo l’attenzione su uno di questi rettangoli e sulla sua immagine sulla superficie (si veda la figura 8.10).

figura 8.10: Area di una calotta

Per semplicità di notazioni, supponiamo che esso sia un quadrato col vertice a sinistra in basso nel punto $(0, 0)$ e che al punto $(0, 0)$ corrisponda il punto $(0, 0, 0)$ (si noti che questo non è il caso illustrato dalla figura). Consideriamo il lato $(t, 0)$ del quadrato, $0 \leq t \leq τ$ . Ad esso corrisponde una curva $\vec{r} (t, 0)$ sulla superficie, la cui tangente in $(0, 0, 0)$ è parallela al vettore ${\vec{r}}_{u} (0, 0)$ . Consideriamo il segmento di tangente ${\vec{r}}_{u} (0, 0) t$ , $0 \leq t \leq τ$ . In modo analogo, a partire dall’altro lato di vertice $(0, 0)$ , arriviamo a considerare il segmento ${\vec{r}}_{v} (0, 0) t$ , $0 \leq t \leq τ$ . Questi due segmenti (uscenti da $(0, 0, 0)$ ) appartengono al piano tangente e in generale non stanno sulla superficie; ma, se $τ$ è “piccolo” il parallelogramma che essi individuano differisce “per poco” dall’immagine del quadrato sulla superficie. Dunque l’area di tale parallelogramma approssima l’area della parte di superficie che viene descritta quando $(u, v)$ varia nel quadrato. L’area del parallelogramma è $τ^{2} \cdot | {\vec{r}}_{u} (0, 0) \land {\vec{r}}_{v} (0, 0) | = τ^{2} | \vec{N} (0, 0) |$ . Si ripeta questo argomento per ciascuno dei rettangoli e si sommino i risultati. Quello che si trova è una somma di Riemann per l’integrale doppio la funzione $| \vec{N} (u, v) |$ . Ciò giustifica la definizione seguente:

Definitione 4 Sia

(u, v) \to \vec{r} (u, v) (u, v) \in Ω

una superficie regolare. Sia $γ$ una curva semplice e chiusa con sostegno in $Ω$ e sia

Σ : (u, v) \to \vec{r} (u, v) (u, v) \in Ω_{γ}

la calotta corrispondente. Si chiama area della calotta $Σ$ il numero

\int_{Ω_{γ}} | \vec{N} (u, v) | d u d v .

Usando la regola per il cambiamento di coordinate degli integrali doppi e il Teorema 202 si potrebbe provare:

Teorema 236 Due superfici equivalenti, ossia che differiscono solo per la parametrizzazione, hanno la medesima area. Inoltre, l’area non muta cambiando l’orientazione della superficie.

Se la superficie è data in forma cartesiana,

z = f (x, y),

la sua area è

\int_{Ω_{γ}} \sqrt{1 + f_{x}^{2} (x, y) + f_{y}^{2} (x, y)} d x d y .

Come ulteriore caso particolare, consideriamo il caso di una superficie di rotazione, descritta da

z = f (\sqrt{x^{2} + y^{2}}) ω_{γ} = D_{R} = \{x^{2} + y^{2} \leq R^{2}\} .

In questo caso,

\begin{aligned} \frac{\partial}{\partial x} f (\sqrt{x^{2} + y^{2}}) = \frac{x}{\sqrt{x^{2} + y^{2}}} f^{'} (\sqrt{x^{2} + y^{2}}), \\ \frac{\partial}{\partial y} f (\sqrt{x^{2} + y^{2}}) = \frac{y}{\sqrt{x^{2} + y^{2}}} f^{'} (\sqrt{x^{2} + y^{2}}) \end{aligned}

e quindi l’area è data da

\begin{aligned} \int_{D_{R}} \sqrt{1 + {[f^{'} (\sqrt{x^{2} + y^{2}})]}^{2}} d x d y \\ \int_{0}^{2 π} \{\int_{0}^{R} r \sqrt{1 + {[f^{'} (r)]}^{2}} d r\} d 𝜃 = 2 π \int_{0}^{R} r \sqrt{1 + {[f^{'} (r)]}^{2}} d r . \end{aligned}

Anche questa formula si chiama formula di Guldino e si interpreta facilmente. Dividendo l’intervallo $[0, R]$ mediante i punti $r_{i}$ , l’integrale si approssima mediante la somma dei numeri

(2 π r_{i}) [(r_{i + 1} - r_{i}) \sqrt{1 + {[f^{'} (r_{i})]}^{2}}]

e questa è l’area di un tronco di cono “iscritto” nella superficie, come in figura 8.11

figura 8.11: Calotta di rotazione (caso particolare: paraboloide di rotazione)

8.4.2 Densità superficiale

Si abbia una funzione che ad ogni calotta di una superficie associa un numero. Per esempio, se la superficie è realizzata con una lamiera, la funzione che ad una calotta della superficie associa la sua massa o, nelle applicazioni all’elettrologia, la sua carica. Indichiamo con $m (Σ)$ questa funzione. La densità (di massa, di carica ecc.) media su $Σ$ è il numero

ρ (Σ) = \frac{m (Σ)}{A (Σ)} .

In questa formula, $A (Σ)$ è l’area della calotta $Σ$ . Vogliamo ora passare dalla densità media alla densità puntuale. Per questo, supponiamo che la superficie sia parametrizzata da

(u, v) \to \vec{r} (u, v), (u, v) \in Ω

e supponiamo che la superficie sia semplice, ossia supponiamo che questa trasformazione sia iniettiva. fissiamo un punto ${\vec{r}}_{0}$ sulla superficie,

{\vec{r}}_{0} = \vec{r} (u_{0}, v_{0}) .

Sia $Q_{l}$ un quadrato di lato $l$ il cui centro è $(u_{0}, v_{0})$ e sia $𝒞_{l}$ l’immagine del quadrato sulla superficie. Si considera quindi il limite

ρ ({\vec{r}}_{0}) = lim_{l \to 0} \frac{m (𝒞_{l})}{A (𝒞_{l})} .

Se questo limite esiste finito, lo chiamiamo la densità della funzione $m$ . In realtà questa definizione è più delicata di quanto possa sembrare perchè per il calcolo del limite si sono privilegiati i quadrati. Niente garantisce che se si fossero scelti dei dischi⁶ si sarebbe trovato il medesimo limite e in effetti generalmente ciò non avviene. Diciamo che, sotto “ipotesi di regolarità” della funzione $m$ ciò non accade. Ma non abbiamo i mezzi necessari per specificare quali siano queste ipotesi. Il procedimento inverso a questo, porta a definire gli integrali di superficie di prima specia.

8.4.3 Integrali di superfici di prima specie

Cosìcome per le curve, anche sulle superfici si definicono due tipi diversi di integrali. Il primo è suggerito dal problema del calcolo della massa di una superficie, quando si conosce la la densità $ρ$ , che può variare da punto a punto. Ricordando la definizione di densità, per esempio di massa, non meraviglia che per ritrovare la massa totale della calotta che si ottiene quando $(u, v)$ varia in una regione $Ω_{γ}$ , delimitata da una curva di Jordan $γ$ , si debba calcolare

\int_{Ω_{γ}} ρ (x (u, v), y (u, v), z (u, v)) | \vec{N} (u, v) | d u d v .

In generale, un integrale della forma

\int_{Ω_{γ}} f (x (u, v), y (u, v), z (u, v)) | \vec{N} (u, v) | d u d v .

(8.25)

(con $f (x, y, z)$ funzione continua definita sulla calotta) si chiama integrale di superficie di prima specie o semplicemente integrale superficiale. E’ chiaro che il valore dell’integrale non cambia cambiando l’orientazione della superficie, dato che nell’espressione dell’integrale figura non direttamente $\vec{N}$ , ma il suo modulo. Oltre a ciò si potrebbe provare:

Teorema 237 L’integrale di superficie di prima specie non muta cambiando parametrizzazione.

Invece di usare la notazione (8.25) si usa in genere la notazione

\int_{Σ} f (x, y, z) d Σ o p p u r e \int_{Σ} f (x, y, z) d A

( $A$ iniziale di “area”. Talvolta si scrive $d S$ ).

8.4.4 Integrale di superficie di seconda specie

L’integrale di superficie di seconda specie è suggerito dal calcolo del ﬂusso attraverso una superficie, che ora definiamo. Sia $\vec{V} (x, y, z) = f (x, y, z) \vec{i} + g (x, y, z) \vec{j} + h (x, y, z) \vec{k}$ un campo vettoriale che però ora non interpretiamo come campo di forze. Piuttosto pensiamo che un ﬂuido riempia tutto lo spazio e che la particella che passa per il punto $(x, y, z)$ ci passi con velocità $\vec{V} (x, y, z)$ . Vogliamo calcolare la quantità di ﬂuido che, nell’unità di tempo, traversa la superficie. Approssimiamo ancora la superficie con tanti piccoli parallelogrammi che giacciono sui piani tangenti, come abbiamo fatto per il calcolo dell’area. Sia $𝒫$ uno di essi. La quantità di ﬂuido che nell’unità di tempo lo attarversa è il volume del parallelepipedo che ha $𝒫$ per base e la cui altezza è, circa,

\frac{\vec{N} (x_{0}, y_{0}, z_{0})}{| \vec{N} (x_{0}, y_{0}, z_{0}) |} \cdot \vec{V} (x_{0}, y_{0}, z_{0})

(“circa”, perché il campo vettoriale non è costante su $𝒫$ ). Si veda la figura 8.12.

figura 8.12: Flusso attraverso una superficie

Il volume va calcolato ora con segno perché non è indifferente che il ﬂuido passi dall’una all’altra parte della superficie, ed è dato da

\vec{V} (x_{0}, y_{0}, z_{0}) \cdot \vec{N} (x_{0}, y_{0}, z_{0})

(si ricordi che $| \vec{N} (x_{0}, y_{0}, z_{0}) |$ è circa l’area di $𝒫$ e che $\vec{N} (x_{0}, y_{0}, z_{0})$ è l’area “con segno”). Sommando i contributi di tutti i parallelogrammi si trova una delle somme di Riemann che approssimano l’integrale di $\vec{V} (x, y, z) \cdot \vec{N} (x, y, z)$ . Ciò suggerisce di definire l’integrale di superficie di seconda specie

\int_{Ω} \vec{V} (x (u, v), y (u, v), z (u, v)) \cdot \vec{N} (x (u, v), y (u, v), z (u, v)) d u d v .

(8.26)

Una notazione più semplice che si usa per indicare questo integrale è

\int_{Σ} \vec{V} \cdot d \vec{Σ} .

(8.27)

In questa notazione si sottintende la dipendenza da $u$ e da $v$ . Si noti che l’integrale di superficie di seconda specie è uguale a

\int_{Σ} \vec{V} (\vec{r}) \cdot \vec{n} (\vec{r}) d A

con $\vec{n} (\vec{r})$ il versore normale alla superficie. Si prova:

Teorema 238 Il valore dell’integrale di superficie di seconda specie non muta cambiando la parametrizzazione della superficie. Esso cambia di segno cambiando l’orientazione.

Osservazione 239 L’integrale di superficie di seconda specie è un “integrale orientato”: esso cambia segno cambiando il verso della normale, ossia l’orientazione della superficie. Consideriamo ora il caso particolare in cui la superficie $Σ$ è un dominio di integrazione, $Σ = 𝒟$ , del piano $(u, v)$ e quindi è parametrizzata da

x = u, y = v, z = 0, (u, v) \in Σ .

Sia inoltre

\vec{V} (x, y, z) = \vec{V} (x, y) = h (x, y) \vec{k} .

In questo caso, se la superficie è orientata positivamenta

\int_{Σ} \vec{V} (x, y) \cdot d Σ = \int_{Σ} h (x, y) d x d y = \int_{𝒟} h (x, y) d x d y,,

l’usuale integrale doppio di $h (x, y)$ . Se però la superficie è orientata negativamente, la normale punta verso il basso e

\int_{Σ} \vec{V} (x, y) \cdot d Σ = \int_{Σ} h (x, y) d y d x,

e questo vale

- \int_{𝒟} h (x, y) d x d y,

l’usuale integrale doppio cambiato di segno. _

8.4.5 Integrale di superficie di seconda specie e forme differenziali

Sia nel calcolo del lavoro, integrale di curva di prima specie, che nel calcolo del ﬂusso, integrale di superficie di seconda specie, interviene un campo vettoriale, ma le proprietà fisiche di tali campi sono sostanzialmente diverse. E’ quindi utile individuare un formalismo matematico che permetta di distinguere un caso dall’altro e di distinguere anche visivamente se un campo vettoriale si vuol usare per il calcolo di un’integrale di curva o di superficie. Per arrivare a ciò, vediamo una formula esplicita per il calcolo dell’integrale (8.27), più esplicita della formula (8.26). Ricordiamo che

\begin{aligned} \vec{N} (u, v) = (x_{u} \vec{i} + y_{u} \vec{j} + z_{u} \vec{k}) \land (x_{v} \vec{i} + y_{v} \vec{j} + z_{v} \vec{k}) \\ = [y_{u} z_{v} - z_{u} y_{v}] \vec{i} + [z_{u} x_{v} - x_{u} z_{v}] \vec{j} + [x_{u} y_{v} - y_{u} x_{v}] \vec{k} . \end{aligned}

L’espressione esplicita di (8.27) è

\int_{Ω} \{f (x, y, z) [y_{u} z_{v} - z_{u} y_{v}] + g (x, y, z) [z_{u} x_{v} - x_{u} z_{v}] + h (x, y, z) [x_{u} y_{v} - y_{u} x_{v}]\} d u d v

(8.28)

(la dipendenza di $x$ , $y$ , $z$ da $u$ e da $v$ non si è indicata per brevità). Se $\vec{V} (x, y, z) = f (x, y, z) \vec{i} + g (x, y, z) \vec{j} + h (x, y, z) \vec{k}$ è il campo vettoriale che si vuol integrare su una superficie, indichiamolo col simbolo

f d y d z + g d z d x + h d x d y .

(8.29)

Scriviamo inoltre

d x = x_{u} d u + x_{v} d v, d y = y_{u} d u + y_{v} d v, d z = z_{u} d u + z_{v} d v .

(8.30)

Usando le “regole di calcolo” (8.21) è ora facile ricostruire l’espressione dell’integrale (8.28). L’integrando si ottiene sostituendo le (8.30) in (8.29) e usando le (8.21) (rispetto ai simboli $d u$ e $d v$ ). Si trova:

\begin{aligned} d y d x & = & y_{u} z_{u} d u d u + y_{u} z_{v} d u d v + y_{v} z_{u} d v d u + y_{v} z_{u} d v d v \\ = & (y_{u} z_{v} - y_{v} z_{u}) d u d v \\ d z d x & = & (z_{u} x_{v} - z_{v} x_{u}) d u d v \\ d x d y & = & (x_{u} y_{v} - x_{v} y_{u}) d u d v \end{aligned}

come serve per il calcolo dell’integrale (8.28). Un’espressione della forma (8.29) si chiama una $2$ -forma differenziale (il numero 2 ricorda che si vuole integrarla su una superficie, intuitivamente un “foglietto” di dimensione $2$ .) Anche le $2$ -forme differenziali si indicano con lettere greche minuscole,

ω = f d y d z + g d z d x + h d x d y .

Completiamo le regole (8.21) imponendo:

\begin{matrix} d x d x = 0, & d y d y = 0, & d z d z = 0, \\ d y d x = - d x d y, & d z d x = - d x d z, & d z d y = - d y d z . \end{matrix}

(8.31)

(anche queste regole sono suggerite dalle regole del prodotto vettoriale). Con queste notazioni, la (8.28) si ottiene dalla (8.29) sostituendo $x$ , $y$ , $z$ con $x (u, v)$ , $y (u, v)$ , $z (u, v)$ ; usando le regole di calcolo precedenti e quindi integrando su $Ω$ .

8.5 Analisi vettoriale nello spazio

Studiamo ora l’analisi vettoriale nello spazio.

8.5.1 Formula della divergenza e formula di Gauss

L’uguaglianza (8.23) correla le $1$ -forme differenziali e gli integrali su aree piane. Mostriamo che esiste una formula analoga, che correla gli integrali delle $2$ –forme differenziali (ossia, i ﬂussi di campi vettoriali) e gli integrali di volume. Limitiamoci a considerare il caso di regioni $Ω$ convesse. Non è diffcile mostrare che la formula che troveremo vale anche se la regione $Ω$ può rappresentarsi come unione o differenza di regioni convesse. Cosìcome abbiamo fatto per la riduzione degli integrali multipli ad integrali iterati, indichiamo con $Ω_{z}$ la proiezione sul piano $(x, y)$ di $Ω$ ,

Ω_{z} = {(x, y) | esiste z tale che (x, y, z) \in Ω} .

Analogamente definiamo $Ω_{x}$ ed $Ω_{y}$ . Sia $(x, y) \in Ω_{z}$ . La retta verticale per $(x, y)$ interseca $Ω$ in un segmento $[ϕ (x, y), ψ (x, y)]$ . Richiediamo che le funzioni $ϕ (x, y)$ , $ψ (x, y)$ siano di classe $C^{1}$ . Proprietà analoghe richiediamo anche per le intersezioni con le rette parallele agli assi delle ascisse e delle ordinate. Sotto queste condizioni, la regione $Ω$ viene ad essere delimitata da “pezzi” di superfici regolari. In ciascun punto di tali superfici è possibile definire la normale. La normale non sarà generalmente definita nei punti in cui due “pezzi” diversi si congiungono. Per semplicità noi supporremo che in ogni punto di $\partial Ω$ sia possibile definire la retta normale. Vedremo più avanti come indebolire questa condizione. Consideriamo un punto ${\vec{r}}_{0} = (x_{0}, y_{0}, ψ (x_{0}, y_{0}))$ della superficie superficie $z = ψ (x, y)$ . Se un punto ${\vec{r}}_{1} = (x_{1}, y_{1}, z_{1})$ di questa retta appartiene ad $Ω$ , tutto il segmento che lo congiunge a ${\vec{r}}_{0}$ è in $Ω$ perch’e $Ω$ è convessa. Dunque, è possibile definire la normale entrante e la normale uscente da $Ω$ nel punto ${\vec{r}}_{0}$ . Applichiamo in ogni punto $P$ di $Ω$ la normale uscente ad $Ω$ in tale punto. Tale vettore normale indichiamo col simbolo ${\vec{N}}_{e} (P)$ (l’indice “ $e$ ” indica “normale esterna” o uscente dalla superficie).

figura 8.13: Una sfera e la parte “sotto l’equatore”

Per esempio, fissiamo l’attenzione sulla “parte inferiore” della superficie $Ω$ in fig. 8.13, parametrizzata da

x \vec{i} + y \vec{j} + ϕ (x, y) \vec{k} (x, y) \in Ω_{z} .

Nel caso specifico si tratta di una sfera e se ne considera la parte “sotto l’equatore”. Abbiamo definito la normale

\vec{N} (x, y) = (\vec{i} + ϕ_{x} (x, y) \vec{k}) \land (\vec{j} + ϕ_{y} \vec{k}) = - ϕ_{x} (x, y) \vec{i} - ϕ_{y} (x, y) \vec{j} + \vec{k} .

Essendo positivo il coeffciente di $\vec{k}$ , la normale punta verso l’alto. Dunque entra in $Ω$ . Invece, noi vogliamo la normale che esce da $Ω$ . Dobbiamo quindi cambiare segno alla $\vec{N} (x, y)$ e scegliere

- \vec{N} (x, y) = - (\vec{i} + ϕ_{x} (x, y) \vec{k}) \land (\vec{j} + ϕ_{y} \vec{k}) = ϕ_{x} (x, y) \vec{i} + ϕ_{y} (x, y) \vec{j} - \vec{k} .

Definitione 5 Indicheremo con ${\vec{N}}_{e} (\vec{r})$ la normale nel punto $\vec{r}$ alla superficie $Σ$ che racchiude $Ω$ , orientata verso l’esterno di $Ω$ . _

Vediamo esplicitamente un esempio.

Esempio 240 La superficie sia la sfera $x^{2} + y^{2} + z^{2} = 1$ . Si tratta quindi di una superficie assegnata in modo implicito. I due emisferi superiore ed inferiore sono parametrizzati rispettivamente da

z = \sqrt{1 - x^{2} - y^{2}} z = - \sqrt{1 - x^{2} - y^{2}}, x^{2} + y^{2} < 1 .

Si vede facilmente che se si vuole la normale esterna, ossia uscente da $Ω$ , bisogna parametrizzare l’emisfero superiore scegliendo prima $x$ e poi $y$ ; nell’emisfero inferiore bisogna scegliere prima $y$ e poi $x$ . _

Sia ora $T (x, y, z)$ una funzione derivabile. Calcoliamo

\begin{aligned} \int_{Ω} \frac{\partial}{\partial z} T (x, y, z) d x d y d z = \int_{Ω_{z}} [\int_{ϕ (x)}^{ψ (x)} \frac{\partial}{\partial z} T (x, y, z) d z] d x d y \\ = \int_{Ω_{z}} T (x, y, ψ (x, y)) d x d y - \int_{Ω_{z}} T (x, y, ϕ (x, y)) d x d y . \end{aligned}

La normale esterna alla superficie di $Ω$ , nei punti $(x, y, ψ (x, y))$ , rispettivamente $(x, y, ϕ (x, y))$ , è:

\begin{aligned} {\vec{N}}_{e} (x_{0}, y_{0}, z_{0}) = - ψ_{x} (x_{0}, y_{0}) \vec{i} - ψ_{y} (x_{0}, y_{0}) \vec{j} + \vec{k}, \\ {\vec{N}}_{e} (x_{0}, y_{0}, z_{0}) = ϕ_{x} (x_{0}, y_{0}) \vec{i} + ϕ_{y} (x_{0}, y_{0}) \vec{j} - \vec{k} \end{aligned}

Dunque

\int_{Ω} \frac{\partial}{\partial z} T (x, y, z) d x d y d z = \int_{Ω_{z}} T \vec{k} \cdot {\vec{N}}_{e} d x d y .

Indichiamo con $Σ_{z}$ le due calotte di parametrizzazione $ϕ (x, y)$ e $ψ (x, y)$ . Con questa notazione e chiamando ${\vec{n}}_{e}$ il versore

{\vec{n}}_{e} = \frac{{\vec{N}}_{e}}{| {\vec{n}}_{e} |},

l’ultimo integrale è uguale a

\int_{Σ_{z}} T \vec{k} \cdot {\vec{n}}_{e} d Σ = \int_{Σ_{z}} T \vec{k} \cdot d \vec{Σ} .

Si noti che i grafici delle funzioni $ϕ (x, y)$ e $ψ (x, y)$ possono non esaurire tutta la frontiera di $Ω$ , ma una parte della frontiera che non appartiene a tali grafici è parte di un cilindro verticale. Ha quindi per normale un vettore ortogonale a $\vec{k}$ e quindi non dà contributo al calcolo dell’integrale. In modo analogo si mostra che

\begin{aligned} \int_{Ω} \frac{\partial}{\partial y} S (x, y, z) d x d y d z = \int_{Ω_{y}} S \vec{j} \cdot {\vec{N}}_{e} d x d y = \int_{Σ_{y}} S \vec{j} \cdot {\vec{n}}_{e} d Σ, \\ \int_{Ω} \frac{\partial}{\partial x} R (x, y, z) d x d y d z = \int_{Ω_{x}} R \vec{k} \cdot {\vec{N}}_{e} d y d z = \int_{Σ_{x}} R \vec{i} \cdot {\vec{n}}_{e} d Σ \end{aligned}

(le definizioni di $Σ_{x}$ e $Σ_{y}$ sono analoghe a quella di $Σ_{z}$ ). Sommando i tre integrali si trova

Teorema 241 (della divergenza) Sia $Ω$ una regione convessa e limitata, la cui frontiera è sostegno di una superficie regolare. Vale

\begin{aligned} \int_{Ω} [\frac{\partial}{\partial x} R (x, y, z) + \frac{\partial}{\partial y} S (x, y, z) + \frac{\partial}{\partial z} T (x, y, z)] d x d y d z \\ = \int_{Ω} d i v (R \vec{i} + S \vec{j} + T \vec{k}) d x d y d z = \int_{Ω} \nabla \cdot (R \vec{i} + S \vec{j} + T \vec{k}) d x d y d z \\ = \int_{\partial Ω} {R \vec{i} + S \vec{j} + T \vec{k}} \cdot d \vec{Σ} . \end{aligned}

La superficie

Σ

è orientata scegliendo la normale usente da

Ω

Nell’ultimo integrale si intende che la superficie è orientata mediante la normale esterna.

Il teorema della divergenza ha la seguente interpretazione: il ﬂusso di un campo vettoriale uscente da una superficie è uguale all’integrale di volume della divergenza del campo vettoriale stesso. Il ﬂusso è positivo quando il campo vettoriale “esce” da $Ω$ . In tal caso, l’integrale della divergenza è positivo, e ciò, come si è già notato, spiega l’uso del termine “divergenza”. Consideriamo ora una caso particolare: supponiamo che il campo vettoriale $\vec{V} (x, y, z)$ sia il gradiente di una funzione $ϕ (x, y, z)$ , a valori reali. In questo caso,

\begin{aligned} d i v \nabla ϕ (x, y, z) = \nabla \cdot \nabla ϕ (x, y, z) \\ = ϕ_{x x} (x, y, z) + ϕ_{y y} (x, y, z) + ϕ_{z z} (x, y, z) = Δ ϕ (x, y, z) \end{aligned}

e quindi si trova:

\int_{Ω} Δ ϕ (x, y, z) d x d y d z = \int_{\partial Ω} \nabla ϕ \cdot d \vec{Σ} .

Questo caso particolare del Teorema della divergenza va sotto il nome di Formula di Gauss.

In fisica hanno importanza queli campi vettoriali che hanno ﬂusso nullo attraverso ogni superficie chiusa. Tali campi si chiamano campi solenoidali Una condizione suffciente perchè un campo vettoriale sia solenoidale è che la sua divergenza sia nulla. Questa condizione è solo suffciente come prova l’esempio seguente:

\vec{F} (x, y, z) = \frac{x}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}} \vec{i} + \frac{y}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}} \vec{j} + \frac{z}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}} \vec{k}

(proporzionale al campo elettrico di una carica puntiforme, il cui ﬂusso attraverso una sfera concentrata nella carica non è nullo, nonostante che

\nabla \cdot \vec{F} (x, y, z) = 0

). Se accade che il campo è ovunque definito e di classe

C^{1}

allora il campo è solenoidale se e solo se la sua divergenza è nulla.

Vediamo ora di scrivere il il Teorema della divergenza con l’uso del simbolismo delle forme differenziali. Sia

ω = R d y d z + S d z d x + T d x d y .

Usando le regole (8.31) si trova

d ω = (R_{x} + S_{y} + T_{z}) d x d y d z .

(8.32)

Per uniformità, usa chiamare “3–forma differenziale” un’espressione della forma

f (x, y, z) d x d y d z .

Essa è niente altro che la funzione scalare $f (x, y, z)$ . Si usa questa notazione, per intendere che questa funzione va integrata su una regione dello spazio $ℝ^{3}$ , con l’avvertenza però che il segno cambia per ogni inversione nell’ordine dei tre simboli $d x$ , $d y$ e $d z$ . Ossia, per esempio,

\begin{aligned} f (x, y, z) d x d y d z = - f (x, y, z) d y d x d z, \\ f (x, y, z) d x d y d z = f (x, y, z) d y d y d x . \end{aligned}

Con queste notazioni, il Teorema della divergenza si scrive

\int_{\partial Ω} ω = \int_{Ω} d ω .

(8.33)

In questa formula si intende di aver orientato la normale verso l’esterno di $Ω$ .

Estensioni

Estendiamo ora la formula della divergenza a regioni più generali. Consideriamo due casi:

: Caso 1.

Supponiamo di avere due regioni $Ω_{1}$ e $Ω_{2}$ su ciascuna delle quali vale il teorema della divergenza, e supponiamo che

le due regioni non siano contenute l’una nell’altra, ma si intersechino.

figura 8.14: Le due regioni

Indichiamo con $Ω_{d}$ e $Ω_{u}$ rispettivamente l’unione delle due regionie la differenza $Ω_{1} - Ω_{2}$ :

\begin{aligned} Ω_{d} = {\vec{r} | \vec{r} \in Ω_{1}, e anche \vec{r} \notin Ω_{2}}, \\ Ω_{u} = {\vec{r} | \vec{r} \in Ω_{1} o p p u r e \vec{r} \in Ω_{2}} . \end{aligned}

Supponiamo che una $2$ -forma differenziale $ω$ (equivalentemente, un campo vettoriale $\vec{V} (\vec{r})$ ) sia di classe $C_{1} (ℝ^{3})$ . Consideriamo la regione $Ω_{d}$ . In questa regione, la (8.33) diviene:

\int_{Ω_{d}} d ω = \int_{Ω_{1}} d ω - \int_{Ω_{1} \cap Ω_{2}} d ω = \int_{\partial Ω_{1}} ω - \int_{\partial (Ω_{1} \cap Ω_{2})} ω .

(8.34)

Si noti che l’uguaglianza vale perché $Ω_{1} \cap Ω_{2}$ è convessa, come unione di regioni convesse. La figura 8.15 mostra una sezione dell’insieme su cui si lavora. L’insieme $\partial (Ω_{1} \cap Ω_{2})$ è unione di due parti: una parte della frontiera di $Ω_{1}$ che chiamiamo $Γ_{1}$ e una parte della frontiera di $Ω_{2}$ che chiamiamo $Γ_{2}$ . Chiamiamo invece $Σ_{1}$ e $Σ_{2}$ le parti rimanenti delle frontiere di $Ω_{1}$ e di $Ω_{2}$ .

figura 8.15: Una sezione della regione

Proseguiamo ora le uguaglianze in (8.34). Si ha:

\begin{aligned} [\int_{\partial Ω_{1}} ω] - \{\int_{\partial (Ω_{1} \cap Ω_{2})} ω\} = [\int_{Σ_{1}} ω + \int_{Γ_{1}} ω] - \{\int_{Γ_{1}} ω + \int_{Γ_{2}} ω\} \\ \int_{Σ_{1}} ω + \int_{Γ_{2}} ω = \int_{\partial (Ω_{1} - Ω_{2})} ω . \end{aligned}

Ciò prova che la formula della divergenza vale anche nella regione non convessa ottenuta come differenza di due regioni convesse.

Osservazione 242 Si noti un problema nel calcolo precedente: la frontiera di $Ω_{1} - Ω_{2}$ non è regolare e quindi l’uguaglianza in (8.35) non è perfettamente giustificata da quanto abbiamo detto prima. Però la dimostrazione della formula della divergenza si ottiene con una catena di integrazioni per parti, che possono giustificarsi anche nel caso in esame. _

: Caso 2.

Passiamo ora a considerare la regione $Ω = Ω_{1} \cup Ω_{2}$ . Si noti che $Ω$ non è una regione convessa e che

\partial Ω = Σ_{1} \cup Σ_{2}

ove $Σ_{1}$ è la parte della frontiera di $Ω_{1}$ che non è contenuta in $Ω_{2}$ ; $Σ_{2}$ è la parte della frontiera di $Ω_{2}$ che non è contenuta in $Ω_{1}$ . Sia inoltre

Γ_{1} = [\partial Ω_{1}] \cap Ω_{2}, Γ_{2} = [\partial Ω_{2}] \cap Ω_{1} .

La figura 8.14 mostra, separatamente a sinistra ed a destra, le due regioni con indicate le varie parti della frontiera. Le stelle indicano la curva in cui si intersecano. La figura 8.16 mostra l’unione delle due regioni, con la parte delle due frontiere “visibile dall’esterno”. E’ chiaro che

Σ = \partial Ω = Σ_{1} \cup Σ_{2} .

Però, né la regione è convessa, né la frontiera è regolare. Ciò nonostante, argomenti analoghi a quelli visti sopra portano a concludere che il teorema della divergenza vale anche nella regione $Ω = Ω_{1} \cup Ω_{2}$ .

figura 8.16: Ancora la regione

Osservazione 243 Si potrebbe provare che la classe delle regioni per cui vale il Teorema della divergenza è assai ampia: tutte le regioni limitate la cui frontiera è una superficie regolare orientabile. Discuteremo il concetto di orientabilità di una superficie più avanti. Per ora diciamo soltanto che se una superficie regolare ha per sostegno la frontiera di una regione limitata, essa si dice superficie chiusa⁷. _

: Caso 3.

E’ il caso in cui la regione $Ω_{2}$ sia contenuta nella regione $Ω_{1}$ , come può essere il caso di due palle concentriche. In tal caso è facile vedere che la (8.35) vale ancora. Però ora

\partial (Ω_{1} - Ω_{2}) = [\partial Ω_{1}] ⋃ [\partial Ω_{2}] .

La normale va scelta uscente da $Ω_{1} - Ω_{2}$ . E quindi sulla frontiera di $Ω_{1}$ va scelta la normale uscente da $Ω_{1}$ ; sulla frontiera di $Ω_{2}$ va scelta la normale entrante in $Ω_{2}$ .

8.5.2 La formula di Stokes: il caso delle superfici parametriche

La formula di Stokes dà un’ulteriore relazione che ora collega integrali di curva nello spazio e integrali di superficie.

Osservazione 244 Abbiamo specificato “curva nello spazio” per intendere che se in queste considerazioni interviene la normale alla curva, come nell’osservazione 245, questa va calcolata con la regola con cui si calcola la normale alla curva nello spazio; ossia, $\vec{n} (s)$ è colineare ed ha lo stesso verso di ${\vec{t}}^{'} (s)$ . E ciò anche se, per caso, la curva che si considera appartiene ad un piano. _

Consideriamo una superficie parametrica $Σ$

Σ : (u, v) \to \vec{r} (u, v) = x (u, v) \vec{i} + y (u, v) \vec{j} + z (u, v) \vec{k}, (u, v) \in Ω .

Supponiamo che la parametrizzazione sia iniettiva e di classe $C^{2}$ . Consideriamo una curva semplice e chiusa, con sostegno in $Ω$ :

γ : t \to u (t) \vec{i} + v (t) \vec{j}, t \in [a, b] .

Indichiamo con $Ω_{γ}$ la regione interna alla curva $γ$ . La regione $Ω_{γ}$ è contenuta in $Ω$ e la restrizione di $\vec{r} (u, v)$ alla chiusura di $Ω_{γ}$ definisce una calotta che indichiamo con $Σ_{1}$ . Diciamo che la calotta $Σ_{1}$ ha per bordo⁸ la curva $γ_{1}$ parametrizzata da

\begin{aligned} t \to \vec{r} (t) = \vec{r} (u (t), v (t)) \\ = x (u (t), v (t)) \vec{i} + y (u (t), v (t)) \vec{j} + z (u (t), v (t)) \vec{k}, t \in [a, b] . \end{aligned}

La scelta del verso di percorrenza della curva $γ$ stabilisce un’orientazione su $γ_{1}$ mentre la scelta di considerare $\vec{i}$ come primo elemento della base di $ℝ^{2}$ stabilisce un’orientazione sulla normale a $Σ_{1}$ . Le due orientazioni non hanno relazioni tra loro: per esempio sia

Σ : \vec{r} (u, v) = u \vec{i} + v \vec{j} + \sqrt{1 - u^{2} - v^{2}} \vec{k} .

Le due curve

γ : t \to \frac{1}{2} [cos t \vec{i} + sin t \vec{j}], \tilde{γ} : t \to \frac{1}{2} [sin t \vec{i} + cos t \vec{j}],

figura 8.17: Le due orientazioni del bordo

identificano la medesima calotta, ma le corrispondenti curve $γ_{1}$ e ${\tilde{γ}}_{1}$ hanno orientazioni opposte. Volendo correlare un’integrale sulla superficie $Σ_{1}$ con l’integrale sul suo bordo, dobbiamo correlare le due orientazioni. Per fissare le idee, consideriamo assegnata l’orientazione della superficie, ossia il verso positivo della normale e scegliamo di conseguenza quella sulla curva, ma niente vieta di fare il contrario e talvolta questo è effettivamente utile.

Definitione 6 Diciamo che l’orientazione della calotta $Σ_{1}$ e quella del suo bordo $γ_{1}$ sono concordi quando vale la regola d’Ampère: una persona in piedi sulla superficie nel verso positivo della normale, vede un punto mobile sulla curva passare dalla sua destra alla sua sinistra. _

Osservazione 245 Facendo tendere ad un punto della curva la posizione della persona che osserva il moto, si vede che l’orientazione della calotta e quella del suo bordo sono concordi quando i tre versori della tangente alla curva, della normale alla curva e della normale alla superficie, presi in quest’ordine, formano un sistema di riferimento positivo. Supponiamo che un punto $P (t)$ di $γ_{1}$ percorra la curva a partire da $P (a)$ , portandosi dietro questo sistema di riferimento. Dato che la parametrizzazione della superficie è iniettiva, il punto $P (t)$ torna alla posizione iniziale quando $t = b$ . E alla fine del giro il sistema di riferimento viene a trovarsi nella posizione che aveva all’inizio. Ricordiamo che in queste considerazioni $\vec{n} (s) = {\vec{t}}^{'} (s) ∕ | | {\vec{t}}^{'} (s) | |$ . _

Vale:

Teorema 246 (di Stokes) Valgano le ipotesi dette sopra, in particolare sia iniettiva e di classe $C^{2}$ la parametrizzazione della superficie. Sia $γ_{1}$ il bordo di $Σ_{1}$ e $Σ_{1}$ e $γ_{1}$ abbiano orientazioni compatibili. Sia $\vec{V} (x, y, z)$ un campo vettoriale di classe $C^{1}$ , definito su $Ω$ . Vale

\int_{Σ_{1}} r o t \vec{V} \cdot d \vec{Σ} = \int_{γ_{1}} \vec{V} \cdot d \vec{r} .

(8.35)

Il calcolo che prova questo teorema è in appendice. Il significato fisico del teorema di Stokes è il seguente: La circuitazione del campo vettoriale lungo il bordo di $Σ_{1}$ è uguale al ﬂusso attraverso $Σ_{1}$ del rotore del campo vettoriale stesso. Notiamo che, con le notazioni introdotte per le forme differenziali, anche il Teorema di Stokes si scrive

\int_{Σ_{1}} d ω = \int_{\partial Σ_{1}} ω .

(8.36)

Infatti, se $ω$ è una $1$ –forma differenziale i cui coeffcienti sono le componenti del campo vettoriale $\vec{V}$ , è immediato calcolare che $d ω$ è quella $2$ –forma differenziale i cui coeffcienti sono le componenti del rotore di $\vec{V}$ . Confrontiamo ora le espressioni dei teoremi di Green e di Stokes scritte mediante le formule differenziali. Si vede che essi si possono ambedue scrivere nella forma generale (8.36).

Osservazione 247 Si osservi che nel calcolo l’iniettività della parametrizzazione non si è usata. L’iniettività si è solo usata per l’interpretazione data nell’Osservazione 245. Dunque, la formula (8.35) vale senza quest’ipotesi, pur di intendere che l’integrale a destra sia sostituito da

\int_{a}^{b} \vec{V} (x (t), y (t), z (t)) \cdot {\vec{r}}^{'} (t) d t .

Però in tal caso la curva $γ$ potrebbe essere semplice e la curva $γ_{1}$ potrebbe non esserlo; e quindi il valore dell’integrale non dipenderebbe soltanto dagli enti geometrici $Σ$ e $γ_{1}$ , ma dalla loro parametrizzazione, ciò che non ha senso fisico. Si veda anche l’osservazione 248. _

8.5.3 Estensioni

Una prima estensione della formula di Stokes si incontra nel caso in cui la calotta è delimitata da due curve, come nella figura 8.18 a sinistra.

figura 8.18: Estensione al caso del cilindro

Procedendo come nel caso piano (paragrafo 8.3.5), ossia operando due tagli vicini come nella figura a destra, ci si riconduce al caso che abbiamo già trattato e quindi per una superficie siffatta la formula di Stokes assume l’aspetto

\int_{Σ} d ω = \int_{\partial Σ} ω = \int_{γ_{1}} ω - \int_{γ_{2}} ω .

Il segno negativo di fronte al secondo integrale dipende dal fatto che la curva $γ_{2}$ va orientata in modo discorde rispetto a quello della superficie, si veda la figura. In questo caso diremo che il bordo di $Σ$ è costituito dalle due curve $γ_{1}$ , orientata in modo concorde, e $γ_{2}$ , orientata in modo discorde, rispetto a $Σ$ . Si estendono facilmente queste considerazioni al caso in cui il bordo è costituito da più curve. Ricapitolando, abbiamo introdotto la formula di Stokes per superfici date in forma parametrica. Inoltre, abbiamo esplicitamente supposto che sia possibile orientare la calotta ed il suo bordo in modo concorde. Il fatto è che ciò talvolta non può farsi e questo è tanto più importante perchè molto spesso in pratica è necessario usare il teorema di Stokes nel caso in cui la superficie è ottenuta “incollando” tanti pezzi di superfici parametriche. Chiameremo calotta composta una calotta cosìottenuta. Si noti che passando da un pezzo di superficie ad un altro, la normale può variare in modo discontinuo, si veda la figura 8.19

figura 8.19: Estensione ad una superficie non regolare

E’ chiaro dalla figura che

\int_{Σ} d ω = \int_{Σ_{1}} d ω + \int_{Σ_{2}} d ω

e che la formula di Stokes può applicarsi sia a $Σ_{1}$ che a $Σ_{2}$ ; che il contributo degli integrali sul lato comune si elide e quindi che l’integrale precedente è uguale alla circuitazione del campo vettoriale sui segmenti che delimitano la superficie, opportunamente orientati. Indicando con $γ$ la curva che ha tali segmenti come sostegno, vale ancora

\int_{Σ} d ω = \int_{\partial Σ} ω .

La discontinuità della normale non costituisce quindi un problema.

figura 8.20: La costruzione del nastro di Möbius

Queste considerazioni sono però soltanto apparentemente semplici. Per renderci conto delle diffcoltà, applichiamole alle superfici nelle due figure 8.20. Queste sono superfici regolari, il cui bordo è una curva regolare a tratti, e quindi l’applicazione della formula di Stokes non presenta problemi.

figura 8.21: Il cilindro e il nastro di Möbius

Modifichiamo ora le superfici come in figura 8.21. E’ ancora ovvio che la formula di Stokes vale. Ma, modifichiamo ulteriormente le superfici, portando i segmenti affancati a coincidere. Nel caso della superficie a sinistra, la formula di Stokes vale ancora, nella forma generalizzata perché ora il bordo è costituito da due curve. Infatti, gli integrali sui due segmenti si elidono. Invece, tali integrali si sommano nel caso della superficie a destra e quindi per tale superficie, che si chiama nastro di Möbius, la formula di Stokes non vale.

Osservazione 248 Si noti che nè il cilindro nè il nastro di Möbius sono superfici “semplici”, ossia con parametrizzazione iniettiva; ma in un caso la formula di Stokes vale mentre nell’altro non vale; o meglio, vale la formula di Stokes nell’accezione dell’Osservazione 247, che semplicemente significa: contare due volte il contributo dei segmenti che si sovrappongono. Notiamo però che la posizione dei tali segmenti sul nastro di Möbius è arbitraria: possiamo fare un taglio nella posizione che vogliamo e applicare il Teorema di Stokes alla superficie ottenuta. D’altra parte il campo vettoriale cambia da punto a punto e questo vuol dire che il valore dell’integrale cambia a seconda della posizione del taglio, ossia a seconda del modo che usiamo per calcolare l’integrale. Dunque, tale integrale non dipende dalle sole proprietà geometriche del nastro di Möbius, e non ha alcun significato fisico. _

Si suggerisce di costruire un modello del nastro di Möbius usando una striscia di carta, e di vedere che il suo bordo consiste di un’unica curva. La circuitazione del campo vettoriale lungo tale curva non ha alcuna relazione col ﬂusso del rotore attraverso il nastro. Il nastro di Möbius è una superficie regolare, anche se con parametrizzazione non iniettiva. Dunque, l’unico punto in cui può cedere l’argomentazione che porta alla formula di Stokes è il punto in cui si cerca di orientare la superficie ed il bordo in modo concorde. Infatti, ciò non può farsi. Per vedere ciò, conviene lavorare col versore normale

\vec{n} (u, v) = \frac{\vec{N} (u, v)}{| | \vec{N} (u, v) | |} .

(8.37)

Questo versore è ben definito perchè $\vec{N} (\vec{r})$ non è mai nullo. Dunque,

det [\begin{matrix} {\vec{r}}_{u} (u, v) & {\vec{r}}_{v} (u, v) & \vec{n} (u, v) \end{matrix}]

non si annulla mai: o è sempre positivo, o è sempre negativo. Con la scelta fatta per $\vec{n} (u, v)$ , esso è sempre positivo. Sia ora $γ$ una curva chiusa che gira lungo tutto il nastro di Möbius,

γ : t \to \vec{r} (t)

Sia $\vec{n} (t) = \vec{n} (\vec{r} (t))$ . La funzione $\vec{n} (t)$ varia con continuità, ma la continuità è un concetto locale: niente dice dei valori che $\vec{n} (t)$ prende in punti “lontani”. Chiediamoci allora cosa accade di $\vec{n} (a)$ e di $\vec{n} (b)$ . Costruendo un modello del nastro di Möbius, si vede immediatamente che

\vec{n} (a) = - \vec{n} (b) .

E quindi, non è possibile orientare la curva $γ$ in modo concorde alla superficie. Ciò da una parte spiega come mai la formula di Stokes non vale per il nastro di Möbius e dall’altra conduce alle seguenti definizioni:

Definitione 7 Sia $Σ$ una superficie composta. Essa si chiama una varietà se il versore normale $\vec{n} (\vec{r})$ , definito da (8.37), esiste per ogni $\vec{r}$ , ed è funzione continua di $\vec{r}$ . La varietà si dice orientabile se lungo ogni arco chiuso $\vec{r} (t)$ , $t \in [a, b]$ , si ha

\vec{n} (\vec{r} (a)) = \vec{n} (\vec{r} (b)) .

La formula di Stokes vale per varietà orientabili, il teorema della divergenza vale in regioni $Ω$ la cui frontiera è una varietà orientabile.

Osservazione 249 Le superfici sono state introdotte parametricamente, ma anche come “superfici di livello” di funzioni $F (x, y, z)$ , si veda il capitolo 5. Se la funzione $F (x, y, z)$ è di classe $C^{1}$ e il suo gradiente non si annulla, allora le superfici definite da

F (x, y, z) = c

sono superfici orientabili. _

8.6 Appendici

8.6.1 Appendice: fatti da ricordare

Ricordiamo che:

se $ω = f d x + g d y + h d z, V = f \vec{i} + g \vec{j} + h \vec{k}$
i coeffcienti di $d ω$ sono le componenti del rotore di $\vec{V}$ , ossia di $\nabla \land V$ .
Se $ω = f d y d z + g d z d x + h d x d y, V = f \vec{i} + g \vec{j} + h \vec{k}$
allora
$d ω = (\nabla \cdot \vec{V}) d x d y d z = (d i v \vec{V}) d x d y d z .$

Questi fatti vanno ricordati, insieme alla formula seguente, che si ricava facilmente:

d i v g r a d f = \nabla \cdot [\nabla f] = Δ f = f_{x x} + f_{y y} + f_{z z} = Δ f .

8.6.2 Appendice: osservazioni sulla terminologia

Gli argomenti trattati in questo capitolo vanno sotto il nome di “Analisi Vettoriale”. I termini usati per indicare i singoli argomenti sono però variabili da autore ad autore (praticamente solo il termine “Teorema di Stokes” è usato da tutti nel medesimo modo, quando applicato alle curve nello spazio). Per esempio, l’integrale di curva di prima specie si chiama anche integrali curvilineo mentre l’integrale di curva di seconda specie si chiama anche integrale di linea I due integrali di superficie si chiamano anche, rispettivamente, integrale superficiale ed integrale di ﬂusso Le varie formule integrali che abbiamo incontrato hanno nomi variabili: la formula di Green (nel piano) talvolta si chiama anche formula di Riemann ed è niente altro che la particolarizzazione a curve piane della formula di Stokes nello spazio. Il Teorema della divergenza (nello spazio) si chiama anche Teorema di Gauss o formula do Ostrogradski e talvolta “Formula di Green” ed ha una particolarizzazione al piano che ancora si chiama “formula di Green”. E’ quindi opportuno memorizzare il significato fisico dei vari teoremi per saperli identificare in contesti diversi.

8.7 Appendice: Una dimostrazione del Teorema di Stokes

Dimostriamo il teorema di Stokes in un caso particolare: supponiamo cioè che la superficie $Σ$ sia cartesiana, parametrizzata da

Σ : (x, y) \to (x, y, z (x, y)) .

Però per maggior chiarezza indichiamo con $(u, v)$ i punti di $Ω$ ; ossia imponiamo la condizione $x = x (u, v) = u$ , $y = y (u, v) = v$ . Notiamo che in questo caso particolare la calotta ed il suo bordo sono orientate in modo concorde quando la curva $γ$ è orientata positivamente; ossia quando una punto mobile su $γ$ vede la regione interna $Ω_{γ}$ alla sua sinistra. Sia $\vec{V} (x, y, z) = f (x, y, z) \vec{i} + g (x, y, z) \vec{j} + h (x, y, z) \vec{k}$ il campo vettoriale. Nel nostro caso particolare, si ha

\frac{\partial x}{\partial u} = 1, \frac{\partial y}{\partial v} = 1, \frac{\partial x}{\partial v} = 0, \frac{\partial y}{\partial u} = 0 .

Inoltre, $f_{x} = f_{u}$ , $f_{y} = f_{v}$ ed analoga notazione per $g$ ed $h$ . Dunque si calcola:

\begin{aligned} \int_{γ_{1}} f d x + g d y + h d z = \int_{γ} \{f d u + g d v + (h \frac{\partial z}{\partial u} d u + \frac{\partial z}{\partial v} d v)\} \\ = \int_{γ} f d u + g d v + h (z_{u} d u + z_{v} d v) = \int_{γ} (f + h z_{u}) d u + (g + h z_{v}) d v \\ = \int_{Ω_{γ}} d [(f + h z_{u}) d u + (g + h z_{v}) d v] \\ = \int_{Ω_{γ}} \{\frac{\partial}{\partial u} (g + h z_{v}) - \frac{\partial}{\partial v} (f + h z_{u})\} d u d v \\ = \int_{Ω_{γ}} [(g_{u} + g_{z} z_{u}) - (f_{v} + f_{z} z_{v}) + (h_{u} z_{v} - h_{v} z_{u})] d u d v . \end{aligned}

Mostriamo che anche il ﬂusso del rotore è uguale a questo integrale:

\begin{aligned} \int_{Σ_{1}} r o t \vec{V} \cdot d \vec{Σ} = \int_{Ω_{γ}} \{(h_{v} - g_{z}) (- z_{u}) - (f_{z} - h_{u}) z_{v} + (g_{u} - f_{v})\} d u d v \\ = \int_{Ω_{γ}} [(g_{u} + g_{z} z_{u}) - (f_{v} + f_{z} z_{v}) + (h_{u} z_{v} - h_{v} z_{u})] d u d v . \end{aligned}

Ciò prova l’uguaglianza cercata.

Capitolo 9
Campi conservativi

In questo capitolo studieremo l’esistenza del potenziale di un campo vettoriale, equivalentemente, di una primitiva di una forma differenziale. Cambieremo un po’ le notazioni perché in molte applicazioni il potenziale si indica col simbolo $V$ . Quindi useremo un altro simbolo, per esempio $\vec{F}$ , per indicare il campo vettoriale.

9.1 Potenziale

Supponiamo che il campo vettoriale $\vec{F} (\vec{r})$ definito su una regione $Ω$ sia il gradiente di una funzione¹ $V (\vec{r})$ di classe $C^{1}$ . Si sa dalla fisica che la funzione $V$ si chiama il potenziale del campo vettoriale e che un campo vettoriale dotato di potenziale si chiama conservativo. I campi conservativi hanno grande importanza per le applicazioni.

Si faccia attenzione a non confondersi con i segni: in fisica,

V (\vec{r})

si chiama il potenziale del campo

\vec{F} (\vec{r})

mentre

- V (\vec{r})

ne è l’energia potenziale In fisica si lavora più frequentemente con l’energia potenziale di

\vec{F} (\vec{r})

, ossia con la funzione

- V (\vec{r})

, talvolta indicata come “energia potenziale

V (\vec{r})

”. In questo caso

V (\vec{r})

non è il potenziale di

\vec{F} (\vec{r})

ma di

- \vec{F} (\vec{r})

Vogliamo dare condizioni atte a riconoscere se un assegnato campo vettoriale è conservativo su una regione $Ω$ e, se lo è, vogliamo calcolarne il potenziale. Per evitare complicazioni puramente tecniche assumeremo che i campi vettoriali e le funzioni siano definiti e con la regolarità che verrà richiesta in una regione $\tilde{Ω}$ e che la regione $Ω$ in cui si lavora abbia chiusura contenuta in $\tilde{Ω}$ . In questo modo le derivate delle funzioni sono automaticamente continue sia su $Ω$ che sulla sua chiusura. Col termine “curva” inoltre intenderemo “curva regolare a tratti”. Vediamo subito una condizione necessaria che deve essere soddisfatta dai campi conservativi. Premettiamo quest’osservazione:

Lemma 250 Vale

\oint_{γ} \vec{F} (\vec{r}) \cdot d \vec{r} = 0

per ogni curva chiusa $γ$ di sostegno in $Ω$ se e solo se

\int_{γ_{1}} \vec{F} (\vec{r}) \cdot d \vec{r} = \int_{γ_{2}} \vec{F} (\vec{r}) \cdot d \vec{r}

per ogni coppia di curve $γ_{1}$ e $γ_{2}$ aventi gli stessi estremi.

Dim. Per la dimostrazione, basta notare che se le due curve $γ_{1}$ e $γ_{2}$ hanno gli stessi estremi, allora $γ_{1} - γ_{2}$ è una curva chiusa, si veda il Lemma 228, e quindi

0 = \int_{γ_{1} - γ_{2}} \vec{F} (\vec{r}) \cdot d \vec{r} = \int_{γ_{1}} \vec{F} (\vec{r}) \cdot d \vec{r} - \int_{γ_{2}} \vec{F} (\vec{r}) \cdot d \vec{r} .

Noto ciò, proviamo:

Teorema 251 Se $\vec{F} (x, y, z)$ è un campo conservativo su una regione $Ω$ allora

\oint_{γ} \vec{F} \cdot d \vec{r} = 0

su ogni curva chiusa di sostegno in $Ω$ . Equivalentemente,

\int_{γ} \vec{F} \cdot d \vec{r}

ha il medesimo valore su tutte le curve $γ$ di sostegno in $Ω$ , che hanno i medesimi estremi.

Dim. Calcoliamo l’integrale di $\vec{F} (\vec{r})$ integrale su un arco $γ$ . Sia

\vec{F} (\vec{r}) = V_{x} (x, y, z) \vec{i} + V_{y} (x, y, z) \vec{j} + V_{z} (x, y, z) \vec{k} .

Si trova

\begin{aligned} \int_{γ} V_{x} d x + V_{y} d y + V_{z} d z = \\ \int_{a}^{b} [V_{x} (x (t), y (t), z (t)) ẋ (t) + V_{y} (x (t), y (t), z (t)) ẏ (t) + V_{z} (x (t), y (t), z (t)) ż (t)] d t \\ = \int_{a}^{b} \frac{d}{d t} V (x (t), y (t), z (t)) = V (x (b), y (b), z (b)) - V (x (a), y (a), z (a)) . \end{aligned}

Dunque, in questo caso particolare, l’integrale non dipende dalla curva $γ$ , ma solo dai suoi estremi. In particolare è nullo se gli estremi coincidono, ossia se la curva è chiusa. _ Il teorema precedente non è immediatamente usabile, perché richiede infinite verifiche; una per ciascuna curva chiusa di sostegno in $Ω$ . Ciò può lievemente migliorarsi. Notando che ogni curva di sostegno in $Ω$ si può approssimare mediante poligonali, si potrebbe provare:

Lemma 252 Accade che

\oint_{γ} \vec{F} \cdot d \vec{r} = 0

per ogni curva $γ$ di sostegno in $Ω$ se e solo se

\oint_{P} \vec{F} \cdot d \vec{r} = 0

per ogni poligonale $P$ di sostegno in $Ω$ .

Proviamo ora che le condizioni necessarie appena individuate sono anche suffcienti:

Teorema 253 Un campo vettoriale di classe $C^{1}$

\vec{F} (\vec{r}) = f (\vec{r}) \vec{i} + g (\vec{r}) \vec{j} + h (\vec{r}) \vec{k}

ammette potenziale $V (\vec{r})$ se e solo se la sua circuitazione lungo ogni poligonale chiusa e semplice di sostegno in $Ω$ è nulla.

Dim. La condizione necessaria si è già provata. Mostriamo che essa è anche condizione suffciente. Per fissare le idee, supponiamo $\vec{r} \in Ω \subseteq ℝ^{3}$ e quindi

\vec{F} (\vec{r}) = u (x, y, z) \vec{i} + v (x, y, z) \vec{j} + w (x, y, z) \vec{k} .

fissiamo un punto ${\vec{r}}_{0}$ qualsiasi in $Ω$ e costruiamo una funzione $V (\vec{r})$ in questo modo: sia $P_{\vec{r}}$ una poligonale che congiuge ${\vec{r}}_{0}$ con $\vec{r}$ . L’integrale

\int_{P_{\vec{r}}} \vec{F} (\vec{c}) \cdot d \vec{c}

dipende solo dagli estremi della poligonale, ossia dai punti ${\vec{r}}_{0}$ e $\vec{r}$ , dato che l’integrale sulle poligonali chiuse è nullo. Essendo ${\vec{r}}_{0}$ fissato, il valore dell’integrale dipende solo dal secondo estremo $\vec{r}$ della curva. Dunque la funzione

V (\vec{r}) = \int_{P_{\vec{r}}} \vec{F} (\vec{c}) \cdot d \vec{c}

è ben definita. Mostriamo che essa è derivabile e che le sue derivate parziali sono le componenti di $\vec{F}$ . Consideriamo per questo la derivata rispetto ad $x$ ,

V_{x} (x, y, z) = lim_{h h \to 0} \frac{V (x + h, y, z) - V (x, y, z)}{h} .

Calcoliamo $V (x + h, y, z))$ percorrendo prima la curva $P_{\vec{r}}$ , che congiunge ${\vec{r}}_{0}$ con $\vec{r}$ , e poi il segmento parametrizzato da

{\vec{c}}_{1} (t) = x + t h, c_{2} (t) = y, c_{3} (t) = z, t \in [0, 1] .

Questo segmento congiunge il punto di coordinate $(x, y, z)$ col punto di coordinate $(x + h, y, z)$ . Indichiamo con $S$ questo segmento, cosìche

\begin{aligned} V (\vec{r} + \vec{h}) - V (\vec{r}) = [\int_{γ_{\vec{r}}} \vec{F} (\vec{c}) \cdot d \vec{c} + \int_{S} \vec{F} (\vec{c}) \cdot d \vec{c}] - \int_{γ_{\vec{r}}} \vec{F} (\vec{c}) \cdot d \vec{c} \\ = \int_{S} \vec{F} (\vec{c}) \cdot d \vec{c} = \int_{0}^{1} [u (x + t h, y, z)] h d t . \end{aligned}

Dunque, (usando il Teorema 139 nel passaggio dalla penultima all’ultima riga)

\begin{aligned} V_{x} (x, y, z) = lim_{h \to 0} \frac{V (x + h, y, z) - V (x, y, z)}{h} \\ = lim_{h \to 0} \frac{1}{h} [\int_{0}^{1} [u (x + t h, y, z)] h d t] = lim_{h \to 0} \int_{0}^{1} u (x + t h, y, z) d t \\ = \int_{0}^{1} u (x, y, z) d t = u (x, y, z) \end{aligned}

come si voleva. In modo analogo si trattano le altre derivate. _

Osservazione 254 Ricordiamo che la circuitazione di un campo di forze lungo una curva chiusa si interpreta come il lavoro che il campo compie su un punto che percorre la curva. Il teorema precedente mostra quindi che un campo è conservativo se e solo se esso compie lavoro nullo su ogni punto che percorre una qualsiasi curva chiusa di sostegno in $Ω$ .

Inoltre:

Teorema 255 Due diversi potenziali del medesimo campo vettoriale, definiti su una medesima regione $Ω$ , hanno differenza costante.

Dim. Perchè la loro differenza $U (x, y, z) = V_{1} (x, y, z) - V_{2} (x, y, z)$ ha derivate parziali tutte nulle. Dunque è costante su ogni poligonale e quindi sulla regione $Ω$ . _ L’uso del Teorema 253 per verificare se un campo vettoriale è conservativo, richiede infinite verifiche e quindi non può usarsi per risolvere problemi concreti. Per dare un criterio utilizzabile in pratica, ricordiamo la nostra ipotesi, che il campo vettoriale sia di classe $C^{1}$ . Quindi il potenziale, se esiste, è di classe $C^{2}$ e quindi il Teorema di Schwarz relativo all’eguaglianza delle derivate miste mostra:

Teorema 256 Se il campo vettoriale

\vec{F} (\vec{r}) = u (x, y, z) \vec{i} + v (x, y, z) \vec{j} + w (x, y, z) \vec{k}

di classe $C^{1}$ è conservativo, valgono le uguaglianze

u_{y} = v_{x}, u_{z} = w_{x}, v_{z} = w_{y}

(9.1)

in ogni punto di $Ω$ .

Dim. Infatti, sia

\vec{F} (x, y, z) = V_{x} (x, y, z) \vec{i} + V_{y} (x, y, z) \vec{j} + V_{z} (x, y, z) \vec{k}

Ossia, per esempio, $u = V_{x}$ , $v = V_{y}$ . Il Teorema di Schwarz mostra che

u_{y} = V_{x, y} = V_{y, x} = v_{x} .

Le altre uguaglianze si ottengono in modo analogo. _

Osservazione 257 Le condizioni (9.1) sono state scritte per campi vettoriali su $ℝ^{3}$ , ma naturalmente valgono anche per campi vettoriali in $ℝ^{2}$ . Se $n = 2$ queste condizioni si riducono a

u_{y} = v_{x}, u_{x} = v_{y} .

(9.2)

Le condizioni (9.1) sono le condizioni per avere

r o t \vec{F} (\vec{r}) = \nabla \land \vec{F} (\vec{r}) = 0 .

Un campo vettoriale il cui rotore è nullo si dice irrotazionale Il Teorema 256 si riformula quindi come segue:

Teorema 258 Ogni campo conservativo è irrotazionale.

L’esempio seguente mostra che il viceversa non vale:

Esempio 259 Si consideri il campo vettoriale su $ℝ^{2}$ dato da

\vec{F} (x, y) = \frac{- y}{x^{2} + y^{2}} \vec{i} + \frac{x}{x^{2} + y^{2}} \vec{j} .

(9.3)

Il campo vettoriale (9.3) è rappresentato nella figura 9.1, a sinistra. Si vede immediatamente che questo campo vettoriale verifica, ove è definito, le uguaglianze (9.2); però non è conservativo perchè, calcolando la circuitazione lungo la circonferenza parametrizzata da

γ : x = r cos t, y = r sin t, t \in [0, 2 π]

si trova

r^{2} \int_{γ} ({sin}^{2} t + {cos}^{2} t) d t = 2 r^{2} π \neq 0 .

Dunque, il potenziale non esiste, grazie al Teorema 251. Se si prova ad usare la costruzione nel Teorema 253, si trova una funzione $V (x, y)$ che però non è estendibile con continuità a tutto il piano privato della sola origine: la funzione che si ottiene non ammette estensione continua ad almeno una semiretta uscente dall’origine. _

Osservazione 260 Il campo vettoriale (9.3) è il campo di forze prodotto da un filo percorso da corrente elettrica, in un piano ad esso perpendicolare. Si sa che tale campo di forza può fornire energia ad una particella che è vincolata a percorrere una traiettoria circolare centrata sul filo. Questo campo di forze è rappresentato nella figura 9.1, a sinistra. _

Ricapitolando, abbiamo una condizione necessaria e suffciente perché un campo sia conservativo, espressa dal Teorema 253. Questo teorema però richiede di fare infinite verifiche, e non è praticamente usabile. Abbiamo poi una semplice condizione necessaria, espressa dal Teorema 256. Però l’esempio precedente mostra che questa condizione non è suffciente. Essa però diviene suffciente se la regione su cui si lavora ha una semplice proprietà geometrica:

Definitione 8 Una regione $Ω \subseteq ℝ^{2}$ si dice semplicemente connessa se vale

Ω_{γ} \subseteq Ω

per ogni curva di Jordan $γ$ il cui sostegno è in $Ω$ . Una regione $Ω$ di $ℝ^{3}$ si dice semplicemente connessa se due qualsiasi punti di $Ω$ possono congiungersi con una curva regolare² ed inoltre se ogni curva regolare semplice e chiusa in $Ω$ è bordo di una superficie parametrica semplice il cui sostegno è contenuto in $Ω$ . _

Intuitivamente, una regione di $ℝ^{2}$ è semplicemente connessa quando “non ha buchi”. Una regione di $ℝ^{3}$ semplicemente connessa può avere “buchi” che però devono essere “localizzati”. Per esempio, una corona circolare non è semplicemente connessa in $ℝ^{2}$ mentre un guscio sferico è semplicemente connesso in $ℝ^{3}$ . Invece, togliendo da $ℝ^{3}$ un cilindro (illimitato in ambedue le direzioni) la regione rimanente non è semplicemente connessa. Una classe (molto particolare) di insiemi semplicemente connessi in $ℝ^{3}$ è quella degli insiemi convessi. Proviamo ora:

Teorema 261 Sia $\vec{F} (\vec{r})$ un campo vettoriale di classe $C^{1}$ su una regione $Ω$ . Supponiamo che $\vec{F} (\vec{r})$ sia irrotazionale. Se la regione $Ω$ è semplicemente connessa allora il campo è conservativo.

Dim. Proviamo il teorema in $ℝ^{2}$ . Per provare che il campo è conservativo, dobbiamo provare che vale

\oint_{γ} \vec{F} (\vec{r}) \cdot d \vec{r} = 0

su ciascuna curva regolare, semplice e chiusa $γ$ di sostegno in $Ω$ . Sia $Ω_{γ}$ la regione interna a $γ$ . Dato che la regione $Ω$ è semplicemente connessa, $Ω_{γ}$ è tutta contenuta in $Ω$ e quindi si può usare il Teorema di Green, ossia il Teorema di Stokes sul piano. Si ha quindi

\int_{γ} \vec{F} (\vec{r}) \cdot d \vec{r} = \int_{Ω_{γ}} r o t \vec{F} (x, y) \cdot \vec{k} d x d y = 0

perché il rotore è nullo. La dimostrazione del teorema in $ℝ^{3}$ è analoga: bisogna ricordare che, per ipotesi, ogni curva regolare, semplice e chiusa contenuta in $Ω$ è bordo di una calotta parametrica semplice $Σ$ , tutta contenuta nella regione $Ω$ , sulla quale si può usare il teorema di Stokes in $ℝ^{3}$ . Per il Teorema di Stokes, detta $γ$ la poligonale e $Σ$ la calotta³, vale

\int_{γ} \vec{F} \cdot d \vec{r} = \int_{Σ} r o t \vec{F} \cdot d \vec{Σ} = 0 .

L’esistenza del potenziale segue dall’arbitrarietà della $γ$ , si veda il Teorema 253. _

Osservazione 262

Un disco del piano, o una palla in $ℝ^{3}$ , sono regioni semplicemente connesse. Dunque ogni campo irrotazionale è localmente conservativo. Diffcoltà possono sorgere solamente se ci si “allontana troppo” dal punto di partenza.
Applicando quest’osservazione al campo vettoriale dell’Esempio 259, possiamo dire che questo campo vettoriale ammette potenziale per esempio in ogni semipiano o in ogni angolo che non contiene l’origine.
La condizione sulla regione $Ω$ è solamente suffciente. Il potenziale di un campo vettoriale (irrotazionale) può esistere anche in una regione che non è semplicemente connessa, come mostra l’esempio seguente. Il campo vettoriale è definito su $ℝ^{2} - (0, 0)$ : $\vec{F} (x, y) = \frac{x}{x^{2} + y^{2}} \vec{i} + \frac{y}{x^{2} + y^{2}} \vec{j} .$
Questo campo vettoriale ammette potenziale su $ℝ^{2} - (0, 0)$ , dato da
$V (x, y) = \frac{1}{2} log (x^{2} + y^{2}) .$ (9.4)

9.1.1 Il calcolo del potenziale

Il Teorema 253 insegna a costruire il potenziale di un campo conservativo: basta calcolarne gli integrali lungo curve di forma “semplice”, per esempio poligonali che congiungono un punto ${\vec{r}}_{0}$ fissato col generico punto $\vec{r}$ della regione. E’ ovvio perè che questa via è praticamente percorribile solamente se due punti della regione possono congiungersi con un segmento, in modo da avere integrali facilmente calcolabili. Il caso più semplice è quello in cui $Ω$ è una regione stellata rispetto ad un punto ${\vec{r}}_{0}$ (si veda la definizione al paragrafo 3.1.1). In questo caso esiste un punto ${\vec{r}}_{0}$ che può essere congiunto al generico punto $\vec{r} \in Ω$ mediante un segmento

t \to {\vec{r}}_{0} + t (\vec{r} - {\vec{r}}_{0}), t \in [0, 1] .

In tal caso, Dalla dimostrazione del Teorema 253,

V (\vec{r}) = \int_{0}^{1} \vec{F} ({\vec{r}}_{0} + t [\vec{r} - {\vec{r}}_{0}]) \cdot [\vec{r} - {\vec{r}}_{0}] d t .

Peró questa non è l’unica costruzione possibile e non è la più semplice nemmeno nel caso di una regione stellata. Di solito, è più semplice risolvere, con successivi calcoli di primitive, le equazioni

V_{x} (x, y, z) = u (x, y, z), V_{y} (x, y, z) = v (x, y, z), V_{z} (x, y, z) = w (x, y, z) .

Vediamo ciò su un esempio.

Esempio 263 Sia

\vec{F} (x, y, z) = \frac{\vec{r}}{| \vec{r} |^{3}} \vec{r} = x \vec{i} + y \vec{j} + z \vec{k} .

In questo caso,

\begin{aligned} u (x, y, z) = \frac{x}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}}, \\ v (x, y, z) = \frac{y}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}}, \\ w (x, y, z) = \frac{z}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}} . \end{aligned}

Si noti che la funzione non è definita nell’origine; ma sembra di intuire che su ogni curva di Jordan regolare che non passa per l’origine si possa appoggiare una calotta regolare che non incontra l’origine, alla quale applicare il Teorema di Stokes. Inoltre, si vede facilmente che il campo vettoriale verifica le uguaglianze (9.1). Si può quindi sperare di costruirne un potenziale in ogni regione semplicemente connessa che non contiene l’origine. Per questo si noti che integrando rispetto ad $x$ l’uguaglianza

V_{x} (x, y, z) = u (x, y, z) = \frac{x}{{(x^{2} + y^{2} + z^{2})}^{3 ∕ 2}}

si trova

V (x, y, z) = - \frac{1}{\sqrt{x^{2} + y^{2} + z^{2}}} + Φ (y, z) .

Derivando rispetto ad $y$ ed uguagliando a $v (x, y, z)$ si trova

Φ_{y} (y, z) = 0

e quindi $Φ (y, z)$ non dipende dalla variabile $y$ :

Φ (y, z) = Φ (z) .

Derivando ora $V (x, y, z)$ rispetto a $z$ ed uguagliando a $w (x, y, z)$ si trova

Φ^{'} (z) = 0

e quindi $Φ (z)$ viene ad essere costante. il campo vettoriale proposto ammette quindi come potenziali le funzioni

V (x, y, z) = - \frac{1}{\sqrt{x^{2} + y^{2} + z^{2}}} + c

ove $c$ è una qualsiasi costante. Si osservi che il campo vettoriale dell’esempio precedente è quello gravitazionale (cambiato di segno) e che il potenziale trovato è il potenziale newtoniano (cambiato di segno). La figura 9.1, a destra, mostra la restrizione del campo vettoriale al piano $x = 0$ . _

figura 9.1: Un campo vettoriale conservativo ed uno non conservativo

Ricordiamo nuovamente che la condizione di irrotazionalità è necessaria per l’esistenza del potenziale mentre la condizione che la regione sia semplicemente connessa è solamente suffciente. Un campo irrotazionale potrebbe annettere potenziale anche su una regione non semplicemente connessa. Il potenziale (9.4) mostra un caso di questo tipo.

9.2 Il linguaggio delle $1$ -forme differenziali

Gli stessi argomenti che abbiamo visto sopra possono riformularsi col linguaggio delle forme differenziali. In tal caso usa una terminologia un po’ diversa. Consideriamo il campo vettoriale e la forma differenziale

\vec{F} (\vec{r}) = f (\vec{r}) \vec{i} + g (\vec{r}) \vec{j} + h (\vec{r}) \vec{k}, ω = f (\vec{r}) d x + g (\vec{r}) d y + h (\vec{r}) d z .

Allora:

la condizione $\nabla \land \vec{F} = 0$ (campo irrotazionale) equivale alla condizione
$d ω = 0 .$ (9.5)

Una forma differenziale che verifica (9.5) si dice chiusa

la funzione

V (\vec{r})

verifica

\nabla V (\vec{r})

se e solo se

d V (\vec{r}) = ω .

(9.6)

Una funzione $V (\vec{r})$ per cui vale (9.6) si chiama una primitiva della $1$ -forma differenziale $ω$ .

una forma differenziale dotata di primitive si dice esatta.

Possiamo quindi riformulare i teoremi visti per i campi differenziali in questo modo:

una $1$ -forma differenziale esatta ha integrale nullo su ogni curva chiusa;
una $1$ -forma differenziale esatta è chiusa;
$1$ -forma differenziale chiusa su una regione semplicemente connessa è esatta.

Il linguaggio delle forme differenziali è particolarmente comodo quando si vuol passare al caso di forme differenziali di ordine superiore, come ora vediamo.

9.3 Primitive di $2$ -forme differenziali

Consideriamo ora una $2$ -forma differenziale

ω = f d y d z + g d z d x + h d x d y .

In certe applicazioni ha interesse sapere quando esiste una $1$ -forma differenziale $\tilde{ω}$ tale che

d \tilde{ω} = ω

con $\tilde{ω}$ di classe $C^{2}$ . Una condizione necessaria è:

d ω = d [d \tilde{ω}] = 0 .

Infatti, sia

\tilde{ω} = a d x + b d y + c d z .

Allora, come si è visto,

d \tilde{ω} = [c_{y} - b_{z}] d y d z + [a_{z} - c_{x}] d z d x + [b_{x} - a_{y}] d x d y .

Dunque,

\begin{aligned} d [d \tilde{ω}] = [c_{y x} - b_{z x}] d x d y d z + [a_{z y} - c_{x y}] d y d z d x + [b_{x z} - a_{y z}] d z d x d y \\ = [(a_{z y} - a_{y z}) + (b_{x z} - b_{z x}) + (c_{y z} - c_{x y})] d x d y d z \end{aligned}

e l’ultima espressione è nulla per il Teorema di Schwarz. La condizione $d ω = 0$ si scrive esplicitamente

f_{x} (x, y, z) + g_{y} (x, y, z) + h_{z} (x, y, z) = 0 .

(9.7)

Una $2$ -forma differenziale $ω$ che verifica

d ω = 0

si dice chiusa Se esiste, una $1$ -forma differenziale $\tilde{ω}$ per cui

d \tilde{ω} = ω

si dice una primitiva di $ω$ ; e una $2$ -forma differenziale dotata di primitive si dice ancora esatta Proviamo:

Teorema 264 Una $2$ -forma differenziale chiusa su un rettangolo è anche esatta.

Dim. Infatti, supponiamo che la (9.7) valga e mostriamo un modo per costruire la $\tilde{ω}$ . Uguagliando i coeffcienti di $ω$ e di $\tilde{ω}$ , si vede che i coeffcienti $a (x, y, z)$ , $b (x, y, z)$ e $c (x, y, z)$ devono verificare

\begin{aligned} c_{y} - b_{z} = f, \end{aligned}

(9.8)

\begin{aligned} a_{z} - c_{x} = g, \end{aligned}

(9.9)

\begin{aligned} b_{x} - a_{y} = h . \end{aligned}

(9.10)

Proviamo a vedere se si trova una $1$ -forma $\tilde{ω}$ che verifica queste uguaglianze e che ha nullo uno dei coeffcienti, per esempio il coeffciente $c$ . In tal caso, da (9.8) e (9.8) si trova

\begin{aligned} a (x, y, z) = c_{1} (x, y) + \int_{z_{0}}^{z} g (x, y, s) d s \\ b (x, y, z) = c_{2} (x, y) - \int_{z_{0}}^{z} f (x, y, s) d s \end{aligned}

dove $c_{1} (x, y)$ e $c_{2} (x, y)$ sono arbitrarie funzioni, indipendenti da $z$ . E ora mostriamo che le funzioni $c_{1} (x, y)$ e $c_{2} (x, y)$ si possono determinare in modo che valga anche la (9.10). Per ottenere ciò basta

\frac{\partial}{\partial x} c_{2} (x, y) - \frac{\partial}{\partial y} c_{1} (x, y) = Φ (x, y, z) = h (x, y, z) + \int_{z_{0}}^{z} f_{x} (x, y, s) d s + \int_{z_{0}}^{z} g_{y} (x, y, s) d s .

(9.11)

Notiamo che

\frac{\partial}{\partial z} Φ (x, y, z) = f_{x} (x, y, z) + g_{y} (x, y, z) + h_{z} (x, y, z) = 0

e quindi in realtà

Φ (x, y, z) = Φ (x, y) .

Notato ciò, si vede che ci sono infiniti modi per soddisfare (9.11). Un modo è di scegliere

c_{1} (x, y) = 0, c_{2} (x, y) = \int_{0}^{x} Φ (s, y) d s .

9.4 Alcune formule importanti

Nel corso della trattazione precedente, abbiamo visto che tutte le $0$ -forme, tutte le $1$ -forme e tutte le $2$ -forme (di classe $C^{2}$ ) verificano⁴

d [d ω] = 0

(9.12)

D’altra parte quest’uguaglianza si verifica facilmente anche per le $3$ -fome (e anzi, per le $3$ -forme si ha addirittura $d [f d x d y d z] = 0$ . Vogliamo vedere l’aspetto particolare che questa formula assume quando si vuole scrivere per mezzo degli operatori differenziali. Ricordiamo che:

se $ω = f d x + g d y + h d z, V = f \vec{i} + g \vec{j} + h \vec{k}$
i coeffcienti di $d ω$ sono le componenti del rotore di $\vec{V}$ , ossia di $\nabla \land V$ .
Se $ω = f d y d z + g d z d x + h d x d y, V = f \vec{i} + g \vec{j} + h \vec{k}$
allora
$d ω = (\nabla \cdot V) d x d y d z .$

Dunque, la (9.12) assume la forma:

\begin{aligned} r o t g r a d f = \nabla \land [\nabla f] = 0, \\ d i v r o t \vec{V} = \nabla \cdot [\nabla \land \vec{V}] = 0 . \end{aligned}

Queste formule vanno ricordate insieme a quella, già incontrata e facilmente ricavabile,

d i v g r a d f = \nabla \cdot [\nabla f] = Δ f = f_{x x} + f_{y y} + f_{z z} .

Capitolo 10
I sistemi di equazioni differenziali

10.1 Introduzione

Ricordiamo dal corso di Analisi matematica 1 che si chiama equazione differenziale del primo ordine un’equazione che ha per incognita una funzione $\vec{x} (t)$ , generalmente a valori vettori, a cui si richiede di verificare

{\vec{x}}^{'} (t) = \vec{f} (t, \vec{x} (t)) .

(10.1)

Si parla di problema di Cauchy quando si richiede di risolvere l’equazione differenziale (10.1) insieme all’ulteriore condizione

\vec{x} (t_{0}) = {\vec{x}}_{0} .

(10.2)

Convenzionalmente, la variabile $t$ si chiama tempo, $t_{0}$ si chiama istante iniziale e la condizione (10.2) si chiamacondizione iniziale o condizione di Cauchy. Alcune precisazioni vanno richiamate esplicitamente:

con le lettere in grassetto si intendono vettori e $\vec{x}$ indica un vettore di dimensione $n$ , $n \geq 1$ . Quando $n > 1$ la (10.1) si chiama anche un sistema di equazioni differenziali.
Sia $\vec{x} \in ℝ^{n}$ . Il dominio dell’equazione differenziale è una regione (quindi un aperto connesso) di $ℝ^{n + 1}$ su cui $\vec{f} (t, \vec{x})$ è definita. Attenzione che il dominio dell’equazione differenziale è sempre un aperto, anche se $\vec{f} (t, \vec{x})$ è definita su un chiuso più grande, si veda l’esempio 266.
la funzione incognita $\vec{x}$ è calcolata nel medesimo istante $t$ ovunque essa compare.
Per soluzione dell’equazione (10.1) si intende una funzione x→(t) tale che:
1. $\vec{x} (t)$ è definita su un intervallo $(a, b)$ e ivi derivabile.
2. per ogni $t$ , la coppia $(t, \vec{x} (t))$ appartiene al dominio dell’equazione differenziale.¹
3. per ogni $t \in (a, b)$ l’uguaglianza (10.1) è verificata.
Si dice che la soluzione $\vec{x} (t)$ verifica il problema di Cauchy (10.1), (10.2) quando $t_{0} \in (a, b)$ e $\vec{x} (t_{0}) = {\vec{x}}_{0}$ .
Infine, ricordiamo che, come notazione, generalmente invece di (10.1) si scrive ${\vec{x}}^{'} = \vec{f} (t, \vec{x})$
senza indicare la dipendenza di $\vec{x}$ da $t$ .

Vedremo che, sotto opportune condizioni sulla funzione $\vec{f} (t, \vec{x})$ , il problema di Cauchy (10.1)-(10.2) ammette soluzione unica, definita su un opportuno intervallo aperto contenente $t_{0}$ . Scriveremo $\vec{x} (t; t_{0}, {\vec{x}}_{0})$ per indicare la soluzione del problema di Cauchy. Quando $t_{0}$ è sottinteso, scriveremo $\vec{x} (t; {\vec{x}}_{0})$ . Si noti che le soluzioni di equazioni differenziali, essendo funzioni continue definite su intervalli, sono curve parametriche. Per chiarire la definizione di soluzione, consideriamo gli esempi seguenti:

Esempio 265 Sia

x^{'} = 1 + x^{2} .

Si sa che $x (t) = tan t$ verifica l’uguaglianza in ogni punto $t$ in cui la funzione $tan t$ è definita. Però $x (t) = tan t$ non è soluzione dell’equazione differenziale perché non è definita su un intervallo. Invece, la restrizione di $tan t$ all’intervallo $(- π ∕ 2, π ∕ 2)$ è soluzione, cosìcome è soluzione la restrizione di $tan t$ all’intervallo $(π ∕ 2, 3 π ∕ 2)$ . Consideriamo ora la funzione $tan (t + π ∕ 4)$ . Questa funzione è soluzione dell’equazione differenziale, sull’intervallo $(- 3 π ∕ 4, π ∕ 4)$ . Dunque, soluzioni diverse della medesima equazione differenziale possono avere domini DIVERSI; e in generale una soluzione è definita soltanto su un “piccolo” intervallo. _

Inoltre:

Esempio 266 Sia

x^{'} = \sqrt{1 - x^{2}}, x (0) = 0 .

Il dominio della funzione $f (t, x) = f (x) = \sqrt{1 - x^{2}}$ è l’insieme chiuso $ℝ \times [- 1, 1]$ . Questo però non può essere il dominio dell’equazione differenziale perché, per definizione, il dominio dell’equazione differenziale deve essere un aperto. Scegliamo allora come dominio dell’equazione differenziale l’insieme aperto $ℝ \times (- 1, 1)$ . Procedendo per separazione di variabili, si trova che la soluzione è

x (t) = sin t

definita su $(- π ∕ 2, π ∕ 2)$ . Infatti, per $t \to \pm π ∕ 2$ la soluzione tende rispettivamente a $- 1$ e $+ 1$ . In questi punti, $\sqrt{1 - x^{2}}$ è definita, ma i punti $(- π ∕ 2, - 1)$ e $(π ∕ 2, 1)$ non appartengono al dominio dell’equazione differenziale. Dunque, per $t \to \pm π ∕ 2$ , il grafico $(t, x (t))$ della soluzione “esce” dal dominio dell’equazione differenziale. _

Chiediamoci ora perché è cosìimportante insistere sul fatto che una soluzione deve rimanere all’interno dell’insieme su cui il secondo membro dell’equazione è definito. La ragione è questa: nei due esempi precedenti la soluzione si trova esplicitamente procedendo per separazione di variabili, ma in pratica la soluzione di un’equazione differenziale deve calcolarsi numericamente. Consideriamo per esempio la soluzione $x (t) = sin t$ dell’equazione nell’esempio 266. Se si vuol ridefinire il concetto di soluzione in modo da accettare che la soluzione sia definita anche in $- π ∕ 2$ e $π ∕ 2$ allora la soluzione viene ad essere definita su $ℝ$ . Però, nessun metodo numerico riuscirà a trovare tale soluzione perché quando $t = π ∕ 2$ errori comunque piccoli fanno uscire dal dominio e bloccano l’algoritmo numerico usato per trovare la soluzione, qualunque esso sia. Come si è visto nel corso di Analisi Matematica 1, si chiama equazione differenziale del secondo ordine un’equazione nell’incognita $x (t)$ del tipo

x^{″} (t) = f (t, x (t), x^{'} (t))

usualmente scritta senza indicare la dipendenza da $t$ ,

x^{″} = f (t, x, x^{'}) .

Si noti che non abbiamo usato lettere in grassetto perché in generale studieremo le equazioni di ordine superiore per incognite scalari (anche se niente vieta di studiare sistemi di equazioni di ordine superiore, si veda l’Esempio 269). Il problema di Cauchy si ottiene ora associando all’equazione differenziale le ulteriori condizioni

x (t_{0}) = x_{0}, x^{'} (t_{0}) = x_{1}

ossia ricercando soluzioni dell’equazione differenziale che hanno assegnata posizione e velocità in un medesimo istante. E’ noto dal corso di Analisi Matematica 1 che un’equazione di ordine $n$ è

x^{(n)} = f (t, x, x^{'}, \dots, x^{(n - 1)}) .

(10.3)

Il problema di Cauchy corrispondente si ottiene fissando un punto $t_{0}$ e richiedendo che in questo punto la soluzione cercata verifichi le condizioni

x (t_{0}) = x_{0}, x^{'} (t_{0}) = x_{1}, \dots, x^{(n - 1)} (t_{0}) = x_{n - 1} .

E’ importante notare che ogni equazione differenziale di ordine $n$ può scriversi come sistema di $n$ equazioni differenziali. La (10.3) può scriversi in forma di sistema come segue: si scriva $x_{1} (t)$ invece di $x (t)$ e quindi si definiscono $x_{2} (t)$ , …, $x_{n} (t)$ dalle uguaglianze

\begin{matrix} ẋ_{1} (t) = x_{2} (t) \\ ẋ_{2} (t) = x_{3} (t) \\ ⋮ \\ ẋ_{n} (t) = f (t, x_{1} (t), x_{2} (t), \dots, x_{n - 1} (t)) . \end{matrix}

(10.4)

Osservazione 267 Si noti l’uso intercambiabile dell’apostrofo e del punto per indicare la derivata rispetto al tempo $t$ .

Mostriamo ora due esempi. Abbiamo detto che ogni equazione differenziale di ordine $n$ può scriversi come sistema. Invece, il viceversa non vale: esistono sistemi di $n$ equazioni differenziali che non corrispondono ad equazioni differenziali di ordine $n$ .

Esempio 268 Si consideri il sistema di equazioni differenziali

x^{'} = x, y^{'} = y .

(10.5)

Le sue soluzioni sono $x (t) = e^{t} x_{0}$ , $y (t) = e^{t} y_{0}$ . In particolare, la (10.5) è risolta da

x (t) = e^{t}, y (t) = 2 e^{t} .

(10.6)

Si vede subito che nessuna equazione scalare del secondo ordine

x^{″} = f (x, x^{'})

(10.7)

scritta in forma di sistema del primo ordine, ossia scritta come

x^{'} = y, y^{'} = f (x, y)

può avere le medesime soluzioni di (10.5). Infatti la prima uguaglianza $x^{'} = y$ non vale se $x (t)$ ed $y (t)$ sono le funzioni in (10.6). _

Esempio 269 Si considerino due punti materiali di massa $M_{1}$ ed $M_{2}$ vincolati a scorrere (senza attrito) su un segmento orizzontale. Il punto $M_{1}$ è attaccato ad una molla (di costante elastica $k_{1}$ ) a sua volta fissata nell’origine ed il punto $M_{2}$ è collegato al punto $M_{1}$ attraverso una seconda molla di costante elastica $k_{2}$ . Indichiamo con $x$ ed $y$ rispettivamente l’ascissa del primo e del secondo punto. Allora, le equazioni di Newton per questo sistema sono

\begin{matrix} M_{1} x^{″} = - k_{1} x + k_{2} (y - x) \\ M_{2} y^{″} = - k_{2} (y - x) . \end{matrix}

Si ha quindi un sistema di due equazioni del secondo ordine. Questo può rappresentarsi come sistema di quattro equazioni del primo ordine,

\begin{matrix} x_{1}^{'} = \frac{1}{M_{1}} x_{2} \\ x_{2}^{'} = - k_{1} x_{1} + k_{2} (y_{1} - x_{1}) \\ y_{1}^{'} = \frac{1}{M_{2}} y_{2} \\ y_{2}^{'} = - k_{2} (y_{1} - x_{1}) . \end{matrix}

La fisica insegna che la posizione e velocità “iniziali”, ossia assegnate ad un certo istante di tempo, e le forze cui il sistema è soggetto, determinano l’evoluzione futura del sistema. Dunque, se vogliamo un primo controllo che il modello matematico che abbiamo costruito effettivamente corrisponda alle proprietà fisiche del sistema, dovremo verificare che l’evoluzione nel tempo delle funzioni $x (t)$ , $x^{'} (t)$ , $y (t)$ , $y^{'} (t)$ sia univocamente determinata dalla conoscenza delle costanti $M_{1}$ , $M_{2}$ , $k_{1}$ , $k_{2}$ e dei quattro numeri $x (t_{0})$ , $x^{'} (t_{0})$ , $y (t_{0})$ , $y^{'} (t_{0})$ . A questo quesito risponde il Teorema di Cauchy, Teorema 270. _

I sistemi di equazioni differenziali considerati negli esempi precedenti sono tutti sistemi lineari, ossia hanno forma

{\vec{x}}^{'} = A \vec{x} + \vec{f}

con $A$ matrice (generalmente dipendente dal tempo, $A = A (t)$ ) ed $\vec{f} = \vec{f} (t)$ dipendente dal solo tempo $t$ e non da $\vec{x}$ (anzi, negli esempi, $\vec{f} = 0$ ). Quando $\vec{f} = 0$ il sistema si dice lineare omogeneo, altrimenti si chiama affne. La funzione $\vec{f} (t)$ si chiama termine noto. Sono invece esempi di sistemi non lineari i seguenti

x^{'} = - x (a + b y), y^{'} = - y (c x + d)

che si incontra in problemi di dinamica di popolazioni (equazione di Lotka-Volterra) oppure

x^{″} + a x^{'} + c x + 𝜖 x^{3} = cos ω t, o s s i a \{\begin{matrix} x^{'} = y \\ y^{'} = - a y - c x - 𝜖 x^{3} + cos ω t \end{matrix}

(equazione di Duffn) che si incontra nello studio delle oscillazioni elastiche. Un altro esempio importante di equazione differenziale non lineare è l’equazione di van der Pol

x^{″} = - x + μ (x^{2} - 1) x^{'}

che si incontra nello studio di certi circuiti elettrici. Consideriamo ora un caso particolare: supponiamo che l’equazione differenziale (10.1) abbia forma

{\vec{x}}^{'} = \vec{f} (\vec{x})

con $\vec{f}$ che non dipende da $t$ . In questo caso si dice che il sistema è autonomo o tempo invariante. Esso descrive fenomeni la cui legge fisica è costante nel tempo e le sue soluzioni hanno una proprietà importante: sia $\vec{x} (t)$ una soluzione e sia $\vec{y} (t) = \vec{x} (t + τ)$ con $τ$ numero fissato ma qualsiasi. Allora,

{\vec{y}}^{'} (t) = {\vec{x}}^{'} (t + τ) = \vec{f} (\vec{x} (t + τ)) = \vec{f} (\vec{y} (t)),

ossia $\vec{y} (t)$ è ancora soluzione. Si osservi che ciò non avviene se $\vec{f}$ dipende anche da $t$ perché in questo caso si trova

{\vec{y}}^{'} (t) = \vec{f} (t + τ, \vec{y} (t))

che è una diversa equazione differenziale. La funzione $t \to \vec{y} (t) = \vec{x} (t + τ)$ è una curva ottenuta riparametrizzando (in modo molto semplice) la curva $t \to \vec{x} (t)$ . Per questa ragione, quando si studiano sistemi autonomi, conviene studiare sia il grafico $(t, \vec{x} (t))$ della soluzione sia la “curva soluzione” $t \to \vec{x} (t)$ . Nel contesto dei sistemi autonomi questa si chiama orbita Graficamente se ne rappresenta il sostegno, ossia l’immagine della funzione e, quando serve, si indica anche il verso di percorrenza al crescere del tempo $t$ . Un punto ${\vec{x}}_{0}$ per cui $f ({\vec{x}}_{0}) = 0$ è detto punto di equilibrio o stazionario (talvolta si dice anche soluzione stazionaria.) In tal caso, $\vec{x} (t) \equiv {\vec{x}}_{0}$ è soluzione costante di (10.1). Se l’equazione differenziale è autonoma, l’orbita di tale soluzione si riduce al punto ${\vec{x}}_{0}$ stesso. Un punto critico si dice isolato se in un suo intorno non vi sono altri punti critici.

Concludiamo dicendo che le equazioni differenziali che stiamo studiando si dicono “ordinarie” in opposizione alle “equazioni differenziali a derivate parziali” che si incontrano quando l’incognita dipende da più variabili e quindi le derivate che compaiono nell’equazione sono derivate parziali. Come esempio di equazione a derivate parziali si consideri

\frac{\partial}{\partial t} x + \frac{\partial}{\partial s} x = 0

e si provi che tutte le funzioni

x (t, s) = ϕ (t - s)

con $ϕ$ di classe $C^{1}$ risolvono quest’equazione.

10.2 Esistenza e unicità di soluzione

Consideriamo il problema di Cauchy

{\vec{x}}^{'} = \vec{f} (t, \vec{x}), \vec{x} (t_{0}) = {\vec{x}}_{0} .

(10.8)

Come si è notato all’esempio 269, vanno conosciute condizioni che assicurino la risolubilità di questo problema, e condizioni che implichino l’unicità della soluzione. Ricordiamo che per definizione la soluzione deve essere definita in un intervallo che contiene $t_{0}$ al suo interno. E’ suffciente però mostrare che la soluzione esiste in $[t_{0}, t_{0} + a)$ perché lo stesso argomento si potrà poi applicare all’intervallo $(t_{0} - a, t_{0}]$ . Inoltre, proveremo l’esistenza di soluzioni in un opportuno intervallo, non necessariamente il più grande possibile. Se $\vec{x} (t)$ risolve (10.8) allora $\vec{x} (t)$ è una curva parametrica che nel punto $\vec{x} (t_{0})$ ha per tangente la retta di parametrizzazione

\vec{x} (t) = \vec{x} (t_{0}) + \vec{f} (t_{0}, \vec{x} (t_{0})) (t - t_{0}) .

(10.9)

Ciò suggerisce di costruire come approssimazione della soluzione una spezzata costituita da segmenti delle rette di forma (10.9). Bisogna però usare un po’ di cautela, perché si sa già che in generale una soluzione di (10.8) può solo definirsi in un “piccolo” intervallo, si ricordi l’Esempio 265. Il teorema che si può provare è il seguente:

Teorema 270 (di Cauchy) Sia $\vec{x} = (x_{1}, \dots, x_{n})$ e supponiamo che la funzione $\vec{f} (t, \vec{x})$ e le sue derivate parziali rispetto alle componenti di $\vec{x}$ siano continue in una regione $D$ contenente il “rettangolo” $R$

R = {(t, \vec{x}) | t_{0} - a \leq t \leq t_{0} + a, | | x - x_{0} | | \leq b} .

Il problema di Cauchy (10.8) ammette soluzione unica su un intervallo $(t_{0} - T, t_{0} + T)$ ove $T$ dipende sia da $t_{0}$ che da $x_{0}$ .²

La dimostrazione del teorema è piuttosto tecnica, ma è opportuno accennare all’idea che guida la dimostrazione, perché questa suggerisce un modo importante di pensare alle equazioni differenziali. Costruiamo una successione di funzioni ${\vec{x}}^{(N)} (t)$ , continue su $[t_{0}, t_{0} + T]$ , che, si può provare, converge a una funzione $\vec{x} (t)$ che risolve (10.8). Per questo, dividiamo l’intervallo $[t_{0}, t_{0} + T]$ in $N$ parti uguali mediante i punti

t_{0}, t_{0} + δ, t_{0} + 2 δ, \dots, t_{0} + (N - 1) δ, ove δ = T ∕ N .

Inizialmente siamo nel punto $(t_{0}, {\vec{x}}_{0})$ . Definiamo la funzione ${\vec{x}}^{(N)} (t)$ sul primo intervallo $[t_{0}, t_{0} + δ]$ indicandone il grafico: il grafico è il segmento di retta

y = \vec{x} (t_{0}) + \vec{f} (t_{0}, \vec{x} (t_{0})) (t - t_{0}), t \in [t_{0}, t_{0} + δ] .

In questo modo si identifica in particolare ${\vec{x}}^{(N)} (t_{0} + δ)$ . A partire dal punto $(t_{0} + δ, {\vec{x}}^{(N)} (t_{0} + δ))$ si ripeta il procedimento: si definisca ${\vec{x}}^{(N)} (t)$ per $t \in [t_{0} + δ, t_{0} + 2 δ]$ :

{\vec{x}}^{(N)} (t) = {\vec{x}}^{(N)} (t_{0} + δ) + \vec{f} (t_{0} + δ, {\vec{x}}^{(N)} (t_{0} + δ)) (t - (t_{0} + δ)), t \in [t_{0} + δ, t_{0} + 2 δ] .

Si ripeta quindi questo procedimento fino a coprire tutto l’intervallo $[t_{0}, t_{0} + T]$ . In generale avremo, per $k = 0, 1, \dots, N - 1$ ,

{\vec{x}}^{(N)} (t) = {\vec{x}}^{(N)} (t_{0} + k δ) + \vec{f} (t_{0} + k δ, {\vec{x}}^{(N)} (t_{0} + k δ)) (t - (t_{0} + k δ)), t \in [t_{0} + k δ, t_{0} + (k + 1) δ] .

La figura 10.1 illustra questo procedimento.

figura 10.1: Spezzata di Eulero

In questo modo, per ogni $N$ , si costruisce una spezzata che si chiama spezzata di Eulero. Si può provare che la successione di funzioni $\{x^{(N)} (t)\}$ converge uniformemente ad una funzione $x (t)$ sull’intervallo $(t_{0} - T, t_{0} + T)$ , purché $T$ sia opportunamente scelto. Ora, vorremmo sostituire questa funzione nei due membri di (10.8) trovando che i due membri differiscono per un errore che tende a zero per $N \to + \infty$ . Però, questo non può farsi perché le funzioni $x^{(N)} (t)$ non sono derivabili; e anche se si potesse fare a poco servirebbe perché la sola convergenza uniforme niente permette di concludere sulla derivata della funzione limite $x (t)$ . Viene però in aiuto un’altra idea: integrando i due membri dell’equazione differenziale in (10.8) si vede che $\vec{x} (t)$ risolve (10.8) se e solo se essa risolve l’equazione integrale

\vec{x} (t) = {\vec{x}}_{0} + \int_{t_{0}}^{t} \vec{f} (s, \vec{x} (s)) d s .

(10.10)

E’ possibile sostituire la $x^{(N)} (t)$ nei due membri dell’equazione integrale, e stimare lo scarto tra i due membri, provando che esso tende a zero per $N \to + \infty$ ; e usando la sola convergenza uniforme è ora possibile completare la dimostrazione del teorema. Omettiamo i dettagli della dimostrazione, contentandoci di avere illustrato queste idee fondamentali. _ La dimostrazione del Teorema di Cauchy suggerisce un modo importante di pensare ad un’equazione differenziale, che illustriamo nel caso del sistema

x^{'} = f (x, y), y^{'} = g (x, y) :

si può pensare al campo vettoriale $f (x, y) \vec{i} + g (x, y) \vec{j}$ come ad un “campo di velocità” che trasporta un pallino inizialmente nella posizione $(x_{0}, y_{0})$ . La traiettoria descritta dal pallino è la soluzione del problema di Cauchy con quel dato iniziale. Da questo punto di vista,

il vettore \vec{f} (\vec{x}) = [\begin{matrix} f (x, y) \\ g (x, y) \end{matrix}] applicato in \vec{x} = [\begin{matrix} x \\ y \end{matrix}]

rappresenta la velocità che il pallino ha se transita dalla posizione $\vec{x}$ all’istante $t$ .

Le isocline

Consideriamo il caso di un sistema autonomo di due equazioni differenziali

x^{'} = f (x, y), y^{'} = g (x, y) .

La dimostrazione del Teorema di Cauchy suggerisce di considerare il luogo dei punti che vengono incontrati dalle soluzioni dell’equazione differenziale con pendenza assegnata. Escludendo i punti nei quali sia $f$ che $g$ si annullano, le orbite sono curve regolari di parametrizzazione $(x (t), y (t))$ . Per fissare le idee, sia $x^{'} (t_{0}) \neq 0$ . La pendenza della tangente nell’istante $t_{0}$ è

\frac{y^{'} (t_{0})}{x^{'} (t_{0})} = \frac{g (x (t_{0}), y (t_{0}))}{f (x (t_{0}), y (t_{0}))} .

Se invece $x^{'} (t_{0}) = 0$ allora la tangente è verticale. Dunque, le orbite hanno tangente verticale nei punti dell’insieme identificato da $f (x, y) = 0$ ; hanno tangente con pendenza $m$ nei punti dell’insieme identificato da

\frac{g (x, y)}{f (x, y)} = m .

Quest’insieme si chiama l’isoclina di pendenza $m$ . L’isoclina di pendenza $m$ ha questa proprietà: le soluzioni escono dai suoi punti con tangenti tutte parallele, con la medesima pendenza $m$ . Se si riescono a disegnare “molte” isocline e quindi a disegnare su di esse segmenti di pendenza $m$ , si può pensare di tracciare una soluzione del problema di Cauchy in questo modo: si parte dal dato $(x_{0}, y_{0})$ , che appartiene ad una certa isoclina, corrispondente alla pendenza $m_{0}$ . Si traccia per $(x_{0}, y_{0})$ un segmento parallelo a $y = m_{0} x$ fino ad incontrare la “successiva” isoclina (successiva, tra quelle tracciate) diciamo corrispondente alla pendenza $m_{1}$ . Dal punto di intersezione si fa uscire un segmento parallelo a $y = m_{1} x$ fino ad incontrare l’isoclina successiva, ecc. Si costruisce una spezzata che approssima la soluzione del problema di Cauchy.

10.2.1 Equazioni differenziali lineari a coeffcienti costanti

Si è visto, al paragrafo 2.4.4 che l’equazione differenziale lineare a coeffcienti costanti

\dot{\vec{x}} = A \vec{x} + \vec{f} (t)

(10.11)

(con $A$ matrice $n \times n$ ) ha per soluzioni le funzioni

\vec{x} (t) = e^{A t} {\vec{x}}_{0} + \int_{0}^{t} e^{A (t - s)} \vec{f} (s) d s .

Il membro destro di questa formula si chiama soluzione generale o anche integrale generale della (10.11). La soluzione generale della (10.11) si ottiene sommando ad una soluzione particolare,

\int_{0}^{t} e^{A (t - s)} \vec{f} (s) d s

tutte le funzioni

e^{A t} {\vec{x}}_{0}, {\vec{x}}_{0} \in ℝ^{n} .

Al variare di ${\vec{x}}_{0}$ queste sono tutte le soluzioni dell’equazione lineare omogenea associata, ossia dell’equazione che si ottiene dalla (10.11) ponendo $\vec{f} (t) = 0$ . Dunque, il calcolo dell’integrale generale si riduce al calcolo dell’esponenziale di matrici

e^{A t} .

Il calcolo di quest’esponenziale è tutt’altro che semplice in generale e ci limitiamo a studiare il caso dei “sistemi piani”, ossia il caso in cui $\vec{x} \in ℝ^{2}$ . Consideriamo prima di tutto l’equazione lineare omogenea, ossia assumiamo $\vec{f} (t) = 0$ . Dobbiamo ricordare alcune proprietà delle matrici, che richiamiamo esclusivamente nel caso di matrici $2 \times 2$ . Proprietà analoghe valgono in generale, ma la casistica diventa sempre più complessa all’aumentare delle dimensioni della matrice. Ogni matrice ammette almeno un autovalore ossia almeno un numero $λ$ tale che

det [A - λ I] = 0 .

Questo discende dal teorema fondamentale dell’algebra, perché $det [A - λ I]$ è un polinomio non costante, e quindi ammette almeno uno zero che però può essere un numero complesso, anche se gli elementi della matrice sono reali. Il polinomio $det [A - λ I]$ si chiama polinomio caratteristico della matrice $A$ . In corrispondenza di ciascun autovalore, si trovano soluzioni $\vec{v}$ non nulle dell’equazione lineare

A \vec{v} = λ \vec{v} .

Questi vettori non nulli si chiamano gli autovettori relativi all’autovalore $λ$ . Naturalmente, se $\vec{v}$ è un autovettore relativo a $λ$ , anche i suoi multipli lo sono. Dobbiamo osservare che:

se $λ$ è un numero complesso, anche i suoi autovettori sono autovettori a elementi complessi; ossia, implicitamente anche se gli elementi della matrice $A$ sono reali, ci riconduciamo a lavorare con vettori ad elementi complessi;
autovettori relativi ad autovalori diversi sono linearmente indipendenti.

Consideriamo la funzione

\vec{x} (t) = e^{A t} \vec{v}, .

Allora,

\frac{d}{d t} e^{A t} \vec{v} = A e^{A t} \vec{v}

è una soluzione della (10.11) (anche se $\vec{v}$ non è autovettore di $A$ ). Se

A \vec{v} = λ \vec{v},

si ha

e^{A t} \vec{v} = [\sum_{n = 0}^{+ \infty} \frac{A^{n}}{n!}] \vec{v} = [\sum_{n = 0}^{+ \infty} \frac{A^{n} \vec{v}}{n!}] = \sum_{n = 0}^{+ \infty} \frac{λ^{n} \vec{v}}{n!}

ossia

e^{A t} \vec{v} = e^{λ t} \vec{v} .

Dunque, noto un autovalore $λ$ e un suo autovettore $\vec{v}$ , è facile scrivere alcune soluzioni dell’equazione lineare omogenea: sono le funzioni

α e^{λ t} \vec{v}

con $α$ coeffciente qualsiasi (in generale, coeffciente complesso). Esista ora un secondo autovalore $μ$ e sia $\vec{w}$ un suo autovettore. Allora, anche le funzioni

β e^{μ t} \vec{w}

risolvono l’equazione ldifferenziale lineare omogenea

{\vec{x}}^{'} = A \vec{x};

(10.12)

e quindi anche le funzioni

α e^{λ t} \vec{v} + β e^{μ t} \vec{w}

(10.13)

la risolvono. Quanto detto fin’ora vale per sistemi di qualunque dimensione. Supponiamo ora che il sistema sia di dimensione $2$ . Dato che i vettori $\vec{v}$ e $\vec{w}$ sono linearmente indipendenti, ogni vettore a due dimensioni $\vec{x}$ si può rappresentare in modo unico come

\vec{x} = α \vec{v} + β \vec{w};

Ossia, al variare dei coeffcienti $α$ e $β$ , le funzioni (10.13) permettono di esprimere tutte le soluzioni di (10.12). Dunque, la (10.13) è la soluzione generale di (10.12). Si noti che il fatto importante è l’esistenza di due autovettori $\vec{v}$ e $\vec{w}$ linearmente indipendenti: le considerazioni precedenti possono ripetersi anche se i due autovettori $\vec{v}$ e $\vec{w}$ corrispondono ad un medesimo autovalore, ossia se $λ = μ$ . Sfortunatamente, non è vero che ogni matrice $2 \times 2$ debba avere due autovettori linearmente indipendente, come mostra l’esempio seguente:

Esempio 271 Gli autovettori della matrice

[\begin{matrix} 0 & 1 \\ 0 & 0 \end{matrix}]

sono tutti i multipli di

\vec{v} = [\begin{matrix} 1 \\ 0 \end{matrix}] :

Questa matrice non ha due autovettori linearmente indipendenti. _

In tal caso, si procede come segue: si identifica (l’unico) autovettore $λ$ ed un suo autovettore $\vec{v}$ . Ricordiamo che per definizione $\vec{v} \neq 0$ . Quindi si considera l’equazione

(A - λ I) \vec{w} = \vec{v} .

E’ un fatto che, se $A$ , matrice $2 \times 2$ , non ha due autovettori linearmente indipendenti, quest’equazione ammette soluzione $\vec{w}$ , e inoltre $\vec{w}$ è linearmente indipendente da $\vec{v}$ . Identificati $\vec{v}$ e $\vec{w}$ , si costruiscono due polinomi, a valori vettori, uno di grado $0$ ed uno di grado $1$ :

{\vec{p}}_{0} = \vec{v}, {\vec{p}}_{1} = \vec{v} t + \vec{w} .

Nel caso che stiamo ora considerando, si verifica facilmente per sostituzione che la soluzione generale di (10.12) è

e^{λ t} [α {\vec{p}}_{0} + β {\vec{p}}_{1} (t)] .

(10.14)

Abbiamo quindi scritto la soluzione generale di (10.12) in ciascuno dei casi che possono presentarsi: in tutti i casi la soluzione generale è combinazione lineare di due soluzioni fondamentali. Delle soluzioni

e^{λ t} {\vec{p}}_{0}, e^{λ t} {\vec{p}}_{1} (t)

delle soluzioni

e^{τ t} \vec{v}, e^{μ t} \vec{w}

(con $λ = μ$ oppure $λ \neq μ$ ) quando la matrice $A$ ammette due autovettori linearmente indipendenti. Queste coppie di soluzioni di (10.12) si chiamano un sistema fondamentale di soluzioni. Rimane da chiarire un punto: se la matrice $A$ è reale ma ammette due autovalori complessi e coniugati, le soluzioni scritte sopra prendono valori complessi. Vorremmo trovare un diverso sistema fondamentale di soluzioni, che però prendano valori reali.

Il caso degli autovettori complessi e coniugati Le considerazioni precedenti valgono per ogni matrice $A$ sia che i suoi autovalori siano reali sia che siano complessi. Se però la matrice $2 \times 2$ ha elementi reali ed un autovalore $λ$ complesso, allora anche $\bar{λ}$ è autovalore; e quindi siamo automaticamente nel caso in cui la matrice ha due diversi autovalori e quindi due autovettori linearmente indipendenti: la soluzione generale di (10.12) è data da (10.13). Siano

λ_{\pm} = ξ \pm i ω

gli autovalori e sia ${\vec{v}}_{+} = {\vec{v}}_{1} + i {\vec{v}}_{2}$ un autovettore di $λ_{+}$ . In quest’espressione, ${\vec{v}}_{1}$ e ${\vec{v}}_{2}$ sono vettori reali, che però non sono essi stessi autovettori di $A$ . E’ un fatto che

{\bar{\vec{v}}}_{\vec{+}} = {\vec{v}}_{1} - i {\vec{v}}_{2}

è un autovettore di $λ_{-}$ . Usando la (10.13) si vede quindi che un sistema fondamentale di soluzioni è

\begin{matrix} e^{ξ t} [e^{- i ω t} ({\vec{v}}_{1} + i {\vec{v}}_{2})] \\ = e^{ξ t} [({\vec{v}}_{1} cos ω t - {\vec{v}}_{2} sin ω t) + i ({\vec{v}}_{2} cos ω t + {\vec{v}}_{1} sin ω t)] \\ e^{ξ t} [e^{- i ω t} ({\vec{v}}_{1} - i {\vec{v}}_{2})] \\ = e^{ξ t} [({\vec{v}}_{1} cos ω t - {\vec{v}}_{2} sin ω t) - i ({\vec{v}}_{2} cos ω t + {\vec{v}}_{1} sin ω t)] . \end{matrix}

(10.15)

Queste soluzioni prendono valori complessi. Sommandole e sottraendole (e dividendo rispettivamente per $2$ e per $2 i$ ) si trovano due soluzioni a valori reali:

e^{ξ t} [{\vec{v}}_{1} cos ω t - {\vec{v}}_{2} sin ω t], e^{ξ t} [{\vec{v}}_{1} cos ω t + {\vec{v}}_{2} sin ω t] .

Questo anche è un sistema fondamentale di soluzioni, a valori reali. Infatti, combinandole linearmente si ritrovano le (10.15) e quindi ogni altra soluzione di (10.12).

10.2.2 Il caso dell’equazione completa e delle equazioni di ordine superiore

Limitandoci ancora al caso di sistemi di due equazioni, mostriamo un metodo per risolvere l’equazione completa. Abbiamo bisogno di un risultato di algebra lineare, che è questo: scriviamo esplicitamente il sistema in forma

\{\begin{matrix} x^{'} & = & a x + b y + f_{1} \\ y^{'} & = & c x + d y + f_{2} \end{matrix}

(10.16)

e consideriamo la matrice

A = [\begin{matrix} a & b \\ c & d \end{matrix}] .

Mostriamo:

Teorema 272 Esiste una matrice $P$ (generalmente ad elementi complessi) tale che $det P \neq 0$ e inoltre tale che

P A P^{- 1} = P [\begin{matrix} a & b \\ c & d \end{matrix}] P^{- 1} = [\begin{matrix} α & β \\ 0 & δ \end{matrix}] .

Dim. Bisogna ricordare che ogni matrice ammette almeno un autovalore ed un corrispondente autovettore, che in generale sono complessi. Dunque si trovano $\vec{v}$ e $α$ tali che

A \vec{v} = α \vec{v} .

Sia $\vec{w}$ un qualsiasi vettore indipendente da $\vec{v}$ e consideriamo la matrice

P^{- 1} = [\begin{matrix} \vec{v} & \vec{w} \end{matrix}] .

Questa matrice trasforma gli elementi della base canonica ordinatamente in $\vec{v}$ e $\vec{w}$ . La sua inversa quindi trasforma ordinatamente $\vec{v}$ e $\vec{w}$ nella base canonica. E’:

A P^{- 1} = [\begin{matrix} α \vec{v} & \vec{z} \end{matrix}] \vec{z} = A \vec{w} = β \vec{v} + δ \vec{w}

e quindi

P A P^{- 1} = [\begin{matrix} α & β \\ 0 & δ \end{matrix}] .

Sia ora

\vec{g} (t) = [\begin{matrix} g_{1} (t) \\ g_{2} (t) \end{matrix}] = P \vec{f} (t) = P [\begin{matrix} f_{1} (t) \\ f_{2} (t) \end{matrix}]

Applicando la trasformazione $P$ al sistema, questo si riduce a

ξ^{'} = α ξ + β η + g_{1} (t), η^{'} = δ η + g_{2} (t) .

La seconda equazione è un’equazione nella sola incognita $η (t)$ , che si sa risolvere; nota $η (t)$ , questa funzione si sostituisce nella prima equazione, ottenendo un’equazione nella sola incognita $ξ$ , che ancora si sa risolvere. Calcolate le funzioni $ξ (t)$ ed $η (t)$ , la soluzione $\vec{x} (t)$ si ottiene come

\vec{x} (t) = P^{- 1} [\begin{matrix} ξ (t) \\ η (t) \end{matrix}] .

Quando il termine noto ha forma “particolare”, dal corso di Analisi Matematica 1, si sa che conviene ricercare una soluzione di forma “particolare”. Consideriamo quest’esempio:

x^{'} = α x + β y + e^{γ t}, y^{'} = δ y + e^{σ t} .

La risoluzione di questo sistema può farsi semplicemente con le tecniche viste nel corso di Analisi Matematica 1 e quindi non entriamo nei dettagli del calcolo. Notiamo però che se $δ \neq σ$ allora le soluzioni della seconda equazione hanno forma

a e^{δ t} + b e^{σ t} .

Se però $δ = σ$ allora le soluzioni sono

a e^{δ t} + b t e^{δ t} .

Inserite queste nella prima equazione, la soluzione della prima equazione ha forma rispettivamente

c e^{α t} + a e^{δ t} + b e^{σ t} oppure c e^{α t} + a e^{δ t} + b t e^{δ t}

se $α$ è diverso dagli esponenti che si sono incontrati risolvendo la seconda equazione; altrimenti compariranno fattori $t^{n}$ con $n > 1$ . Si esaminino i vari casi e si ritrovi che i possibili valori di $n$ sono $0$ , $1$ e $2$ . E ora consideramo il caso di un sistema omogeneo di tre equazioni differenziali lineari. Anche in questo caso esistono trasformazioni di coordinate che “triangolarizzano” il sistema, ossia lo riducono a forma

\{\begin{matrix} x^{'} & = & α x & + & β y & + & χ z \\ y^{'} & = & δ y & + & σ z \\ z^{'} & = & γ z \end{matrix}

Anche questo sistema si risolve a partire dall’ultima equazione e, risoltala, si vede che $z (t) = a e^{γ t}$ . Sostituita queste funzione nelle prime due equazioni, ci si riconduce al caso di due equazioni lineari con termine affne visto sopra. E quindi nell’espressione delle prime due componenti compariranno termini della forma $t^{n} e^{γ t}$ con $n = 0$ , $n = 1$ oppure $n = 2$ .

10.2.3 Il comportamento in futuro delle soluzioni

Spesso interessa conoscere il comportamento delle soluzioni di un sistema di equazioni differenziali per $t \to + \infty$ . Quando si fa questo studio, si dice che si studia il “comportamento in futuro” delle soluzioni. Facciamo questo studio nel caso dei sistemi lineari omogenei di due equazioni differenziali. In tal caso, le soluzioni sono funzioni $\vec{x} (t)$ con $\vec{x} (t)$ vettore a due componenti $x (t)$ ed $y (t)$ . Dunque le soluzioni rappresentano curve parametriche piane. Per questo, i sistemi due due equazioni differenziali si chiamano anche sistemi piani ed il piano $(x, y)$ si chiama piano delle fasi Vogliamo descrive le soluzioni di un sistema lineare omogeneo piano sul piano delle fasi e vedere come il comportamento dipenda dagli autovalori della matrice $A$ e, se c’è un solo autovalore, anche dal fatto che esistano due autovettori linearmente indipendenti, o uno solo. La soluzione stazionaria $\vec{x} (t) = \vec{0}$ esiste sempre. Noi considereremo solamente il caso in cui

ker A = \vec{0}

ossia in cui il sistema differenziale ammette un’unica soluzione stazionaria, e questa è $\vec{x} (t) = \vec{0}$ . Interessa conoscere il comportamente delle altre soluzioni rispetto alla soluzione stazionaria. Questo comportamento viene descritto introducendo opportune definizioni³. Nel caso lineare però non abbiamo bisogno dei dettagli di queste definizioni. Diciamo per ora che interessa sapere se tutte le soluzioni rimangono limitate e se tutte le soluzioni tendono a zero per $t \to + \infty$ . Naturalmente tutte le soluzioni rimangono limitate se le due soluzioni che costituiscono un sistema fondamentale di soluzioni sono ambedue limitate; tutte le soluzioni tendono a zero per $t \to + \infty$ se ciò accade per ambedue gli elementi di un sistema fondamentale di soluzioni. Ricapitoliamo i casi che si possono presentare: casi: 1) la matrice $A$ ha due autovettori indipendenti $v_{1}$ e $v_{2}$ , corrispondenti rispettivamente agli autovalori reali $λ_{1}$ e $λ_{2}$ (non necessariamente distinti). Allora un sistema fondamentale di soluzioni è dato da

x_{1} (t) = e^{λ_{1} t} v_{1}, x_{2} (t) = e^{λ_{2} t} v_{2};

2) la matrice $A$ ha due autovettori complessi coniugati $v \pm i w$ e corrispondenti rispettivamente agli autovalori complessi coniugati $α \pm i β$ . Un sistema fondamentale di soluzioni è dato da

x_{1} (t) = e^{α t} (cos (β t) v - sin (β t) w), x_{2} (t) = e^{α t} (cos (β t) w + sin (β t) v);

3) la matrice $A$ ha un solo autovalore $λ$ ma non vi sono due autovettori indipendenti. Allora, detto $v_{1}$ un autovettore, si risolve il sistema⁴ $(A - λ I) v_{2} = v_{1}$ e un sistema fondamentale di soluzioni è dato da

x_{1} (t) = e^{λ t} v_{1}, x_{2} (t) = e^{λ t} (t v_{1} + v_{2}) .

Esaminando separatamente questi tre casi, si vede che valgono i risultati elencati nella tabella 10.1.

Tabella 10.1: Comportamento asintotico delle soluzioni dei sistemi lineari piani

\begin{matrix} Due autovettori linearm. indipendenti & Soluzioni limitate in futuro se e solo se ambedue gli autovalori hanno parte reale non positiva \\ Due autovettori linearm. indipendenti & Le soluzioni tendono a zero per t \to + \infty se e solo se \\ integrale di curva di seconda specie & integrale di linea; integrale di linea di seconda specie. \end{matrix}

I casi che possono presentarsi sono ben rappresentati negli esempi seguenti.

Esempio 273

il caso di due autovalori reali distinti e di segno concorde. In questo caso le soluzioni del sistema diagonalizzato hanno forma $x (t) = e^{λ t} x_{0}, y (t) = e^{μ t} y_{0} .$
Le orbite sono le curve
$y^{λ} = c x^{μ}$
percorse verso l’origine se gli autovalori sono negativi, allontanandosi dall’origine altrimenti. Se $λ = μ$ le orbite sono rette. Questo caso è illustrato dalla figura 10.2 a sinistra. Questa configurazione di orbite si chiama nodo.
I due autovalori sono reali, di segno opposto. In questo caso le soluzioni sono della forma $x (t) = e^{λ t} x_{0}, y (t) = e^{- μ t} y_{0}$
con, per esempio, $λ > 0$ e $μ > 0$ . Nel caso $λ = μ$ le orbite sono le iperboli
$x y = c o s t .$
e per questa ragione il punto di equilibrio $(0, 0)$ si dice di tipo iperbolico, o di sella. La figura (10.2) a destra illustra questo caso.

figura 10.2: Nodo e punto di sella
I due autovalori sono puramente immaginari, e coniugati. In questo caso le soluzioni hanno forma $x (t) = A cos (ω t + ϕ), y (t) = A sin (ω t + ϕ) .$
Le orbite sono le circonferenze
$x^{2} + y^{2} = A^{2} .$
Il caso è illustrato nella figura 10.3 a sinistra, e il punto di equilibrio si chiama ora centro.

figura 10.3: Centro e fuoco
I due valori sono numeri complessi e coniugati, ma non puramente immaginari. In questo caso le soluzioni hanno forma $x (t) = A e^{a t} cos (ω t + ϕ), y (t) = A e^{a t} sin (ω t + ϕ) .$
In coordinate polari sono descritte da
$r (t) = A e^{a t}, 𝜃 (t) = ω t + ϕ$
e sono quindi spirali che si avvolgono verso l’origine se $a < 0$ , altrimenti si allontanano dall’origine. Il punto d’equilibrio $(0, 0)$ è ora detto fuoco. Questo caso è illustrato nella figura 10.3, a destra. Il numero $a$ è la parte reale comune ai due autovalori.

10.3 La stabilità

Consideriamo ora il sistema non lineare autonomo⁵

{\vec{x}}^{'} = \vec{f} (\vec{x}) .

(10.17)

Per semplicità supponiamo che tutte le soluzioni di (10.17) siano definite su $[0, + \infty)$ .⁶ Ricordiamo che i punti di equilibrio sono quei punti ${\vec{x}}_{0}$ tali che $\vec{f} ({\vec{x}}_{0}) = \vec{0}$ . I punti di equilibrio corrispondono a soluzioni costanti e spesso queste sono le “più importanti” tra le soluzioni dell’equazione differenziale. Per questa ragione, interessa sapere come si comportano soluzioni il cui dato iniziale poco differisce da un punto di equilibrio; in particolare interessa sapere se per $t \to + \infty$ tali soluzioni tendono o meno al punto di equilibrio stesso. Introduciamo le definizioni seguenti.

Definitione 9 Diciamo che tutte le soluzioni di (10.17) sono limitate in futuro quando per ogni ${\vec{x}}_{0}$ esiste $M_{{\vec{x}}_{0}}$ tale che

| | \vec{x} (t; {\vec{x}}_{0}) | | < M_{{\vec{x}}_{0}} \forall t > 0 .

In modo analogo si definisce la limitatezza in passato. Si dice che le soluzioni di (10.17) sono limitate quando sono limitate sia in futuro che in passato. _

Esempio 274 Consideriamo l’equazione scalare

x^{'} = a x,

le cui soluzioni sono $x (t) = c e^{a t}$ . Tutte le soluzioni sono limitate in futuro ma non in passato se $a < 0$ ; sono limitate in passato ma non in futuro se $a > 0$ ; sono limitate se $a = 0$ . _

Presentiamo ora le definizioni di stabilità, con riferimento ad un punto di equilibrio ${\vec{y}}_{0}$ .

Definitione 10 Diciamo che il punto di equilibrio ${\vec{y}}_{0}$ è

stabile quando per ogni $𝜖 > 0$ esiste $σ > 0$ tale che se $| | {\vec{x}}_{0} - {\vec{y}}_{0} | | < σ$ allora $| | \vec{x} (t; {\vec{x}}_{0}) - {\vec{y}}_{0} | | < 𝜖$ per ogni $t > 0$ (si noti: $σ \leq 𝜖$ ).
attrattivo se esiste $σ > 0$ tale che se $| | {\vec{x}}_{0} - {\vec{y}}_{0} | | < σ$ allora $lim_{t \to + \infty} | | \vec{x} (t; {\vec{x}}_{0}) | | = {\vec{y}}_{0}$ . L’insieme dei vettori ${\vec{x}}_{0}$ tali che $lim_{t \to + \infty} | | \vec{x} (t; {\vec{x}}_{0}) | | = {\vec{y}}_{0}$ si chiama il bacino d’attrazione di ${\vec{y}}_{0}$ .
asintoticamente stabile se è sia stabile che attrattivo.

Osservazione 275 E’ bene notare che l’attrattività non implica la stabilità. _

Si potrebbe pensare che se ${\vec{y}}_{0}$ è un punto di equilibrio stabile allora si possa sempre scegliere $δ = 𝜖$ . L’esempio seguente mostra che questa congettura è falsa:

Esempio 276 Si consideri il sistema

x^{'} = 2 y, y^{'} = - x .

L’unico punto di equilibrio è ${\vec{y}}_{0} = (0, 0)$ . Derivando la prima equazione si vede che

x^{″} = - 2 x

e questa è l’equazione del moto armonico. Dunque, le soluzioni del sistema sono

x (t) = A cos \sqrt{2} t + ϕ, y (t) = - \frac{A}{\sqrt{2}} sin (\sqrt{2} t + ϕ) .

Dunque le soluzioni descrivono l’ellisse

x^{2} + 2 y^{2} = 1 .

Sono tutte limitate e inoltre se si assegna $𝜖$ si può trovare un $δ$ tale che

| | (x_{0}, y_{0}) | | < δ \Rightarrow | | (x (t), y (t)) | | < 𝜖 .

Però, $δ$ va scelto strettamente minore di $𝜖$ , si veda la figura 10.4. _

figura 10.4: Nella definizione di stabilità in generale si deve scegliere

δ < 𝜖

Quest’esempio verrà nuovamente esaminato in seguito. Osserviamo che se il punto di equilibrio ${\vec{y}}_{0}$ è stabile allora le soluzioni (con dato iniziale suffcientemente vicino a ${\vec{y}}_{0}$ ) sono limitate in futuro e addirittura in modo uniforme: se $| | {\vec{x}}_{0} - {\vec{y}}_{0} | | < δ$ allora $| | \vec{x} (t; {\vec{x}}_{0}) | | < 𝜖 + | | {\vec{y}}_{0} | | = M_{{\vec{x}}_{0}}$ . In questo caso $M_{{\vec{x}}_{0}} = 𝜖 + | | {\vec{y}}_{0} | |$ è indipendente da ${\vec{x}}_{0}$ (se $| | {\vec{x}}_{0} - {\vec{y}}_{0} | | < δ$ ). Il viceversa non vale:

Esempio 277 Consideriamo il sistema descritto in coordinate polari da

r^{'} = r (1 - r), 𝜃^{'} = 1 .

$r (t) = 1$ è una soluzione costante e, procedendo per separazione di variabili,

log \frac{r (t)}{| 1 - r (t) |} = t + c

(si ricordi che $r \geq 0$ ). Dunque, le soluzioni sono

𝜃 (t) = t + h, r (t) = \{\begin{matrix} \frac{k e^{t}}{1 + k e^{t}} & con k > 0 se 0 \leq r (0) < 1 \\ 1 & se r (0) = 1 \\ \frac{k e^{t}}{k e^{t} - 1} & con k > 1 se r (0) > 1 . \end{matrix}

Le soluzioni descrivono delle spirali che si avvolgono intorno alla circonferenza di raggio $1$ . Tutte le soluzioni sono limitate ma scegliendo un intorno dell’origine di raggio minore di $1$ , non si riesce a rimanere in quest’intorno scegliendo di partire “vicini” all’origine. Si veda la figura 10.5. _

figura 10.5: Il caso dell’esempio 277: la limitatezza delle soluzioni non implica la stabilità

Concludiamo notando che i risultati della tabella 10.1, che si riferisce ai sistemi lineari piani autonomi, possono riformularsi con la terminologia della stabilità. Si ottiene cosìla tabella 10.2, nella quale ${\vec{y}}_{0} = 0$ .

Tabella 10.2: La stabilità dei sistemi lineari piani

\begin{matrix} Due autovettorilinearm. indipendenti & Soluzione nulla stabile se e solo seambedue gli autovalori hanno parte reale non positiva \\ Due autovettori linearm. indipendenti & Soluzione nulla asintoticamente stabile se e solo se  ambedue gli autovalori hanno parte reale negativa \\ Autovettori tutti linearmente dipendenti (e quindi un solo autovalore δ) & Soluzione nulla asintoticamente stabile se e solo se l’unico autovalore è negativo \end{matrix}

Si pone ora il problema di sapere quando un punto di equilibrio di un sistema piano è stabile oppure asintoticamente stabile. Questo è generalmente un problema piuttosto diffcile. I due test più semplici che possono usarsi sono il Teorema di Lagrange, per la stabilità, e il teorema sulla stabilità “in prima approssimazione”, per la stabilità asintotica. Per chiarire il significato del Teorema di Lagrange, conviene introdurre la nozione di integrale primo, che ha un’importanza fondamentale in tutte le applicazioni della matematica.

10.4 Sistemi piani ed integrali primi

Il concetto di integrale primo non è limitato ai sistemi piani, ma è in questo caso particolare che noi lo studieremo. Consideriamo quindi il sistema piano

x^{'} = f (x, y), y^{'} = g (x, y) .

(10.18)

Si chiama integrale primo una funzione $V (x, y)$ di classe $C^{1}$ tale che:

gli zeri di $\nabla V (x, y)$ sono isolati;
ogni orbita di (10.18) è contenuta in una curva di livello di $V (x, y)$ .

Integrali primi possono non esistere, ma se esistono non sono mai unici: se $V (x, y)$ è un integrale primo, anche $c V (x, y)$ e $V (x, y) + c$ (con $c$ costante) lo sono. E’ un fatto che molto spesso quando un integrale primo si può trovare allora questo dà informazioni importanti sul comportamento delle soluzioni dell’equazione differenziale. Per esempio:

se si riesce a trovare un integrale primo allora le orbite del sistema (10.18) si possono (almeno localmente) calcolare risolvendo l’equazione (non differenziale) $V (x, y) = c$ . Grazie al Teorema della funzione implicita, ciò è lecito nell’intorno dei punti nei quali il gradiente di $V (x, y)$ non si annulla.
Se le curve di livello di un integrale primo sono tutte limitate, allora le soluzioni dell’equazione rimangono limitate al trascorrere del tempo.

Gli integrali primi hanno una relazione importante con le proprietà dei campi vettoriali. Provando il Teorema di Cauchy, abbiamo visto che al sistema (10.18) conviene associare il campo vettoriale

\vec{F} (x, y) = f (x, y) \vec{i} + g (x, y) \vec{j} .

Associamogli anche il campo vettoriale

\vec{G} (x, y) = - g (x, y) \vec{i} + f (x, y) \vec{j}

ortogonale a $\vec{F} (x, y)$ in ogni punto. Supponiamo che $\vec{G} (x, y)$ ammetta potenziale $V (x, y)$ . Allora, lungo le soluzioni di (10.18) si ha:

\frac{d}{d t} V (x (t), y (t)) = V_{x} x^{'} + V_{y} y^{'} = - g f + f g = 0 .

Ossia, $V$ è un integrale primo di (10.18). Condizione necessaria per l’esistenza del potenziale $V (x, y)$ del campo $\vec{G} (x, y)$ è che

- g_{y} = f_{x}

Dunque:

Teorema 278 Supponiamo che il dominio del sistema piano sia una regione di Jordan. Se

d i v \vec{F} (x, y) = 0

allora il sistema piano ammette integrali primi.

Ovviamente, esistono sistemi che non ammettono integrali primi. Esistono però anche sistemi che ammettono integrali primi e che non soddisfano alle condizioni del Teorema 278, che dà una condizione solo suffciente per l’esistenza di integrali primi:

Esempio 279 Si consideri il sistema piano

t^{'} = 1, x^{'} = x .

Chiaramente, la condizione del Teorema 278 non è soddisfatta, ma integrali primi esistono:

V (t, x) = x e^{- t}

è infatti un integrale primo. _

Ciò nonostante, il caso descritto nel Teorema 278 è particolarmente importante per le applicazioni. Indicando con $H (x, y)$ un integrale primo, si ha $\nabla H = [\begin{matrix} - g & f \end{matrix}]$ , ossia

f = H_{y}, g = - H_{x}

e quindi il sistema piano (10.18) si rappresenta come

x^{'} = H_{y}, y^{'} = - H_{x} .

Sistemi di questa forma si chiamano sistemi hamiltoniani e l’integrale primo $H (x, y)$ si chiama l’ hamiltoniana del sistema. Un caso molto importante nel quale è facile trovare un integrale primo si ha quando si studia

x^{″} = - ϕ (x) o s s i a \{\begin{matrix} x^{'} & = & y \\ y^{'} & = & - ϕ (x) \end{matrix}

(10.19)

Si noti che $ϕ$ dipende dalla sola posizione $x$ e non dalla velocità $y$ . Assumiamo $ϕ (x) \in C^{1} (ℝ)$ . In questo caso

\vec{F} (x, y) = y \vec{i} - ϕ (x) \vec{j}

ha divergenza nulla e quindi il sistema è hamiltoniano. Calcolando il potenziale di

\vec{G} (x, y) = ϕ (x) \vec{i} + y \vec{j}

si trova l’integrale primo

V (x, y) = \frac{1}{2} y^{2} + Φ (x), Φ (x) = \int_{0}^{x} ϕ (s) d s .

Nelle applicazioni fisiche, il sistema si incontra generalmente scritto nella forma

m x^{″} = - ϕ (x)

ove $m$ è la massa. In tal caso

\vec{F} (x, y) = y \vec{i} - \frac{1}{m} ϕ (x) \vec{j}, \vec{G} (x, y) = \frac{1}{m} ϕ (x) \vec{i} + y \vec{j}

ed un integrale primo è

V (x, y) = \frac{1}{m} Φ (x) + \frac{1}{2} y^{2} .

Si è detto che i multipli di un integrale primo sono ancora integrali primi. Il particolare multiplo

E (x, y) = \frac{1}{2} m y^{2} + Φ (x)

si chiama energia totaledel sistema, mentre si chiamano rispettivamente energia cinetica ed energia potenziale le due funzioni $m y^{2} ∕ 2$ e $Φ (x)$ . I sistemi della forma (10.19) si dicono conservativi, poiché l’energia totale (che è un integrale primo) rimane costante lungo ogni orbita (in generale ha valore diverso su orbite diverse):

Teorema 280 L’energia totale “si conserva” (ossia rimane costante) sulle traiettorie di un sistema conservativo.

Esempio 281 Consideriamo l’equazione

m x^{″} = - \frac{l}{g} sin x

che rappresenta le oscillazioni di un pendolo di lunghezza costante.⁷ La sua energia totale è

E (x, y) = \frac{1}{2} m y^{2} + \frac{l}{g} \int_{0}^{x} sin s d s = \frac{1}{2} m y^{2} - \frac{l}{g} [cos x - 1] .

I potenziali sono sempre definiti a meno di una costante additiva, ed usa scegliere come energia totale la funzione

E (x, y) = \frac{1}{2} m y^{2} - \frac{l}{g} cos x .

10.4.1 Integrali primi e stabilità

Se si possono studiare le curve di livello di un integrale primo è possibile ottenere informazioni sulla stabilità di un punto di equilibrio. Mostriamo questo su un esempio.

Esempio 282 Si consideri il sistema

x^{'} = 2 y, y^{'} = - x .

E’ immediato notare che $V (x, y) = x^{2} + 2 y^{2}$ è un integrale primo di questo sistema. Le curve di livello sono le ellissi

x^{2} + 2 y^{2} = c .

Usiamo questo per mostrare che l’origine è un punto di equilibrio stabile. Si fissi per questo $𝜖 > 0$ e sia $c$ cosìpiccolo che l’ellisse $x^{2} + 2 y^{2} = c$ sia contenuta nel disco di centro l’origine e raggio $𝜖$ . Indichiamo con $E$ quest’ellisse. Sia $δ > 0$ cosìpiccolo che la circonferenza di centro l’origine e raggio $δ$ sia contenuta nell’ellisse $E$ , si veda la figura 10.6.

figura 10.6: Integrali primi e stabilità

Sia $(x_{0}, y_{0})$ un dato iniziale di norma minore di $δ$ . L’orbita che lo contiene è contenuta in un ellisse che appartiene alla regione interna all’ellisse $E$ e quindi in particolare nell’intorno dell’origine di raggio $𝜖$ . Ciò mostra la stabilità. _

In generale lo studio geometrico delle curve di livello non è facile. Vogliamo dare un risultato di stabilità che usi l’idea dell’esempio precedente, ma che non richieda la determinazione esplicita delle curve di livello. Questo risultato si applica a sistemi della forma

m x^{'} = y, y^{'} = - ϕ (x) o s s i a m x^{″} = - ϕ (x) con ϕ (0) = 0 .

(10.20)

L’origine, ossia il punto di coordinate $(0, 0)$ , è punto d’equilibrio di questo sistema. Si sa che a questo sistema si può associare sia l’energia potenziale

Φ (x), Φ (x) = - \int_{0}^{x} ϕ (s) d s

sia l’“energia” totale

E (x, y) = \frac{1}{2} m y^{2} + Φ (x) .

Diciamo che $Φ (x)$ ha minimo stretto in $0$ quando

Φ (0) < Φ (x) \forall x \neq 0 .

Analoga definizione per l’energia totale $E (x, y)$ . Vale:

Teorema 283 (di Lagrange) Supponiamo che $0$ sia uno zero isolato di $ϕ (x)$ . Se $0$ è punto di minimo stretto per $Φ (x)$ allora il punto d’equilibrio $(0, 0)$ del sistema (10.20) è stabile.

Dim. Il fatto che $Φ (x)$ abbia un minimo stretto in zero implica che l’energia totale $E (x, y)$ ha minimo stretto in $(0, 0)$ :

0 = E (0, 0) < E (x, y) \forall (x, y) \neq (0, 0) .

Inoltre, l’energia totale è una funzione continua. fissiamo $𝜖 > 0$ e consideriamo il numero

E_{0} = min {E (x, y), | | (x, y) | | = 𝜖} .

Essendo $(0, 0)$ un minimo stretto, segue che $E_{0} > 0$ . Scegliamo ora $σ > 0$ tale che se $| | (x, y) | | < σ$ allora si abbia

E (x, y) < E_{0} ∕ 2 .

Sia $(x_{0}, y_{0})$ un dato iniziale con $| | (x_{0}, y_{0}) | | < σ$ . Sia $(x (t), y (t))$ la soluzione corrispondente a tale dato iniziale. Lungo questa soluzione l’energia si conserva e quindi

E (x (t), y (t)) = E (x_{0}, y_{0}) < E_{0} ∕ 2 .

Dunque, $| | (x (t), y (t)) | |$ non può mai prendere il valore $𝜖$ : se ciò avvenisse per un valore $\bar{t}$ di $t$ avremmo infatti $E (x (\bar{t}), y (\bar{t})) > E_{0} ∕ 2$ . Quindi, essendo $t \to | | (x (t), y (t)) | |$ una funzione continua, si ha sempre

| | (x (t), y (t)) | | < 𝜖 .

Ossia, se il dato iniziale ha norma minore di $σ$ , in ogni istante successivo la soluzione ha norma minore di $𝜖$ . L’arbitrarietà di $𝜖$ prova che il punto di equilibrio $(0, 0)$ è stabile. _ Dalla definizione di $Φ (x)$ si vede immediatamente:

Corollario 284 Le condizioni del Teorema 283 sono soddisfatte se la funzione $ϕ (x)$ verifica

x ϕ (x) > 0 .

Esempio 285 Consideriamo l’equazione

x^{″} = - sin x

che descrive il moto di un pendolo. Le condizioni del Corollario 284 sono soddisfatte e quindi il punto di equilibrio $(0, 0)$ è stabile. L’energia totale è

E (x, y) = \frac{1}{2} y^{2} + cos x .

Alcune delle sue curve di livello intorno al punto d’equilibrio $(0, 0)$ sono riportate nella figura 10.7. Dato che l’energia si conserva, una soluzione che ha dato iniziale all’interno della curva di livello chiusa non esce dalla regione delimitata da questa curva, in accordo con l’asserto del Teorema di Lagrange. Se però il dato iniziale è “lontano” da $(0, 0)$ allora la traiettoria del sistema ad esso corrispondente si allontana dal punto di equilibrio. _

figura 10.7: Il caso considerato nell’esempio 285

10.4.2 Stabilità asintotica e perturbazioni

E’ importante osservare che il teorema di Lagrange dipende da una proprietà di minimo che non si conserva sotto l’azione di piccole perturbazioni. E in effetti piccole perturbazioni possono distruggere la proprietà di stabilità, come mostrano gli esempi seguenti.

Esempio 286 Consideriamo il sistema scalare

x^{'} = 𝜖 x .

Se $𝜖 = 0$ allora il punto d’equilibrio $0$ è stabile, mentre è instabile per ogni $𝜖 > 0$ . Questo esempio non verifica le ipotesi del teorema di Lagrange. Per trovare invece un esempio che verifica le ipotesi del teorema di Lagrange, consideriamo

x^{″} = 𝜖 x^{'} - x .

Se $𝜖 = 0$ questa è l’equazione del moto armonico e verifica le ipotesi del Teorema di Lagrange. Dunque, $(0, 0)$ è punto d’equilibrio stabile come d’altra parte si verifica anche direttamente notando che la matrice corrispondente ha i due autovalori $\pm i$ , distinti e puramente immaginari. Il punto d’equilibrio $(0, 0)$ diviene instabile per ogni $𝜖 > 0$ . _

Esempio 287 Consideriamo ora il sistema

x^{'} = - y - x^{5}, y^{'} = x - y^{3} .

Questo sistema non ammette integrali primi. Però, se $(x (t), y (t))$ è una soluzione,

\frac{d}{d t} {||[\begin{matrix} x (t) \\ y (t) \end{matrix}]||}^{2} = - 2 x^{6} (t) - 2 y^{4} (t) < 0 .

Ciò mostra che la norma decresce e che quindi il punto di equilibrio $(0, 0)$ è stabile. Si può provare che è addirittura asintoticamente stabile. Però, la “piccola” perturbazione che consiste nel trascurare i termini $x^{5}$ ed $y^{3}$ , che è una perturbazione infinitesima di ordine superiore al primo (rispetto ad $(x, y)$ ), ne distrugge la stabilità asintotica. _

Invece, la stabilità asintotica dei sistemi lineari si conserva sotto l’azione di “piccole” perturbazioni. Questa è una proprietà importantissima per le applicazioni, ed anche molto comoda in pratica perché dà un test facile da usare. Enunciamo il risultato senza provarlo:

Teorema 288 Sia

{\vec{x}}^{'} = A \vec{x} + \vec{f} (\vec{x})

(10.21)

e supponiamo che $\vec{f} (\vec{0}) = \vec{0}$ . Supponiamo inoltre:

la matrice $A$ abbia tutti gli autovalori con parte reale negativa, cosìche il punto di equilibrio $\vec{0}$ di ${\vec{x}}^{'} = A \vec{x}$
è asintoticamente stabile;
Valga $lim_{\vec{x} \to 0} \frac{\vec{f} (\vec{x})}{| | \vec{x} | |} = \vec{0} .$

Sotto queste condizioni il punto d’equilibrio $\vec{0}$ è asintoticamente stabile per il sistema (10.21).

Il teorema precedente può anche essere precisato: si può provare che se la matrice $A$ ha un autovalore con parte reale positiva allora l’origine non è stabile per il sistema (10.21). Questo teorema in pratica si usa come segue: si ha un sistema della forma

{\vec{x}}^{'} = \vec{g} (\vec{x}), c o n \vec{g} (\vec{0}) = \vec{0} .

(10.22)

Dato che $\vec{g} (0) = 0$ , lo sviluppo di McLaurin di $\vec{g}$ arrestato al primo ordine dà

\vec{g} (\vec{x}) = A \vec{x} + \vec{f} (\vec{x}), A = J_{\vec{g}} (\vec{0})

e si sa che $\vec{f} (\vec{x})$ è infinitesimo di ordine maggiore di $1$ rispetto a $| | \vec{x} | |$ , ossia

lim_{\vec{x} \to 0} \frac{\vec{f} (\vec{x})}{| | \vec{x} | |} = \vec{0} .

Se gli autovalori di $A$ hanno tutti parte reale negativa, allora il punto d’equilibrio $0$ del sistema (10.22) è asintoticamente stabile.
Si usa dire che il sistema lineare

{\vec{x}}^{'} = A \vec{x}

si ottiene linearizzando in $0$ il sistema ${\vec{x}}^{'} = g (\vec{x})$ . Quando si usa questo teorema per studiare la stabilità asintotica di un punto di equilibrio, si dice che si studia la stabilità in prima approssimazione.

¹in realtà vale di più: ogni sottosuccessione $(x_{n_{k}})$ ha il medesimo limite della $(x_{n})$ .

²La successione ${s_{n}}$ delle somme parziali si costruisce dalla (1.1), conoscendo la successione ${x_{n}}$ . E’ importante notare che, viceversa, nota la successione ${s_{n}}$ , si può ricostruire la successione ${x_{n}}$ . Infatti è

x_{1} = s_{1}, e, per k > 1, x_{k} = s_{k} - s_{k - 1} .

³per provarlo si usi il teorema di confronto per i limiti.

⁴L’esempio 24 presenta una diversa dimostrazione di questo fatto.

⁵si usi

\frac{d}{d x} log [log x] = \frac{1}{x log x} .

¹non spieghiamo la ragione dell’indice “ $\infty$ ”. Per spiegarlo, dovremmo introdurre una famiglia di altre distanze, che non useremo.

²si può mostrare che le proprietà essenziali di questo prodotto mimano quelle del prodotto scalare di vettori di $ℝ^{n}$ o di $ℂ^{n}$ .

³invece, non illustreremo le relazioni tra tali proprietà e le convergenze in media, che richiederebbero l’introduzione di concetti di integrale più generali di quello di Riemann.

⁴nella forma enunciata sopra. Il criterio della radice può modificarsi in modo da avere un nuovo criterio, che identifica in raggio di convergenza in ogni caso.

⁵ora $| \cdot |$ indica il modulo dei numeri complessi.

⁶con l’avvertenza di non commutare i fattori!

⁷L’estremo inferiore dei periodi può essere nullo. Accade ciò se la funzione è costante, ma non solo in tal caso. Per esempio, l’estremo inferiore dei periodi positivi è nullo per la funzione di Dirichlet.

⁸molto spesso, ma non sempre: si faccia attenzione al contesto!

⁹si può provare che è lecito derivare sotto il segno di integrale. Ciò è provato al paragrafo 141. Alternativamente, si può sviluppare il quadrato portare i coeffcienti $α_{0}$ , $α_{1}$ e $β_{1}$ fuori dagli integrali. Quindi si calcolano le derivate.

¹⁰Lo scambio del segno di derivata con quello di integrale è giustificato al paragrafo 141.

¹si ricordi che uno spazio vettoriale si chiama anche spazio lineare.

²perchè, come si è già notato, la retta per ${\vec{x}}_{0}$ parallela ad ${\vec{y}}_{0}$ non muta sostituendo ${\vec{y}}_{0}$ con $m {\vec{y}}_{0}$ , purch’e sia $m \neq 0$ .

³si osservi che la sostituzione $t = 1 - τ$ , $τ \in (0, 1)$ , scambia il primo col secondo estremo.

⁴più precisamente si dovrebbe dire “connesso per archi”. La definizione che qui diamo non ha la forma più generale possibile. Però noi saremo principalmente interessati ad insiemi connessi che sono anche “aperti” e per tali insiemi la definizione data coincide con quella generale, che non riportiamo.

⁵che assumeremo la medesima sullle due rette, ma si potrebbero anche fissare unità di misura diverse, una sulla prima e una sulla seconda retta.

⁶si osservi che i valori assoluti nell’espressione seguente non hanno alcun ruolo. Sono stati introdotti per due ragioni: prima di tutto per uniformità col caso $p \neq 2$ e poi perché, come diremo in seguito, niente cambia se i vettori si considerano a componenti complesse, invece che reali; salvo che in tal caso anche la definizione di $∥ \vec{x} ∥_{2}$ richiede i moduli perch’e la norma deve comunque essere un numero reale.

⁷talvolta invece che con vettori a componenti reali dovremo lavorare con vettori a componenti numeri complessi. In tal caso il prodotto scalare è $\vec{x} \cdot \vec{y} = \sum_{i = 1}^{n} α_{i} {\bar{β}}_{i}$ dove la barra indica il coniugato. Si noti che in questo modo $\vec{x} \cdot \vec{x}$ è sempre reale e positivo e la (3.4) vale anche per vettori a componenti numeri complessi.

⁸in libri molto vecchi e assai raramente in testi recenti si trova usata la croce per il prodotto scalare, $\vec{v} \times \vec{w}$ .

⁹ricordiamo, definito solo in $ℝ^{3}$ .

¹se si usa il simbolo con la parentesi graffa, si deve fare attenzione a capire quando si indica la successione oppure quando se ne vuole indicare l’insieme immagine.

²va notato che in certi testi di meccanica del continuo, il gradiente di una funzione a valori in $ℝ$ si intende essere un vettore riga; ossia in tali libri si confonde il gradiente col vettore che rappresenta il differenziale.

³come proveremo al Capitolo 5

⁴facciamo il caso di un intervallo chiuso, ma quello che andiamo a dire si adatta in ogni caso, anche nel caso che si tratti di una semiretta.

⁵più comunemente, per sfasamento si prende un numero dell’intervallo $[0, 2 π)$ . Ciò può farsi perché le funzioni $cos x$ e $sin x$ sono periodiche di periodo $2 π$ .

⁶Questo non è un termine usuale!

¹i punti di massimo si trattano in modo analogo

¹in modo più rigoroso: si introduce una relazione di equivalenza tra due curve definite parametricamente $\vec{r} (t)$ $t \in I$ e $\tilde{\vec{r}} (τ)$ , $τ \in J$ : esse sono equivalenti quando esiste una trasformazione continua e strettamente crescente $t (τ)$ da $J$ su $I$ tale che $\vec{r} (t (τ)) = \tilde{\vec{r}} (τ)$ per ogni $τ \in (α, β)$ . E quindi si definisce curva una classe di equivalenza rispetto a tale relazione. Per provare che quella introdotta è effettivamente una relazione di equivalenza va ricordato che la funzione inversa di una funzione crescente è essa stessa crescente.

²si ricordi che ogni curva chiusa è un arco.

³ossia, richiediamo che esistano anche i limiti direzionali di $| {\vec{r}}^{'} (s) |$ e che questi siano finiti.

⁴considerazioni analoghe se $\vec{n} (s_{0}) = - \frac{{\vec{t}}^{'} (s_{0})}{| | {\vec{t}}^{'} (s_{0}) | |}$ .

¹sul piano non si introduce una relazione d’ordine; e quindi non si introdurà per l’integrale multiplo un concetto analogo a quello di integrale orientato che si introduce nel caso delle funzioni di una variabile. Esiste però nel piano un “verso positivo di rotazione”. Questo permetterà di introdurre “integrali orientati” sulle superfici in un capitolo successivo.

²si faccia attenzione al fatto che “dominio” indica una insieme connesso ed aperto mentre i “domini di integrazione” sono insiemi chiusi.

³si potrebbe definire l’integrale anche per funzioni con proprietà assai più generali, ma questa classe di funzioni è suffciente praticamente per tutte le applicazioni.

⁴questo metodo di riduzione si chiama anche “metodo di riduzione per fili”.

⁵questo metodo di riduzione si chiama anche “metodo di riduzione per strati”.

⁶con tecniche diverse si potrebbe anche provare che

\int_{0}^{+ \infty} sin x^{2} d x = \int_{0}^{+ \infty} cos x^{2} d x = \frac{\sqrt{π}}{2 \sqrt{2}} .

Questi due integrali si incontrano in problemi di ottica e si chiamano integrali di Fresnel

⁷invece se per esempio gli insiemi $𝒟_{n}$ diventano via via “più lunghi e sottili”, niente può dirsi del limite degli integrali calcolati su di essi.

⁸si noti che ${\vec{r}}_{0}$ potrebbe avere norma $1$

¹come diremo al paragrafo 8.2.3, questa proprietà immediatamente discende dalla (8.4).

²suggerito dalla formula (8.7).

³e solo sotto condizioni di regolarità: esistono curve dalla parametrizzazione continua ma non derivabile, che hanno per sostegno un quadrato. Il prototipo di tali curve si chiama “curva di Peano”.

⁴più correttamente dovremmmo dire “per definirla”.

⁵Non si esclude che l’uguaglianza valga negli estremi dell’intervallo.

⁶o peggio ancora dei rombi che diventano via via più “lunghi e sottili”.

⁷Non si confonda il termine “superficie chiusa” col termine “insieme chiuso”.

⁸Si tratta di una definizione matematicamente non soddisfacente, come si è notato al paragrafo 6.3.1.

¹ricordiamo che col termine “funzione” si indica sempre una funzione univoca.

²questo fatto è automaticamente vero perché $Ω$ è una regione, ossia un aperto connesso. E’ stato enunciato esplicitamente per maggior chiarezza.

³orientando $Σ$ e $γ$ con la regola d’Ampère

⁴nel caso delle $0$ -forme, ossia delle funzioni $f (x, y, z)$ , la (9.12) è niente altro che il Teorema di Schwarz.

¹si ricordi che per definizione il dominio di un’equazione differenziale è un insieme aperto.

²Un possibile valore per $T$ può costruirsi come segue: Sia

M = max_{(t, \vec{x}) \in R} | | \vec{f} (t, \vec{x}) | |, \tilde{M} = max_{i} \{max_{(t, \vec{x}) \in R} ||\frac{\partial \vec{f} (t, \vec{x})}{\partial x_{i}}||\} .

Si può scegliere

T < min \{a, \frac{b}{M}, \frac{1}{\tilde{M}}\} .

Notare che questo valore di $T$ non identifica il più grande intervallo su cui la soluzione esiste.

³di “stabilità”, che vedremo piu’ avanti nel caso non lineare.

⁴si tratta di un sistema la cui matrice dei coeffcienti è degenere, ma si dimostra che è compatibile

⁵le definizioni di questo paragrafo possono adattarsi anche al caso dei sistemi non autonomi. Tal caso è più delicato e non lo consideriamo.

⁶non è restrittivo assumere che l’istante iniziale $t_{0}$ sia $0$ perché il sistema è tempo invariante.

⁷si noti che se le oscillazioni sono “piccole” si può approssimare $sin x \sim x$ ed ottenere l’equazione del moto armonico, $x^{″} = - ω^{2} x$ con $ω^{2} = l ∕ m g$ .

Indice

Elenco delle figure

Capitolo 1Serie numeriche

1.1 Successioni numeriche: ricapitolazione

1.2 Le serie numeriche

1.2.1 Serie telescopiche

Esempi

1.3 Criteri di convergenza

1.3.1 Il teorema di Cauchy per le serie

1.3.2 Monotonia e serie a termini di segno costante

La formula di Stirling

1.3.3 Il test di MacLaurin

1.3.4 Serie a termini di segno qualsiasi

1.4 Alcuni esempi numerici

1.5 Convergenza condizionata ed incondizionata

1.5.1 Serie dipendenti da un parametro e serie di funzioni

1.6 Operazioni algebriche e serie

1.7 Prodotto alla Cauchy

1.8 Appendici

1.8.1 Appendice: ancora sul test di MacLaurin

1.8.2 La dimostrazione del Teorema di Leibniz

Capitolo 2Successioni e serie di funzioni

2.1 Introduzione

2.2 Distanze tra funzioni

2.2.1 Il prodotto interno su ℒ2(a,b)

2.2.2 Proprietà della convergenza uniforme

2.3 Serie di funzioni

2.4 Serie di potenze

2.4.1 Operazioni sulle serie di potenze

2.4.2 Serie di potenze nel campo complesso

2.4.3 Serie di Taylor

2.4.4 Serie di potenze ed equazioni differenziali lineari

2.5 Serie di Fourier: introduzione

2.5.1 Premesse: le funzioni periodiche

2.5.2 Premesse: le formule d’Eulero

2.6 La serie di Fourier in ℒ2(−L,L)

Il calcolo dei coeffcienti di Fourier

2.6.1 Estensioni pari e dispari, e serie di Fourier

Sviluppo di Fourier in soli coseni

Sviluppo di Fourier in soli seni

2.7 La convergenza puntuale della serie di Fourier

Capitolo 3Lo spazio lineare normato ℝn

3.1 Lo spazio lineare ℝn

Vettori colineari e rette parallele

3.1.1 Connessione e convessità

3.1.2 Vettori liberi e vettori applicati

3.2 Basi e basi ordinate

3.2.1 Il piano e lo spazio

3.3 Norme e distanze

3.3.1 Completezza di ℝn

3.4 La norma euclidea

3.4.1 ℝ2 e ℝ3 con la norma euclidea

3.5 Il prodotto vettoriale

3.6 Coordinate curvilinee nel piano e nello spazio

3.7 Funzioni da ℝ in ℝn

Capitolo 4Funzioni da ℝn in ℝm

4.1 Limiti e continuità

4.1.1 Funzioni continue su insiemi

4.2 Le proprietà di differenziabilità

4.2.1 Il differenziale delle funzioni a valori reali

4.2.2 Regole di derivazione

4.2.3 La direzione del gradiente e la direzione di massima velocità crescita

4.2.4 Le funzioni definite tramite integrali

4.3 Le derivate di ordine superiore

4.3.1 La formula di Taylor per le funzioni a valori reali

4.4 Gli estremi

4.5 Il differenziale delle funzioni a valori in ℝm

4.5.1 Regole di calcolo della matrice jacobiana

4.6 Campi vettoriali

4.6.1 Operatori differenziali e campi vettoriali

4.7 Appendici

4.7.1 Appendice: Rappresentazione di funzioni di due variabile

4.7.2 Appendice: Propagazione ondosa

Onde e moto armonico

Onde stazionarie

Interferenza

4.7.3 Appendice: Funzioni omogenee

4.7.4 Appendice: La dimostrazione del teorema 132

4.7.5 Appendice: la dimostrazione del teorema di Schwarz

Capitolo 5Funzioni implicite ed estremi vincolati

Capitolo 1
Serie numeriche

Capitolo 2
Successioni e serie di funzioni

2.2.1 Il prodotto interno su $ℒ^{2} (a, b)$

2.6 La serie di Fourier in $ℒ^{2} (- L, L)$

Capitolo 3
Lo spazio lineare normato $ℝ^{n}$

3.1 Lo spazio lineare $ℝ^{n}$

3.3.1 Completezza di $ℝ^{n}$

3.4.1 $ℝ^{2}$ e $ℝ^{3}$ con la norma euclidea

3.7 Funzioni da $ℝ$ in $ℝ^{n}$

Capitolo 4
Funzioni da $ℝ^{n}$ in $ℝ^{m}$

4.5 Il differenziale delle funzioni a valori in $ℝ^{m}$

Capitolo 5
Funzioni implicite ed estremi vincolati

Capitolo 6
Curve e superfici

6.4.2 Appendice: Curve in $ℝ^{n}$

Capitolo 7
Integrazione delle funzioni di più variabili

Capitolo 8
Integrali di curva e di superficie