321
Flervariabel analyse med lineær algebra av Tom Lindstrøm og Klara Hveberg Matematisk institutt og Senter for matematikk for anvendelser (CMA) Universitetet i Oslo Revidert versjon for v˚ arsemesteret 2009

Flervariabel analyse med lineær algebra

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Flervariabel analyse med lineær algebra

Flervariabel analyse med lineær algebra

av

Tom Lindstrøm og Klara Hveberg

Matematisk instituttog

Senter for matematikk for anvendelser (CMA)Universitetet i Oslo

Revidert versjon for varsemesteret 2009

Page 2: Flervariabel analyse med lineær algebra

i

Forord til første versjon, varen 2006

Dette heftet er første del av et planlagt kompendium som skal dekke pensumi lineær algebra og flervariabel analyse i kursene MAT1100 og MAT1110ved Universitetet i Oslo. I de to kapitlene som na foreligger, gjennomgar viførst vektor- og matriseregning i Rn og deretter den grunnleggende teorienfor funksjoner av flere variable (inklusive kjerneregelen, men ikke multippelintegrasjon).

Opplegget vart har to grunntanker. For det første vil vi utnytte samspil-let mellom lineær algebra og flervariabel analyse pa en bedre mate enn detsom er vanlig i “standardopplegget” der disse to emnene undervises i separa-te kurs. Etter var mening tjener begge emnene pa a bli sett i sammenheng —flervariabel analyse blir begrepsmessig enklere og mer oversiktlig nar mankan bruke notasjon og terminologi fra lineær algebra, og lineæralgebraenvinner nye anvendelsesomrader nar den blir knyttet til flervariabel analyse.Var andre grunntanke er at undervisningen i lineær algebra og flervaria-bel analyse bør knyttes nærmere til numeriske problemstillinger og brukav dataverktøy. Siden MAT1100 er et kurs med grafiske lommeregnere someneste elektroniske hjelpemiddel, er ikke denne tanken sa synlig i de kapit-lene som na foreligger, med den vil komme tydligere frem bade i stoffutvalgog presentasjonsform i de neste kapitlene. Vi har imidlertid prøvd a leggeforholdene til rette allerede i de første kapitlene ved a trekke frem begrepersom iterasjon, linearisering og egenverdier/egenvektorer pa et tidlig stadi-um. Sa selv om numerikken er sa godt som fraværende i dette heftet, servi det likevel som en del av fakultetets kampanje for a styrke de numeriskesidene av realfagsutdanningen!

Heftet forutsetter at studentene har en solid forstaelse av kontinuitet ogderiverbarhet av funksjoner av en variabel, f.eks. tilsvarende de første sjukapitlene i Tom Lindstrøms lærebok Kalkulus (siden denne boken brukes ide andre delene av MAT1100, finnes det en del referanser til den i teksten).Siden heftet skal bli del av et større kompendium, finnes det noen fa be-merkninger av typen “som vi senere skal se” som referer til deler som ennaikke foreligger.

To ord om notasjon: Vi bruker ! til a markere slutten pa et bevis og ♣til a markere slutten pa et eksempel.

Blindern 26/10-2006

Tom Lindstrøm Klara Hveberg

Kommentar til den reviderte utgaven for varsemesteret 2009: Etterat den første versjonen ble lagt ut pa nettet i 2006, har kompendiet gjen-nomgatt en rekke forandringer — feil er rettet opp, nye oppgaver er lagt

ii

til og noen seksjoner er flyttet eller omarbeidet. Til tross for at det ikke gisMATLAB-undervisning i MAT1100, har vi lagt til noen fa, korte MATLAB-kommentarer med tanke pa dem som har lyst til a sette seg inn i programmetpa egen hand. Vi nevner ogsa at fire nye kapitler lagt ut pa nettet som se-parate filer (disse brukes i oppfølgingskurset MAT1110):

Kapittel 3: “Kurver og flater”

Kapittel 4: “Lineær algebra i Rn”

Kapittel 5: “Iterasjon og optimering”

Kapittel 6: “Multippel integrasjon”

Dersom du finner trykkfeil eller har kommentarer til denne utgaven, sa senden e-post til [email protected].

Page 3: Flervariabel analyse med lineær algebra

Innhold

1 Vektorer og matriser 31.1 Algebra for n-tupler . . . . . . . . . . . . . . . . . . . . . . . 41.2 Geometri for n-tupler . . . . . . . . . . . . . . . . . . . . . . 91.3 Komplekse n-tupler . . . . . . . . . . . . . . . . . . . . . . . . 201.4 Vektorproduktet . . . . . . . . . . . . . . . . . . . . . . . . . 231.5 Matriser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351.6 Multiplikasjon av matriser . . . . . . . . . . . . . . . . . . . . 451.7 Identitetsmatriser og inverse matriser . . . . . . . . . . . . . . 561.8 Determinanter, arealer og volumer . . . . . . . . . . . . . . . 62

2 Funksjoner fra Rn til Rm 752.1 Funksjoner av flere variable . . . . . . . . . . . . . . . . . . . 752.2 Kontinuerlige funksjoner . . . . . . . . . . . . . . . . . . . . . 792.3 Grenseverdier . . . . . . . . . . . . . . . . . . . . . . . . . . . 862.4 Derivasjon av skalarfelt . . . . . . . . . . . . . . . . . . . . . 892.5 Partiellderiverte av høyere orden . . . . . . . . . . . . . . . . 1022.6 Derivasjon av vektorvaluerte funksjoner . . . . . . . . . . . . 1062.7 Kjerneregelen . . . . . . . . . . . . . . . . . . . . . . . . . . . 1112.8 Lineæravbildninger . . . . . . . . . . . . . . . . . . . . . . . . 1222.9 Affinavbildninger og lineariseringer . . . . . . . . . . . . . . . 131

3 Kurver og flater 1413.1 Parametriserte kurver . . . . . . . . . . . . . . . . . . . . . . 1413.2 Kjerneregelen for parametriserte kurver . . . . . . . . . . . . 1573.3 Linjeintegraler for skalarfelt . . . . . . . . . . . . . . . . . . . 1613.4 Linjeintegraler for vektorfelt . . . . . . . . . . . . . . . . . . . 1693.5 Gradienter og konservative felt . . . . . . . . . . . . . . . . . 1783.6 Kjeglesnitt . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1853.7 Grafisk fremstilling av skalarfelt . . . . . . . . . . . . . . . . . 2083.8 Grafisk fremstilling av vektorfelt . . . . . . . . . . . . . . . . 2273.9 Parametriserte flater . . . . . . . . . . . . . . . . . . . . . . . 232

iii

INNHOLD 1

4 Lineær algebra i Rn 2394.1 Noen eksempler pa Gauss-eliminasjon . . . . . . . . . . . . . 2404.2 Trappeform . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2494.3 Redusert trappeform . . . . . . . . . . . . . . . . . . . . . . . 2614.4 Matriseligninger . . . . . . . . . . . . . . . . . . . . . . . . . 2674.5 Inverse matriser . . . . . . . . . . . . . . . . . . . . . . . . . . 2754.6 Lineærkombinasjoner og basiser . . . . . . . . . . . . . . . . . 2834.7 Underrom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3004.8 Elementære matriser . . . . . . . . . . . . . . . . . . . . . . . 3094.9 Determinanter . . . . . . . . . . . . . . . . . . . . . . . . . . 3134.10 Egenvektorer og egenverdier . . . . . . . . . . . . . . . . . . . 3314.11 Egenvektorer i praksis . . . . . . . . . . . . . . . . . . . . . . 3474.12 Spektralteoremet . . . . . . . . . . . . . . . . . . . . . . . . . 366

5 Iterasjon og optimering 3755.1 Litt topologi i Rm . . . . . . . . . . . . . . . . . . . . . . . . 3765.2 Kompletthet av Rm . . . . . . . . . . . . . . . . . . . . . . . 3855.3 Noen konsekvenser av kompletthet . . . . . . . . . . . . . . . 3905.4 Iterasjon av funksjoner . . . . . . . . . . . . . . . . . . . . . . 4025.5 Konvergens mot et fikspunkt . . . . . . . . . . . . . . . . . . 4105.6 Newtons metode i flere variable . . . . . . . . . . . . . . . . . 4205.7 Omvendte og implisitte funksjoner . . . . . . . . . . . . . . . 4395.8 Ekstremalverdisetningen . . . . . . . . . . . . . . . . . . . . . 4545.9 Maksimums- og minimumspunkter . . . . . . . . . . . . . . . 4565.10 Lagranges multiplikatormetode . . . . . . . . . . . . . . . . . 4785.11 Gradientmetoden . . . . . . . . . . . . . . . . . . . . . . . . . 502

6 Multippel integrasjon 5076.1 Dobbeltintegraler over rektangler . . . . . . . . . . . . . . . . 5086.2 Dobbeltintegraler over begrensede omrader . . . . . . . . . . 5186.3 Dobbeltintegraler i polarkoordinater . . . . . . . . . . . . . . 5266.4 Anvendelser av dobbeltintegraler . . . . . . . . . . . . . . . . 5346.5 Greens teorem . . . . . . . . . . . . . . . . . . . . . . . . . . 5466.6 Jordan-malbare mengder . . . . . . . . . . . . . . . . . . . . . 5606.7 Skifte av variable i dobbeltintegral . . . . . . . . . . . . . . . 5666.8 Uegentlige integraler i planet . . . . . . . . . . . . . . . . . . 5866.9 Trippelintegraler . . . . . . . . . . . . . . . . . . . . . . . . . 5906.10 Skifte av variable i trippelintegraler . . . . . . . . . . . . . . . 5996.11 Anvendelser av trippelintegraler . . . . . . . . . . . . . . . . . 607

Fasit 613

Page 4: Flervariabel analyse med lineær algebra

2 INNHOLD

Kapittel 1

Vektorer og matriser

Tall spiller en sentral rolle i matematikken — sa sentral at mange nok vilsi at der det er tall, er det matematikk, og der det ikke er tall, er detikke matematikk! Fullt sa enkelt er det ikke — det finnes mange grener avmatematikken der tall spiller en underordnet rolle — men det er likevel ikketil a komme forbi at tall er et av fagets aller viktigste bestanddeler.

I din tidligere matematikkutdanning har du lært a regne med mangeslags tall: hele tall, desimaltall, brøker, irrasjonale tall og til og med kom-plekse tall. I dette kapitlet skal vi ga et skritt videre og regne med tuplerav tall, dvs. flere tall pa en gang. Du har vært borti dette tidligere nar duhar regnet med vektorer i planet og i rommet — en vektor [x, y] i planet eret 2-tuppel, mens en vektor [x, y, z] i rommet er et 3-tuppel. Vi skal na gavidere og regne med n-tupler for alle naturlige tall n. Hvis du tenker geome-trisk, kan dette høres skummelt ut — hvordan skal man kunne forestille segen 4-dimensjonal vektor [x, y, z, u]? Tenker du mer algebraisk, er det ikkenoe skummelt i det hele tatt; et 4-tuppel [x, y, z, u] er bare en notasjon for aholde styr pa fire tall pa en praktisk og kortfattet mate. I dette kapitlet skalvi utvikle bade algebra og geometri, for selv om det a regne algebraisk medtupler er trygt og ukomplisert, mister man fort oversikten, og den gjenvinnerman først nar man lærer a tenke pa tupler som geometriske objekter.

Vi skal ogsa ga et skritt videre og arbeide med matriser. Dette er rek-tangulære oppsett av tall som f.eks.

(2 −1 40 −3 2

)og

3 2

−1 1232 −2

Ved hjelp av matriser kan vi “transformere” n-tupler pa en mate som erviktig i svært mange sammenhenger, bade regneteknisk og geometrisk. Ma-triser og tupler kommer til a spille en sentral rolle ogsa i senere kapitler, delssom nyttige verktøy og dels som selvstendige studieobjekter.

3

Page 5: Flervariabel analyse med lineær algebra

4 KAPITTEL 1. VEKTORER OG MATRISER

1.1 Algebra for n-tupler

La oss begynne med den grunnleggende definisjonen. Et n-tuppel er et ut-trykk (a1, a2, . . . , an) der a1, a2, . . . , an er reelle tall. Vi ser at (2,−1, 7, 3) eret 4-tuppel, mens (0, 1,π, 3

2 ,−7, 3) er et 6-tuppel. To n-tupler (a1, a2, . . . , an)og (b1, b2, . . . , bn) regnes som like dersom de inneholder de samme tallene isamme rekkefølge, dvs. hvis a1 = b1, a2 = b2, . . . , an = bn. Legg merke til at(3, 2, 4) #= (2, 3, 4); selv om tallene er de samme, er rekkefølgen forskjellig.

I dette heftet skal vi bruke bokstaver i fete typer som navn pa n-tupler,f.eks. a = (−2, 3, 0,−17). Det er vanskelig a bruke fete typer nar man skriverfor hand, og man kan da isteden skrive en pil eller en strek over bokstavene;dvs. "a = (−2, 3, 0,−17) eller a = (−2, 3, 0,−17).

Vi skriver 0 for det n-tuplet som har alle komponenter lik 0, altsa 0 =(0, 0, . . . , 0). Hvis vi har et n-tuppel a = (a1, a2, . . . , an), skriver vi −a forn-tuplet (−a1,−a2, . . . ,−an).

Det er en naturlig mate a definere addisjon og subtraksjon av n-tuplerpa. Dersom a = (a1, a2, . . . , an) og b = (b1, b2, . . . , bn), sa er

a + b = (a1 + b1, a2 + b2, . . . , an + bn)

oga− b = (a1 − b1, a2 − b2, . . . , an − bn)

Vi sier at vi adderer og subtraherer komponentvis. Legg merke til at vi barekan addere og subtrahere tupler med like mange komponenter — oppskriftenovenfor gir oss ikke noen mate a addere et 3-tuppel og et 7-tuppel pa. Førvi ser pa et eksempel, tar vi med en regneoperasjon til. Dersom s er et tallog a = (a1, a2, . . . , an) er et n-tuppel, definerer vi produktet av s og a til avære

sa = (sa1, sa2, . . . , san)

Vi ganger altsa s inn i hver komponent i a.

Eksempel 1. Vi lar a = (−2, 3, 0,−17) og b = (4,−1, 3, 17). Da er

a + b = (−2 + 4, 3 + (−1), 0 + 3,−17 + 17) = (2, 2, 3, 0)

og

a− b = (−2− 4, 3− (−1), 0− 3,−17− 17) = (−6, 4,−3,−34)

Hvis s = 3, far vi

sa = (3 · (−2), 3 · 3, 3 · 0, 3 · (−17)) = (−6, 9, 0,−51)

1.1. ALGEBRA FOR N -TUPLER 5

Vi skal innføre en regneoperasjon til. Dersom a = (a1, a2, . . . , an) ogb = (b1, b2, . . . , bn) er to n-tupler, definerer vi skalarproduktet (ogsa kaltprikkproduktet) a · b ved

a · b = a1b1 + a2b2 + · · · + anbn

Legg merke til at a · b ikke er et n-tuppel, men et tall (eller en skalar somman ofte sier nar man vil understreke at noe er et tall og ikke et n-tuppel).Hvis vi lar a = (−2, 3, 0,−17) og b = (4,−1, 3, 17) som ovenfor, ser vi at

a · b = (−2) · 4 + 3 · (−1) + 0 · 3 + (−17) · 17 = −8− 3 + 0− 289 = −300

Vi har na sett hvordan vi kan regne med n-tupler, og det er kanskje patide a ta en kikk pa noen eksempler som antyder hvorfor det er et poengmed slike regnestykker. Det første eksemplet viser at n-tupler er naturligeredskap nar vi skal holde styr pa mer informasjon enn det som kan rommesi et enkelt tall, og at regneoperasjonene svarer til regnestykker det ofte ernaturlig a utføre i slike sammenhenger.

Eksempel 2. En forretning har ansatt 7 studenter pa timebasis. For a holdestyr pa hvor mange timer hver student har arbeidet sa langt, kan vi brukeet 7-tuppel t = (t1, t2, . . . , t7) der t1 er antall timer den første studenten hararbeidet, t2 er antall timer den andre studenten har arbeidet osv. Dersomstudentene arbeider mer senere, kan vi pa samme mate kode tilleggstimenesom et 7-tuppel s = (s1, s2, . . . , s7). Det totale antall timer som studentenehar arbeidet, er na gitt ved t + s.

Studentene har ulik erfaring og derfor ulik lønn. Hvis student nummer enhar en timelønn pa p1 kroner, student nummer to har en timelønn pa p2 kro-ner osv., kan vi ogsa representere lønnen som et 7-tuppel p = (p1, p2, . . . , p7).Dersom studentene har arbeidet t = (t1, t2, . . . , t7) timer, er den totalelønnen som forretningen skylder, gitt av skalarproduktet p · t = p1t1 +p2t2 + . . .+ p7t7. Dersom alle studentene far et lønnstillegg pa 7 prosent, farvi det nye lønnstuplet ved a gange det gamle med skalaren 1.07, altsa 1.07p.

Vi tar med noen eksempler til som viser hvordan n-tupler brukes til aholde styr pa tallmessig informasjon i forskjellige sammenhenger.

Eksempel 3. Tilstanden til en gassbeholder er bestemt av trykket p, tem-peraturen T og volumet V . Hvis du far i oppdrag a male tilstanden til be-holderen ved forskjellige tidspunkt, kan det være naturlig a bruke 4-tuplera = (t, p, T, V ) der t er tidspunktet for malingen. Forskjellen mellom tomalinger a og b er da gitt ved differensen b− a. ♣

Page 6: Flervariabel analyse med lineær algebra

6 KAPITTEL 1. VEKTORER OG MATRISER

Eksempel 4. Et bilde pa en fjernsynsskjerm eller en dataskjerm er byggetopp av sma lysende punkter (piksler). Et vanlig format er 1280 × 1024 =1310720 piksler. I hvert punkt ma vi angi styrken til hver av de tre grunn-fargene rødt, grønt og blatt, sa totalt har vi 3× 1310720 = 3932160 tall aholde styr pa. En naturlig mate a gjøre dette pa er a oppfatte bilder som3932160-tupler! Dette er ikke noe enestaende eksempel — i mange anven-delser er man interessert i tupler med svært mange komponenter. ♣

Her er noen enkle regneregler for n-tupler (det finnes flere). Vær opp-merksom pa at vi bruker de samme prioriteringsreglene for vektorer somfor tall; dersom det ikke star parenteser, skal multiplikasjoner utføres føraddisjoner.

Setning 1.1.1 (Regneregler for n-tupler) Dersom a, b og c er n-tuplerog s og t er reelle tall, gjelder følgende regneregler:

(a) a + b = b + a

(b) a · b = b · a

(c) s(a + b) = sa + sb

(d) (s + t)a = sa + ta

(e) c · (a + b) = c · a + c · b og (a + b) · c = a · c + b · c

(f) (sa) · b = a · (sb) = s(a · b)

(g) a · a ≥ 0 med likhet hvis og bare hvis a = 0

Bevis: Alle disse reglene bevises lett ved a regne ut venstre- og høyresidenog kontrollere at svarene stemmer overens. Vi tar (c) og (g) som eksempler:(c) Dersom a = (a1, a2, . . . , an) og b = (b1, b2, . . . , bn), ser vi at venstresidenkan skrives

s(a + b) = s(a1 + b1, a2 + b2, . . . , an + bn)

= (s(a1 + b1), s(a2 + b2) . . . , s(an + bn))

= (sa1 + sb1, sa2 + sb2 . . . , san + sbn)

Tilsvarende kan høyresiden skrives

sa + sb = (sa1, sa2 . . . , san) + (sb1, sb2 . . . , sbn)

= (sa1 + sb1, sa2 + sb2, . . . , san + sbn)

Siden de to uttrykkene er like, er (c) bevist.(g) Vi ser at

a · a = a21 + a2

2 + · · · + a2n ≥ 0

1.1. ALGEBRA FOR N -TUPLER 7

siden kvadrater aldri er negative. Likhet har vi dersom a21 = 0, a2

2 = 0, . . .a2

n = 0, dvs. dersom a1 = 0, a2 = 0, . . . , an = 0. !

Vi har hittil skrevet vare n-tupler liggende

a = (a1, a2, . . . , an),

men vi kan ogsa skrive dem staende

a =

a1

a2...

an

.

I det første tilfellet kaller vi a en radvektor, mens vi i det andre kaller aen søylevektor. I de fleste situasjoner spiller det ingen rolle om vi skrivern-tuplene pa den ene eller andre formen, og vi velger da ofte a skrive demsom radvektorer siden det tar minst plass. Det finnes imidlertid tilfeller derdet er viktig a skille mellom radvektorer og søylevektorer, men det skal vikomme tilbake til senere — foreløpig kan du skrive dine vektorer pa denmaten du matte ønske. Legg for øvrig merke til at det ofte kan være letterea fa øye pa strukturen i et regnestykke nar du bruker søylevektorer, f.eks.kan

s

a1

a2...

an

+ t

b1

b2...

bn

+ r

c1

c2...

cn

=

sa1 + tb1 + rc1

sa2 + tb2 + rc2...

san + tbn + rcn

virke mer oversiktlig enn

s(a1, a2, . . . , an) + t(b1, b2, . . . , bn) + r(c1, c2, . . . , cn) =

= (sa1 + tb1 + rc1, sa2 + tb2 + rc2, . . . , san + tbn + rcn)

La oss avslutte denne seksjonen med noen flere ord om notasjon. Meng-den av alle n-tupler kaller vi Rn. Nar vi skriver a ∈ Rn, betyr dette derforikke noe annet enn at a er et n-tuppel. Hittil har vi holdt oss til reellen-tupler, men vi kan selvfølgelig ogsa tenke oss n-tupler (c1, c2, . . . , cn) derkomponentene c1, c2, . . . , cn er komplekse tall. Mengden av alle slike n-tuplerkaller vi Cn. Vi skal se nærmere pa komplekse n-tupler litt senere. Notasjo-nen kan ogsa gjøres enda mer generell: Dersom A er en hvilken som helstmengde, betegner An mengden av alle n-tupler (a1, a2, . . . , an) der ai ∈ Afor alle i = 1, 2, . . . , n.

Page 7: Flervariabel analyse med lineær algebra

8 KAPITTEL 1. VEKTORER OG MATRISER

Helt til slutt legger vi merke til at et 1-tuppel (a1) ikke er noe annet ennet tall inni en parentes. Parentesen spiller ingen rolle (den er bare med fora avgrense uttrykket), og vi skal derfor regne 1-tuplet (a1) og tallet a1 somdet samme objektet. Dette betyr at R1 og R er den samme mengden.

MATLAB-kommentar: For a regne med vektorer i MATLAB, ma duførste skrive dem inn. Du kan skrive inn radvektorene a = (1,−2, 3, 0, 5) ogb = (3,−2.4,−2, 0) ved hjelp av kommandoene:

>> a=[1,-2,3,0,5]>> b=[3,-2.4,-2,0]

Legg merke til at vi bruker hakeparenteser [, ] og ikke runde parenteser (, ) fora beskrive vektorer. Du kan ogsa erstatte kommaene mellom komponentenemed mellomrom:

>> a=[1 -2 3 0 5]>> b=[3 -2 4 -2 0]

Nar vektorene er skrevet inn, kan du regne med dem ved a bruke komman-doer av typen >>a+b, >>a-b, >>7*a. Skalarproduktet far du ved a skrive>>dot(a,b). Vil du skrive inn en søylevektor

c =

−1

32

,

ma du bruke semikolon mellom komponentene:

c=[-1;3;2]

0ppgaver til seksjon 1.1

1. Finn a+b, a−b, sa og a·b nar a = (1,−2, 4,−5, 1), b = (−3, 5, 5, 0,−3) og s = 3.

2. Finn a + b, a− b, sa og a · b nar a = (7, 0, 4,−2,−5, 4), b = (0, 2, 1,−6, 0,−1)og s = −4.

3. Vis at for alle x,y ∈ Rn er:

a) (x + y) · (x + y) = x · x + 2x · y + y · y

b) (x− y) · (x− y) = x · x− 2x · y + y · y

c) (x + y) · (x− y) = x · x− y · y.

4. Bevis punktene d), e), f) i setning 1.1.1.

5. Et grossistfirma har n vareslag pa lager, m1 enheter av vareslag 1, m2 enheterav vareslag 2 osv. Verdien av hver enhet er p1 for vareslag 1, p2 for vareslag 2 osv.Uttrykk den totale verdien av varelageret som skalarproduktet mellom to n-tupler.

1.2. GEOMETRI FOR N -TUPLER 9

1.2 Geometri for n-tupler

Et 2-tuppel er ikke noe annet enn et par (a1, a2). Geometrisk kan vi tenkepa et slikt par pa to mater — enten som et punkt med koordinater a1 oga2, eller som en vektor (pil) som starter i origo og ender i dette punktet (sefigur 1).

!

"

! a = (a1, a2)

# !a1

$

"a2

!

"

%%

%%

%%&

a = (a1, a2)

# !a1

$

"a2

Figur 1: a som et punkt og som en vektor

I skolematematikken bruker man gjerne forskjellig notasjon ettersomman tenker pa paret som et punkt eller som en vektor — et punkt (a1, a2)har runde parenteser, mens en vektor [a1, a2] har klammeparenteser. Deter ganske tungvint a bruke to forskjellige notasjoner, og vi vil derfor brukerunde parenteser a = (a1, a2) uansett om vi tenker pa a som et punkt ellersom en vektor. Hva som er naturlig, fremgar som regel av sammenhengen.Snakker vi om en linje gjennom a, er det naturlig a tenke pa a som et punkt,men snakker vi om en linje parallell med a, er det naturlig a tenke pa a somen vektor. Nar vi lager figurer, vil vi noen ganger tegne paret (a1, a2) somen vektor og andre ganger som et punkt, alt etter hva vi synes passer best ihvert enkelt tilfelle (se figur 1).

''''''''''''''(

"

)))))))))*+

++

++

++

++,

!

)))))

a = (a1, a2, a3)

a1a2

a3

'''''(''''- ))))).*

"

$

Figur 2: Et 3-tuppel som en vektor i rommet

Pa tilsvarende vis kan vi oppfatte 3-tupler som punkter og vektorer i

Page 8: Flervariabel analyse med lineær algebra

10 KAPITTEL 1. VEKTORER OG MATRISER

rommet. Figuren ovenfor viser hvordan et 3-tuppel a = (a1, a2, a3) kan opp-fattes som en vektor i rommet.

Som du vet fra skolematematikken, har de algebraiske operasjonene viinnførte i forrige seksjon, en geometrisk tolkning nar vi tenker pa tupler somvektorer i planet eller rommet. Figur 3 viser hvordan vi far frem addisjonog subtraksjon ved a sette sammen vektorer:

!

"

%%

%%

%%&

//

//

//

//

//

///0

111111112

a

ba + b

!

"

++

++

++,

33333333345556 d

c− d

c

Figur 3: Addisjon og subtraksjon av vektorer

Multiplikasjon med en skalar har ogsa en geometrisk tolkning. Dersomvi ganger a med et positivt tall s, beholder vektoren retningen, men blir sganger sa lang. Dersom vi ganger a med et negativt tall s, snur retningen180◦, og den nye vektoren blir |s| ganger sa lang som den opprinnelige (sefigur 4).

!

"

%%

%&%

%%

%%

%%

%%&

%%

%%

%%7

3a

(−2)a

a

Figur 4: Multiplikasjon med et tall

Det er ogsa andre sammenhenger mellom regneoperasjoner og geometri.Fra skolematematikken vet du for eksempel at to (ikke-null) vektorer a, ber parallelle dersom det finnes et tall s #= 0 slik at a = sb, og at de erortogonale (dvs. star normalt pa hverandre) dersom a · b = 0. Du vet ogsaat lengden |a| til vektoren a = (a1, a2, a3) kan regnes ut fra koordinatene:

|a| =√

a21 + a2

2 + a23

1.2. GEOMETRI FOR N -TUPLER 11

og at det er en sammenheng mellom lengden og skalarproduktet:

|a|2 = a · a

Det er sammenhengen mellom geometri og algebra som gir liv til vek-torregning i to og tre dimensjoner, og det hadde vært nyttig om vi kunnebruke var geometriske intuisjon pa samme mate nar vi arbeidet med ge-nerelle n-tupler. Dette kan virke som en uoverkommelig oppgave — hvis2-tupler representerer 2-dimensjonale objekter i planet, og 3-tupler repre-senterer 3-dimensjonale objekter i rommet, sa burde 4-tupler representere4-dimensjonale objekter i et slags 4-dimensjonalt rom? Og, enda verre, 5-tupler burde representere 5-dimensjonale objekter i et 5-dimensjonalt rom,6-tupler burde representere 6-dimensjonale objekter i et 6-dimensjonalt romosv? Hvem av oss kan med handen pa hjertet si at de har noen særlig geome-trisk intuisjon for det som skjer i 4-, 5- og 6-dimensjonale rom?

Heldigvis behøver vi ikke a ha en slik intuisjon pa forhand, men kanbygge den opp gradvis. Ideen er enkel: vi overfører geometriske begreper fraplanet og rommet til det generelle tilfellet ved a bruke de algebraiske beskri-velsene av geometriske egenskaper. Her er et eksempel: At to vektorer a ogb er ortogonale (dvs. at de star normalt pa hverandre), er i utgangspunk-tet en geometrisk egenskap. Denne egenskapen kan vi beskrive algebraiskved a · b = 0. Vi bruker na denne algebraiske beskrivelsen til a definere atto n-tupler a og b er ortogonale dersom a · b = 0 (vi sier da at de starnormalt pa hverandre). Pa denne maten far vi innført det geometriske be-grepet ortogonalitet i høyere dimensjoner uten a matte støtte oss til noengeometrisk intuisjon. Nar begrepet først er innført pa denne maten, kan viundersøke i hvilken grad det svarer til vare (geometriske) forestillinger omhva ortogonalitet er. Pa den maten bygger vi etter hvert opp en intuisjonom ortogonalitet av n-tupler, og denne intuisjonen tar fort en geometriskform.

La oss begynne med litt terminologi: Mengden Rn av alle n-tupler kal-les det n-dimensjonale euklidske rommet, og et n-tuppel a kalles ogsa enn-dimensjonal vektor eller et n-dimensjonalt punkt. Som i det 2- og 3-dimensjonale tilfellet skal vi ofte bruke ordet “vektor” nar det er naturliga tenke pa a som et geometrisk objekt med lengde og retning, og vi skalbruke ordet “punkt” nar vi er opptatt av noe (f.eks. en linje eller et plan)som gar gjennom a. Logisk sett er det selvfølgelig unødvendig a ha mer ennett navn pa disse objektene, men pedagogisk er det ofte en fordel a kunnebruke et ord som antyder hvilke egenskaper vi er opptatt av i hver enkeltsituasjon. Vi har valgt det nøytrale ordet ”n-tuppel” som utgangspunkt forikke a binde oss for sterkt til den ene eller andre tolkningen.

Hvis a = (a1, a2) er en to-dimensjonal vektor, er lengden gitt ved

|a| =√

a21 + a2

2

Page 9: Flervariabel analyse med lineær algebra

12 KAPITTEL 1. VEKTORER OG MATRISER

Tilsvarende er lengden til en tre-dimensjonal vektor a = (a1, a2, a3) gitt ved

|a| =√

a21 + a2

2 + a23

For en n-dimensjonal vektor a = (a1, a2, . . . , an) er det derfor naturlig adefinere lengden (eller normen som den ogsa kalles) ved

|a| =√

a21 + a2

2 + · · · + a2n

I kapittel 1 definerte vi skalarproduktet av vektorene a = (a1, a2, . . . , an) ogb = (b1, b2, . . . , bn) til a være

a · b = a1b1 + a2b2 + · · · + anbn

og vi ser at vi har den vanlige sammenhengen mellom lengden og skalarpro-duktet:

|a| =√

a · a eller med andre ord a · a = |a|2

Vi har allerede definert to n-tupler a og b til a være ortogonale (eller stanormalt pa hverandre) dersom a ·b = 0. Ved hjelp av denne definisjonen kanvi formulere en n-dimensjonal versjon av et meget berømt resultat (figur 5viser den geometriske motivasjonen).

!

"

))))))*88889

++

++

++,

a

a + b b

Figur 5: Pythagoras’ setning i planet

Setning 1.2.1 (Pythagoras’ setning for n-tupler) Dersom a, b ∈ Rn

er ortogonale, sa er|a + b|2 = |a|2 + |b|2

Bevis: Dette er bare et enkelt regnestykke (husk regnereglene for n-tuplerfra kapittel 1):

|a + b|2 = (a + b) · (a + b) =

= a · a + 2a · b + b · b = |a|2 + 2 · 0 + |b|2 =

= |a|2 + |b|2

!

Setningen ovenfor er vart første eksempel pa et resultat om n-tupler somer inspirert av en geometrisk observasjon. Vart neste problem tar utgangs-punkt i figur 6. Vi tenker oss at vi er gitt to vektorer a, b, og at vi ønsker

1.2. GEOMETRI FOR N -TUPLER 13

a finne projeksjonen p av a ned pa b. Dette betyr at p er vektoren parallellmed b slik at a− p star normalt pa b.

!

"

111111112

++

++

+,

++

++

++

+,:

::

:+

p

aba− p

Figur 6: Projeksjonen p av a ned pa b

I utgangspunktet er dette en geometrisk problemstilling som bare girmening for vektorer i planet og rommet, men vi kan bruke var oversettings-filosofi til a gi mening til problemet for generelle n-tupler a og b. Siden detn-tuplet p vi er pa jakt etter skal være parallelt med b, ma det finnes et tallt slik at p = tb, og siden a− p skal sta normalt pa b, ma vi ha

0 = (a− p) · b = (a− tb) · b = a · b− t|b|2

Løser vi denne ligningen med hensyn pa t, far vi

t =a · b|b|2 ,

som betyr at

p = tb =a · b|b|2 b

Vi far dermed dette resultatet:

Setning 1.2.2 Anta at a og b er to ikke-null vektorer i Rn. Da er projek-sjonen p av a ned pa b gitt ved:

p =a · b|b|2 b

Lengden til projeksjonen er |p| = |a·b||b| .

Bevis: Den første formelen har vi allerede utledet. Den andre kan vi foreksempel finne med følgende regnestykke:

|p| = |tb| = |t||b| =|a · b||b|2 |b| =

|a · b||b|

!

Page 10: Flervariabel analyse med lineær algebra

14 KAPITTEL 1. VEKTORER OG MATRISER

La oss kombinere resultatet vi nettopp har bevist med Pythagoras’ set-ning. Siden a− p star normalt pa b, ma den ogsa sta normalt pa p som erparallell med b (sjekk dette!). Det betyr at vi kan bruke Pythagoras’ setningpa vektorene p, a− p og a (se figur 6 for a fa intuisjonen):

|a|2 = |p|2 + |a− p|2

Siden |a− p|2 ≥ 0, betyr dette at

|a|2 ≥ |p|2

som medfører at|a| ≥ |p|

(husk at bade |a| og |p| er positive). Ifølge setningen ovenfor er |p| = |a·b||b| ,

og setter vi dette inn i ulikheten, far vi

|a| ≥ |a · b||b|

Ganger vi med |b| pa begge sider, sitter vi igjen med

|a||b| ≥ |a · b|

Vi har kommet frem til en berømt og meget nyttig ulikhet:

Setning 1.2.3 (Schwarz’ ulikhet) For alle a,b ∈ Rn gjelder

|a · b| ≤ |a||b|

Vi har likhet (dvs. |a ·b| = |a||b|) hvis og bare hvis a og b er parallelle ellerminst en av dem er null.

Bevis: I utledningen av ulikheten har vi strengt tatt gatt ut i fra at a,b #= 0,men ulikheten gjelder apenbart ogsa om en eller begge vektorer er lik 0 (forda er venstresiden i ulikheten lik 0). Det gjenstar dermed bare a sjekke densiste pastanden. Leser du gjennom utledningen av ulikheten en gang til, vildu se at vi har likhet nar |a − p| = 0, dvs. nar a = p. Siden p er parallellmed b, skjer dette nar a og b er parallelle. !

Du husker sikkert fra skolematematikken at

a · b = |a||b| cos v

der v er vinkelen mellom vektorene a og b. I utgangspunktet gir denneformelen bare mening nar a og b er vektorer i planet eller rommet — forgenerelle n-tupler vet vi jo ikke hva vinkler er. Ved hjelp av Schwarz’ ulikhetkan vi na snu situasjonen pa hodet; vi definerer rett og slett vinkelen mellom

1.2. GEOMETRI FOR N -TUPLER 15

to ikke-null n-tupler a og b til a være den vinkelen v mellom 0◦ og 180◦ somer slik at cos v = a·b

|a||b| . Legg merke til at siden Schwarz’ ulikhet garantererat −1 ≤ a·b

|a||b| ≤ 1, sa finnes det alltid en slik vinkel v som definisjonenforutsetter. Vi ser ogsa at vi far a · b = |a||b| cos v.

Hva er sa vitsen med et slikt abstrakt og merkelig vinkelbegrep? Kandisse vinklene brukes til noe, og oppfører de seg som de vinklene vi er vanttil fra planet og rommet? Dette er fornuftige spørsmal som bare erfaring kangi svar pa. Erfaringen viser at disse vinklene fungerer utmerket, og at de i detstore og hele har de samme egenskapene som vinkler i 2 og 3 dimensjoner.Vi skal ikke komme nærmere inn pa dette her, men tar med et eksempel pahvordan man finner en vinkel:

Eksempel 1: Finn vinkelen mellom vektorene a = (2,−1, 0, 1, 1) og b =(0, 1, 3,−2, 0). Vi har

cos v =a · b|a||b| =

=(2,−1, 0, 1, 1) · (0, 1, 3,−2, 0)|(2,−1, 0, 1, 1)||(0, 1, 3,−2, 0)| =

−3√7√

14= −3

√2

14

Bruker vi en lommeregner, finner vi at −3√

214 ≈ −0.3030. Dette gir v ≈

arccos(−0.3030) ≈ 107.6◦. ♣

Et viktig resultat i planet og rommet er trekantulikheten som sier at|a + b| ≤ |a| + |b|. Ved hjelp av Schwarz’ ulikhet skal vi na vise at trekant-ulikheten ogsa gjelder i n dimensjoner.

Setning 1.2.4 (Trekantulikheten) For alle a,b ∈ Rn gjelder

|a + b| ≤ |a| + |b|

Bevis: Vi har|a + b|2 = (a + b) · (a + b)

= |a|2 + 2 a · b + |b|2 ≤ |a|2 + 2 |a||b| + |b|2 = (|a| + |b|)2

der vi har brukt at ifølge Schwarz’ ulikhet er a · b ≤ |a||b|. !

Geometrisk sier trekantulikheten at lengden til den ene siden i en trekantalltid er mindre enn summen av de to andre sidene. Resultatet ovenfor for-teller oss at dette ogsa gjelder i høyere dimensjoner. Faktisk spiller trekant-ulikheten en nøkkelrolle i de fleste forsøk pa a generalisere avstandsbegrepettil nye sammenhenger. I dette heftet skal vi ha stor glede av trekantulikhetennar vi studerer funksjoner av flere variable.

La oss avslutte denne seksjonen med a se pa hvordan vi kan generaliserebegrepet linje til Rn. Vi starter i planet. Figur 7 viser en rett linje gjennompunktet a parallell med vektoren b.

Page 11: Flervariabel analyse med lineær algebra

16 KAPITTEL 1. VEKTORER OG MATRISER

!

"

%%

%&

!

%%

%%

%%

%%

%%

%%

%%

%%

%%

ab

Figur 7: Rett linje gjennom a parallell med b

Siden enhver vektor tb er parallell med b, ser vi at alle punkter av typena + tb ma ligge pa linjen (se figur 8). Det er heller ikke sa vanskelig aoverbevise seg om at ethvert punkt pa linjen ma være av formen a + tb forett eller annet tall t.

Vi har dermed kommet frem til at de punktene som ligger pa den rettelinjen, er nøyaktig de som er av typen a + tb for et reelt tall t. Vi skrivergjerne

r(t) = a + tb

og tenker pa r(t) som et punkt som beveger seg langs linjen nar t endrerseg.

!

"

%%

%&

!%

%%

%%&

!

%%

%%

%%

%%

%%

%%

%%

%

atb

b

a + tb

Figur 8: Parameterfremstilling av en rett linje

Det er na lett a generalisere begrepet rett linje til Rn. Hvis a,b ∈ Rn,b #= 0, sa bestar den rette linjen gjennom punktet a og med retningsvektorb av alle punkter pa formen

r(t) = a + tb

1.2. GEOMETRI FOR N -TUPLER 17

Bruker vi koordinater, ser vi at hvis a = (a1, a2, . . . , an) og b = (b1, b2, . . . , bn),sa blir

r(t) = a + tb = (a1 + tb1, a2 + tb2, . . . , an + tbn)

Eksempel 2: Finn en parameterfremstilling til linjen gjennom punktet a =(1, 2, 0,−1) med retningsvektor b = (−1, 2,−3, 1), og avgjør om punktetc = (2,−1, 1, 4) ligger pa linjen.

Parameterfremstillingen er

r(t) = a + tb = (1− t, 2 + 2t,−3t,−1 + t)

Skal punktet c ligge pa linjen, ma det finnes et tall t slik at r(t) = c, dvs.at følgende ligninger ma være oppfylt:

1− t = 2, 2 + 2t = −1, −3t = 1, −1 + t = 4

Siden det ikke finnes noe tall t som oppfyller alle disse ligningene, ligger ikkec pa linjen. ♣

La oss avslutte denne seksjonen med et begrep som først vil spille ensentral rolle i senere kapitler, men som det kan være greit a vite om alleredena. Anta at vi har vektorer v1, v2,. . . , vk i Rn. Vi sier at vektoren v ∈ Rn

er en lineærkombinasjon av v1, v2,. . . , vk dersom det finnes tall s1, s2,. . . ,sk slik at

v = s1v1 + s2v2 + · · · + skvk

MATLAB-kommentar: MATLAB har en egen kommando for a regne utlengden (eller normen) til en vektor a. Vi skriver >>norm(a).

Oppgaver til seksjon 1.2

1. Finn skalarproduktet av (−2, 3) og (4, 1). Finn ogsa vinkelen mellom vektorene.

2. |a| = 4, |b| = 5 og vinkelen mellom a og b er 45◦. Finn a · b.

3. Finn vinkelen mellom vektorene (1, 2, 3) og (−1, 0, 1).

4. Regn ut vinkelen mellom (−1, 2, 6, 2, 4) og (1, 0, 3, 1, 1).

5. Finn vinkelen mellom vektorene a = (4, 3, 1, 2) og b = (−1, 3, 2, 0). Finn ogsaprojeksjonen av a ned pa b.

6. Hvor lang er projeksjonen av (−3, 4, 2, 5) ned pa (0, 3, 1, 2)?

Page 12: Flervariabel analyse med lineær algebra

18 KAPITTEL 1. VEKTORER OG MATRISER

7. Skriv a = (4, 3) som en sum av to vektorer b og c der b er parallell med d = (1, 2)og c star normalt pa d.

8. Skriv a = (2, 2, 1) som en sum av to vektorer b og c der b er parallell medd = (1, 0,−1) og c star normalt pa d

9. Finn vinkelen som hver av vektorene a = (√

3, 1) og b = (1, 1) danner medx-aksen. Regn ut a · b og bruk svaret til a finne et eksakt uttrykk for cos(15◦).

10. Finn to vektorer som begge star normalt pa (3, 2,−1) og som ikke er parallelle.

11. Vis at dersom a star normalt pa bade b og c, sa star a normalt pa b + c.

12. I denne oppgaver er a,b ∈ Rn.

a) Vis at |a + b|2 = |a|2 + 2 a · b + |b|2.

b) Finn a · b nar |a| = 6, |b| = 4 og |a + b| = 3,

c) Anta at |c| = 3, |d| = 4 og |c + d| = 5. Finn vinkelen mellom c og d.

13. Per pastar at han har to vektorer a og b slik at |a| = 3, |b| = 2 og |a + b| = 7.Hvorfor tror du ikke pa ham?

14. Kari pastar at hun har to vektorer a og b slik at |a| = 7, |b| = 2 og a ·b = −16.Hvorfor tror du ikke pa henne?

15. Vis at for alle x,y ∈ Rn er |x|−| y| ≤ |x− y|. Vis ogsa at |y|−| x| ≤ |x− y|,og konkluder med at | |x|−| y| | ≤ |x− y|.

16. Avstanden d(a,b) mellom to punkter a,b ∈ Rn er lik lengden til vektoren somforbinder dem, dvs. d(a,b) = |b − a|. Bevis at d(a,b) ≤ d(a, c) + d(c,b) for allevektorer a, b, c. Hva er den geometriske tolkningen av denne ulikheten?

17. Vis at for alle vektorer x og y gjelder |x+y|2 + |x−y|2 = 2|x|2 + 2|y|2. Vis ati et parallellogram er summen av kvadratene av sidene lik summen av kvadrateneav diagonalene.

18. Finn en parameterfremstilling av linjen som gar gjennom punktet (−1,−1, 2)og er parallell med (2, 3, 1).

19. Finn en parameterfremstilling av linjen gjennom (−3,−2, 5, 8) parallell med(1,−2,−1, 3). Sjekk om punktet (1,−6, 3, 14) ligger pa linjen.

20. Finn en parameterfremstilling av linjen som gar gjennom punktene (2,−1, 3)og (3, 8,−2).

21. Finn en parameterfremstilling av linjen som gar gjennom punktene (7,−3, 2, 4,−2)og (2, 1,−1,−1, 5).

1.2. GEOMETRI FOR N -TUPLER 19

22. Finn en parameterfremstilling for linjen som gar gjennom (5,−2) og som starnormalt pa (−1, 2).

23. Finn en parameterfremstilling for linjen i planet som har ligning 2x + 3y = 6.

24. En linje i planet har parameterfremstilling (−3 + 2t, 2− t). Finn en ligning avtypen y = ax + b for denne linjen.

25. To skip er pa kryssende kurs. Ved tiden t = 0 er det ene skipet i punktet (0, 4),og det andre skipet i punktet (39, 14) (alle avstander er malt i nautiske mil.) Detførste skipet beveger seg parallelt med vektoren (3, 4) med en fart av 15 knop (1knop = 1 nautisk mil per time). Det andre skipet beveger seg parallelt med vektoren(−12, 5) med en fart av 13 knop.

a) Hvor vil kursene krysse hverandre?

b) Vil skipene kollidere?

26. To fly er i det samme omradet. Ved tiden t = 0 er det ene flyet i punktet(0, 0, 2000) og flyr med en fart pa 150m/s parallelt med vektoren (2, 2, 1). Detandre flyet er ved tiden t = 0 i punktet (5000,−1000, 4000) og 20 sekunder senerei punktet (4400, 2000, 4000). Flyet følger en rett linje og holder konstant hastighet.

a) Vil kursene til de to flyene skjære hverandre?

b) Vil flyene kollidere?

27. I sin evige jakt etter honning forsøker Ole Brumm a invadere et tre ved hjelpav en ballong. Plutselig blir ballongen tatt av et vindkast og farer av sted medOle Brumm. Etter a ha tenkt seg om et øyeblikk, innser Kristoffer Robin at hanseneste sjanse til a redde vennen er a skyte istykker ballongen med lekegeværet sitt.Figuren nedenfor viser en skisse av situasjonen.

"#$%

!

"

;;

;;<

::

::=

&>>??:

@(0, 6)

(4, 3)

(20, 0)u

Nar vindkastet kommer ved tiden t = 0, befinner ballongen seg i punktet (0, 6).Den blir ført av garde med en fart av 5m/s i retningen (4, 3). Ved tiden t = 2 skyterKristoffer Robin mot ballongen fra sin posisjon (20, 0). Vinkelen mellom geværetog underlaget er u, og vi regner med at kulen beveger seg rettlinjet med en fart av70m/s. Alle avstander er malt i meter og tiden er malt i sekunder.

a) Forklar at ballongens posisjon ved tiden t er (4t, 6 + 3t).

Page 13: Flervariabel analyse med lineær algebra

20 KAPITTEL 1. VEKTORER OG MATRISER

b) Vis at kulens posisjon ved tiden t er (20− 70(t− 2) cos u, 70(t− 2) sinu).

c) Hvilken vinkel u ma Kristoffer Robin holde geværet i for a treffe midt iballongen? Hvor langt er det ned til bakken nar ballongen blir truffet?

28. I denne oppgaven skal vi se pa et annet bevis for Schwarz’ ulikhet.

a) Vis at for alle a, b ∈ R og alle x,y ∈ Rn er

0 ≤ |ax± by|2 = a2|x|2 ± 2ab x · y + b2|y|2

b) Velg a = |y|, b = |x| i ulikhetene ovenfor og utled Schwarz’ ulikhet.

1.3 Komplekse n-tupler

Hittil har vi bare sett pa n-tupler a = (a1, a2, . . . , an) der komponentenea1, a2, . . . , an er reelle tall. Vi skal na ta en rask titt pa det komplekse tilfel-let. Som nevnt tidligere kalles mengden av alle komplekse n-tupler for Cn.Addisjon og subtraksjon av komplekse n-tupler foregar komponentvis akku-rat som i det reelle tilfellet. Ogsa multiplikasjon med skalar (som na godtkan være kompleks) foregar akkurat som før. La oss se pa et eksempel:

Eksempel 1: Regn ut sa + tb nar s = 1 + i, t = i, a =(

2i

), b =

(1− i1 + i

). Vi far (husk at i2 = −1):

sa + tb = (1 + i)(

2i

)+ i

(1− i1 + i

)=

((1 + i)2(1 + i)i

)+

(i(1− i)i(1 + i)

)=

=(

2 + 2ii− 1

)+

(i + 1i− 1

)=

(3 + 3i−2 + 2i

)

Nar vi skal definere normen (dvs. lengden) til et komplekst n-tuppel, mavi være litt forsiktig. Dersom a = (z1, z2, . . . , zn), setter vi

|a| =√|z1|2 + |z2|2 + · · · + |zn|2

Vi tar altsa tallverdien til komponentene før vi kvadrerer dem. Grunnen tildette er at kvadratet til et komplekst tall ikke behøver a være positivt ogderfor gir et darlig mal pa størrelse.

Eksempel 2: Finn normen til vektoren a = (2 + i, 4 + i, 1 − 3i). Husk atdersom z = a + ib, sa er |z| =

√a2 + b2 og dermed |z|2 = a2 + b2. Dette gir

|a| =√|2 + i|2 + |4 + i|2 + |1− 3i|2 =

1.3. KOMPLEKSE N -TUPLER 21

=√

(22 + 12) + (42 + 12) + (12 + (−3)2) =

=√

4 + 1 + 16 + 1 + 1 + 9 =√

32 = 4√

2

Lengden til vektoren er altsa 4√

2. ♣

For a fa til det riktige samspillet mellom normen og skalarproduktet,ma vi ogsa gjøre en liten justering i definisjonen av skalarprodukt. Dersoma = (z1, z2, . . . , zn) og b = (w1, w2, . . . , wn), definerer vi

a·b = z1w1 + z2w2 + · · · + znwn

Vi komplekskonjugerer altsa den andre faktoren i skalarproduktet. Sidenzz = |z|2, ser vi at

a · a = z1z1 + z2z2 + · · · + znzn = |z1|2 + |z2|2 + · · · + |zn|2 = |a|2

Vi har altsa den vanlige sammenhengen mellom norm og skalarprodukt:

|a| =√

a · a

La oss ta med et eksempel pa hvordan man regner ut et komplekst ska-larprodukt.

Eksempel 3: Regn ut a · b nar a = (1 + i,−2, 1 + 3i) og b = (2 + 2i, 1 −2i, 3 + 4i). Vi far

a · b = (1 + i)(2− 2i) + (−2)(1 + 2i) + (1 + 3i)(3− 4i) =

= 2− 2i + 2i + 2− 2− 4i + 3− 4i + 9i + 12 = 17 + i

Skalarproduktet av to komplekse vektorer er altsa et komplekst tall. ♣

Pa grunn av komplekskonjugasjonen i annen faktor, har vi ikke lenger ata · b = b · a for komplekse vektorer (den kommutative lov gjelder altsa ikkefor komplekse skalarprodukter). Bruker vi regnereglene for konjugasjon (seKalkulus, setning 3.1.5), ser vi imidlertid at

b · a = w1z1 + w2z2 + · · · + wnzn =

= w1 z1 + w2 z2 + · · · + wn zn =

= w1z1 + w2z2 + · · · + wnzn =

= z1w1 + z2w2 + · · · + znwn = a · b

Bytter vi om pa faktorenes rekkefølge, sa komplekskonjugerer vi altsa resul-tatet!

Siden vi er sa vant til at faktorenes rekkefølge ikke spiller noen rolle, erdet lett a bli lurt av det komplekse skalarproduktet. Dersom vi skal regne

Page 14: Flervariabel analyse med lineær algebra

22 KAPITTEL 1. VEKTORER OG MATRISER

ut (a + b) · (a + b), er det f.eks. fristende a bruke første kvadratsetning tila skrive svaret

a · a + 2a · b + b · b,

men dette blir ikke riktig! Ganger vi nemlig ut parentesene litt forsiktig, servi at

(a + b) · (a + b) = a · a + a · b + b · a + b · b

og siden a · b og b · a ikke er like, kan vi ikke sla sammen de to midtersteleddene pa vanlig mate. Siden tallene a · b og b · a er komplekskonjugerte,har vi imidlertid at a · b + b · a = 2 Re(a · b) (der Re star for realdel), ogdermed kan vi skrive

(a + b) · (a + b) = a · a + 2 Re(a · b) + b · b =

|a|2 + 2 Re(a · b) + |b|2

Dette regnestykket viser at vi ma være litt forsiktige nar vi overfører stan-dard regneprosedyrer til komplekse skalarprodukt.

La oss skrive opp de grunnleggende regnereglene for komplekse n-tupler(sammenlign med setning 1.1.1 for reelle n-tupler):

Setning 1.3.1 (Regneregler for komplekse n-tupler.) Dersom a, b ogc er n-tupler, og s og t er komplekse tall, gjelder følgende regneregler:

(a) a + b = b + a

(b) a · b = b · a

(c) s(a + b) = sa + sb

(d) (s + t)a = sa + ta

(e) c · (a + b) = c · a + c · b og (a + b) · c = a · c + b · c

(f) (sa) · b = s(a · b) og a · (sb) = s(a · b)

(g) a · a ≥ 0 med likhet hvis og bare hvis a = 0

Bevis: Med unntak av b) (som vi nettopp har bevist) og andre del av f),er dette nøyaktig de samme reglene som i setning 1.1.1, og bevisene erogsa de samme. Vi nøyer oss derfor med a vise andre del av f). Hvis a =(z1, z2, . . . , zn) og b = (w1, w2, . . . , wn), ser vi at sb = (sw1, sw2, . . . , swn),og dermed er

a · (sb) = z1sw1 + z2sw2 + · · · + znswn =

= s(z1w1 + z2w2 + · · · + znwn) = s(a · b) !

1.4. VEKTORPRODUKTET 23

Vi kan innføre geometriske begreper for komplekse n-tupler akkurat somfor reelle selv om visualiseringen blir enda vanskeligere i dette tilfellet. Vi sierf.eks. at to vektorer a,b ∈ Cn er ortogonale dersom a ·b = 0. Legg merke tilat dette medfører at b·a = 0 siden b·a = a · b = 0 = 0. Argumentkjeden somga oss Pythagoras’ setning, Schwarz’ ulikhet og trekantulikheten i forrigeseksjon, fungerer med sma justeringer ogsa i det komplekse tilfellet, og vinøyer oss med a skrive opp resultatet:

Setning 1.3.2 For komplekse vektorer a,b gjelder:

(i) (Pythagoras’ setning) Dersom a,b ∈ Cn er ortogonale, sa er |a|2 +|b|2 = |a + b|2

(ii) (Schwarz’ ulikhet) For alle a,b ∈ Cn er |a · b| ≤ |a||b|

(iii) (Trekantulikheten) For alle a,b ∈ Cn er |a + b| ≤ |a| + |b|

!

Oppgaver til seksjon 1.3

1. Regn ut sx + ty nar s = i, t = 1 + 2i, x =(−4i2− i

)og y =

(2 + i2i

).

2. Finn lengden til vektorene a = (3 + 2i,−1 + i) og b = (i, 2 + 3i,−2− i).

3. Regn ut skalarproduktet x·y nar x = (1+3i,−2i, 2+3i) og y = (2, 1+2i,−1+i).

4. Vis at for alle x,y ∈ Cn er

|x− y|2 = |x|2 − 2 Re(x · y) + |y|2

og(x + y) · (x− y) = |x|2 − 2 Im(x · y)− |y|2

hvor Re(z) og Im(z) betegner hhv. realdelen og imaginærdelen til z.

5. Bevis setning 1.3.2 ved a ga gjennom beviset for de tilsvarende resultatene iseksjon 1.2 og se hvilke modifikasjoner som ma gjøres.

1.4 Vektorproduktet

De regneoperasjonene vi hittil har sett pa, er definert for vektorer av alledimensjoner. I denne seksjonen skal vi se studere en operasjon — vektor-produktet — som bare er definert for tredimensjonale vektorer. Siden 3 erden fysiske romdimensjonen, brukes vektorproduktet ofte i geometriske pro-blemstillinger. Det brukes ogsa mye i fysikk og mekanikk — tok du fysikki videregaende skole, har du sikkert støtt pa “høyrehandsregler” i en del

Page 15: Flervariabel analyse med lineær algebra

24 KAPITTEL 1. VEKTORER OG MATRISER

sammenhenger, og bak enhver slik høyrehandsregel skjuler det seg et vek-torprodukt.

Det er to mater a definere vektorproduktet pa, en geometrisk og enalgebraisk, og det er samspillet mellom disse to betraktningsmatene somgir vektorproduktet slagkraft. Vi skal ta utgangspunkt i den algebraiskedefinisjonen. Før vi begynner, minner vi om at man i tre dimensjoner gjerneskriver enhetsvektorene langs aksene pa denne maten:

i = (1, 0, 0), j = (0, 1, 0), k = (0, 0, 1).

Gitt to vektorer a = (a1, a2, a3) og b = (b1, b2, b3) i R3 definerer vi navektorproduktet (ogsa kalt kryssproduktet) a× b ved:

a× b = (a2b3 − a3b2, a3b1 − a1b3, a1b2 − a2b1)

= (a2b3 − a3b2)i + (a3b1 − a1b3)j + (a1b2 − a2b1)k

Denne formelen kan være vanskelig a huske, men det finnes huskeregler. Enslik regel er vist i skjemaet nedenfor. Vi multipliserer langs pilene og girresultatet positiv verdi dersom pilene gar fra venstre mot høyre og negativverdi dersom de gar fra høyre mot venstre (kjenner du en annen huskeregelfra før, kan du trygt bruke den).

i j k i j k

a1 a2 a3 a1 a2 a3

b1 b2 b3 b1 b2 b3

55A 55A 55A55A 55A 55A

33B33B33B33B33B33B

55A 55A 55A33B 33B 33B−a3b2i −a1b3j −a2b1k a2b3i a3b1j a1b2k

Figur 1: Huskeregel for vektorproduktet

La oss regne ut et vektorprodukt:

Eksempel 1: Finn vektorproduktet av a = (3,−1, 2) og b = (4,−2, 5). Vifar:

a× b = ((−1) · 5− 2 · (−2))i + (2 · 4− 3 · 5)j + (3 · (−2)− (−1) · 4)k

= (−1,−7,−2)

♣La oss sa se hva som skjer dersom vi regner ut b× a istedenfor a× b:

b× a = (b2a3 − b3a2, b3a1 − b1a3, b1a2 − b2a1)

= −(a2b3 − a3b2, a3b1 − a1b3, a1b2 − a2b1) = −(a× b)

1.4. VEKTORPRODUKTET 25

Akkurat som skalarproduktet for komplekse vektorer er altsa vektorproduk-tet ikke-kommutativt, men vi har en formel som gjør at vi lett kan regne utb× a nar vi kjenner a× b.

Her er en liste over de grunnleggende egenskapene til vektorproduktet:

Setning 1.4.1 For vektorer a, b, c ∈ R3 gjelder:

(a) a× b = −(b× a)

(b) a× (b + c) = a× b + a× c og (a + b)× c = a× c + b× c

(c) a× (sb) = s(a× b) og (sa)× b = s(a× b) der s ∈ R

(d) a× b star ortogonalt pa bade a og b

(e) (Lagranges identitet) |a× b|2 = |a|2|b|2 − (a · b)2

Bevis: Punkt a) har vi allerede bevist og de andre bevisene er av samme type— vi skriver vektorene pa koordinatform, regner ut og ser at det stemmer.Vi tar c), d) og e) som eksempler:c) Hvis a = (a1, a2, a3) og b = (b1, b2, b3), sa er sa = (sa1, sa2, sa3). Vi far:

(sa)× b = ((sa2)b3 − (sa3)b2, (sa3)b1 − (sa1)b3, (sa1)b2 − (sa2)b1)

= s(a2b3 − a3b2, a3b1 − a1b3, a1b2 − a2b1) = s(a× b)

Den andre likheten i c) gar pa samme mate.d) For a vise at a star ortogonalt pa a×b, ma vi vise at a · (a×b) = 0. Vifar:

a · (a× b) = a1(a2b3 − a3b2) + a2(a3b1 − a1b3) + a3(a1b2 − a2b1)

= a1a2b3 − a1a3b2 + a2a3b1 − a2a1b3 + a3a1b2 − a3a2b1 = 0

En helt tilsvarende regning viser at b star ortogonalt pa a× b.e) Vi skriver a = (a1, a2, a3), b = (b1, b2, b3) og regner ut begge sider (du erikke forpliktet til a føle at dette er spesielt festlig):

|(a× b)|2 = (a2b3 − a3b2)2 + (a3b1 − a1b3)2 + (a1b2 − a2b1)2

= a22b

23−2a2a3b2b3 +a2

3b22 +a2

3b21−2a1a3b1b3 +a2

1b23 +a2

1b22−2a1a2b1b2 +a2

2b21

og

|a|2|b|2 − (a · b)2 = (a21 + a2

2 + a23)(b

21 + b2

2 + b23)− (a1b1 + a2b2 + a3b3)2

= a21b

21 + a2

1b22 + a2

1b23 + a2

2b21 + a2

2b22 + a2

2b23 + a2

3b21 + a2

3b22 + a2

3b23

−a21b

21 − a2

2b22 − a2

3b23 − 2a1a2b1b2 − 2a1a3b1b3 − 2a2a3b2b3

Page 16: Flervariabel analyse med lineær algebra

26 KAPITTEL 1. VEKTORER OG MATRISER

= a21b

22 +a2

1b23 +a2

2b21 +a2

2b23 +a2

3b21 +a2

3b22−2a1a2b1b2−2a1a3b1b3−2a2a3b2b3

Bortsett fra rekkefølgen pa leddene er dette det samme uttrykket som vifikk ovenfor. Dermed er e) bevist. !

Bemerkning: Legg merke til at det ikke finnes noen assosiativ lov i listenovenfor — generelt er nemlig (a×b)× c #= a× (b× c). Som et eksempel larvi a = (1, 1, 0), b = (1, 0, 0) og c = (0, 0, 1). Da er

(a× b)× c = ((1, 1, 0)× (1, 0, 0))× (0, 0, 1) = (0, 0,−1)× (0, 0, 1) = 0

mens

a×(b×c) = (1, 1, 0)×((1, 0, 0))×(0, 0, 1)) = (1, 1, 0)×(0,−1, 0) = (0, 0,−1)

At (a×b)×c #= a×(b×c) betyr at uttrykket a×b×c ikke gir noen mening— vi ma ha med parenteser for a presisere hvilken rekkefølge produkteneskal utføres i.

Som allerede nevnt, er det ogsa en geometrisk mate a beskrive vektor-produktet pa. For a finne frem til denne geometriske beskrivelsen, tar viutgangspunkt i punkt e) i setningen ovenfor:

|a× b|2 = |a|2|b|2 − (a · b)2

Siden vi allerede vet at a · b = |a||b| cos v, der v er vinkelen mellom a og b,sa er

|a× b|2 = |a|2|b|2 − |a|2|b|2 cos2 v = |a|2|b|2 sin2 v

der vi har benyttet at 1− cos2 v = sin2 v. Altsa er

|a× b| = |a||b| sin v

(husk at siden 0◦ ≤ v ≤ 180◦, er sin v aldri negativ). Dermed vet vi hvorlang vektoren a × b er. Legg spesielt merke til at a × b = 0 hvis og barehvis sin v = 0, dvs. dersom a og b er parallelle.

Fra punkt d) i setning 1.4.1 vet vi ogsa noe om retningen til a × b,nemlig at a × b star normalt pa bade a og b. Na finnes det to motsattrettede vektorer som har lengde |a||b| sin v og star normalt pa bade a og b(se figur 2). For a vite hvilken av disse to vektorene som er a×b, bruker vihøyrehandsregelen:

1.4. VEKTORPRODUKTET 27

''''''(+

++

+,

888888889

888888C

a

b

Figur 2: To like lange vektorer som star normalt pa bade a og b

Vi legger høyre hand med fingrene pekende den korteste veien fra a til bmens vi spriker med tommelen. Da er a × b den av de to normalvektorenesom peker i tommelens retning (se figur 3 der den krumme pilen viser denretningen fingrene peker). Legg merke til at nar vi regner ut b × a, skalfingrene spenne over den samme vinkelen, men i motsatt retning (fra bmot a), og tommelen kommer derfor til a peke motsatt vei. Dette er dengeometriske forklaringen pa regelen a× b = −b× a.

''''''(+

++

+,

888888889

888888C

a

b

-

a× b

−(a× b)

Figur 3: Vektorene a× b og −(a× b)

La oss oppsummere det vi har kommet frem til:

Setning 1.4.2 La a og b være to vektorer i R3 og kall vinkelen mellom demv. Da har vektorproduktet a × b lengde |a||b| sin v og star normalt pa badea og b. Retningen til a× b er gitt ved høyrehandsregelen.

∗Bevis: Vi har bevist alt bortsett fra høyrehandsregelen. Beviset vi skal gifor denne regelen kan se litt umatematisk og skissemessig (og vanskelig!) ut,

Page 17: Flervariabel analyse med lineær algebra

28 KAPITTEL 1. VEKTORER OG MATRISER

men det kan uten store endringer bygges ut til et fullverdig bevis. Du kangodt hoppe over dette beviset uten a fa problemer med det som kommersenere. Legg merke til at hvis a og b er parallelle, sa er det ingen ting abevise siden a×b = 0. Vi ser derfor pa tilfellet der a og b ikke er parallelle.

Vi skal først bevise høyrehandsregelen for det spesialtilfellet der a og bligger i xy-planet, og a peker langs den positive x-aksen. Det betyr at a harkoordinater a = (a1, 0, 0) der a1 > 0, og b har koordinater b = (b1, b2, 0). Idette tilfellet vil a× b være parallell med z-aksen, og vi ma undersøke narden peker i positiv retning. Bruker vi høyrehandsregelen, far vi at a×b skalpeke langs den positive z-aksen dersom b ligger i første eller annen kvadrantav xy-planet (dvs. nar b2 > 0), og langs den negative z-aksen dersom b liggeri tredje eller fjerde kvadrant (dvs. nar b2 < 0). Bruker vi isteden formelenfor vektorproduktet, ser vi at

a× b = 0 i + 0 j + a1b2 k = a1b2 k

Denne vektoren peker langs den positive eller negative z-aksen ettersomb2 er positiv eller negativ (husk at a1 > 0). Dette betyr at formelen oghøyrehandsregelen gir samme resultat, og dermed er høyrehandsregelen be-vist i dette tilfellet.

Vi er na rede til a se pa det generelle tilfellet a = (a1, a2, a3), b =(b1, b2, b3). Velg et par av vektorer a0, b0 i xy-planet slik at a peker langsden positive x-aksen, og slik at a0,b0 er en “kopi” av paret a, b. Med dettemener vi at a0 er like lang som a, b0 er like lang som b, og at vinkelen fraa0 til b0 er lik vinkelen fra a til b. La c0 = a0 × b0. Etter det vi alleredehar vist, gjelder høyrehandsregelen for a0, b0 og c0.

La oss na tenke pa vektortriplet (a0,b0, c0) som en materiell gjenstand,f.eks. tre sammensveisede biter av staltrad. Vi flytter na denne gjenstandenmed en kontinuerlig bevegelse, uten a deformere den pa noen mate, slik ata0 ender opp som a, og b0 ender opp som b. La a(t) være posisjonen til a0

etter t sekunder av denne bevegelsen, og la b(t) og c(t) være de tilsvarendeposisjonene til b0 og c0. Hvis bevegelsen tar T sekunder, er dermed a = a(T )og b = b(T ).

Dersom c(T ) = a(T ) × b(T ), er høyrehandsregelen oppfylt for tripleta(T ) = a, b(T ) = b, c(T ) = c. Vi skal derfor anta at c(T ) = −a(T )× b(T )(den eneste andre muligheten) og vise at dette fører til en selvmotsigelse.La t0 være det første tidspunktet der c(t) skifter fra a være lik a(t) × b(t)til a være lik −a(t) × b(t) (formelt er t0 = inf{t : c(t) = −a(t) × b(t)}).Siden c(t) beveger seg kontinuerlig, betyr dette at a(t) × b(t) ma gjøre etsprang ved tidspunktet t0. Men det er umulig siden a(t) × b(t) vil bevegeseg kontinuerlig nar a(t) og b(t) gjør det (tenk pa det algebraiske uttrykketfor vektorproduktet). Dermed har vi fatt var selvmotsigelse, og beviset erfullført. !

Vi skal na se pa noen av de tingene vektorproduktet kan brukes til. Først

1.4. VEKTORPRODUKTET 29

et enkelt eksempel.

Eksempel 2: Finn en vektor som star ortogonalt pa bade a = (1,−2, 3)og b = (4,−1,−2). Vi regner rett og slett ut vektorproduktet: a × b =(1,−2, 3) × (4,−1,−2) = (7, 14, 7). Legg merke til at siden (7, 14, 7) =7(1, 2, 1), kan vi forenkle løsningen til (1, 2, 1). ♣

a)

%%

%%

%%&

%%

%%

%%&

111111112

111111112

a

a + b

bv

b)

%%

%%

%%&

111111112

::

::

a

bv

Figur 4: Parallellogrammet og trekanten utspent av a og b

Det neste vi skal se pa, er hvordan vektorproduktet kan brukes til aregne ut arealer. To vektorer a og b utspenner pa en naturlig mate et pa-rallellogram (se figur 4a). Halvparten av dette parallellogrammet (se figur4b ovenfor), utgjør trekanten utspent av a og b.

??????????

??????????

a

b h = b sin vArealet = ah = ab sin v

v

Figur 5: Arealet til et parallellogram

Setning 1.4.3 Arealet til parallellogrammet utspent av vektorene a og b erlik |a× b|. Arealet til trekanten utspent av a og b er 1

2 |a× b|

Bevis: Enkel geometri forteller oss at arealet til et parallellogram er produk-tet av de to sidene ganget med sinus til den mellomliggende vinkelen (se figur5). For vart parallellogram blir dette |a||b| sin v, som vi vet er lik |a × b|.Siden arealet av trekanten er halvparten av arealet til parallellogrammet,far vi ogsa formelen for arealet av trekanten. !

Page 18: Flervariabel analyse med lineær algebra

30 KAPITTEL 1. VEKTORER OG MATRISER

Eksempel 3: Finn arealet til trekanten med hjørner i punktene a = (2,−7, 3),b = (−2, 3, 2) og c = (2, 2, 2). Denne trekanten har samme areal som denutspent av vektorene c − a og b − a (hvorfor?) Siden c − a = (0, 9,−1) ogb− a = (−4, 10,−1), far vi:

(c− a)× (b− a) = (0, 9,−1)× (−4, 10,−1) = (1, 4, 36)

Dermed er arealet til trekanten lik

12|(1, 4, 36)| =

12

√12 + 42 + 362 =

12√

1313 ♣

Eksemplet ovenfor viser noe av styrken ved a bruke vektorregning til aregne ut geometriske størrelser; det spiller ikke noen rolle hvor komplisertpunktene ligger i forhold til hverandre — vi bare kopler inn den generelleformelen og ut faller svaret. Hadde vi prøvd a finne arealet med tradisjonellegeometriske metoder, hadde vi fort druknet i finurlige tegninger og kompli-serte beregninger. Ulempen ved a bruke vektorregning er at vi ofte misterkontakten med det geometriske bildet — regningen viser oss at noe er riktig,men vi skjønner ikke riktig hvorfor.

Vektorproduktet kan ogsa brukes til a regne ut volumer. Tre vektorer a,b, c i rommet definerer pa en naturlig mate et romlegeme, et parallellepiped,som vist pa figur 6.

!5556/

//

//

//

///0

//

//

//

//

//

555//

//

//

//

// 555555

//

//

//

//

//

ab

c

Figur 6: Parallellepipedet utspent av a, b og c

.

Fra skolen vet vi at volumet til et parallellepiped er arealet av grunnflatenganget med høyden. Sier vi at grunnflaten er parallellogrammet utspent ava og b, vet vi at arealet til grunnflaten er |a × b|. Pa figur 7 har vi kaltvinkelen mellom a× b og den tredje vektoren c for u.

1.4. VEKTORPRODUKTET 31

DDDDDD*E

EEF

????????G

HHHHHHHHHHHHH

HHHH

HHHH

h

2

2

I????????

EE

EDDDDDD????????

DDDDDDE

EE E

EEDDDDDD

????????

HH

u

a× b

ab

c

Figur 7: Volumet til et parallellepiped

.

Siden a× b star normalt pa grunnflaten, blir høyden h lik |c|| cos u| (vima ha med tallverdien rundt cosinus i tilfelle u er større en 90◦). Volumettil parallellepipedet er derfor |a× b||c|| cos u|. Men dette uttrykket er jo lik|(a×b) ·c| (husk den geometriske beskrivelsen av skalarproduktet). Dermedhar vi vist:

Setning 1.4.4 Volumet til parallellepipedet utspent av vektorene a, b, c er|(a× b) · c|

Bemerkning: Nar vi skal regne ut volumet til parallellepipedet utspent ava, b og c, spiller selvfølgelig ikke rekkefølgen av de tre vektorene noen rolle.Volumet kan derfor skrives som bade |(a× b) · c|, |(a× c) · b|, |(b× a) · c|,|(b × c) · a|, |(c × a) · b|, og |(c × b) · a|. Disse seks uttrykkene ma derforvære like. Hvis du orker, kan du sjekke dette ved direkte utregning.

Eksempel 4: Finn volumet til parallellepipedet som utspennes av vektorene(4, 0, 3), (−1, 2,−3) og (0, 2, 1). Ifølge setningen er dette volumet gitt ved|((4, 0, 3)× (−1, 2,−3)) · (0, 2, 1)|. Vi regner først ut

(4, 0, 3)× (−1, 2,−3) = (−6, 9, 8)

Deretter tar vi

|(−6, 9, 8) · (0, 2, 1)| = |0 + 18 + 8| = 26

Volumet er altsa 26. ♣

Tre vektorer a, b, c utspenner ogsa en pyramide (se figur 8a). For a finnevolumet til denne pyramiden husker vi at volumet til en generell pyramideer 1

3gh, der h er høyden og g er arealet til grunnflaten.

Page 19: Flervariabel analyse med lineær algebra

32 KAPITTEL 1. VEKTORER OG MATRISER

))))*:

:=JJJJJJ2

++

+

@@@@@@KK

KK

a)

ab

c

))))*:

:=JJJJJJ2

++

+

@@@@@@KK

KK

JJJJJJ

JJJJJJ

JJJJJJ

::

:: :

:

))))

))))))))b)

ab

c

Figur 8: Pyramiden og parallellepipedet utspent av a, b og c

.

Sammenligner vi pyramiden utspent av a, b, c med parallellepipedetutspent av de samme vektorene (figur 8b), ser vi at høydene er like, menat grunnflaten til pyramiden er halvparten av grunnflaten til parallellepipe-det. Det betyr at volumet til pyramiden ma være en seksdel av volumet tilparallellepipedet. Dermed har vi:

Korollar 1.4.5 Volumet av pyramiden utspent av de tre vektorene a, b, cer 1

6 |(a× b) · c|

Eksempel 5: Finn volumet til pyramiden med hjørner i punktene a =(−1, 2,−3), b = (1, 4, 1), c = (0, 4, 7) og d = (3, 0, 5). Denne pyramiden harsamme volum som pyramiden utspent av vektorene b − a, c − a og d − a(forklar hvorfor!) Siden

b− a = (2, 2, 4) c− a = (1, 2, 10) d− a = (4,−2, 8)

far vi:Volum =

16|((2, 2, 4)× (1, 2, 10)) · (4,−2, 8)|

=16|(12,−16, 2) · (4,−2, 8)| =

966

= 16

Helt til slutt i dette avsnittet skal vi se hvordan vi kan bruke vektor-produktet til a finne ligningen til et plan. Den enkleste maten a beskriveet plan pa, er som regel a angi en normalvektor n = (n1, n2, n3) pluss etpunkt a = (a1, a2, a3) som planet gar gjennom. Planet bestar da av alle depunkter x = (x, y, z) slik at x − a star normalt pa n (se figur 9). At x − astar normalt pa n er ekvivalent med at

0 = n · (x− a) = n1x + n2y + n3z − n1a1 − n2a2 − n3a3

eller med andre ord

n1x + n2y + n3z = n1a1 + n2a2 + n3a3

1.4. VEKTORPRODUKTET 33

Dette kaller vi ligningen til planet. Legg merke til at koeffisientene til x, yog z rett og slett er koordinatene til n

''''''''''''''(

"

))))))))*

++

++

++

+

''''''''''++

++

++

+

''''''''''

!>>

>>

>>L

33334! x3

>>a

n

Figur 9: x ligger i planet gjennom a normalt pa n

Eksempel 6: Finn ligningen til planet som gar gjennom a = (−3, 1, 2) ogstar normalt pa n = (−4, 2,−1). Undersøk om punktet (−2, 4, 3) ligger idette planet.

Vi skal finne alle vektorer x = (x, y, z) slik at 0 = n · (x− a), dvs.

0 = (−4, 2,−1) · (x− (−3), y − 1, z − 2)

= (−4)(x + 3) + 2(y − 1)− 1(z − 2) = −4x + 2y − z − 12

Altsa blir ligningen−4x + 2y − z = 12

For a undersøke om punktet (−2, 4, 3) ligger i planet, sjekker vi om detpasser i ligningen. Setter vi inn pa venstre side, far vi:

−4 · (−2) + 2 · 4− 3 = 13 #= 12

som viser at punktet ikke ligger i planet. ♣

En annen mate a beskrive et plan pa, er a spesifisere tre punkter a, b,c som planet gar gjennom, se figur 10 (sørg for at punktene ikke ligger pasamme rette linje!). For a finne ligningen til planet, ma vi da først finne ennormalvektor. Det er ikke sa vanskelig; en normalvektor til planet ma stanormalt pa begge vektorene b − a og c − a (siden begge disse vektorene isin helhet ligger i planet), og kryssproduktet n = (b− a)× (c− a) er derforet naturlig valg.

Page 20: Flervariabel analyse med lineær algebra

34 KAPITTEL 1. VEKTORER OG MATRISER

''''''''''''''(

"

))))))))*

++

++

++

+

''''''''''++

++

++

+

''''''''''

!a

!c

! b

Figur 10: Planet gjennom a, b og c

Eksempel 7: Finn ligningen til planet som gar gjennom a = (1,−2, 1),b = (3,−2, 2) og c = (2, 0, 1).

Siden b−a = (2, 0, 1) og c−a = (1, 2, 0), sa er en normalvektor gitt ved

n = (b− a)× (c− a) = (2, 0, 1)× (1, 2, 0) = (−2, 1, 4)

Siden normalvektoren er (−2, 1, 4), vet vi at planligningen har formen

−2x + y + 4z = d

for et tall d. For a finne d, kan vi f.eks. sette inn koordinatene til a i lignin-gene:

d = −2 · 1 + (−2) + 4 · 1 = 0

Altsa er ligningen til planet

−2x + y + 4z = 0

MATLAB-kommentar: Du kan bruke MATLAB til a regne ut krysspro-duktet til to vektorer a,b ∈ R3 ved a skrive cross(a,b).

Oppgaver til seksjon 1.4

1. Regn ut a× b nar

a) a = (−1, 3, 2) b = (−2, 1, 7) b) a = (4,−3, 1) b = (−6, 1, 0)

2. Finn arealet til parallellogrammet utspent av a = (−2, 3, 1) og b = (4, 0,−2).

3. En trekant har hjørner i punktene (0,−1, 2), (2,−1, 4) og (3, 0, 4). Finn arealet.

1.5. MATRISER 35

4. Finn en vektor som star normalt pa bade (2, 0,−3) og (−1, 3, 4).

5. Regn ut i× j, j× k, k× i.

6. Finn volumet til parallellepipedet utspent av (3,−2,−2), (0, 0, 4) og (−3, 2, 1).

7. En pyramide har hjørner i punktene (2,−1, 2), (0, 5,−3), (2, 4, 6) og (3,−2, 4).Finn volumet.

8. Finn en ligning for planet som gar gjennom punktene a = (1, 1,−1), b =(0,−2,−6), c = (2, 3, 3).

9. Finn en ligning for planet som gar gjennom punktene a = (1, 2, 1), b = (2, 3, 0),c = (2, 1,−1).

10. Anta at alle hjørnene i et parallellepiped har heltallige koeffisienter. Vis atvolumet er et helt tall.

11. Bevis setning 1.4.1b).

1.5 Matriser

Hittil har vi bare studert n-tupler, men tiden er na inne for a introduserematriser. En m× n-matrise

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

er et rektangulært oppsett av tall med m rader (linjer) og n søyler. Toeksempler er 2× 3-matrisen

B =(−1 2 0−3 4 1

)

og 3× 3-matrisen

C =

2 −3 112 −2 π1 −3

4 0

Tallene a11, a12, . . . , amn som inngar i matrisen A, kaller vi elementene iA. Legg merke til hvordan vi nummerer elementene: a34 er elementet i rad3 og søyle 4 (strengt tatt burde vi ha skrevet et komma mellom 3-tallet og4-tallet for a gjøre det klart at det ikke er element nummer 34 det er snakkom, men man blir fort lei av a skrive alle kommaene, og det er derfor vanliga droppe dem dersom det ikke kan oppsta misforstaelser). Legg ogsa merketil at vi kan oppfatte vektorer som matriser. En radvektor

a = (a1, a2, . . . , an)

Page 21: Flervariabel analyse med lineær algebra

36 KAPITTEL 1. VEKTORER OG MATRISER

er en 1× n-matrise, mens en søylevektor

a =

a1

a2...

an

er en n × 1-matrise. Som matriser betraktet er altsa radvektoren og søyle-vektoren av forskjellig type, og nar vi blander vektorer og matriser er det der-for viktig a holde styr pa om a skal oppfattes som en rad- eller en søylevektor.Vi skal komme tilbake til dette etter hvert. Legg forøvrig merke til at en 1×1-matrise (a11) bare er et tall med en parentes rundt. Parentesen spiller ingenrolle, og vi skal derfor si at en 1× 1-matrise bare er et tall a11.

Akkurat som for n-tupler kan vi definere addisjon og subtraksjon kom-ponentvis. Dersom vi har to m× n-matriser

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og B =

b11 b12 · · · b1n

b21 b22 · · · b2n...

... · · ·...

bm1 bm2 · · · bmn

sa definerer vi

A + B =

a11 + b11 a12 + b12 . . . a1n + b1n

a21 + b21 a22 + b22 . . . a2n + b2n...

... · · ·...

am1 + bm1 am2 + bm2 . . . amn + bmn

og

A−B =

a11 − b11 a12 − b12 . . . a1n − b1n

a21 − b21 a22 − b22 . . . a2n − b2n...

... · · ·...

am1 − bm1 am2 − bm2 . . . amn − bmn

Siden alle regneoperasjoner foregar komponentvis, vil de vanlige regnereglenefor addisjon og subtraksjon ogsa gjelde for matriser.

Vi kan ogsa multiplisere en matrise med et tall s ved a gange tallet inni hver komponent:

sA =

sa11 sa12 · · · sa1n

sa21 sa22 · · · sa2n...

... · · ·...

sam1 sam2 · · · samn

La oss ta et eksempel der vi kombinerer flere av regneoperasjonene:

1.5. MATRISER 37

Eksempel 1: Regn ut 3A− 2B nar

A =(

1 −1 24 0 −1

)og B =

(2 −3 06 −2 3

)

Vi far

3A− 2B =(

3 −3 612 0 −3

)−

(4 −6 0

12 −4 6

)=

(−1 3 6

0 4 −9

)

Transponering er en viktig operasjon for matriser som ikke finnes for tall.Vi transponerer en matrise ved a bytte om rader og søyler. Den transponertetil matrisen A ovenfor er derfor

AT =

a11 a21 · · · am1

a12 a22 · · · am2...

... · · ·...

a1n a2n · · · amn

Legg merke til at nar A er en m× n-matrise, sa er AT en n×m-matrise.

Eksempel 2: Den transponerte til 2× 3-matrisen

A =(

2 −1 35 −2 0

)

er

AT =

2 5

−1 −23 0

som er en 3× 2-matrise. ♣

Transponering kan lett kombineres med addisjon, subtraksjon og multi-plikasjon med skalar. Du kan sjekke at

(A + B)T = AT + BT , (A−B)T = AT −BT , (cA)T = cAT

Hvis vi transponerer den transponerte, kommer vi tilbake til utgangspunk-tet: (

AT)T = A

Legg ogsa merke til at rad- og søylevektorer er transponerte av hverandre.Oppfatter vi søylevektoren

a =

a1

a2...

an

Page 22: Flervariabel analyse med lineær algebra

38 KAPITTEL 1. VEKTORER OG MATRISER

som en matrise, blir den transponerte en radvektor

aT = (a1, a2, . . . , an)

De grunnleggende regneoperasjonene for matriser som vi na har sett pa,er ganske enkle, men man kan jo lure pa hva det hele er godt for — hvorforinnfører vi egentlig matriser nar vi allerede har n-tupler til a holde styr palister av tall? Ett svar er at en del lister kommer naturlig i rektangelform, ogat det er greit a beholde denne formen for ikke a miste oversikt over infor-masjonen. Opplysningene vi legger inn i et regneark vil for eksempel ofte hamatriseform. Det neste eksemplet viser en situasjon som ofte forekommer,og der elementene i matrisen viser fordelingen mellom forskjellige muligheter.

Eksempel 3: En fruktpresse mottar epler fra fire forskjellige produsenter.Eplene blir sortert i tre kategorier: god, middels, darlig. Erfaringene viser atprodusentene har forskjellig kvalitet pa sine produkter. Produsent 1 leverer50% av god kvalitet, 30% av middels kvalitet og 20% av darlig kvalitet. Tal-lene for de andre produsentene er: Produsent 2: 30%, 40%, 30%; produsent3: 25%, 40%, 35%, produsent 4: 20%, 60%, 20%. Dersom vi gir hver produ-sent en søyle, kan vi sette opp denne informasjonen som en 3 × 4-matrise(husk at prosent betyr “hundredel”):

A =

0.5 0.3 0.25 0.20.3 0.4 0.4 0.60.2 0.3 0.35 0.2

Anta na at fruktpressen mottar leveringer fra hver av produsentene: 4 tonnfra produsent 1, 5 tonn fra produsent 2, 3 tonn fra produsent 3 og 6 tonnfra produsent 4. Vi setter opp denne leveransen som en søylevektor

b =

4536

Vi ønsker a finne ut hvor mange tonn vi har fatt av hver kvalitet. Observerat dersom vi ganger hvert av tallene i første rad i A med tilsvarende tall ib, og sa legger sammen, far vi antall tonn av beste kvalitet:

0.5 · 4 + 0.3 · 5 + 0.25 · 3 + 0.2 · 6 = 2 + 1.5 + 0.75 + 1.2 = 5.45

Tilsvarende far vi antall tonn av nest beste kvalitet ved a gange tallene iannen rad i A med tilsvarende tall i b, og sa legge sammen:

0.3 · 4 + 0.4 · 5 + 0.4 · 3 + 0.6 · 6 = 1.2 + 2 + 1.2 + 3.6 = 8

1.5. MATRISER 39

Til slutt far vi antall tonn av darligste kvalitet ved a gange tallene i nedersterad i A med tilsvarende tall i b og sa legge sammen:

0.2 · 4 + 0.3 · 5 + 0.35 · 3 + 0.2 · 6 = 0.8 + 1.5 + 1.05 + 1.2 = 4.55

Legg merke til at i hvert av disse regnestykkene har vi regnet ut et slagsskalarprodukt mellom en rad i matrisen A og vektoren b (vi sier et “slags”skalarprodukt siden det er et litt uortodokst produkt mellom en radvektorog en søylevektor). Legg ogsa merke til at vi kan tenke pa resultatet avregnestykkene som en ny vektor

c =

5.458

4.55

som forteller oss hvor mange tonn vi har av hver kvalitet. ♣

Vi skal se pa et eksempel til av lignende type.

Eksempel 4: Et kjøpesenter har tre stativ X, Y og Z hvor du kan henteog avlevere handlevogner. Av de vognene som starter dagen i stativ X, vil70% avslutte den pa samme sted, 10% vil ha endt opp i Y , og 20% i Z. Avde vognene som startet dagen i stativ Y , vil 30% avslutte dagen i stativ X,mens henholdsvis 50% og 20% vil havne i stativene Y og Z. De tilsvarendetallene for vogner som starter i Z, er at 40% ender dagen i X, 20% i Yog 40% i Z. Vi kan ordne disse tallene i en matrise A der første søyle girfordelingen av de vognene som startet i X, andre søyle gir fordelingen avde vognene som startet i Y og tredje søyle gir fordelingen av vognene somstartet i Z:

A =

0.7 0.3 0.40.1 0.5 0.20.2 0.2 0.4

Anta na at vi startet dagen med 100 vogner i X, 70 vogner i Y og 30 vogneri Z, og la oss skrive dette som en søylevektor

b =

1007030

Vi ønsker a finne ut hvor mange vogner som befinner seg pa hvert sted vedslutten av dagen. Antall vogner i X far vi ved a gange tallene i første rad iA med tilsvarende komponent i vektoren b, og sa legge sammen:

0.7 · 100 + 0.3 · 70 + 0.4 · 30 = 70 + 21 + 12 = 103

Page 23: Flervariabel analyse med lineær algebra

40 KAPITTEL 1. VEKTORER OG MATRISER

Antall vogner i Y far vi tilsvarende ved a gange hvert tall i annen rad i Amed tilsvarende tall i b, og sa legge sammen:

0.1 · 100 + 0.5 · 70 + 0.2 · 30 = 10 + 35 + 6 = 51

Antall vogner i Z ved slutten av dagen, far vi sa ved a gange hvert tall itredje rad i A med tilsvarende tall i b, og legge sammen:

0.2 · 100 + 0.2 · 70 + 0.4 · 20 = 10 + 14 + 12 = 46

Vi kan skrive opp resultatet som en ny vektor

c =

1035146

som gir oss fordelingen av handlevogner ved slutten av dagen. Legg merketil at vi i dette eksemplet har gjort akkurat samme operasjoner som i detforrige; vi har tatt skalarproduktene mellom radene i A og søylevektoren b.

I begge eksemplene ovenfor gjennomførte vi samme type regneopera-sjoner. Vi startet med en matrise A og en søylevektor b, og laget en nysøylevektor c der komponentene fremkom som skalarprodukt av radene i Aog vektoren b. Denne regneoperasjonen er sa vanlig at det er greit a ha eteget navn pa den.

Definisjon 1.5.1 (Multiplikasjon av matrise og søylevektor) Anta atA er en m× n-matrise og at b er en n-dimensjonal søylevektor:

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og b =

b1

b2...bn

Produktet av A og b er da den m-dimensjonale søylevektoren c = Ab gittved

c =

c1

c2...

cm

=

a11b1 + a12b2 + · · · + a1nbn

a21b1 + a22b2 + · · · + a2nbn...

am1b1 + am2b2 + · · · + amnbn

Den i-te komponentene i c = Ab fremkommer altsa ved at vi tar skalarpro-duktet av den i-te raden i A med vektoren b.

1.5. MATRISER 41

Legg merke til at produktet Ab bare er definert nar A og b passer sammenstørrelsesmessig; b ma ha like mange komponenter som A har søyler. Ob-server ogsa at produktet Ab er en søylevektor med like mange rader som A.

Eksempel 5: Finn Ab nar

A =

2 14 −1

−2 5

og b =(

36

)

Vi far

Ab =

2 · 3 + 1 · 6

4 · 3 + (−1) · 6(−2) · 3 + 5 · 6

=

126

24

Vi skal komme tilbake til regneregler for produkter senere, men skriveropp noen av de enkleste og vanligste (i formlene nedenfor er s et tall):

(A + B)b = Ab + Bb, (sA)b = s(Ab)

A(b + c) = Ab + Ac, A(sb) = s(Ab)

Det er god trening a sjekke at disse reglene holder. Vær oppmerksom pa atdet ogsa er en del ting du kan gjøre med vanlige produkter, som du ikke kangjøre med produktet ovenfor, f.eks. kan du ikke bytte om pa rekkefølgen avfaktorene (bA gir ikke mening). Du kan heller ikke forkorte A i uttrykk avtypen Ab = Ac eller b i uttrykk av typen Ab = Bb — a forkorte betyregentlig a gange med et inverst element pa begge sider av ligningen, og vi vetforeløpig ikke noe om inverse vektorer og matriser (det viser seg at vektorerikke har inverser, men at noen matriser har det!)

La oss ta en ny kikk pa eksempel 3 og 4 i lys av de begrepene vi na harinnført:

Eksempel 3 og 4 pa nytt: I eksempel 3 (fruktpressen) ble leveransene frade fire produsentene kodet som et 4-tuppel b, mens 3-tuplet c fortalte osshvor mange tonn vi mottok av hver kvalitet. Vi regnet ut elementene i c veda ta skalarproduktet av radene i matrisen A med vektoren b — med andreord:

c = Ab

Som vi skal komme tilbake til senere, kan vi tenke pa multiplikasjon med Asom en “transformasjon” — vektoren b forteller oss hvor mye frukt vi farfra hver produsent, og multiplikasjon med A “transformerer” denne kunn-skapen til kunnskap om hvor mye vi mottar av hver kvalitet (representertved vektoren c).

Page 24: Flervariabel analyse med lineær algebra

42 KAPITTEL 1. VEKTORER OG MATRISER

Noe lignende skjer i eksempel 4 (handlevognene). Her representerer vek-tor b fordelingen av handlevogner ved begynnelsen av dagen, mens vektorc representerer fordelingen ved slutten av dagen. Vi regnet ut elementene ic ved a ta skalarproduktet av radene i matrisen A med vektoren b — medandre ord:

c = Ab

Igjen kan vi tenke pa multiplikasjon med A som en transformasjon somtransformerer kunnskap om hvor handlevognene er ved begynnelsen av da-gen til kunnskap om hvor de er ved slutten av dagen. ♣

La oss avsluttte med en liten observasjon som vi kommer til a fa gledeav senere. Anta at

a =

a1

a2...

an

og b =

b1

b2...

bn

er to søylevektorer. Transponerer vi a, far vi radvektoren

aT = (a1, a2, . . . , an)

som vi kan oppfatte som en 1×n-matrise. Vi kan na ta produktet av matrisenaT og vektoren b. Dette gir oss en 1× 1-matrise (dvs. et tall):

aTb = a1b1 + a2b2 + · · · + anbn = a · b

Matriseproduktet aTb er altsa lik skalarproduktet a ·b. Dette kan virke somen kuriositet, men viser seg a være viktig i en del sammenhenger.

MATLAB-kommentar: Du kan skrive inn en matrise

A =

2 −1 31 0 −34 0 1

i MATLAB ved med kommandoen

>>A=[2 -1 31 0 -34 0 1]

Du kan ogsa markere linjeskiftene med semikolon:

>>A=[2 -1 3;1 0 -3;4 0 1]

1.5. MATRISER 43

Nar matrisene er lastet inn, kan du utføre operasjoner med kommandoersom >>A+B og >>3*A-2*B. Den transponerte til A far du ved a skrive >>A’,og produktet mellom en matrise A og en vektor b er gitt ved kommandoen>>A*b. Alle disse kommandoene forutsetter at matrisene og vektorene harriktige dimensjoner slik at regneoperasjonene gir mening.

Oppgaver til seksjon 1.5

1. Regn ut 2A, (−3)B, A + B og A−B nar

A =(

3 −2 4−1 0 6

)og B =

(2 2 −14 0 −6

)

2. Regn ut 4A− 3B nar

A =

1 −32 −13 −1

og B =

3 2

−2 −13 0

3. Finn de transponerte:

A =(

1 −2 6−1 8 6

)og B =

2 2 −14 0 −61 7 −3

4. Finn de transponerte til A, B og 4A−B nar

A =

1 0

−5 72 −1

og B =

4 −1

−1 32 −6

5. Regn ut Ax nar:

a) A =(

1 0 −3−2 −3 2

)og x =

−2

3−1

.

b) A =

2 03 16 −2

og x =(

3−2

).

c) A =

2 1 0

−3 4 −21 −3 2

og x =

403

.

6. Regn ut hvor mange tonn vi far av hver kvalitet i eksempel 3 dersom produsent 1leverer 10 tonn, produsent 2 leverer 5 tonn, produsent 3 leverer 8 tonn og produsent4 leverer 6 tonn.

7. Hvordan vil handlevognene i eksempel 4 fordele seg ved slutten av dagen dersomvi begynner med 50 vogner i stativ X, 70 i stativ Y og 80 i stativ Z?

8. Bevis regnereglene for transponering som star rett etter eksempel 2.

Page 25: Flervariabel analyse med lineær algebra

44 KAPITTEL 1. VEKTORER OG MATRISER

9. Bevis regnereglene for multiplikasjon av matrise og vektor som star rett ettereksempel 5.

10. Et oljemottak far olje fra 3 oljefelt. Oljen inndeles i fem kvaliteter A, B, C,D, E. Fra oljefelt 1 er fordelingen: A: 10%, B: 20%, C: 30%, D: 30%, E: 10%. Fraoljefelt 2 er fordelingen: A: 0%, B: 30%, C: 30%, D: 30%, E: 10%. Fra oljefelt 3 erfordelingen: A: 20%, B: 20%, C: 10%, D: 10%, E: 40%. Anta at mottaket far inn xenheter fra felt 1, y enheter fra felt 2 og z enheter fra felt 3. Finn en matrise somkan brukes til a regne ut hvor mange enheter man far av hver kvalitet. Hva blirresultatet nar x = 10, y = 12 og z = 8?

11. En smittsom sykdom sprer seg i et land. Helsemyndighetene deler befolkningeni tre grupper: smitteutsatte, syke, immune. Fra en uke til den neste regner man at5% av de smitteutsatte blir syke, mens 1% av dem blir immune uten a ha værtsyke. Av de syke blir 80% immune, mens resten fortsatt er syke. En prosent av deimmune mister immuniteten og blir smitteutsatte, mens resten fortsatt er immune.La xn, yn, zn være den andelen av befolkningen som er hhv. smitteutsatt, syk og

immun etter n uker. La vn =

xn

yn

zn

.

a) Finn en matrise A slik at Avn = vn+1.

b) I uke 0 er 10% av befolkningen syke, mens resten er smitteutsatte. Finnfordelingen av smitteutsatte, syke og immune i uke 1 og 2.

12. En forskergruppe som studerer et bestemt dyreslag, deler bestanden inn i firegrupper:

1. unge, dvs. dyr født samme var

2. unge voksne, dvs. dyr født aret før

3. voksne, dvs. dyr født to ar før

4. gamle, dvs. dyr født mer enn to ar før

Statistikken viser at bare 5% av de unge overlever til aret etter. Av de unge voksneoverlever 50% til aret etter. I tillegg gir en ung voksen i gjennomsnitt opphav til 20unger som blir født aret etter. Blant de voksne overlever 30% til aret etter. I tillegggir en voksen i gjennomsnitt opphav til 50 unger som blir født aret etter. Av degamle overlever 10% til aret etter. I tillegg gir en gammel i gjennomsnitt opphavtil 10 unger som blir født aret etter. La xn, yn, zn, un være hhv. antall unge, antallunge voksne, antall voksne og antall gamle etter n ar, og skriv

vn =

xn

yn

zn

un

a) Finn en matrise A slik at vn+1 = Avn.

b) Anta at det et ar settes ut 100 voksne dyr i et terreng der det ikke er noendyr fra før av. Hvor mange dyr av hver kategori vil det være i dette terrengetto ar senere?

1.6. MULTIPLIKASJON AV MATRISER 45

13. Per, Pal og Espen leker sisten. Hver gang Per eller Pal har sisten, er det 90%sjanse for at Espen far sisten neste gang, mens hver gang Espen har sisten, har Perog Pal 50% sjanse hver for a fa sisten neste gang. Anta at xn er sannsynlighetenfor at Per er den n-te som har sisten, at yn er sannsynligheten for at Pal er denn-te som har sisten, og at zn er sannsynligheten for at Espen er den n-te som har

sisten. La vn =

xn

yn

zn

.

a) Finn en matrise A slik at vn+1 = Avn.

b) Anta at Pal har sisten først. Hva er sannsynligheten for at henholdsvis Per,Pal og Espen er den tredje som har sisten?

1.6 Multiplikasjon av matriser

I forrige seksjon sa vi at addisjon og subtraksjon av matriser er lett; vi bareadderer og subtraherer komponentvis. Det er fristende a definere multipli-kasjon pa samme mate; hvis

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og B =

b11 b12 · · · b1n

b21 b22 · · · b2n...

... · · ·...

bm1 bm2 · · · bmn

sa bør kanskje produktet være

a11b11 a12b12 . . . a1nb1n

a21b21 a22b22 . . . a2nb2n...

... · · ·...

am1bm1 am2bm2 . . . amnbmn

?

Det er ikke noe galt med dette produktet (det kalles Hadamard-produktet oger nyttig for noen formal), men det er en annen type matriseprodukt som erlangt viktigere. Ved første øyekast ser dette produktet litt merkelig ut, ogfor a motivere det skal vi ga tilbake til produktet Ab fra slutten av forrigeseksjon. (Dersom du synes denne motivasjonen er vanskelig, kan du trøstedeg med at det kommer en oppsummering i definisjon 1.6.1.)

La oss se litt nærmere pa produktet c = Ab mellom en matrise A ogen vektor b. Som allerede nevnt, er det ofte smart a tenke pa dette som entransformasjon; vi starter med en vektor b, og matrisen A transformerer btil en ny vektor c. I eksempel 3 i forrige seksjon (fruktpressen), sa vi f.eks.hvordan A transformerer kunnskap om hvor mange tonn epler vi far fra hverprodusent (kodet opp i vektoren b) til kunnskap om hvor mange tonn epler vihar av hver kvalitet (kodet opp i vektoren c = Ab). Noe tilsvarende skjeddei eksempel 4 (handlevognene); i dette tilfellet transformerer A kunnskap om

Page 26: Flervariabel analyse med lineær algebra

46 KAPITTEL 1. VEKTORER OG MATRISER

hvor vognene er ved begynnelsen av dagen (gitt ved vektoren b), til kunnskapom hvor de er ved slutten av dagen (gitt ved vektoren c = Ab). Legg merketil at i begge eksemplene bruker vi den samme matrisen A uansett hvilkeninput-vektor b vi har — det er slik gjenbruk som ofte gjør matriser nyttige.

Vi kan illustrere situasjonen med diagrammet nedenfor; en m×n-matriseA transformerer vektorer x i Rn til vektorer y = Ax i Rm:

x ∈ Rn !A

y = Ax ∈ Rm

I mange situasjoner ma vi foreta flere transformasjoner etter hverandre.Neste diagram viser en slik situasjon; først transformeres x ∈ Rk til y =Bx ∈ Rn ved hjelp av matrisen B, og deretter transformeres y ∈ Rn tilz = Ay = A(Bx) ∈ Rm ved hjelp av matrisen A:

x ∈ Rk !B

y = Bx ∈ Rn !A

z = Ay = A(Bx) ∈ Rm

Det er naturlig a spørre om det finnes en matrise C som tar oss direktefra x til z uten a ga veien om y, dvs. slik at z = Cx. Neste diagram viserhvordan en slik C vil fungere:

x ∈ Rk !B

y = Bx ∈ Rn !A

z = Ay = A(Bx) ∈ Rm

C

* =

Cx

Det viser seg at det eksisterer en slik matrise C, og vi skal na finneden. Før vi begynner kan det være greit a bestemme dimensjonene til de trematrisene vare A, B og C. Vi ser at A transformerer vektorer i Rn til vektoreri Rm, og det betyr at A er en m × n-matrise. Tilsvarende transformerer Bvektorer i Rk til vektorer i Rn, og det betyr at B er en n × k-matrise. Denukjente matrisen C skal transformere vektorer i Rk til vektorer i Rm, og maderfor være en m× k-matrise. Vi har derfor

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og B =

b11 b12 · · · b1k

b21 b22 · · · b2k...

... · · ·...

bn1 bn2 · · · bnk

som vare kjente matriser, og

C =

c11 c12 · · · c1k

c21 c22 · · · c2k...

... · · ·...

cm1 cm2 · · · cmk

1.6. MULTIPLIKASJON AV MATRISER 47

som var ukjente matrise. Hvis x er vektoren

x =

x1

x2...

xk

,

ser vi at

y = Bx =

b11x1 + b12x2 + · · · + b1kxk

b21x1 + b22x2 + · · · + b2kxk...

bn1x1 + bn2x2 + · · · + bnkxk

Ser vi pa den j-te raden i denne ligningen, far vi yj = bj1x1 + bj2x2 + · · · +bjkxk. Vi har ogsa

z = Ay =

a11y1 + a12y2 + · · · + a1nyn

a21y1 + a22y2 + · · · + a2nyn...

am1y1 + am2y2 + · · · + amnyn

og setter vi yj = bj1x1 + bj2x2 + · · · + bjkxk inn i dette uttrykket, ser vi atden i-te komponenten til z er gitt ved

zi = ai1y1 + ai2y2 + · · · + ainyn = ai1(b11x1 + b12x2 + · · · + b1kxk)+

+ai2(b21x1 + b22x2 + · · · + b2kxk) + · · · + ain(bn1x1 + bn2x2 + · · · + bnkxk)

Samler vi alle x1-ledd for seg, alle x2-ledd for seg osv, far vi:

zi = (ai1b11 + ai2b21 + · · · + ainbn1)x1 ++ (ai1b12 + ai2b22 + · · · + ainbn2)x2 + · · ·+ (ai1b1k + ai2b2k + · · · + ainbnk)xk

Pa den annen side: hvis vi tenker oss at z fremkommer direkte fra x vedbruk av matrisen C, har vi

z = Cx =

c11x1 + c12x2 + · · · + c1kxk

c21x1 + c22x2 + · · · + c2kxk...

cm1x1 + cm2x2 + · · · + cmkxk

dvs. at den i-te komponenten til z er gitt ved

zi = ci1x1 + ci2x2 + · · · + cikxk

Page 27: Flervariabel analyse med lineær algebra

48 KAPITTEL 1. VEKTORER OG MATRISER

Skal de to uttrykkene for zi være like, ma vi ha

ci1 = ai1b11 + ai2b21 + · · · + ainbn1

ci2 = ai1b12 + ai2b22 + · · · + ainbn2

osv. ned tilcik = ai1b1k + ai2b2k + · · · + ainbnk

Generelt har vi altsa

cij = ai1b1j + ai2b2j + · · · + ainbnj

Legg merke til at dette er skalarproduktet av den i-te raden i A med denj-te søylen i B.

La oss oppsummere. Vi har vist at den matrisen

C =

c11 c12 · · · c1k

c21 c22 · · · c2k...

... · · ·...

cm1 cm2 · · · cmk

som i en operasjon utfører den samme transformasjonen som B etterfulgtav A, er gitt ved

cij = ai1b1j + ai2b2j + · · · + ainbnj

Siden det a transformere vektorer er det viktigste matriser gjør, tar vi denneformelen som utgangspunkt for var definisjon av matriseprodukt.

Definisjon 1.6.1 Anta at A er en m × n-matrise og at B er en n × k-matrise. Da er matriseproduktet C = AB definert som m × k-matrisen Cmed komponenter

cij = ai1b1j + ai2b2j + · · · + ainbnj

Vi far altsa den ij-te komponenten i C ved a ta skalarproduktet av den i-teraden i A med den j-te søylen i B.

Figuren viser grafisk hvordan vi finner det ij-te elementet i produkt-matrisen C: Vi tar skalarproduktet av den i-te raden i A med den j-tesøylen i B:

a11 a12 . . . a1n...

......

...ai1 ai2 . . . ain...

......

...am1 am2 . . . amn

b11 b12 . . . b1j . . . b1k

b21 b22 . . . b2j . . . b2k...

......

......

......

......

......

...bn1 bn2 . . . bnj . . . bnk

'( )*

+

,

-

.

1.6. MULTIPLIKASJON AV MATRISER 49

Legg merke til at matriseproduktet AB bare er definert nar A og B pas-ser sammen i størrelse: radene i A ma være like lange som søylene i B. Dettebetyr at den “siste” dimensjonen n i m × n-matrisen A er lik den “første”dimensjonen n i n × k-matrisen B. Legg merke til at hvis vi stryker de ton-ene i m× n og n× k, sitter vi igjen med størrelsen m× k til produktma-trisen C.

Eksempel 1: Regn ut AB nar

A =

2 31 −14 −2

og B =(

4 −3 2−1 4 5

)

Siden A er en 3 × 2 og B er 2 × 3-matrise, eksisterer produktet og er en3× 3-matrise. Vi far

AB =

2 · 4 + 3 · (−1) 2 · (−3) + 3 · 4 2 · 2 + 3 · 5

1 · 4 + (−1) · (−1) 1 · (−3) + (−1) · 4 1 · 2 + (−1) · 54 · 4 + (−2) · (−1) 4 · (−3) + (−2) · 4 4 · 2 + (−2) · 5

=

=

5 6 195 −7 −3

18 −20 −2

Legg merke til at selv i de tilfellene hvor AB er definert, kan vi ikkenødvendigvis regne ut BA. Her prøver vi nemlig a multiplisere en n × k-matrise med en m × n-matrise, og det er bare mulig nar k = m. Selv i detilfellene hvor bade AB og BA er definert, er de som regel forskjellige. Herer et eksempel.

Eksempel 2: Regn ut AB og BA nar

A =(

2 1−1 4

)og B =

(−3 2

4 5

)

Vi far

AB =(

2 · (−3) + 1 · 4 2 · 2 + 1 · 5(−1) · (−3) + 4 · 4 (−1) · 2 + 4 · 5

)=

(−2 919 18

)

og

BA =(

(−3) · 2 + 2 · (−1) (−3) · 1 + 2 · 44 · 2 + 5 · (−1) 4 · 1 + 5 · 4

)=

(−8 5

3 24

)

Vi har altsa AB #= BA. ♣

Page 28: Flervariabel analyse med lineær algebra

50 KAPITTEL 1. VEKTORER OG MATRISER

Regnereglen ab = ba (som altsa ikke gjelder for matriser!) kalles for denkommutative lov. Siden matrisemultiplikasjon ikke oppfyller denne regelen,sier vi at matriseproduktet er ikke-kommutativt. Vi har tidligere sett at vek-torproduktet ikke er kommutativt (det er heller ikke skalarproduktet forkomplekse n-tupler), men der har vi i hvert fall en grei regel for sammen-hengen mellom a×b og b× a, nemlig at a×b = −(b× a). Det har vi ikkefor multiplikasjon av matriser; kjenner vi AB, har vi fortsatt ingen anelseom hva BA er!

Det tar tid a vende seg til ikke-kommutative operasjoner, og det enesteradet vi kan gi er: Vær forsiktig og begrunn hvert eneste skritt nar duregner med slike operasjoner! Heldigvis er det mange regneregler som fortsattgjelder for matriseprodukter:

Setning 1.6.2 (Regneregler for matrisemultiplikasjon) I hvert avpunktene nedenfor antar vi at A, B og C er matriser slik at regneopera-sjonene er definert.

(i) (AB)C = A(BC)

(ii) A(B + C) = AB + AC

(iii) (B + C)A = BA + CA

(iv) (sA)B = A(sB) = s(AB) for alle tall s

(v) (AB)T = BT AT

Bevis: Bevisene gar rett og slett ut pa a gange ut venstre og høyre side avlikhetene og sjekke at svarene er like. Vi tar (i) og (v) som eksempler — deandre punktene er atskillig enklere enn (i):

∗ (i) (Dette punktet er kronglete og du mister ikke noe i fortsettelsen hvisdu hopper over beviset.) Vi skal bevise at de to matrisene X = (AB)C ogY = A(BC) er like. Før man begynner, er det lurt a være helt sikker pahva som er forskjellen pa de to uttrykkene. Poenget er at vi alltid gjen-nomfører operasjonene inni parentesene først. Nar vi regner ut X = (AB)C,multipliserer vi altsa først sammen A og B til en matrise D = AB, og samultipliserer vi D fra høyre med C slik at vi far X = DC. Nar vi regnerut Y = A(BC), ganger vi først sammen B og C til en matrise E = BC, ogsa ganger vi denne fra venstre med A slik at vi far Y = AE. Var oppgaveer altsa a vise at DC = AE. Formulert pa denne maten er ikke likheten saselvfølgelig som den kan se ut ved første blikk.

Før vi begynner pa regningene, er det greit a se litt pa dimensjonene tilde involverte matrisene. For at produktene (AB)C og A(BC) skal gi mening,ma det finnes tall m,n, k, l slik at A er en m×n-matrise, B en n×k-matriseog C en k× l-matrise. Dermed blir D = AB en m×k-matrise og E = BC en

1.6. MULTIPLIKASJON AV MATRISER 51

n× l-matrise. Legg merke til at bade X = DC og Y = AE er m× l-matriser,sa dimensjonsmessig er i hvert fall de to matrisene like.

Vi er na klare til a gjøre regningene vare. Vi observerer først at det ij-teelementet i X = DC er lik

xij = di1c1j + di2c2j + · · · + dikckj =k∑

p=1

dipcpj

Siden D = AB er videre

dip = ai1b1p + ai2b2p + · · · + aincnp =n∑

q=1

aiqbqp

Setter vi dette inn i uttrykket ovenfor, far vi

xij =k∑

p=1

dipcpj =k∑

p=1

n∑

q=1

aiqbqp

cpj =k∑

p=1

n∑

q=1

aiqbqpcpj

dvs. at xij er summen av alle mulige kombinasjoner aiqbqpcpj .Pa tilsvarende mate regner vi ut Y = AE. Det ij-te elementet i Y er

yij = ai1e1j + ai2e2j + · · · + ainenj =n∑

q=1

aiqeqj

Siden E = BC er videre

eqj = bq1c1j + bq2c2j + · · · + bqkckj =k∑

p=1

bqpcpj

Setter vi dette inn i uttrykket ovenfor, far vi

yij =n∑

q=1

aiqeqj =n∑

q=1

aiq

k∑

p=1

bqpcpj

=n∑

q=1

k∑

p=1

aiqbqpcpj

Dette viser at yij er lik summen av alle mulige kombinasjoner aiqbqpcpj , ak-kurat som xij er. Altsa er xij = yij , og beviset for (i) er ferdig.

(v) Anta at A er en m×n-matrise og at B er en n×k-matrise. Da er AT enn×m-matrise og BT en k × n-matrise, sa bade (AB)T og BT AT er k ×m-matriser. Det ij-te elementer i C = (AB)T er lik det ji-te elementet i AB,dvs:

cij = aj1b1i + aj2b2i + · · · + ajnbni

Pa den annen side fremkommer det ij-te elementet i D = BT AT ved at vitar skalarproduktet av den i-te raden i BT med den j-te søylen i AT . Men

Page 29: Flervariabel analyse med lineær algebra

52 KAPITTEL 1. VEKTORER OG MATRISER

den i-te raden i BT er den i-te søylen i B, og den j-te søylen i AT , er denj-te raden i A, sa dette blir skalarproduktet mellom den j-te raden i A ogden i-søylen i B, dvs.

dij = aj1b1i + aj2b2i + · · · + ajnbni

Altsa er cij = dij , og beviset er fullført. !

Regnereglene ovenfor gjør det enklere a regne med matriser, men vi masom sagt være forsiktige med en del ting — spesielt at vi ikke bytter ompa rekkefølgen av matrisene (husk at vanligvis er AB ulik BA). Vi kanheller ikke forkorte matriser pa vanlig mate — a forkorte betyr egentlig amultiplisere med et inverst element, og foreløpig vet vi ingen ting om inversematriser.

La oss ta med oss en liten observasjon. Dersom A er en m × n-matriseog b er en søylevektor med n-komponenter, kan vi danne produktet Ab pato mater — vi kan enten tenke pa det som produktet av matrisen A ogvektoren b slik vi definerte det i forrige seksjon, eller vi kan tenke pa detsom produktet av m× n-matrisen A med n× 1-matrisen

b =

b1

b2...

bn

slik vi har definert det i denne seksjonen. Det er lett a se at disse to matenegir akkurat samme svar. Dette betyr at vi kan bruke regnereglene ovenforogsa nar noen av matrisene er vektorer.

Eksempel 3: Vi har en m× n-matrise A og en n × k-matrise B. Vi lar Btransformere en søylevektor x ∈ Rk ved y = Bx. Sa lar vi A transformere yslik at z = Ay. Det samlede resultatet er:

z = Ay = A(Bx)

Ved hjelp av regneregel (i) ovenfor kan vi flytte parentesene:

z = Ay = A(Bx) = (AB)x

Dette viser noe vi allerede vet, nemlig at nar vi transformerer en vektorto ganger ved først a bruke B og deretter A, sa er det det samme som atransformere en gang ved hjelp av produktet AB. ♣

Vi avslutter denne seksjonen med en ulikhet som vi vil fa bruk for i nestekapittel. Hvis

1.6. MULTIPLIKASJON AV MATRISER 53

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

er en m× n-matrise, definerer vi normen til A til a være

||A|| =

√√√√m∑

i=1

n∑

j=1

a2ij

(vi legger altsa sammen kvadratene a2ij av alle leddene og tar kvadratroten

til summen).

Setning 1.6.3 Hvis A er en m× n-matrise og x ∈ Rn, sa er

|Ax| ≤ ||A|| |x|

Med andre ord: Nar vi ganger vektoren x med matrisen A, sa øker lengdenmaksimalt med en faktor ||A||.

Bevis: La y = Ax. Da er

|Ax| =√

y21 + y2

2 + · · · + y2m

der y1, y2, . . . , ym er komponentene til y. Dersom ai = (ai1, ai2, . . . , ain) erden i-te linjen i A, vet vi at yi = ai·x. Ifølge Schwarz’ ulikhet er dermed |yi| ≤|ai||x|. Kvadrerer vi, far vi y2

i ≤ |ai|2|x|2. Setter vi dette inn i uttrykket forAx, ser vi at

|Ax| =√

y21 + y2

2 + · · · + y2m ≤

≤√|a1|2|x|2 + |a2|2|x|2 + · · · + |am|2|x|2 =

=√|a1|2 + |a2|2 + · · · + |am|2 |x| = ||A|| |x|

der vi har brukt at

√|a1|2 + |a2|2 + · · · + |am|2 =

√√√√n∑

i=1

m∑

j=1

a2ij = ||A||

!

Bemerkning: |A| er normalt ikke det minste tallet slik at |Ax| ≤ |A||x| foralle x. Vi skal komme tilbake til denne problemstillingen i seksjon 5.2.

Page 30: Flervariabel analyse med lineær algebra

54 KAPITTEL 1. VEKTORER OG MATRISER

MATLAB-kommentar: Har du skrevet inn to matriser A og B med pas-sende dimensjoner, far du MATLAB til a regne ut produktet ved a skriveA*B.

Oppgaver til seksjon 1.6

1. Regn ut AB og BA nar

a) A =(

1 −23 1

)og B =

(2 −11 2

)

b) A =

1 −1 0

−2 0 1−1 2 1

og B =

0 2 1

−1 −2 03 −1 2

2. Regn ut AB nar

A =(

1 −2 30 −1 2

)og B =

2 10 −31 0

.

3. Regn ut AB nar

A =

1 −23 0

−1 2

og B =(

2 1 0−3 1 1

).

4. a) Hvilken dimensjon har produktmatrisen AB hvis A er en 8× 6-matrise og Ber en 6× 9-matrise?

b) Hvilken dimensjon har matrisen B hvis A er en 4×3-matrise og produktmatrisenAB er en 4× 5-matrise?

c) Hvor mange søyler har matrisen B hvis produktet AB er en 5× 7-matrise?

5. Gitt følgende matriser:

A =

1 90 87 4

, B =(

2 89 6

)og C =

(3 0 50 9 4

)

Regn ut følgende uttrykk hvis det er definert (hvis uttrykket ikke er definert, skaldu begrunne hvorfor):

a)ABb) ACc) A(B + C)d) (BC)T

e) BT CT

f) (A + CT )Bg) B(AT − 2C)

1.6. MULTIPLIKASJON AV MATRISER 55

6. Gitt matrisene

A =(

0 10 2

), B =

(1 13 4

), C =

(2 53 4

)og D =

(3 70 0

)

Sjekk at AB = AC selv om B #= C. Sjekk ogsa at AD = 0 selv om A #= 0 og D #= 0.

7. Gitt matrisene D =

3 1 41 5 92 6 5

og E =

2 7 18 2 81 8 2

.

Finn første rad i produktmatrisen DE. Finn deretter andre søyle i produktmatrisenDE.

8. a) Hvis første og andre søyle i matrisen B er like, hva kan du si om første ogandre søyle i produktmatrisen AB (dersom AB er definert)?

b) Hvis andre søyle i matrisen B bare bestar av nuller, hva kan du si om andresøyle i produktmatrisen AB?

9. Finn normen ||A|| til matrisen A =(

1 −1 32 1 0

).

10. Dersom A er en n × n-matrise (dvs. har like mange rader og søyler) definerervi potensene Ak pa vanlig mate: A2 = AA, A3 = AA2, A4 = AA3 osv. Regn ut A2

og A3 nar A =(

1 −2−1 1

).

11. La A =(

1 −1 20 1 3

), B =

2 −1

−1 03 −1

, x =(

12

).

a) Finn y = Bx.

b) Regn ut C = AB.

c) Regn ut bade Ay og Cx. Sammenlign resultatene.

12. I en barnehage kjører barna sanden frem og tilbake i trillebar mellom tre sand-kasser A, B og C (og mister noe pa veien!). Av den sanden som er i sandkasse Aved begynnelsen av dagen, vil 70% være i A ved slutten av dagen, 15% vil være iB, 10% i C (og resten vil være mistet). Av den sanden som starter dagen i B, vil75% være i B ved slutten av dagen, 5% vil være i A og 10% i C. Av den sandensom startet i C, vil 70% være i C ved slutten av dagen, 10% vil være i A og 15% iB.

a) Finn en matrise M slik at hvis x, y, z er henholdsvis antall liter sand i A, B

og C ved begynnelsen av dagen, og u =

xyz

, sa angir komponentene til

v = Mu hvor mange liter sand det er i hver kasse ved slutten av dagen.

b) Etter at barna har gatt hjem, forsøker personalet a fordele sanden pa nytt.De flytter 20% av sanden i B til A og 5% av sanden i C til B. Finn en matriseN slik at komponentene til w = Nv angir hvor mye sand det na er i hversandkasse.

Page 31: Flervariabel analyse med lineær algebra

56 KAPITTEL 1. VEKTORER OG MATRISER

c) Regn ut K = NM . Anta at fordeling ved begynnelsen av dagen var x = 200,y = 300, z = 400. Finn fordelingen pa slutten av dagen etter at personalethar omfordelt sanden.

d) Hvor mye sand vil det være i hver kasse pa slutten av neste dag dersom denforløper pa tilsvarende mate?

13. Bevis punktene (ii), (iii) og (iv) i setning 1.6.2.

1.7 Identitetsmatriser og inverse matriser

I denne seksjonen skal vi bare arbeide med kvadratiske matriser, dvs. matri-ser med like mange rader som søyler. Matrisene vil altsa være n×n-matriserfor et helt tall n. En spesiell slik matrise er identitetsmatrisen

In =

1 0 . . . 00 1 . . . 0...

... . . ....

0 0 . . . 1

som har 1-ere pa diagonalen og 0-er overalt ellers. Ganger du en annenn× n-matrise A med In (gjør det!), ser du at

AIn = A og InA = A

Uansett om vi multipliserer A med In fra høyre eller venstre, far vi altsaA tilbake. Blant tall er det bare 1 som har en tilsvarende egenskap; gangervi et tall med 1, far vi tallet tilbake. Identitetsmatrisen In spiller derformye av den samme rollen for matrisemultiplikasjon som 1 gjør for vanligmultiplikasjon.

Et tall a #= 0 har alltid et inverst tall a−1. Dette tallet er definert ved atproduktet av a og a−1 er lik 1, dvs. aa−1 = 1. Vi kan pa tilsvarende matedefinere inverse matriser:

Definisjon 1.7.1 Anta at A er en n×n-matrise. En n×n-matrise X kallesen invers matrise til A dersom

AX = XA = In

(siden matrisemultiplikasjon ikke er kommutativ, krever vi a fa In som svaruansett hvilken side vi multipliserer fra).

Som allerede nevnt har alle tall bortsett fra 0 en invers. For matriser erdet mer komplisert; det finnes mange matriser som ikke har invers! Vi skalkomme tilbake til spørsmalet om nar en matrise har en invers etter hvert,men foreløpig nøyer vi oss med a vise noe enklere — nemlig at ingen matrisehar mer enn en invers.

1.7. IDENTITETSMATRISER OG INVERSE MATRISER 57

Setning 1.7.2 En n× n-matrise har høyst en invers.

Bevis: Anta at bade X og Y er inverser til A. Da har vi

X = InX = (Y A)X = Y (AX) = Y In = Y

Altsa er de to inversene like. ♣

Na som vi vet at det finnes høyst en invers, kan vi være mer konkrete isprakbruken.

Definisjon 1.7.3 En n × n-matrise A kalles inverterbar dersom den haren invers, og den inverse matrisen betegnes med A−1. En matrise som ikkeer inverterbar, kalles singulær.

Selv om vi ikke skal utvikle noen teori for hvordan man finner inversematriser pa det naværende tidspunkt (det far vente til kapittel 4) er detinstruktivt a se pa noen enkle eksempler.

Eksempel 1: Finn den inverse matrisen til

A =(

3 −11 2

)

Vi ma finne en 2× 2-matrise X =(

x yz u

)slik at AX = I2 og XA = I2.

Siden

AX =(

3x− z 3y − ux + 2z y + 2u

)

kan ligningen AX = I2 skrives(

3x− z 3y − ux + 2z y + 2u

)=

(1 00 1

)

Dette gir oss fire ligninger med fire ukjente

3x− z = 13y − u = 0x + 2z = 0y + 2u = 1

Dette ligningssystemet er lett a løse (legg merke til at vi har to ligningersom bare inneholder x og z, og to som bare inneholder y og u), og vi farx = 2

7 , y = 17 , z = −1

7 og u = 37 . Dette betyr at

Page 32: Flervariabel analyse med lineær algebra

58 KAPITTEL 1. VEKTORER OG MATRISER

X =

27

17

−17

37

tilfredsstiller ligningen AX = I2. Vi ma ogsa sjekke at X tilfredsstiller detandre kravet til en invers matrise, nemlig at XA = I2:

XA =

27

17

−17

37

3 −1

1 2

=

=

27 · 3 + 1

7 · 1 27 · (−1) + 1

7 · 2

−17 · 3 + 3

7 · 1 −17 · (−1) + 3

7 · 2

=

1 0

0 1

Siden vi na har vist at A er inverterbar og at

A−1 =

27

17

−17

37

er oppgaven var fullført. ♣

Bemerkning: Det kan virke som vi har flaks pa slutten av eksemplet oven-for nar vi sjekker at XA = I2 — vi har laget X slik at AX = I2, men sidenmatrisemultiplikasjon ikke er kommutativ, er det ingen grunn til a tro atdette vil medføre at XA = I2. Det viser seg imidlertid at det alltid er slik;dersom n× n-matrisen X er en ensidig invers til n× n-matrisen A (dvs. atvi enten har AX = In eller XA = In), sa er A inverterbar og X = A−1. Deter imidlertid forbausende vanskelig a bevise dette, og vi ma utsette det tilen senere anledning.

La oss na se pa en matrise som ikke har en invers:

Eksempel 2: La

A =(

1 22 4

)

Vi forsøker a finne en invers matrise

X =(

x yz u

)

pa samme mate som i forrige eksempel, nemlig ved a kreve at AX = I2.Siden

1.7. IDENTITETSMATRISER OG INVERSE MATRISER 59

AX =(

x + 2z y + 2u2x + 4z 2y + 4u

)

gir dette ligningssystemet

x + 2z = 1y + 2u = 0

2x + 4z = 02y + 4u = 1

Det er lett a se at dette ligningssystemet ikke har løsninger; ganger vi denførste ligningen med 2, far vi 2x + 4z = 2 som er i apenbar strid med dentredje ligningen. ♣

De to eksemplene ovenfor viser at det er en nær sammenheng mellominvertering av matriser og lineære ligningssystemer. Vi skal komme tilbake tildenne sammenhengen senere nar vi skal utvikle effektive metoder for a finneinverse matriser. Foreløpig nøyer vi oss med a se pa noen enkle regnereglerfor inverse matriser:

Setning 1.7.4 Anta at A og B er inverterbare n× n-matriser. Da er

(i) sA inverterbar for alle tall s #= 0, og (sA)−1 = s−1A−1

(ii) AB inverterbar, og (AB)−1 = B−1A−1

(iii) AT inverterbar, og (AT )−1 = (A−1)T .

(iv) A−1 er inverterbar og (A−1)−1 = A.

Bevis: Vi konsentrerer oss om (ii), og overlater de (enklere!) (i), (iii) og (iv)til leserne. For a bevise (ii) ma vi sjekke at

(AB)(B−1A−1) = In og (B−1A−1)(AB) = In

Dette er en liten herjing i parentesflytting (husk setning 1.6.2(i)):

(AB)(B−1A−1) = ((AB)B−1)A−1 = (A(BB−1))A−1 =

= (AIn)A−1 = AA−1 = In

Helt tilsvarende far vi:

(B−1A−1)(AB) = B−1(A−1(AB)) = B−1((A−1A)B) =

= B−1(InB) = B−1B = In

Page 33: Flervariabel analyse med lineær algebra

60 KAPITTEL 1. VEKTORER OG MATRISER

!

Bemerkning: Legg merke til at vi ikke har noen regler for de inverse tilA + B og A − B. Disse matrisene behøver ikke være inverterbare selv omA og B er det, og selv i de tilfellene hvor de er inverterbare, finnes det ikkenoen enkel mate a finne den inverse pa.

Dersom en matrise A er inverterbar, kan vi forkorte den bort i ligningerav typen AX = AB og fa X = B. Grunnen er at vi kan multiplisere fravenstre med A−1 pa begge sider av ligningen:

AX = AB =⇒ A−1(AX) = A−1(AB) =⇒ (A−1A)X = (A−1A)B =⇒

=⇒ InX = InB =⇒ X = B

Pa tilsvarende mate kan vi forkorte med A i ligningen XA = BA ogfa X = B (i dette tilfellet ma vi gange ligningen fra høyre med A−1). Vikan imidlertid ikke forkorte med A i ligningen AX = BA — uansett om viganger med A−1 fra venstre eller høyre, vil det være en A vi ikke greier aforkorte bort.

I forrige seksjon tenkte vi pa matriser som transformasjoner; nar vi gan-ger en vektor x med en matrise A, transformerer vi x til en ny vektor y = Ax.Dersom A er inverterbar, kan vi gange den siste ligningen fra venstre medden inverse matrisen A−1. Vi far da

A−1y = A−1(Ax) = (A−1A)x = Inx = x

Dette viser at A−1 er den omvendte transformasjonen til A — hvis A trans-formerer x til y, vil A−1 transformere y til x. Denne ideen om A−1 somden omvendte transformasjonen til A er viktig nar man bruker matriser ipraksis.

x = A−1y

A

A−1

(- y = Ax

Siden det finnes mange transformasjoner vi ikke kan vende om pa, girdette bildet oss en bedre forstaelse av hvorfor det finnes matriser som ikke erinverterbare. Hvis det f.eks. finnes to forskjellige vektorer x og x′ som trans-formeres til den samme vektoren y (dvs. vi har bade y = Ax og y = Ax′),sa kan ikke transformasjonen vendes om; vi kan ikke starte med y og trans-formere den til bade x og x′!

MATLAB-kommentar: Det er en egen kommando for identitetsmatrisenIn i MATLAB — du skriver >>eye(n) (der n er tallet du ønsker). Deninverse matrisen til A far du ved a skrive >>inv(A).

1.7. IDENTITETSMATRISER OG INVERSE MATRISER 61

Oppgaver til seksjon 1.7

1. La A =(

1 3−2 1

). Kontroller at AI2 = A og I2A = A ved a gjennomføre

utregningene.

2. La A =

1 0 −2

−3 1 42 −3 4

. Vis at B =

8 3 1

10 4 172

32

12

er den inverse matrisen

til A ved a regne ut AB og BA.

3. Avgjør om følgende matriser er inverterbare eller singulære:

A =(

3 −71 −2

), B =

(5 00 4

), C =

(2 06 0

)og D =

(2 43 4

)

4. En inverterbar matrise A har en invers matrise som er gitt ved A−1 =(

3 51 2

).

Finn matrisen A.

5. Gitt to inverterbare matriser A og B, hvor A−1 =(

1 42 9

)og B−1 =

(8 32 1

).

Finn (AB)−1.

6. a) La a =(

21

). Vis at I2a = a.

b) La b =

−3

2−1

. Vis at I3b = b.

c) Vis at Inc = c for alle c ∈ Rn.

7. a) Anta at A =(

a 00 b

)der a, b #= 0. Vis at A er inverterbar og at A−1 =

(a−1 00 b−1

).

b) Anta at B =

a 0 00 b 00 0 c

der a, b, c #= 0. Vis at B er inverterbar og at

B−1 =

a−1 0 00 b−1 00 0 c−1

.

c) Formuler et tilsvarende resultat for n× n-matriser.

8. Vis at dersom A og B er inverterbare, sa er den inverse til (AB)T lik (A−1)T (B−1)T .

9. Bevis punktene (i), (iii) og (iv) i setning 1.6.4.

10. a) Vis at 2×2-matrisen A =(

a bc d

)er inverterbar hvis og bare hvis ad−bc #=

Page 34: Flervariabel analyse med lineær algebra

62 KAPITTEL 1. VEKTORER OG MATRISER

0, og at den inverse matrisen i sa fall er gitt ved A−1 = 1ad−bc

(d −b−c a

).

b) Bruk formelen fra punkt a) til a finne den inverse til matrisen A =(

2 −5−1 3

).

c) Bruk matrisen du fant i punkt b) til a løse ligningssystemet

2x− 5y = 3

−x + 3y = 2

Hint: Systemet kan skrives(

2 −5−1 3

) (xy

)=

(32

).

1.8 Determinanter, arealer og volumer

Til enhver n× n-matrise

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

an1 an2 · · · ann

hører det et tall som kalles determinanten til A, og som betegnes med

det(A) =

∣∣∣∣∣∣∣∣∣

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

an1 an2 · · · ann

∣∣∣∣∣∣∣∣∣

Generelle n×n-determinanter kan være litt vanskelige a forsta seg pa, sa viskal derfor begynne med 2× 2- og 3× 3-determinanter og deres geometriskeegenskaper.

Hvis A er en 2× 2-matrise

A =(

a bc d

)

sa er determinanten til A definert ved

det(A) =∣∣∣∣

a bc d

∣∣∣∣ = ad− bc

Legg merke til at uttrykket ad− bc fremkommer fra diagonalene i matrisen(a bc d

); ganger vi sammen tallene i den ene diagonalen, far vi ad, og

ganger vi sammen tallene i den andre diagonalen, far vi bc.La oss regne ut en determinant.

1.8. DETERMINANTER, AREALER OG VOLUMER 63

Eksempel 1: Vi ser at∣∣∣∣−3 −5

4 2

∣∣∣∣ = (−3) · 2− (−5) · 4 = −6 + 20 = 14 ♣

Dersom vi har to vektorer a = (a1, a2), b = (b1, b2), kan vi lage en 2× 2-determinant det(a,b) ved a legge inn vektorene som radene i en matrise padenne maten:

det(a,b) =∣∣∣∣

a1 a2

b1 b2

∣∣∣∣ = a1b2 − a2b1

Legg merke til at dersom vi bytter om rekkefølgen pa vektorene a og b, saskifter determinanten fortegn:

det(b,a) =∣∣∣∣

b1 b2

a1 a2

∣∣∣∣ = b1a2 − b2a1 = −(a1b2 − a2b1) = −det(a,b)

Som vi snart skal se, har bade fortegnet og størrelsen til det(a,b) en geome-trisk betydning.

Bemerkning: Man kan lure pa hvorfor vi legger inn vektorene a og b somrader og ikke som søyler. Det viser seg at dette ikke spiller noen rolle siden∣∣∣∣

a1 a2

b1 b2

∣∣∣∣ =∣∣∣∣

a1 b1

a2 b2

∣∣∣∣, men vi har valgt a ta utgangpunkt i rader siden det

passer best til anvendelsene i senere kapitler (for andre anvendelser haddedet passet vel sa bra a bruke søyler!).

a) b)

!

"

%%

%%

%%&

111111112

a

b

v

!

"

MM

MM

MMMN

))))))))*b

a"

%%

%%

%%&

111111112

a

b

vv

O.

Figur 1: Vinkelen v mellom a og b

For a forsta den geometriske tolkningen av 2× 2-determinanter, er detnyttig a vite litt om orientering av vektorpar. To vektorer a og b bestem-mer en vinkel v mellom 0◦ og 180◦ som vist pa figur 1. Vi kaller dettevinkelen mellom a og b. Legg merke til at dersom vi beveger oss i positivomløpsretning, vil denne vinkelen noen ganger starte i a og ende i b (sefigur 1a) og andre ganger starte i b og ende i a (se figur 1b). I det første

Page 35: Flervariabel analyse med lineær algebra

64 KAPITTEL 1. VEKTORER OG MATRISER

tilfellet sier vi at paret (a,b) er positivt orientert, i det andre tilfellet at deter negativt orientert. Her er apenbart rekkefølgen til vektorene viktig — a erførste vektor og b er andre vektor. Bytter vi om rekkefølgen av vektorene,bytter vi ogsa orientering.

For a studere den geometriske tolkningen av determinanten∣∣∣∣

a1 a2

b1 b2

∣∣∣∣

lønner det seg a skrive vektorene a = (a1, a2) og b = (b1, b2) pa polarform.

!

"

%%

%%

%%

%%%&

a = (a1, a2)

α

|a|a2 = |a| sinα

a1 = |a| cos α

Figur 2: Vektoren a pa polarform

Lar vi α være vinkelen fra den positive x-aksen til vektoren a, sa er

a = (|a| cos α, |a| sinα)

(se figur 2 og husk det du har lært om polarform til komplekse tall). Patilsvarende mate er

b = (|b| cos β, |b| sinβ)

der β er vinkelen fra den positive x-aksen til vektoren b.Vi lar fortsatt v være vinkelen mellom vektorene a og b som pa figur 1.

Dersom paret (a,b) er positivt orientert, ser vi fra figur 3a at β = α + v.Dersom paret (a,b) er negativt orientert, ser vi fra figur 3b at vi β = α− v.

a)

!

"

%%

%%

%%&

>>

>>

>>L

a

α

β = α + v

b

b)

!

"

%%

%%

%%&

888888889

b

β = α− vα

a

Figur 3: Sammenhengen β = α ± v

Vi har altsaβ = α ± v

1.8. DETERMINANTER, AREALER OG VOLUMER 65

der fortegnet er pluss eller minus ettersom paret (a,b) er positivt eller ne-gativt orientert.

La oss na finne determinanten uttrykt ved α og β:

det(a,b) =∣∣∣∣

a1 a2

b1 b2

∣∣∣∣ =∣∣∣∣|a| cos α |a| sinα|b| cos β |b| sinβ

∣∣∣∣

= |a| cos α|b| sinβ − |a| sinα|b| cos β

= |a||b|(sinβ cos α− cos β sinα)

= |a||b| sin(β − α)

der vi i den siste overgangen har brukt formelen for sinus til en differens.Siden β = α ± v, far vi

∣∣∣∣a1 a2

b1 b2

∣∣∣∣ = |a||b| sin(±v) = ±|a||b| sin v

Siden sin v aldri er negativ (v ligger per definisjon i intervallet [0◦, 180◦]der sinus er positiv), vil det(a,b) altsa være positiv dersom paret (a,b)er positivt orientert, og negativ dersom dette paret er negativt orientert.Fortegnet til determinanten det(a,b) gjenspeiler altsa orienteringen til paret(a,b). Legg forøvrig merke til at det(a,b) er 0 dersom v er 0◦ eller 180◦, detvil si nar a og b er parallelle.

??????????

??????????

a

b h = b sin vArealet = ah = ab sin v

v

Figur 4: Arealet til et parallellogram

Etter at vi na har funnet ut hva fortegnet til determinanten betyr, er detpa tide a se pa absoluttverdien. Aller først repeterer vi formelen for arealettil et parallellogram. Som det fremgar fra figur 4, er dette arealet gitt vedA = ab sin v, der a og b er lengdene til sidene, og der v er vinkelen mellomdem (pa figuren er vinkel v spiss, men det er lett a se at resultatet ogsaholder dersom vinkelen er stump).

Page 36: Flervariabel analyse med lineær algebra

66 KAPITTEL 1. VEKTORER OG MATRISER

!

"

%%

%%

%%&

%%

%%

%%&

111111112

111111112

a

a + b

bv

Figur 5: Parallellogrammet utspent av a og b

Arealet til parallellogrammet utspent av vektorene a = (a1, a2) og b =(b1, b2) (se figur 5) er derfor lik |a||b| sin v = ±det(a,b) der fortegnet er plusseller minus ettersom (a,b) er positivt eller negativt orientert. Det betyr atarealet er lik tallverdien til determinanten. La oss oppsummere resultatene.

Setning 1.8.1 Determinanten

det(a,b) =∣∣∣∣

a1 a2

b1 b2

∣∣∣∣

er positiv dersom vektorparet (a,b) er positivt orientert og negativ dersomparet er negativt orientert. Arealet til parallellogrammet utspent av a og ber lik tallverdien til determinanten.

Bemerkning: Matematikere sier at determinanten gir oss arealet med for-tegn (eller orientering). Det kan virke merkelig a knytte fortegn til areal,men spesielt nar man skal studere arealet til flater, viser det seg viktig aholde styr pa retningen — det er i mange sammenhenger viktig a vite hvaman skal regne som flatens “overside/underside” eller “utside/innside”. Somvi skal se senere i denne seksjonen, kan sammenhengen mellom determinantog “areal med fortegn” generaliseres til tre dimensjoner.

Eksempel 2: Finn arealet utspent av vektorene a = (3,−7) og b = (−4, 5).Vi far

det(a,b) =∣∣∣∣

3 −7−4 5

∣∣∣∣ = 3 · 5− (−7) · (−4) = 15− 28 = −13

Arealet er dermed | − 13| = 13. Siden det(a,b) er negativ, er paret (a,b)negativt orientert, dvs. at vinkelen fra a til b er større enn 180◦. ♣

1.8. DETERMINANTER, AREALER OG VOLUMER 67

!

"

%%

%%

%%&

%%

%%

%%&

111111112

111111112:

::

:

a

a + b

b

Figur 6: Trekanten med sider a og b

Determinanter kan ogsa brukes til a regne ut arealet til trekanter. Arealettil trekanten med sider a og b er halvparten av arealet til parallellogrammetutspent av disse vektorene (se figur 6).

Vi har derfor følgende resultat:

Korollar 1.8.2 Arealet til trekanten med sider a og b er 12 · |det(a,b)|

Eksempel 3: Finn arealet til trekanten med hjørner i punktene c = (−1, 2),d = (4, 8) og e = (2,−3). Vi regner ut

a = d− c = (4, 8)− (−1, 2) = (5, 6)

b = e− c = (2,−3)− (−1, 2) = (3,−5)

Trekanten vi er pa jakt etter, har samme areal som trekanten med sider aog b (hvorfor?). Dermed er

Areal =12· |det (a,b)| =

12·∣∣∣∣

5 63 −5

∣∣∣∣ =12· |− 25− 18| =

432

Før vi gar over til 3× 3-determinanter, tar vi med et resultat til. Detteresultatet kan virke litt underlig pa det naværende tidspunkt, men det skalbli en viktig inspirasjonskilde nar vi studerer generelle n× n-determinanteri et senere kapittel.

Setning 1.8.3 For 2× 2-matriser gjelder:

(i) det(I2) = 1 (husk at I2 er identitetsmatrisen I2 =(

1 00 1

)).

(ii) Dersom vi bytter om to rader, sa bytter determinanten fortegn (dvs.det(a,b) = −det(b,a)).

Page 37: Flervariabel analyse med lineær algebra

68 KAPITTEL 1. VEKTORER OG MATRISER

(iii) Dersom vi ganger alle elementene i en rad med et tall s, sa forandrerogsa matrisen seg med en faktor s (dvs. det(sa,b) = sdet(a,b) ogdet(a, sb) = sdet(a,b)).

(iv) Dersom vi adderer et tall ganger en rad til en av de andre radene,endrer ikke determinanten verdi (dvs. det(a + sb,b) = det(a,b) ogdet(a,b + sa) = det(a,b)).

Bevis: Alle punktene kan vises ved direkte utregning, men vi vil gjerne forstadem geometrisk selv om det i noen tilfeller er litt mer omstendelig:

(i) Parallellogrammet utspent av radvektorene a = (1, 0) og b = (0, 1) eret kvadrat med side 1. Arealet er opplagt 1, og siden paret (a,b) er positivtorientert, er det(I2) = 1).

(ii) Bytter vi om pa radene, bytter vi orientering pa paret (a,b), ogdeterminanten bytter dermed fortegn.

(iii) Ganger vi den ene vektoren med et positivt tall s, blir enten grunn-linjen eller høyden i det utspente parallellogrammet ganget med s, og arealetøker/avtar derfor med en faktor s. Ganger vi med et negativt tall, endreshøyden eller grunnlinjen med en faktor |s|, men i tillegg bytter vektorparetorientering slik at ogsa i dette tilfellet endrer determinanten seg med enfaktor s.

a)

!>>

>>

>>L

a

b

>>

>>

>>

b)

!

L

b

sa

a

b + sa

!

??????G

??????? ?

??

??

??

Figur 7: Parallellogrammene utspent av henholdsvis a,b og a,b + sa

(iv) Her trenger vi en liten figur. Figur 7a viser parallellogrammet ut-spent av a og b, mens figur 7b viser parallellogrammet utspent av a ogb+ sa. De to parallellogrammene har samme grunnlinje og høyde, og derforsamme areal. Det er ogsa lett a se at uansett hvor stor s er, sa har parene(a,b) og (a,b + sa) samme orientering. Altsa er det(a,b) = det(a,b + sa).

!

3× 3-determinanter

Determinanten til en 3× 3-matrise

A =

a11 a12 a13

a21 a22 a23

a31 a32 a33

1.8. DETERMINANTER, AREALER OG VOLUMER 69

er definert ved∣∣∣∣∣∣

a11 a12 a13

a21 a22 a23

a31 a32 a33

∣∣∣∣∣∣= a11

∣∣∣∣a22 a23

a32 a33

∣∣∣∣− a12

∣∣∣∣a21 a23

a31 a33

∣∣∣∣ + a13

∣∣∣∣a21 a22

a31 a32

∣∣∣∣

der 2×2-determinantene pa høyre side regnes ut pa vanlig mate. Legg merketil hvordan disse 2 × 2-determinantene fremkommer fra den opprinneligedeterminanten — for a finne den 2× 2-determinanten som ganges med a11,stryker vi den linjen og den søylen som gar gjennom a11 (se figur 8), for afinne den 2× 2-determinanten som ganges med a12, stryker vi den linjen ogden søylen som gar gjennom a12, osv. Legg ogsa merke til at fortegnene tilleddene pa høyre side veksler mellom pluss og minus.

∣∣∣∣∣∣

a11 a12 a13

a21 a22 a23

a31 a32 a33

∣∣∣∣∣∣=

∣∣∣∣a22 a23

a32 a33

∣∣∣∣

Figur 8: 2× 2-determinanten som skal ganges med a1

La oss regne ut en 3× 3-determinant.

Eksempel 4: Regn ut∣∣∣∣∣∣

2 3 −15 −4 0−3 1 2

∣∣∣∣∣∣= 2

∣∣∣∣−4 01 2

∣∣∣∣− 3∣∣∣∣

5 0−3 2

∣∣∣∣ + (−1)∣∣∣∣

5 −4−3 1

∣∣∣∣

= 2((−4) · 2− 0 · 1)− 3(5 · 2− 0 · (−3)) + (−1)(5 · 1− (−4)(−3))

= 2(−8)− 3 · 10 + (−1)(−7) = −16− 30 + 7 = −39

Det er en nær sammenheng mellom 3×3-determinanter og kryssproduk-tet. Som et første eksempel har vi følgende huskeregel for kryssproduktet:

∣∣∣∣∣∣

i j ka1 a2 a3

b1 b2 b3

∣∣∣∣∣∣=

= (a2b3 − a3b2)i + (a3b1 − a1b3)j + (a1b2 − a2b1)k = a× b

Siden vi bare har definert determinanten nar elementene i første rad er tall(og ikke vektorer), gir det første skrittet i denne utregningen egentlig ikkemening, men resultatet er likevel en grei huskeregel.

Page 38: Flervariabel analyse med lineær algebra

70 KAPITTEL 1. VEKTORER OG MATRISER

Vi har tidligere sett at 2 × 2-determinanter kan brukes til a regne utarealer og til a bestemme orienteringen til vektorpar (a,b). Pa tilsvaren-de mate kan vi bruke 3 × 3-determinanter til a regne ut volumer og til abestemme orienteringen til vektortripler (a,b, c). Før vi begynner, kan detvære greit a bli enig om notasjonen. Dersom a = (a1, a2, a3), b = (b1, b2, b3),c = (c1, c2, c3), skriver vi

det(a,b, c) =

∣∣∣∣∣∣

a1 a2 a3

b1 b2 b3

c1 c2 c3

∣∣∣∣∣∣

Vi observerer sa at

det(a,b, c) =

∣∣∣∣∣∣

a1 a2 a3

b1 b2 b3

c1 c2 c3

∣∣∣∣∣∣= a1

∣∣∣∣b2 b3

c2 c3

∣∣∣∣− a2

∣∣∣∣b1 b3

c1 c3

∣∣∣∣ + a3

∣∣∣∣b1 b2

c1 c2

∣∣∣∣

= a1(b2c3 − b3c2)− a2(b1c3 − b3c1) + a3(b1c2 − b2c1) = a · (b× c)

Sammenholder vi dette med setning 1.4.4 og korollar 1.4.5, far vi:

Setning 1.8.4 Volumet av parallellepipedet utspent av vektorene a, b, c er|det(a,b, c)|. Volumet av pyramiden utspent av a, b, c er 1

6 |det(a,b, c)|.

Legg merke til at det(a,b, c) = 0 hvis volumet til parallellepipedet er0. Det skjer hvis vektorene a, b og c ligger i samme plan gjennom origo.Pa det naværende tidspunkt kan dette virke som en uvesentlig observasjon,men det viser seg faktisk a være en av hovedarsakene til determinantenesbetydning.

Hva sa med orienteringen? Først ma vi definere nar et trippel (a,b, c)er positivt og negativt orientert: To ikke-parallelle vektorer a og b definerersammen med origo et plan (planet gjennom punktene 0, a og b). Detteplanet deler rommet i to halvdeler. Dersom c ligger pa samme side av planetsom kryssproduktet a × b, sier vi at triplet (a,b, c) er positivt orientert.Dersom c ligger pa den andre siden av planet, sier vi at triplet er negativtorientert. Bruker vi den geometriske tolkningen av skalarproduktet, ser viat triplet (a,b, c) er positivt orientert hvis og bare hvis (a×b) · c er positiv(for da er vinkelen mellom c og a × b mindre enn 90◦). Det er lett (menikke særlig spennende) a sjekke at (a × b) · c = det(a,b, c) (det er ikkenoe mystisk i dette — bade |(a × b) · c| og |det(a,b, c)| er lik volumet tilparallellepipedet utspent av a, b og c, sa alt vi sjekker er at fortegnet erdet samme). Dette betyr at (a,b, c) er positivt orientert hvis og bare hvisdet(a,b, c) er positiv. Vi har altsa den samme forbindelsen mellom positivorientering og positiv determinant som i det to-dimensjonale tilfellet.

Vi tar med en tredimensjonal versjon av setning 1.8.3.

Setning 1.8.5 For 3× 3-matriser gjelder:

1.8. DETERMINANTER, AREALER OG VOLUMER 71

(i) det(I3) = 1 (husk at I3 er identitetsmatrisen I3 =

1 0 00 1 00 0 1

).

(ii) Dersom vi bytter om to rader, sa bytter determinanten fortegn (det vilf.eks. si at det(a,b, c) = −det(c,b,a)).

(iii) Dersom vi ganger alle elementene i en rad med et tall s, sa forandrerogsa matrisen seg med en faktor s (det vil f.eks. si at det(a, sb, c) =sdet(a,b, c)).

(iv) Dersom vi adderer et tall ganger en rad til en av de andre radene,endrer ikke determinanten verdi (det vil f.eks. si at det(a,b, c+ sa) =det(a,b, c)).

Bevis: Vi skal ikke gjennomga punktene i detalj, bare se pa hovedideene.Punkt (i) kan du bevise enten ved direkte utregning eller ved a observereat parallellogrammet utspent av vektorene a = (1, 0, 0), b = (0, 1, 0) ogc = (0, 0, 1) er en terning med side 1. I punkt (ii) vet vi allerede at tallverdientil determinanten er uforandret om vi bytter om pa radene (fordi begge erlik volumet til det samme parallellepipedet), og alt du behøver a sjekke er atorienteringen snur nar du bytter om to vektorer (bruk høyrehandsregelen).Punkt (iii) følger pa samme mate som i det todimensjonale tilfellet; gangerdu en av sidekantene i et parallellepiped med s > 0, øker ogsa volumet meden faktor s, men ganger du med en faktor s < 0, ma du ogsa ta hensyn tilat orienteringen snur. For a bevise punkt (iv) kan du bruke akkurat sammefigur som i det todimensjonale tilfellet (figur 7) — den eneste forskjellen erat det na inngar en vektor til. Denne vektoren stikker pa skra ut av (ellerinn i) papiret og inngar ikke i beregningene pa noen forstyrrende mate (deteneste den bidrar med er den felles høyden i parallellogrammene).

n× n-determinanter

Vi skal ikke studere generelle n× n-determinanter for alvor i dette kapitlet,men det kan være morsomt a vite hvordan de regnes ut. Gitt en 4×4-matrise

A =

a11 a12 a13 a14

a21 a22 a23 a24

a31 a32 a33 a34

a41 a42 a43 a44

definerer vi determinanten det(A) ved

det(A) = a11

∣∣∣∣∣∣

a22 a23 a24

a32 a33 a34

a42 a43 a44

∣∣∣∣∣∣− a12

∣∣∣∣∣∣

a21 a23 a24

a31 a33 a34

a41 a43 a44

∣∣∣∣∣∣+

Page 39: Flervariabel analyse med lineær algebra

72 KAPITTEL 1. VEKTORER OG MATRISER

+a13

∣∣∣∣∣∣

a21 a22 a24

a31 a32 a34

a41 a42 a44

∣∣∣∣∣∣− a14

∣∣∣∣∣∣

a21 a22 a23

a31 a32 a33

a41 a42 a43

∣∣∣∣∣∣

Sammenligner du denne definisjonen med definisjonen av 3 × 3-deter-minanter, vil du oppdage det generelle mønsteret som gjør at vi kan gavidere og definere 5× 5-determinanter, 6× 6-determinanter osv.

Vi har tidligere sett at tallverdien til 2 × 2-determinanten det(a,b) giross arealet utspent av vektorene a og b, mens fortegnet til determinantenforteller oss om orienteringen til paret (a,b). Pa tilsvarende vis vet vi attallverdien til en 3 × 3-determinant det(a,b, c) gir oss volumet utspent avvektorene a, b og c, mens fortegnet forteller oss om orienteringen til triplet(a,b, c). Vi kan bruke disse observasjonene til a definere volum og oriente-ring i høyere dimensjoner. Gitt n vektorer a1, a2,. . ., an definerer vi volumetutspent av disse vektorene til a være tallverdien til n × n-determinantendet(a1,a2, . . . ,an). Vi sier at n-tuplet (a1,a2, . . . ,an) (legg merke til at det-te er et n-tuppel av vektorer) er positivt (henholdsvis negativt) orientertdersom determinanten er positiv (henholdvis negativ). Vi skal ikke ga nær-mere inn pa volum og orientering i dette heftet, men vi skal komme tilbaketil generelle determinanter i kapittel 4.

Bemerkning: Som vi skal se i kapittel 4, er det en nær sammenheng mellomdeterminanter og inverterbarhet — det viser seg at en kvadratisk matrise Aer inverterbar hvis og bare hvis det(A) #= 0. Dette er kanskje ikke sa overras-kende siden begge begrepene har med degenerasjon a gjøre: En kvadratiskmatrise A er singulær (ikke inverterbar), dersom det finnes to forskjelligevektorer x og x′ slik at Ax = Ax′, og den har determinant lik 0 dersomradene ikke spenner ut et volum. Det viser seg at disse to formene for dege-nerasjon er ekvivalente.

MATLAB-kommentar: MATLAB regner ut determinanten til A nar duskriver >>det(A).

Oppgaver til seksjon 1.8

1. Regn ut determinantene

a)∣∣∣∣

4 3−2 2

∣∣∣∣ b)∣∣∣∣

8 −23 4

∣∣∣∣ c)∣∣∣∣

6 −3−2 1

∣∣∣∣

2. Finn arealet til parallellogrammet utspent av a = (1, 3) og b = (4, 1).

3. En trekant har hjørner i punktene (−1, 2), (4, 3), (1, 7). Finn arealet.

4. En firkant har hjørner i punktene (0, 1), (5, 1), (1, 7) og (7, 4). Finn arealet.

5. Avgjør om parene (a,b) er positivt eller negativt orientert:

a) a = (3,−1) b = (−7, 2) b) a = (−1, 5) b = (3, 2)

1.8. DETERMINANTER, AREALER OG VOLUMER 73

6. Vis at det(a,b) = 0 hvis og bare hvis vektorene a,b ∈ R2 er parallelle eller(minst) en av dem er 0.

7. Vis at∣∣∣∣

a bc d

∣∣∣∣ =∣∣∣∣

a cb d

∣∣∣∣, dvs. at vi far den samme determinanten om vi bytter

om linjer og søyler.

8. Alle hjørnene til et parallellogram har heltallige koordinater. Vis at arealet er ethelt tall.

9. Anta at∣∣∣∣

a1 b1

a2 b2

∣∣∣∣ #= 0

a) Vis at ligningssystemet a1x + b1y = c1, a2x + b2y = c2 har løsningen

x =

∣∣∣∣c1 b1

c2 b2

∣∣∣∣∣∣∣∣

a1 b1

a2 b2

∣∣∣∣y =

∣∣∣∣a1 c1

a2 c2

∣∣∣∣∣∣∣∣

a1 b1

a2 b2

∣∣∣∣

b) Hva skjer med ligningssystemet nar∣∣∣∣

a1 b1

a2 b2

∣∣∣∣ = 0?

10. Regn ut determinantene:

a)

∣∣∣∣∣∣

3 −2 −11 4 32 1 7

∣∣∣∣∣∣b)

∣∣∣∣∣∣

−2 4 0−2 3 31 0 4

∣∣∣∣∣∣c)

∣∣∣∣∣∣

1 2 3−2 5 43 −3 −1

∣∣∣∣∣∣

11. Finn volumet til parallellepipedet utspent av (−1, 0, 2), (3,−1, 3) og (4, 0,−1).

12. Finn volumet til pyramiden med hjørner i punktene (2, 2, 2), (−1, 2, 3), (3, 4, 2)og (7, 2, 2).

13. Avgjør om triplet (a,b, c) er positivt eller negativt orientert nar a = (−1, 2, 3),b = (0, 2, 4) og c = (7,−1, 2).

14. Vis at

∣∣∣∣∣∣

a1 a2 a3

b1 b2 b3

c1 c2 c3

∣∣∣∣∣∣=

∣∣∣∣∣∣

a1 b1 c1

a2 b2 c2

a3 b3 c3

∣∣∣∣∣∣, dvs. at determinanten er den samme

om vi bytter om søyler og linjer.

15. Vis at dersom a, b og c er ortogonale, sa er det(a,b, c) = |a||b||c|.

16. Regn ut determinanten til 4× 4-matrisen

2 1 −3 00 4 1 23 0 −1 24 −2 3 1

17. I denne oppgaven er a, b, c og d tredimensjonale vektorer.

a) Vis at dersom to av vektorene a, b, c er like, sa er det(a,b, c) = 0

Page 40: Flervariabel analyse med lineær algebra

74 KAPITTEL 1. VEKTORER OG MATRISER

b) Vis at for alle vektorer a, b, c, d og alle skalarer s, t gjelder

det(sa + td,b, c) = sdet(a,b, c) + t det(d,b, c)

c) Vi sier at en vektor a er en lineærkombinasjon av vektorene b, c dersom detfinnes skalarer s, t slik at a = sb + tc. Bruk a) og b) til a vise at dersom aer en lineærkombinasjon av b og c, sa er det(a,b, c) = 0.

d) Gi en geometrisk forklaring pa resultatet i c).

18. Bevis setning 1.8.3 ved regning (dvs. regn ut begge sider av likhetene og se atde stemmer).

19. Bevis setning 1.8.5 ved regning (dvs. regn ut begge sider av likhetene og se atde stemmer).

20. Vis at en 2 × 2-matrise A er inverterbar hvis og bare hvis det(A) #= 0. (Hint:Mesteparten av jobben er gjort i oppgave 1.7.10.)

Kapittel 2

Funksjoner fra Rn til Rm

I dette kapitlet skal vi studere funksjoner F fra Rn til Rm. En slik funksjoner bare en regel som til hvert n-tuppel x = (x1, x2, . . . , xn) tilordner et m-tuppel y = F(x). Dersom n > 1 kaller vi F en funksjon av flere variable.Funksjoner av flere variable har mange likhetstrekk med de funksjonene aven variabel som du kjenner fra før, men de har ogsa en del nye og litt uvanteegenskaper. Spesielt blir geometrien mer komplisert nar vi far mer enn envariabel a arbeide med.

2.1 Funksjoner av flere variable

Som allerede nevnt er en funksjon F fra Rn til Rm bare en regel som til hverx ∈ Rn gir oss en y = F(x) i Rm. Ofte er disse reglene gitt ved en formler,f.eks. kan en funksjon fra R4 til R3 være gitt ved

F(x, y, z, u) = (2x2z + u, xy2zu3, yex2y+u sin y)

Gitt et 4-tuppel x = (x, y, z, u) forteller denne formelen oss hvordan vi kanregne ut 3-tuplet F(x). Som du ser, veksler vi mellom skrivematene F(x)og F(x1, x2, . . . , xn); den første er ofte mest praktisk nar vi snakker om engenerell, uspesifisert funksjon, mens den siste som regel er greiest nar visnakker om en bestemt funksjon gitt ved en formel. Husk at R1 = R slik atteorien var ogsa dekker funksjoner F : Rn → R der x er en vektor, men F (x)er et tall (i prinsippet dekker teorien ogsa funksjoner av typen F : R → Rm,men for øyeblikket er vi ikke sa interessert i dem).

Vi husker at vanlige funksjoner f(x) ikke alltid er definert for alle re-elle tall x, og pa samme mate vil heller ikke disse nye funksjonene F(x)nødvendigvis være definert for alle vektorer x ∈ Rn. Den mengden A ⊂ Rn

av vektorer x som F(x) er definert for, kaller vi definisjonsmengden ellerdefinisjonsomradet til F. Vi skal av og til bruke symbolet DF for defini-sjonsomradet til F. Nar vi skriver

F : A → Rm

75

Page 41: Flervariabel analyse med lineær algebra

76 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

mener vi at F er en funksjon definert pa mengden A med verdier i Rm. Hvisen funksjon er gitt ved formler, og definisjonsomradet ikke er spesifisert,regner vi med at funksjonen er definert der alle formlene gir mening.

En funksjon definert pa en delmengde av Rn kaller vi en funksjon avn-variable; f.eks. er

G(x, y) = (xy, ln(1− xy), sin(x2y))

en funksjon av to variable med verdier i R3, mens

g(x, y, z) = x2 + yez+y2

er en funksjon av tre variable med verdier i R (nar funksjonene tar verdieri R skriver vi dem gjerne uten fete typer og ofte med sma bokstaver).

En funksjon som tar verdier i R kalles gjerne et skalarfelt nar vi vilunderstreke at verdiene er tall og ikke vektorer. Legg merke til at en funksjonF : Rn → Rm kan skrives

F(x1, x2, . . . , xn) = (F1(x1, x2, . . . , xn), . . . , Fm(x1, x2, . . . , xn))

der F1, . . . , Fm er skalarfelt. Vi kaller F1, . . . , Fm for komponentene til F.Funksjonen G ovenfor har altsa komponentene.

G1(x, y) = xy, G2(x, y) = ln(1− xy), G3(x, y) = sin(x2y)

Vi skal ofte gjøre bruk av at funksjoner med verdier i Rm er bygget oppav skalarfelt pa denne maten, for eksempel ved at vi først innfører begreperog beviser resultater for skalarfelt og sa utvider til funksjoner med verdier iRm.

Eksempler

Det er naturlig a spørre seg selv om hvorfor man ma studere funksjoner avflere variable — greier det seg ikke med de funksjonene av bare en variabelsom man kjenner fra før? Det viser seg imidlertid at funksjoner av flerevariable dukker naturlig opp i svært mange sammenhenger. Her er et liteutvalg:

• BMI (body mass index) brukes ofte som en indikator pa overvekt ogundervekt. For a finne din BMI, tar du vekten din v (malt i kilo) ogdeler pa kvadratet av høyden din h (malt i meter). Vi kan tenke paBMI som en funksjon f av to variable med verdier i R:

f(v, h) =v

h2

2.1. FUNKSJONER AV FLERE VARIABLE 77

• Nar en gjenstand varmes opp, vil temperaturen avhenge av nar oghvor vi maler. Det er naturlig a angi temperaturen i punktet (x, y, z)ved tiden t som T (x, y, z, t). Dette er en funksjon av fire variable medverdier i R.

• Gravitasjonskraften fra jorden pa en gjenstand i verdensrommet av-henger av posisjonen til gjenstanden. Tenker vi pa kraften som envektor F(x) (vi er interessert i bade størrelse og retning) som er av-hengig av posisjonen x = (x, y, z), far vi en funksjon av tre variablemed verdier i R3. Dersom vi plasserer jorden i origo, kan F i dettetilfellet skrives

F(x) = −γMm

|x|3 x

der γ er en naturkonstant (gravitasjonskonstanten), M er massen tiljorden og m massen til gjenstanden. I dette eksemplet er F en funksjonfra R3 til R3

• Meteorologer arbeider med vind i atmosfæren. Vinden i et punkt medkoordinater (x, y, z) ved tiden t vil være en vektor v(x, y, z, t) (vi erinteressert i bade vindstyrken og retningen). Vi kan tenke pa dettesom en funksjon av fire variable med verdier i R3.

• I eksempel 3 i seksjon 1.5 sa vi pa fire produsenter som leverte eplerav tre ulike kvaliteter til en fruktpresse. Dersom produsentene levertehhv. x, y, z og u tonn epler, kunne vi regne ut hvor mange tonn viville fa av hver kvalitet. Dette gir oss en funksjon av fire variable medverdier i R3. Vi kan skrive funksjonen som F(x) = Ax, eller medkoordinater

F(x, y, z, u) =

0.5x + 0.3y + 0.25z + 0.2u0.3x + 0.4y + 0.4z + 0.6u0.2x + 0.3y + 0.35z + 0.2u

Grafisk fremstilling

Et av de viktigste verktøyene nar man studerer funksjoner av en variabeler grafisk fremstilling. Dessverre er det ikke sa lett a gi realistiske grafiskefremstillinger av funksjoner fra Rn til Rm. Noen ganger kan vi imidlertidha stor glede av mer stiliserte fremstillinger som pa figuren nedenfor. Denillustrerer hvordan en funksjon F fra Rn til Rm sender alle punkter i enmengde A ⊂ Rn pa en mengde B ⊂ Rm. Mengden B kalles bildet av Aunder F og betegnes ofte med B = F(A). Du vil se mange figurer av dennetypen utover i kapitlet.

Page 42: Flervariabel analyse med lineær algebra

78 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

/

0

1

2

Rn

/

0

1

2

ARm3 3A3 3A

3 3A

3 3A B = F(A)

Figur 1: Funksjon fra Rn til Rm

Det er imidlertid ett tilfelle der det gar an a lage gode, realistiske frem-stillinger av en funksjon av flere variable, og det er nar funksjonen gar fraR2 til R. Vi ser altsa pa en funksjon z=f(x, y). For a tegne funksjonsgrafenlager vi først et tre-dimensjonalt koordinatsystem som vist pa figur 2.

"

''''''''''(

))))))* !

!

$

"

f(x, y)

x

y

z

(x, y, 0)

(x, y, f(x, y))

Figur 2: Plotting av skalarfelt

Gitt variabelverdier x og y, finner vi punktet (x, y, 0) i xy-planet. Vi flytteross na loddrett (dvs. parallelt med z-aksen) til vi finner punktet (x, y, f(x, y)).Dette er det første punktet pa funksjonsgrafen var.

"

''''''''''(

))))))* !

!

x

y

z

(x, y, 0)

(x, y, f(x, y))

Figur 3: Grafisk fremstilling av skalarfelt

Gjentar vi denne prosedyren for stadig flere variabelverdier (x, y), vokser

2.2. KONTINUERLIGE FUNKSJONER 79

grafen etterhvert frem som en flate i rommet (se figur 3).Selv om denne prosedyren pa en grei mate forklarer hva grafen til et

skalarfelt er, sa er den i praksis ubrukelig som en oppskrift pa hvordan mantegner grafen. Prøver du den, selv pa en enkel funksjon, oppdager du fort atdu helt mister romfølelsen i bildet. I neste kapittel skal vi se pa mer prak-tiske metoder for a tegne slike funksjonsgrafer — det som er viktig i dettekapitlet, er at du vet hvordan du kan tenke pa grafen til f som en flate.

MATLAB-kommentar: MATLAB er et utmerket verktøy for grafisk frem-stilling av funksjoner av flere variable, men vi utsetter dette temaet til sek-sjon 3.7 og 3.8.

Oppgaver til seksjon 2.1

1. Finn definisjonsomradet til funksjonen:a) f(x, y) = 1

x2+4y2

b) f(x, y) = 1x2−y2

c) f(x, y) = ln(x + y)d) f(x, y) = tan(x− y)e) f(x, y, z) = 1

x2+y2+z2−25

2.2 Kontinuerlige funksjoner

I seksjon 5.1 i Kalkulus studerte vi ε-δ-definisjonen av kontinuitet. Dennedefinisjonen er sannsynligvis ikke like populær blant alle, men den har mangefordeler, blant annet at den lett kan generaliseres til nye situasjoner. I denneseksjonen skal vi se hvordan den generaliseres til funksjoner av flere variable.Før vi begynner, trenger vi a vite litt om avstander og kuler i Rn.

Akkurat som i planet og rommet lar vi avstanden mellom to punkter aog x i Rn være lik lengden til vektoren x− a som forbinder dem, det vil siat avstanden er

|x− a| =√

(x1 − a1)2 + (x2 − a2)2 + · · · + (xn − an)2

MengdenB(a, r) = {x ∈ Rn : |x− a| < r}

bestar av de punktene i Rn som har avstand mindre enn r til punktet a.Vi kaller B(a, r) kulen om a med radius r. Legg merke til at i R3 er dettevirkelig en (apen) kule i tradisjonell forstand, mens det i R2 er en (apen)sirkelskive og i R et apent intervall. Vi velger a bruke “kule” som et fellesordi alle dimensjoner, selv om det til a begynne med kan virke litt uvant nar viarbeider i planet eller pa tallinjen. De fleste illustrasjonene vare vil være iplanet, og der vil kuler fremsta som sirkler.

Vi kan na definere kontinuitet for funksjoner av flere variable:

Page 43: Flervariabel analyse med lineær algebra

80 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Definisjon 2.2.1 Anta at A ⊂ Rn, og at a ∈ A. En funksjon F : A → Rm

er kontinuerlig i a dersom det til enhver ε > 0 finnes en δ > 0 slik at

|F(x)− F(a)| < ε for alle x ∈ A slik at |x− a| < δ

Figuren nedenfor illustrerer definisjonen: Gitt en kule B(F(a), ε) ompunktet F (a), kan vi finne en kule B(a, δ) om punktet a slik at bildetav B(a, δ) (markert med den stiplede kurven pa figuren) ligger helt inniB(F(a), ε).

/

0

1

2

34567

B(a, δ)//0

a

A Rm

389:;

B(F(a), ε)MMN

F(a)#

F

P

Figur 1: Kontinuitet i punktet a

Siden kontinuitet er definert pa akkurat samme mate som for funksjonerav en variabel, har vi de samme reglene med (nesten) de samme bevisene.

Setning 2.2.2 Anta at A ⊂ Rn, og at funksjonene F,G : A → Rm erkontinuerlige i a ∈ A. Da er F + G, F−G og F · G kontinuerlige i a. Deter ogsa F

G forutsatt at F og G tar verdier i R (slik at divisjon gir mening)og G(a) #= 0.

Bevis: Bevisene er akkurat som for funksjoner av en variabel (se setning5.1.5 i Kalkulus), den eneste ekstra komplikasjonen er at vi noen steder maappellere til trekantulikheten (setning 1.2.4) og Schwarz’ ulikhet (setning1.2.3) for a fa argumentene til a ga opp. Vi tar F+G og F ·G som eksempler— det første av disse bevisene er ganske enkelt, det andre er mer komplisert:

For a vise at F+G er kontinuerlig i a, ma vi vise at for hver ε > 0 finnesdet en δ > 0 slik at hvis x ∈ A og |x− a| < δ, sa er

∣∣(F(x) + G(x))−

(F(a) + G(a)

)∣∣ < ε

Vi stokker litt om pa leddene slik at vi far F og G hver for seg, og brukerderetter trekantulikheten:∣∣(F(x) + G(x)

)−

(F(a) + G(a)

)∣∣ =∣∣(F(x)− F(a)

)+

(G(x) + G(a)

)∣∣ ≤

≤∣∣F(x)− F(a)

∣∣ +∣∣G(x) + G(a)

∣∣

Siden F er kontinuerlig i a, finnes det en δ1 > 0 slik at |F(x) − F(a)| < ε2

nar x ∈ A og |x−a| < δ1. Siden G er kontinuerlig i a, finnes det tilsvarende

2.2. KONTINUERLIGE FUNKSJONER 81

en δ2 > 0 slik at |G(x)−G(a)| < ε2 nar x ∈ A og |x−a| < δ2. Lar vi δ være

det minste av de to tallene δ1 og δ2, ser vi at nar x ∈ A og |x−a| < δ, sa er∣∣(F(x) + G(x)

)−

(F(a) + G(a)

)∣∣ ≤

∣∣F(x)− F(a)∣∣ +

∣∣G(x) + G(a)∣∣ <

ε

2+

ε

2= ε

Dermed har vi vist at F + G er kontinuerlig i a.La oss sa vise kontinuitet av F · G. Gitt en ε > 0, ma vi finne en δ > 0

slik at hvis x ∈ A og |x − a| < δ, sa er |F(x) · G(x) − F(a) · G(a)| < ε. Vilegger til og trekker fra F(a) ·G(x), og bruker deretter trekantulikheten ogSchwarz’ ulikhet:

|F(x) ·G(x)− F(a) ·G(a)| =

|F(x) ·G(x)− F(a) ·G(x) + F(a) ·G(x)− F(a) ·G(a)| ≤

≤ |F(x) ·G(x)− F(a) ·G(x)| + |F(a) ·G(x)− F(a) ·G(a)| ≤

≤ |F(x)− F(a)||G(x)| + |F(a)||G(x)−G(a)|

Vi vil være i mal dersom vi kan vise at vi kan fa begge uttrykkene |F(x)−F(a)||G(x)| og |F(a)||G(x)−G(a)| mindre enn ε

2 ved a velge x tilstrekkelignær a. Det siste leddet er det enkleste, sa vi begynner med det. Hvis F(a) =0, er leddet lik 0 og derfor mindre enn ε

2 . Vi kan derfor anta at F(a) #= 0.Siden G er kontinuerlig i a, finnes det en δ1 > 0 slik at hvis |x− a| < δ1, saer |G(x)−G(a)| < ε

2|F(a)| . Dermed er

|F(a)||G(x)−G(a)| ≤ |F(a)| ε

2|F(a)| =ε

2

Vi tar sa for oss leddet |F(x) − F(a)||G(x)|. Observer først at siden G erkontinuerlig i a, sa finnes det en δ2 > 0 slik at hvis |x − a| < δ2, sa er|G(x) − G(a)| < 1. Dette betyr at dersom |x − a| < δ2, sa er (vi brukertrekantulikheten igjen)

|G(x)| = |G(x)−G(a) + G(a)| ≤ |G(x)−G(a)| + |G(a)| ≤ 1 + |G(a)|

Siden F er kontinuerlig i a, finnes det en δ3 > 0 slik at hvis |x − a| < δ3,sa er |F(x) − F(a)| ≤ ε

2(1+|G(a)|) . Er |x − a| mindre enn bade δ1 og δ2, erdermed

|F(x)− F(a)||G(x)| ≤ ε

2(1 + |G(a)|)(1 + |G(a)|) =ε

2

Velger vi δ til a være det minste av tallene δ1, δ2 og δ3, ser vi dermed at narx ∈ A og |x− a| < δ, sa er

|F(x) ·G(x)−F(a) ·G(a)| ≤ |F(x)−F(a)||G(x)|+ |F(a)||G(x)−G(a)| <

Page 44: Flervariabel analyse med lineær algebra

82 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

2+

ε

2= ε

og beviset er fullført. !

Det neste resultatet kjenner du ogsa igjen fra teorien for funksjoner aven variabel:

Setning 2.2.3 Anta at vi har to mengder A ⊂ Rn, B ⊂ Rm, og to funk-sjoner G : A → B, F : B → Rk (se figuren nedenfor). Dersom G erkontinuerlig i punktet a, og F er kontinuerlig i punktet b = G(a), sa er densammensatte funksjonen H(x) = F(G(x)) kontinuerlig i a. !

Beviset er akkurat som for funksjoner av en variabel (se setning 5.1.7 iKalkulus) for hjelp). Figur 2 viser hvordan G,F og H virker.

/

0

1

2Rn

/

0

1

2

/

0

1

2

A

Rm Rk

B

:8

;9

3(A

H

GF3 3

bA

:8

;9a H(a) = F(G(a))

Figur 2: Sammensetning av funksjoner

Nar vi skal bruke reglene ovenfor til a vise at en funksjon F : Rn → Rm

er kontinuerlig, lønner det seg ofte a skrive den pa komponentform:

F(x) = (F1(x), F2(x), . . . , Fm(x))

Det neste resultatet forteller oss nemlig at F er kontinuerlig hvis og barehvis hver komponent Fi er kontinuerlig.

Setning 2.2.4 Anta at F : A → Rm er en funksjon av n variable medkomponenter

F(x) = (F1(x), F2(x), . . . , Fm(x))

Da er F kontinuerlig i et punkt a ∈ A hvis og bare hvis hver komponent Fi

er kontinuerlig i a.

Bevis: La oss først anta at alle komponentene F1, F2, . . . , Fm er kontinuerligei a. Vi ma vise at for enhver ε > 0, finnes det en δ > 0 slik at hvis |x−a| < δ,sa er |F(x)−F(a)| < ε. Siden hver komponent Fi er kontinuerlig i a, finnesdet en δi > 0 slik at |Fi(x)− Fi(a)| < ε√

mnar |x− a| < δi. Vi velger δ til a

være det minste av tallene δ1, δ2, . . . , δm. Hvis |x− a| < δ, har vi da

|F(x)− F(a)| =√

(F1(x)− F1(a))2 + · · · + (Fm(x)− Fm(a))2 ≤

2.2. KONTINUERLIGE FUNKSJONER 83

√(ε√m

)2

+ · · · +(

ε√m

)2

=

m

(ε2

m

)= ε

Dette viser at F er kontinuerlig i a.Anta na omvendt at F er kontinuerlig i a, og at vi skal vise at kom-

ponenten Fi er kontinuerlig i a. Gitt ε > 0, ma vi finne en δ > 0 slik at|Fi(x)− Fi(a)| < ε nar |x− a| < δ. Siden F er kontinuerlig i a, finnnes deten δ > 0 slik at |F(x)− F(a)| < ε nar |x− a| < δ. Men dermed er

|Fi(x)− Fi(a)| ≤√

(F1(x)− F1(a))2 + · · · + (Fm(x)− Fm(a))2 =

= |F(x)− F(a)| < ε

nar |x− a| < δ. Dette viser at Fi er kontinuerlig i a. !

De enkleste funksjonene av flere variable (bortsett fra konstantfunksjonene)er de som bare gir oss en av variablene som funksjonsverdi, f.eks.

f(x, y, z, u) = y eller g(x, y, z) = z

Generelt kaller viki(x1, x2, . . . , xn) = xi

den i-te koordinatfunksjonen. Det er lett a se at disse koordinatfunksjoneneer kontinuerlige, og det neste eksemplet forteller oss hvordan vi kan brukedem og resultatene ovenfor til a vise at mer kompliserte funksjoner er kon-tinuerlige.

Eksempel 1: Vis at funksjonen F : R3 → R2 definert ved

F(x, y, z) =

(x2 sin(yz),

ex2+z

y2 + 1

)

er kontinuerlig i punktet a = (1, 0,−1). Ifølge setning 2.2.4 er det nok a viseat begge funksjonene

F1(x, y, z) = x2 sin(yz) og F2(x, y, z) =ex2+z

y2 + 1

er kontinuerlig i a. Vi begynner med F1(x, y, z). Siden koordinatfunksjo-nene k2(x, y, z) = y og k3(x, y, z) = z er kontinuerlige, er produktet avdem f(x, y, z) = yz ogsa kontinuerlig ifølge setning 2.2.2. Siden sinus eren kontinuerlig funksjon, ma den sammensatte funksjonen sin(yz) ogsa væ-re kontinuerlig ifølge setning 2.2.3. Pa tilsvarende mate ser vi at funksjo-nen g(x, y, z) = x2 er kontinuerlig (fordi den er lik k1(x, y, z) · k1(x, y, z)

Page 45: Flervariabel analyse med lineær algebra

84 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

som er et produkt av to kontinuerlige funksjoner), og dermed er produktetF1(x, y, z) = x2 sin(yz) kontinuerlig.

Vi behandler F2 pa samme mate: Funksjonen h(x, y, z) = x2 + z er kon-tinuerlig siden den er bygget opp fra kontinuerlige koordinatfunksjoner vedhjelp av multiplikasjon og addisjon. Siden eksponentialfunksjonen er konti-nuerlig, er da p(x, y, z) = ex2+z kontinuerlig. Ved et tilsvarende resonnementser vi at nevneren y2 +1 er kontinuerlig, og siden den er forskjellig fra 0, mabrøken

F2(x, y, z) =ex2+z

y2 + 1være kontinuerlig. ♣

Ved hjelp av teknikken i dette eksemplet er det lett a vise at funksjonerbygget opp ved hjelp av potensfunksjoner, eksponentialfunksjoner, logarit-mer, trigonometriske funksjoner og arcusfunksjoner er kontinuerlige (menhusk a sjekke at de er definert i punktet du er interessert i!)

Hittil har teorien for kontinuerlige funksjoner av flere variable vært for-bløffende lik teorien for kontinuerlige funksjoner av en variabel. Pa grunn avden rikere geometrien finnes det imidlertid fenomener for flervariable funk-sjoner som ikke har noen motsvarighet for funksjoner av en variabel. Her eret eksempel.

Eksempel 2: Funksjonen f : R2 → R er gitt ved

f(x, y) =

x2yx4+y2 for (x, y) #= (0, 0)

0 for (x, y) = (0, 0)

Vi skal undersøke om f er kontinuerlig i (0, 0). Uformelt sier en gjerne atf er kontinuerlig (0, 0) dersom f(x, y) nærmer seg f(0, 0) nar (x, y) nærmerseg (0, 0). La oss derfor se hva som skjer nar (x, y) nærmer seg (0, 0) paforskjellige mater.

La oss først se pa hva som skjer nar (x, y) nærmer ser origo langs enskralinje y = cx der c #= 0; dvs. vi har punkter (x, cx) der x gar mot null.Setter vi inn i funksjonsuttrykket, far vi

f(x, y) = f(x, cx) =x2(cx)

x4 + cx2=

cx

x2 + c−→ 0

c= 0

Tilsvarende ser vi at nar (x, y) nærmer seg (0, 0) langs x-aksen, sa er punk-tene pa formen (x, 0) der x → 0, og vi far

f(x, y) = f(x, 0) =x2 · 0

x4 + 02= 0

Akkurat det samme skjer om vi lar (x, y) nærme seg (0, 0) langs y-aksen.

2.2. KONTINUERLIGE FUNKSJONER 85

Alt dette tyder pa at f er kontinuerlig i (0, 0), men det finnes jo andremater a nærme seg et punkt pa enn a følge en rett linje. La oss prøve anærme oss (0, 0) langs parabelen y = x2 (se figuren). Vi ser altsa pa punkter(x, x2) der x gar mot 0.

!

"

Figur 3. Punkter som nærmer seg (0, 0) langs parabelen y = x2

Setter vi inn i funksjonsuttrykket, far vi

f(x, y) = f(x, x2) =x2 · x2

x4 + (x2)2=

12

Dette viser at f ikke er kontinuerlig i (0, 0) siden vi har punkter med verdien12 sa nær (0, 0) vi matte ønske. Funksjonen virker altsa a være kontinuerligsa lenge vi beveger oss langs rette linjer, men er det likevel ikke! ♣

Eksemplet ovenfor viser at det kan være vanskelig a fa god oversiktover hvordan en funksjon av flere variable oppfører seg, og at det kanskjefinnes flere geometriske muligheter enn det vi kan forestille oss. Det er i slikesammenhenger vi virkelige far nytte av abstrakte definisjoner av ε-δ-typen;de gir oss muligheten til a føre vanntette bevis selv i tilfeller der vi ikke ersikre pa om vi har fatt full oversikt over alle geometriske snurrepiperier!

Hittil har vi bare snakket om kontinuitet i et punkt. Vi avslutter den-ne seksjonen med definisjonen av en kontinuerlig funksjon — den er helttilsvarende definisjonen for funksjoner av en variabel.

Definisjon 2.2.5 En funksjon F kalles kontinuerlig dersom den er konti-nuerlig i alle punkter i sitt definisjonsomrade.

Oppgaver til seksjon 2.2

1. Vis at funksjonen f er kontinuerlig

a) f(x, y) = x + y d) f(x, y) = e−x sin(x + y)b) f(x, y) = x2y + y e) f(x, y, z) = x2 + y2 + z2

c) f(x, y) = xy1+x2+y2

2. Vis at funksjonene er kontinuerlige:a) F(x, y, z) = (x2z + y, x2 sinxyz, x3)b) G(x, y, z, u) = (exu+z2

, z cos xy2u)c) H(x, y, z, u) = (xyexz2

, z + u2, x2 + 3yzu)

Page 46: Flervariabel analyse med lineær algebra

86 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

d) K(x, y, z, u, v) = (sin(xy + z2v), 2uv)

3. Vis at koordinatfunksjonene ki(x1, x2, . . . , xn) = xi er kontinuerlige ved a brukedefinisjonen av kontinuitet.

4. a) Anta det finnes en konstant M ∈ R slik at |F(x)−F(y)| ≤ M |x− y| for allex,y i definisjonsomradet DF. Vis at F er kontinuerlig.

b) Anta at F(x) = Ax for en matrise A. Vis at F er kontinuerlig. (Hint: Husksetning 1.6.3.)

5. I denne oppgaven har du bruk for trekantulikheten som sier at hvis x,y ∈ Rn,sa er |x + y| ≤ |x| + |y|.

a) Vis at | |x|−| y| | ≤ |x− y| for alle x,y ∈ Rn.

b) La a ∈ Rn. Vis at funksjonen f(x) = |x− a| er kontinuerlig.

c) Vis at funksjon g(x) = 1|x−a| er kontinuerlig der den er definert.

6. Bevis setning 2.2.2.

7. Bevis setning 2.2.3.

2.3 Grenseverdier

I teorien for funksjoner av en variabel opererer vi bade med ensidige ogtosidige grenser. Ensidige grenser er blant annet nyttig nar vi skal avgjøreom en funksjon er kontinuerlig i enden av sitt definisjonsomrade — vi bru-ker grenseverdien limx→a+ f(x) for a undersøke om f er kontinuerlig i detvenstre endepunktet a av intervallet [a, b], og grenseverdien limx→b− f(x)for a undersøke om f er kontinuerlig i det høyre endepunktet b. Med flerevariable er det sa mange mater a nærme seg et randpunkt pa at vi ikke kanha ett grensebegrep for hver mate — vi ma finne frem til et felles begrepsom dekker alle tilfeller.

La oss først se litt pa hvilke punkter det er naturlig a regne ut grense-verdier i. Vi ser pa en funksjon F : A → Rm definert pa en delmengde A avRn. Figur 1 viser en mulighet; her bestar A av en sammenhengende mengdepluss et isolert punkt a. < a

Figur 1

Siden vi ikke kan nærme oss a innenfor definisjonsmengden til F, er det

2.3. GRENSEVERDIER 87

ikke rimelig a definere grenseverdien til F i punktet a. Figur 2 viser en annensituasjon.

< aFigur 2

A

Pa denne figuren er omkretsen (“randen”) til A stiplet for a markere atpunktene der ikke hører med til mengden. Dermed er a ikke med i defini-sjonsmengden A, men det gar fint an a nærme seg a fra A. I dette tilfelleter det rimelig a definere grenseverdien til F i punktet a. Konklusjonen padisse observasjonene ma bli at det er rimelig a definere grenseverdien til Fi punktet a dersom det gar an a nærme seg a med punkter (#= a) fra defini-sjonsmengden til F, uansett om punktet a selv ligger i definisjonsmengdeneller ikke. Slike punkter kaller vi opphopningspunkter for A. Her er den pre-sise definisjonen:

Definisjon 2.3.1 La A være en delmengde av Rn. Et punkt a ∈ Rn kalleset opphopningspunkt for A dersom enhver kule B(a, r) om a inneholderuendelig mange punkter fra A.

Vi er na klare til a definere grenseverdien i et opphopningspunkt:

Definisjon 2.3.2 La F : A → Rm være en funksjon av n variable og antaat a ∈ Rn er et opphopningspunkt for A. Vi sier at b ∈ Rm er grenseverdienfor F i punktet a dersom det for hver ε > 0 finnes en δ > 0 slik at

|F(x)− b| < ε for alle x ∈ A slik at 0 < |x− a| < δ

Vi skriver limx→a F(x) = b. Dersom a ikke er et opphopningspunkt for A,er grenseverdien ikke definert.

Denne definisjonen ligner pa den du finner for funksjoner av en variabeli definisjon 5.4.1 i Kalkulus, men skiller seg pa et viktig punkt: Vi insistererikke lenger pa at F skal være definert i alle punkter i nærheten av a, menkompenserer for dette ved bare a kreve at |F(x) − b| < ε skal holde forpunkter x som er med i definisjonsomradet A til F.

Akkurat som kontinuitet kan grenseverdier studeres komponentvis:

Setning 2.3.3 La F : A → Rm være en funksjon av n variable, og anta ata ∈ Rn er et opphopningspunkt for A. Anta at komponentene til F er gittved

F(x) = (F1(x), F2(x), . . . , Fm(x))

og la b være en vektor med komponenter b = (b1, b2, . . . , bm). Da er

limx→a

F(x) = b

Page 47: Flervariabel analyse med lineær algebra

88 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

hvis og bare hvislimx→a

Fi(x) = bi for alle i

!

Beviset overlates til leserne. Ideen er den samme som i beviset for setning2.2.4.

Vi har ogsa de vanlige regnereglene for grenseverdier til summer, diffe-renser, produkter og brøker:

Setning 2.3.4 (Regneregler for grenseverdier) Anta at F,G : A →Rm er to funksjoner av n variable og at a ∈ A er et opphopningspunkt forA. Dersom limx→a F(x) = A og limx→a G(x) = B, sa er:a) limx→a(F

(x) + G(x)

)= A + B.

b) limx→a(F(x)−G(x)

)= A−B.

c) limx→a(F(x) ·G(x)

)= A ·B.

d) limx→aF(x)G(x) = A

B forutsatt at F og G tar verdier i R og B #= 0. !

Ogsa disse bevisene overlates til leserne.Det neste resultatet tar seg av sammenhengen mellom grenseverdier og

kontinuitet. Legg merke til at det bare gjelder for kontinuitet i opphopnings-punkter (men i et isolerte punkt er en funksjon alltid kontinuerlig, sa der erdet ikke sa mye a vise!)

Setning 2.3.5 La F : A → Rm være en funksjon av n variable, og anta ata ∈ A er et opphopningspunkt for A. Da er F kontinuerlig i a hvis og barehvis limx→a F(x) = F(a)

Bevis: Sammenlign definisjonen av kontinuitet med definisjonen av grense-verdi. !

Resultatet ovenfor er nyttig nar vi skal regne ut enkle grenseverdier:

Eksempel 1: Finn grenseverdien til

F (x, y) = (x2y, e−xy sin(πx))

nar (x, y) → (1,−2).Vi ser at funksjonen er kontinuerlig i (1,−2), sa

lim(x,y)→(1,−2)

F (x, y) = F (1,−2) = (12 · (−2), e−1·(−2) sin(π · 1)) = (−2, 0)

I noen eksempler ma vi forenkle uttrykket før vi gar til grensen:

2.4. DERIVASJON AV SKALARFELT 89

Eksempel 2: Finn grenseverdien til

f(x, y) =x2 − y2

x− y

nar (x, y) → (0, 0).Siden x2 − y2 = (x + y)(x− y) har vi

lim(x,y)→(0,0)

f(x, y) = lim(x,y)→(0,0)

x2 − y2

x− y=

= lim(x,y)→(0,0)

(x + y)(x− y)x− y

= lim(x,y)→(0,0)

(x + y) = 0

Oppgaver til seksjon 2.3

1. Finn grenseverdiene

a) lim(x,y)→(2,3)

(x3 + 2xy)

b) lim(x,y)→(1, π

2 )x2 sin(xy)

c) lim(x,y)→(1,0)

ex+y

x2+3y

d) lim(x,y)→(0,0)

sin(xy)xy · cos(x + y)

2. Anta at A ⊂ Rn og at a ∈ Rn. Anta at enhver kule B(a, ε) om a inneholderminst ett element fra A forskjellig fra a. Vis at a er et opphopningspunkt for A.

3. Bevis setning 2.3.3.

4. Bevis setning 2.3.4

5. Bevis setning 2.3.5

2.4 Derivasjon av skalarfelt

Vi skal na begynne a se pa derivasjon av funksjoner av flere variable. For atdet ikke skal være altfor mange komponenter a holde styr pa, skal vi førstderivere skalarfelt, dvs. funksjoner f : Rn → R der verdiene f(x) er tall. Førvi setter igang for alvor, trenger vi en definisjon: Hvis A er en delmengdeav Rn, kalles a ∈ A et indre punkt i A dersom det finnes en ε > 0 slik atB(a, ε) ⊂ A. Dette betyr at dersom vi starter i a, kan vi ga et lite stykke ien hvilken som helst retning uten a forlate A.

For en funksjon y = f(x) av en variabel forteller den deriverte f ′(x) osshvor fort funksjonen vokser i punktet x — gar vi et lite skritt med lengde hlangs x-aksen, vil funksjonsverdien øke med (omtrent) f ′(x)h. For funksjoner

Page 48: Flervariabel analyse med lineær algebra

90 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

av flere variable er situasjonen mer komplisert; vi har flere akser a bevegeoss langs, og vi kan ikke regne med at funksjonen stiger like mye uansetthvilken retning vi gar i. Før vi regner ut stigningstallet til funksjonen, mavi derfor spesifisere hvilken retning vi er interessert i. Dette er ideen bakbegrepet retningsderivert:

Definisjon 2.4.1 Anta at funksjonen f : A → R er definert pa en delmeng-de A av Rn og at a er et indre punkt i A. Tenk pa r ∈ Rn som en vektor.Den retningsderiverte til f i punktet a og retningen r er gitt ved

f ′(a; r) = limh→0

f(a + hr)− f(a)h

forutsatt at denne grensen eksisterer.

Figur 1 viser ideen bak definisjonen.

!

"

333334 r

334 a + hr!a

Figur 1

Punktene a + hr er de punktene vi kommer til hvis vi starter i a og gar iretning r. Differansen f(a + hr) − f(a) forteller oss hvor mye funksjonenøker nar vi beveger oss i denne retning, og brøken

f(a + hr)− f(a)h

er økningen per lengdeenhet nar vi bruker |r | som maleenhet.Legg merke til at vi bare har definert retningsderiverte i indre punkter.

Det garanterer at uttrykket f(a+hr)−f(a) alltid gir mening bare vi velgerh liten nok. I punkter som ikke er indre, kan man ofte definere retningsde-riverte i noen retninger, men ikke i andre. Vi skal ikke komme inn pa detteher, men konsentrere oss om indre punkter.

Eksempel 1: La f(x, y) = x2 + xy. Vi skal beregne den retningsderivertef ′(a; r) nar a = (1, 0), r = (2, 1). Først observerer vi at

a + hr = (1, 0) + h(2, 1) = (1 + 2h, h),

som gir f(a + hr) = (1 + 2h)2 + (1 + 2h)h = 1 + 5h + 6h2. Tilsvarende er

2.4. DERIVASJON AV SKALARFELT 91

f(a) = f(1, 0) = 12 + 1 · 0 = 1. Vi far

f ′(a; r) = limh→0

f(a + hr)− f(a)h

= limh→0

(1 + 5h + 6h2)− 1h

= limh→0

5h + 6h2

h= lim

h→0(5 + 6h) = 5.

Hva betyr dette resultatet? Legg merke til at lengden til vektoren r er|r| =

√22 + 12 =

√5 . Dersom vi gar et lite stykke h

√5 i retningen til vek-

toren r = (2, 1), vil funksjonsverdien stige med (omtrent) f ′(a; r)·h = 5·h. ♣

Det er lettest a forsta hva den retningsderiverte er dersom vektoren r harlengde 1 – da er f ′(a; r) rett og slett stigningstallet til funksjonen i retningr nar vi maler med vanlige enheter. Ut i fra dette kan det være fristendea forutsette at |r| = 1 nar vi regner med retningsderiverte, men dette viserseg a være upraktisk, blant annet fordi enhetsvektorer ofte inneholder styggekvadratrøtter.

Sa langt kan det se ut som om vi ma bygge opp en ny derivasjonsteorihelt fra bunnen av for a kunne beregne retningsderiverte til funksjoner avflere variable. Det er heldigvis ikke nødvendig; ved hjelp av sakalte partiell-deriverte kan vi føre mye av teorien tilbake til vanlig derivasjon av funksjonerav en variabel. Før vi definerer partiellderiverte, er det lurt a bli enig omlitt notasjon.

Den i-te enhetsvektoren ei i Rn er vektoren

ei = (0, 0, . . . , 0, 1, 0, . . . , 0)↑

i-te plass

langs den i-te koordinataksen.

Definisjon 2.4.2 La f : A → R være en funksjon av n variable, og la a væreet indre punkt i A. Den i-te partiellderiverte ∂f

∂xi(a) er den retningsderiverte

av f i retning av den i-te enhetsvektoren ei; det vil si

∂f

∂xi(a) = f ′(a; ei)

Andre notasjoner for ∂f∂xi

(a) er Dif(a) og fxi(a). De partiellderiverte er altsastigningstallene til funksjonen parallelt med koordinataksene. Skriver vi utdefinisjonen i detalj, ser vi at

∂f

∂xi(a) = f ′(a; ei) = lim

h→0

f(a + hei)− f(a)h

=

= limh→0

f(a1, a2, . . . , ai + h, . . . , an)− f(a1, a2, . . . , ai, . . . , an)h

Page 49: Flervariabel analyse med lineær algebra

92 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Det siste uttrykket har en slaende likhet med definisjonen av vanlig derivert.Underslar vi de variablene hvor det ikke skjer noen endring, ser vi at

∂f

∂xi(a) = lim

h→0

f(ai + h)− f(ai)h

Dette betyr at vi kan finne den partiellderiverte ∂f∂xi

ved a derivere uttrykkety = f(x1, . . . , xi, . . . , xn) med hensyn pa xi mens vi later som om alle deandre variablene er konstanter.

Eksempel 2: Finn de partiellderiverte ∂f∂x og ∂f

∂y til funksjonen

f(x, y) = x2 + xy3 + sin(xy).

For a finne ∂f∂x deriverer vi uttrykket med hensyn pa x mens vi later som om

y er en konstant:∂f

∂x(x, y) = 2x + y3 + cos(xy) · y

For a finne ∂f∂y deriverer vi med hensyn pa y mens vi holder x konstant:

∂f

∂y(x, y) = 0 + 3xy2 + cos(xy)x = 3xy2 + x cos(xy)

En funksjon f(x1, x2, . . . , xn) av n variable har n partiellderiverte ∂f∂x1

,∂f∂x2

, . . . , ∂f∂xn

. Vi kan sette sammen disse til en vektor(

∂f

∂x1,

∂f

∂x2, . . . ,

∂f

∂xn

)

Denne vektoren er sa viktig at den har fatt sitt eget navn og sitt eget symbol.

Definisjon 2.4.3 Anta at de partiellderiverte til f eksisterer i punktet a ∈Rn. Da kalles

∇f(a) =(

∂f

∂x1(a),

∂f

∂x2(a), . . . ,

∂f

∂xn(a)

)

gradienten til f i punktet a.

Det er ofte lurt a tenke pa gradienten ∇f(a) som en vektor som starter ipunktet a slik som vist pa figuren nedenfor. Som vi snart skal se (setning2.4.7), far gradienten da en geometrisk betydning — den peker i den retnin-gen hvor funksjonen vokser raskest, og lengden |∇f(a)| er lik stigningstalleti denne retningen.

2.4. DERIVASJON AV SKALARFELT 93

!

"

)))))*!

Figur 2

a

∇f(a)

Eksempel 3: Finn gradienten til

f(x, y, z) = x2yexz

i punktet a = (1,−2, 0).Vi ma først finne de partiellderiverte. Deriverer vi mhp. x som om y og

z er konstanter, far vi

∂f

∂x= 2xyexz + x2yexzz = xyexz(2 + xz)

Deriverer vi mhp. y som om x og z er konstanter, far vi tilsvarende

∂f

∂y= x2exz

Til slutt deriverer vi mhp. z som om x og y er konstanter:

∂f

∂z= x2yexzx = x3yexz

Gradienten i et generelt punkt er dermed

∇f(x, y, z) =(xyexz(2 + xz), x2exz, x3yexz

)

I vart punkt a = (1,−2, 0) far vi

∇f(1,−2, 0) =(1 · (−2) · e1·0 · (2 + 1 · 0), 12 · e1·0, 13 · (−2) · e1·0) =

= (−4, 1,−2)

Vi har na sett hvordan vi kan bruke vare vanlige derivasjonsregler til aregne ut partiellderiverte — vi bare deriverer som om de andre variablenevar konstanter. Neste post pa programmet er a vise hvordan vi kan regne utretningsderiverte ved hjelp av partiellderiverte.

La oss begynne med a se pa hva som skjer i to dimensjoner. Anta at viønsker a derivere f i punktet a = (a1, a2) i retningen r = (r1, r2). Dersom her en liten størrelse, vet vi at

f(a1 + hr1, a2 + hr2)− f(a1, a2) = f ′(a; r) · h (2.4.1)

Page 50: Flervariabel analyse med lineær algebra

94 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

nar vi ser bort fra en størrelse som er liten sammenlignet med h.Vi kan ogsa beregne differansen f(a1 + hr1, a2 + hr2) − f(a1, a2) pa en

annen mate. Istedenfor a ga direkte langs vektoren r velger vi a ga paralleltmed koordinataksene som vist pa figur 2.

!

"

3333334

!

"

! !!

Figur 3

(a1, a2) (a1 + hr1, a2)

(a1 + hr1, a2 + hr2)

Vi ser at

f(a1 + hr1, a2 + hr2)− f(a1, a2) =

=

økning parallelt med y-aksen︷ ︸︸ ︷f(a1 + hr1, a2 + hr2)− f(a1 + hr1, a2) +

+

økning parallelt med x-aksen︷ ︸︸ ︷f(a1 + hr1, a2)− f(a1, a2)

Ser vi bort fra feil som er sma sammenlignet med h, far vi videre

f(a1 + hr1, a2)− f(a1, a2) = ∂f∂x (a) · hr1

f(a1 + hr1, a2 + hr2)− f(a1 + hr1, a2) = ∂f∂y (a) · hr2

Dette betyr at

f(a1 + hr1, a2 + hr2)− f(a1, a2) =∂f

∂x(a)hr1 +

∂f

∂y(a)hr2 (2.4.2)

(fortsatt med en feil som er liten sammenlignet med h). Sammenligner vi deto uttrykkene (2.4.1) og (2.4.2) vi na har for f(a1+hr1, a2+hr2)−f(a1, a2),ser vi at

f ′(a; r) =∂f

∂x(a)r1 +

∂f

∂y(a)r2

Gjennomfører vi et tilsvarende argument i n variable, far vi formelen

f ′(a; r) =∂f

∂x1(a)r1 +

∂f

∂x2(a)r2 + . . . +

∂f

∂xn(a)rn

der r = (r1, r2, . . . , rn). Husker vi at gradienten til f er gitt ved

∇f(a) =( ∂f

∂x1(a),

∂f

∂x2(a), . . . ,

∂f

∂xn(a)

),

2.4. DERIVASJON AV SKALARFELT 95

kan vi skrive formelen ovenfor som et skalarprodukt

f ′(a; r) = ∇f(a) · r (2.4.3)

Denne formelen gir oss en effektiv mate a regne ut retningsderiverte pa;vi finner alle de partiellderiverte, setter dem sammen til en gradient, og tarskalarproduktet mellom gradienten og vektoren r. Beregningen som ledet ossfrem til (2.4.3), er imidlertid ingen streng utledning i matematisk forstand(vi har skrevet eksakt likhet = en rekke steder der vi bare hadde omtrentliglikhet), og det viser seg at det finnes funksjoner f som ikke oppfyller (2.4.3)til tross for at bade den retningsderiverte og de partiellderiverte eksisterer(et eksempel pa dette er funksjonen i eksempel 2 i seksjon 2.2, se oppgave 7).Disse funksjonene oppfører seg imidlertid sa merkelig at vi ønsker a utelukkedem fra teorien var. Vi skal derfor innføre et begrep deriverbar funksjon somfanger opp funksjoner med den oppførselen vi ønsker oss. Utgangspunktetfor definisjonen er at vi ønsker at ∇f(a) · r skal være en god tilnærming tilfunksjonsdifferansen f(a + r)− f(a) nar r er liten. Mer presist ønsker vi at“feilleddet”

σ(r) = f(a + r)− f(a)−∇f(a) · r

skal bli mindre og mindre sammenlignet med størrelsen til r, dvs. at

limr→0

σ(r)|r| = 0

Vi far altsa denne definisjonen:

Definisjon 2.4.4 Anta at f : A → R er definert pa en delmengde A av Rn

og at a er et indre punkt i A. Anta videre at alle de partiellderiverte til feksisterer i punktet a. Vi sier at f er deriverbar i a dersom funksjonen

σ(r) = f(a + r)− f(a)−∇f(a) · r

gar mot 0 hurtigere enn |r|, dvs.

limr→0

σ(r)|r| = 0

Kommentar: Man kan lure pa hvorfor vi ikke rett a slett sier at f erderiverbar i a dersom f ′(a; r) = ∇f(a) · r holder for alle r. Det viser segimidlertid at definisjonen ovenfor gir en glattere teori hvor delene passerbedre sammen. Det neste resultatet sier dessuten at vi far likheten f ′(a; r) =∇f(a) · r uansett.

Setning 2.4.5 Anta at f : A → R er derivebar i a. Da er f ′(a; r) = ∇f(a)·rfor alle r.

Page 51: Flervariabel analyse med lineær algebra

96 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Bevis: Vi har

f(a; r) = limh→0

f(a + hr)− f(a)h

= limh→0

∇f(a) · (hr) + σ(hr)h

=

= limh→0

(∇f(a) · r + |r|σ(hr)

h|r|

)= ∇f(a) · r

siden limh→0σ(hr)h|r| = 0. !

Vi tar med et eksempel pa hvordan formel (2.4.3) kan brukes til a be-regne retningsderiverte.

Eksempel 4: La oss anta at funksjonen

f(x, y, z) = x2y + e−yz

er deriverbar. Vi skal finne den retningsderiverte f ′(a; r) der a = (1, 1, 1) ogr = (1,−1, 1). La oss først finne gradienten til f :

∂f

∂x= 2xy;

∂f

∂y= x2 − ze−yz;

∂f

∂z= −ye−yz

Dette gir ∇f = (2xy, x2 − ze−yz,−ye−yz) og ∇f(a) = ∇f(1, 1, 1) =(2, 1− e−1,−e−1). Følgelig er

f ′(a; r) = ∇f(a) · r = (2, 1− e−1,−e−1) · (1,−1, 1) = 1

For a kunne bruke formel (2.4.3) trenger vi a vite at funksjonene vareer deriverbare. Det neste resultatet gir oss den informasjonen vi vanligvistrenger. Beviset er ganske langt og komplisert, og egner seg nok best forde ivrigste og flittigste. Et lite ord om terminologi: Vi sier at en funksjoner definert i en omegn om a dersom det finnes en kule B(a, ε) om a derfunksjonen er definert (den kan godt være definert pa et større omrade —poenget er at vi i hvert fall vil sikre oss at den er definert for alle punktertilstrekkelig nær a).

Teorem 2.4.6 La f : A → Rm være en funksjon av n variable. Anta atalle de partiellderiverte ∂f

∂xier definert i en omegn om a ∈ A, og at de er

kontinuerlige i a. Da er f deriverbar i a.

Bevis: For at ikke notasjonen skal bli for overveldende, skal vi nøye oss meda bevise setningen for en funksjon f(x1, x2) av to variable. Beviset er en littoppstrammet variant av det argumentet som ledet oss til formel (2.4.3).

2.4. DERIVASJON AV SKALARFELT 97

Vi velger r sa liten at a + r ligger innenfor den kulen der vi vet at departiellderiverte eksisterer. Vi lar a = (a1, a2), r = (r1, r2) og observerer at

f(a + r)− f(a) = f(a1 + r1, a2 + r2)− f(a1, a2)= f(a1 + r1, a2 + r2)− f(a1 + r1, a2) +

+f(a1 + r1, a2)− f(a1, a2)

Dette er samme type omskrivning som vi foretok da vi regnet oss frem til(2.4.3). Hvis vi tenker pa x → f(x, a2) som en funksjon av en variabel,forteller middelverdisetningen (se Kalkulus, seksjon 6.2) oss at det finnes etpunkt c mellom a1 og a1 + r1 slik at

f(a1 + r1, a2)− f(a1, a2) =∂f

∂x1(c, a2) r1

Helt tilsvarende kan vi finne et punkt d mellom a2 og a2 + r2 slik at

f(a1 + r1, a2 + r2)− f(a1 + r1, a2) =∂f

∂x2(a1 + r1, d) r2

Kombinerer vi de resultatene vi na har, ser vi at

f(a + r)− f(a) =∂f

∂x1(c, a2) r1 +

∂f

∂x2(a1 + r1, d) r2

Trekker vi fra ∇f(a) · r = ∂f∂x1

(a1, a2) r1 + ∂f∂x2

(a1, a2) r2 pa begge sider, farvi

f(a + r)− f(a)−∇f(a) · r =

=∂f

∂x1(c, a2) r1 +

∂f

∂x2(a1 + r1, d) r2 −

∂f

∂x1(a1, a2) r1 −

∂f

∂x2(a1, a2) r2 =

=(

∂f

∂x1(c, a2)−

∂f

∂x1(a1, a2)

)r1 +

(∂f

∂x2(a1 + r1, d)− ∂f

∂x2(a1, a2)

)r2

Sammenligner vi dette med definisjon 2.4.4, ser vi at

σ(r) =(

∂f

∂x1(c, a2)−

∂f

∂x1(a1, a2)

)r1 +

(∂f

∂x2(a1 + r1, d)− ∂f

∂x2(a1, a2)

)r2

Var oppgave er a vise at limr→01|r|σ(r) = 0. Siden |r1|, |r2| ≤ |r|, far vi

|σ(r)| ≤(∣∣∣∣

∂f

∂x1(c, a2)−

∂f

∂x1(a1, a2)

∣∣∣∣ +∣∣∣∣∂f

∂x2(a1 + r1, d)− ∂f

∂x2(a1, a2)

∣∣∣∣

)|r|

Deler vi pa pa |r|, ser vi at

|σ(r)||r| ≤

(∣∣∣∣∂f

∂x1(c, a2)−

∂f

∂x1(a1, a2)

∣∣∣∣ +∣∣∣∣∂f

∂x2(a1 + r1, d)− ∂f

∂x2(a1, a2)

∣∣∣∣

)

Page 52: Flervariabel analyse med lineær algebra

98 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Dette uttrykket gar mot 0 fordi de partiellderiverte er kontinuerlige i a =(a1, a2), og (c, a2) og (a + r1, d) nærmer seg (a1, a2) nar r → 0. Dermed erteoremet bevist. !

Sammen med setning 2.4.5 forteller setningen ovenfor oss at sa lenge departiellderiverte er kontinuerlige, kan vi trygt bruke formelen

f ′(a; r) = ∇f(a) · r.

Vi har allerede nevnt den geometriske tolkningen av gradienten — atgradienten i punktet a peker i den retningen hvor funksjonen vokser hurtigst,og at stigningstallet i denne retningen er lik lengden til gradienten. Vi harna de redskapene som trengs til a bevise dette.

Setning 2.4.7 Anta at f er deriverbar i a. Da peker gradienten ∇f(a) iden retningen hvor f vokser hurtigst i punktet a, og stigningstallet til f idenne retningen er |∇f(a)|.

Bevis: Hvis u er en enhetsvektor (dvs. |u| = 1), sa forteller den retningsde-riverte f ′(a;u) = ∇f(a) ·u oss hvor fort funksjonen vokser i den retningen upeker. Funksjonen f vokser derfor hurtigst i den retningen u hvor∇f(a)·u erstørst. Siden u er en enhetsvektor, forteller Schwarz’ ulikhet (setning 1.2.3)oss at

|∇f(a) · u| ≤ |∇f(a)| |u| = |∇f(a)|

med likhet bare hvis u og ∇f(a) er parallelle. Dette betyr at |∇f(a) · u|er størst nar u og ∇f(a) er parallelle. Na er det to enhetsvektorer som erparallelle med ∇f(a) — en som peker samme vei som ∇f(a), og en sompeker motsatt vei. Det er lett a se at ∇f(a) · u = |∇f(a)| nar u og ∇f(a)peker samme vei, og at ∇f(a) ·u = −|∇f(a)| nar u og ∇f(a) peker motsattvei. Altsa har f sitt største stigningstall |∇f(a)| i den retningen som ∇f(a)peker. !

Eksempel 5: I hvilken retning vokser funksjonen f(x, y) = x3y sin(πxy)hurtigst nar vi star i punktet (1, 1

2)?Vi ma først finne gradienten. De partiellderiverte er

∂f

∂x= 3x2y sin(πxy) + x3y cos(πxy)(πy) = 3x2y sin(πxy) + πx3y2 cos(πxy)

∂f

∂y= x3 sin(πxy) + x3y cos(πxy)(πx) = x3 sin(πxy) + πx4y cos(πxy)

Setter vi inn (x, y) = (1, 12), far vi

∂f

∂x

(1,

12

)= 3 · 12 · 1

2· sin(π · 1 · 1

2) + π · 13 ·

(12

)2

· cos(π · 1 · 12) =

32

2.4. DERIVASJON AV SKALARFELT 99

og∂f

∂y

(1,

12

)= 13 · sin(π · 1 · 1

2) + π · 14 · 1

2· cos(π · 1 · 1

2) = 1

Dermed er∇f

(1,

12

)=

(32, 1

)

Funksjonen vokser altsa raskest i retningen (32 , 1), og stigningstallet i denne

retningen er

|∇f

(1,

12

)| =

√(32

)2

+ 12 =√

94

+ 1 =12√

13

Vi tar med et litt mer teoretisk resultat som vi far bruk for siden. Forfunksjoner av en variabel vet vi at dersom den deriverte eksisterer i et punkt,sa er funksjonen kontinuerlig i punktet. For funksjoner av flere variable ersammenhengen litt mer subtil — det kan faktisk hende at alle de retnings-deriverte eksisterer i et punkt, men at funksjonen likevel ikke er kontinuerligi punktet (se oppgave 7). Er funksjonen deriverbar i betydningen vi innførtei definisjon 2.4.4, er vi imidlertid pa den sikre siden.

Setning 2.4.8 Anta at f : A → R er en funksjon av n variable. Dersom fer deriverbar i et punkt a ∈ A, sa er f kontinuerlig i a.

Bevis: Ifølge setning 2.3.5 er det nok a vise at limx→a f(x) = f(a). Setter vir = x− a, er dette det samme som a vise at limr→0 f(a + r) = f(a). Sidenf er deriverbar i a, vet vi at

f(a + r) = f(a) +∇f(a) · r + σ(r)

der σ(r)|r| → 0 nar r→ 0. Dette betyr spesielt at σ(r) → 0, og dermed er

limr→0

f(a + r) = limr→0

(f(a) +∇f(a) · r + σ(r)

)= f(a) + 0 + 0 = f(a)

!

Helt til slutt skal vi se pa eksempel som viser en typisk anvendelse avgradienter og partiellderiverte.

Eksempel 6: Anta at en tynn gass oppbevares i en beholder der vi kanjustere volumet V og temperaturen T . Det viser seg da at trykket P erproporsjonalt med temperaturen T og omvendt proporsjonalt med volumetV , dvs. P = k T

V der k er en konstant som blant annet avhenger av hvor mye

Page 53: Flervariabel analyse med lineær algebra

100 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

gass det er i beholderen (dette forutsetter egentlig at temperaturen males igrader Kelvin og ikke Celsius, men det behøver vi ikke bry oss om her). Vikan tenke pa trykket P som en funksjon av T og V :

P (T, V ) = kT

V

Partiellderiverer vi dette uttrykket, far vi

∂P

∂T= k

1V

og∂P

∂V= −k

T

V 2

Gradienten er dermed

∇P (T, V ) =(

k1V

,−kT

V 2

)

Det er ofte naturlig a spørre hvor mye trykket endrer seg dersom vi girtemperaturen et lite tillegg ∆T og volumet et lite tillegg ∆V . Det eksakteuttrykket for dette tillegget er selvfølgelig

∆P = P (T + ∆T, V + ∆V )− P (T, V ),

men denne differansen er tung a arbeide med. Vi vet imidlertid at den haren god tilnærming i skalarproduktet av gradienten∇P med tilvekstvektoren(∆T,∆V ):

∆P = P (T + ∆T, V + ∆V )− P (T, V ) ≈ ∇P (T, V ) · (∆T,∆V ) =

=∂P

∂T∆T +

∂P

∂V∆V = k

1V

∆T − kT

V 2∆V

Ved hjelp av denne formelen er det lett a ansla hvor mye trykket endrer segnar vi regulerer volumet og temperaturen.

La oss na anta at vi regulerer temperaturen og volumet kontinuerlig, ogat endringene ∆P , ∆T og ∆T har foregatt i løpet av et lite tidsintervall ∆t,Endringen per tidsenhet er da

∆P

∆t≈ k

1V

∆T

∆t− k

T

V 2

∆V

∆t

med bedre tilnærming dess mindre ∆t er. Lar vi ∆t → 0, far vi

P ′(t) = k1V

T ′(t)− kT

V 2V ′(t)

Ved hjelp av denne formelen kan vi regne ut hvor fort trykket endrer segdersom vi kjenner endringshastighetene til temperaturen og volumet. For-melen er en forsmak pa kjerneregelen for funksjoner av flere variable. Vi skalse nærmere pa denne regelen i seksjon 2.7. ♣

2.4. DERIVASJON AV SKALARFELT 101

Oppgaver til seksjon 2.4

1. Finn de partiellderiverte til f .

a) f(x, y) = x3y + 3xy4 e) f(x, y, z) = (x + y)e−z

b) f(x, y) = x2+x3

y f) f(x, y, z) = z2 tan x1+y2

c) f(x, y) = cos(x + y2) g) f(x, y, z) = z arctan(x + y)d) f(x, y) = x2 ln(xy2) h) f(x, y, z, u) = (z2 + u)e−x+3y

2. Finn gradienten til funksjonen:

a) f(x, y) = x2y

b) f(x, y, z) = x cos(xy2z)

c) f(u, v, w) = weu cos v

d) f(z1, z2, z3) = z3 arctan(z1z2) + ez3

3. Finn den retningsderiverte f ′(a; r):

a) f(x, y) = 3xy + y2; a = (1, 2); r = (3,−1)b) f(x, y) = ln(x + y2); a = (1, 0); r = (−1, 1)c) f(x, y, z) = x2y + z2; a = (1, 0, 1); r = (1, 1,−1)d) f(x, y, z) = z sin(xy); a = (π

2 , 1, 0); r = (2, 0,−1)

4. I hvilken retning vokser funksjonen hurtigst i det angitte punktet

a) f(x, y) = −x2y + 7y3, a = (4,−3)b) f(x, y, z) = (x2 − y2)ez; a = (1,−1, 3)c) f(x, y, z, u) = xuz2 − y2zu; a = (1, 0,−2, 3)

5. Volumet til en sylinder med radius r og høyde h er V = πr2h. Nar høyden ogradien varierer, kan vi tenke pa dette som en funksjon i to variable V (r, h) = πr2h.Forklar at nar radien endrer seg fra r til r + ∆r og høyden endrer seg fra h tilh + ∆h, sa er endringen i V tilnærmet gitt ved

∆V ≈ ∂V

∂r· ∆r +

∂V

∂h· ∆h = 2πrh ∆r + πr2∆h.

Anta at du har en sylinder hvor du vet at radien ligger mellom 2 m og 2.05 mog hvor høyden ligger mellom 5 m og 5.05 m. Bruk formelen ovenfor til a anslausikkerheten i volumet.

6. BMI (body mass index) er en indikator for undervekt og overvekt. For a finnedin BMI tar du vekten din (malt i kilo) og deler pa kvadratet av høyden din (malti meter). Du kan tenke pa BMI som en funksjon av to variable

f(v, h) =v

h2

a) Vis at dersom ∆v og ∆h er sma endringer i vekt og høyde, sa er endringen iBMI gitt ved

∆f(v, h) ≈ ∆v

h2− 2

v

h3∆h

Page 54: Flervariabel analyse med lineær algebra

102 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

b) En tommelfingerregel sier at for hver ekstra centimeter du har i høyde, kan du“tale” en ekstra kilo uten at BMI-en din endrer seg særlig. Bruk formelen i a) til aundersøke hvor godt dette passer for personer med forskjellig vekt og høyde.

7. Vi skal se mer pa funksjonen f : R2 → R fra eksempel 2 i seksjon 2.2. Husk atdenne funksjonen er gitt ved

f(x, y) =

x2yx4+y2 for (x, y) #= (0, 0)

0 for (x, y) = (0, 0)

a) Vis at ∂f∂x (0, 0) = 0 og ∂f

∂y (0, 0) = 0. Hva er ∇f(0, 0)?

b) Bruk definisjonen av retningsderivert til a vise at f(0; r) = r21

r2der r = (r1, r2),

r2 #= 0.

c) Vis at for denne funksjonen gjelder ikke likheten f(0; r) = ∇f(0) · r.

d) Vis at alle de retningsderiverte til f eksisterer i 0, men at funksjonen hverkener kontinuerlig eller deriverbar i punktet.

2.5 Partiellderiverte av høyere orden

Fra teorien for funksjoner av en variabel vet vi at det ofte er nyttig ellernødvendig a derivere mer enn en gang. Ogsa i flervariabel teori er det oftenyttig a arbeide med annenderiverte, tredjederiverte osv. Den store forskjel-len er at vi har sa mange flere mater a derivere pa.

Eksempel 1: La f(x, y) = x2y3 + y2. Vi har to partiellderiverte av førsteorden

∂f

∂x= 2xy3 og

∂f

∂y= 3x2y2 + 2y

Nar vi skal regne ut annenderiverte, har vi mange valg. Vi kan for eksempelderivere ∂f

∂x med hensyn pa x en gang til:

∂2f

∂x2=

∂x

(∂f

∂x

)=

∂x(2xy3) = 2y3.

Vi kan ogsa derivere ∂f∂x med hensyn pa y:

∂2f

∂y∂x=

∂y

(∂f

∂x

)=

∂y(2xy3) = 6xy2.

I tillegg kan vi derivere ∂f∂y med hensyn pa bade x og y:

∂2f

∂x∂y=

∂x

(∂f

∂y

)=

∂x(3x2y2 + 2y) = 6xy2

∂2f

∂y2=

∂y

(∂f

∂y

)=

∂y(3x2y2 + 2y) = 6x2y + 2

2.5. PARTIELLDERIVERTE AV HØYERE ORDEN 103

Vi har altsa fire annenordens partiellderiverte for denne funksjonen: ∂2f∂x2 ,

∂2f∂y∂x , ∂2f

∂x∂y og ∂2f∂y2 . ♣

Den generelle notasjonen skulle fremga av eksemplet ovenfor —

∂nf

∂xin . . . ∂xi2∂xi1

er den funksjonen vi far ved a derivere funksjonen f n ganger, først medhensyn pa variabelen xi1 , sa med hensyn pa variabelen xi2 osv.

I eksemplet ovenfor sa vi at de to “blandede” partiellderiverte ∂2f∂x∂y og

∂2f∂y∂x var like. Dette er ikke en universell regel; det finnes funksjoner f slik

at ∂2f∂x∂y og ∂2f

∂y∂x er forskjellige, men for de fleste vi støter pa i praksis, vilde blandede partiellderiverte være like. Den neste setningen viser at dettegjelder dersom de annenordens partiellderiverte eksisterer i en omegn rundtpunktet a og er kontinuerlige i a. Beviset er krevende og minner om bevisetfor teorem 2.4.6. I oppgave 4 finner du et eksempel pa en funksjon der deblandede partiellderiverte ikke er like.

Setning 2.5.1 La f(x1, . . . , xn) være en funksjon av n variable. Anta at∂2f

∂xi∂xjog ∂2f

∂xj∂xieksisterer i en omegn om punktet a og er kontinuerlige i a.

Da er ∂2f∂xi∂xj

(a) = ∂2f∂xj∂xi

(a).

Bevis: For a forenkle notasjonen antar vi at f(x, y) er en funksjon av tovariable, og at ∂2f

∂x∂y og ∂2f∂y∂x eksisterer i en omegn om punktet (a, b) og er

kontinuerlige i (a, b). Anta at tallene h, k er sa sma at hele rektangelet i figur1 ligger i det omradet der de blandede partiellderiverte eksisterer.

Figur 1

(a, b) (a + h, b)

(a + h, b + k)(a, b + k)

3

3

3

3–

+

+

La∆(h, k) = f(a + h, b + k)− f(a, b + k)− f(a + h, b) + f(a, b)

der vi har kombinert funksjonsverdiene i hjørnene pa rektanglet vart ved abruke fortegnene vist pa figuren. Vi skal vise at grenseverdien

lim(h,k)→(0,0)

∆(h, k)h · k

Page 55: Flervariabel analyse med lineær algebra

104 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

er lik bade ∂2f∂x∂y (a, b) og ∂2f

∂y∂x(a, b).Først skritt er a bruke middelverdisetningen pa funksjonen

g(x) = f(x, b + k)− f(x, b).

Vi farg(a + h)− g(a) = g′(c) · h

for en c mellom a og a + h. Setter vi inn den opprinnelige funksjonen, ser viat

f(a + h, b + k)− f(a + h, b)− f(a, b + k) + f(a, b) =

=[∂f

∂x(c, b + k)− ∂f

∂x(c, b)

]h

Dette kan ogsa skrives

∆(h, k) =[∂f

∂x(c, b + k)− ∂f

∂x(c, b)

]h

Neste steg er a bruke middelverdisetningen pa funksjonen

G(y) =∂f

∂x(c, y).

Vi farG(b + k)−G(b) = G′(d) · k

for en d mellom b og b + k. Dette kan ogsa skrives

∂f

∂x(c, b + k)− ∂f

∂x(c, b) =

∂2f

∂y∂x(c, d) · k

Kombinerer vi formlene vare, ser vi at

∆(h, k) =∂2f

∂y∂x(c, d) · hk

Siden ∂2f∂y∂x er kontinuerlig i (a, b), vil ∂2f

∂y∂x(c, d) → ∂2f∂y∂x(a, b) nar (h, k) → 0.

Følgelig er

lim(h,k)→(0,0)

∆(h, k)hk

=∂2f

∂y∂x(a, b)

For a vise at ogsa lim(h,k)→(0,0)

∆(h,k)hk = ∂2f

∂x∂y (a, b), bytter vi om pa rollene til

variablene x og y i argumentet ovenfor. Vi starter med a bruke middelverdi-setningen pa funksjonen

γ(y) = f(a + h, y)− f(a, y)

2.5. PARTIELLDERIVERTE AV HØYERE ORDEN 105

og fortsetter pa akkurat samme mate som ovenfor. Detaljene overlates tilleserne. !

At blandede partiellderiverte av annen orden er like, medfører ogsa atblandede partiellderiverte av høyere orden er like dersom de inneholder likemange derivasjoner med hensyn pa hver variabel. Dersom f har kontinuerligefjerdederiverte, kan vi for eksempel vise at

∂4f

∂x∂y∂z∂x=

∂4f

∂z∂y∂x∂x

pa følgende mate:

∂4f

∂x∂y∂z∂x=

∂4f

∂x∂z∂y∂x=

∂4f

∂z∂x∂y∂x=

∂4f

∂z∂y∂x∂x

Overbevis deg selv om at du kan begrunne disse overgangene.

Oppgaver til seksjon 2.5

1. Regn ut de annenordens partiellderiverte til funksjonene:

a) f(x, y) = 3x2y + 2y2xb) f(x, y) = x sin yc) f(x, y) = x2ex−y

d) f(x, y, z) = x2z − y2z2

2. Regn ut de partiellderiverte:

a) ∂3f∂x∂z∂x nar f(x, y, z) = x2yexz.

b) ∂4f∂y∂z∂x∂z nar f(x, y, z) = x2y3 cos xyz.

3. Gjennomfør den siste delen av beviset for setning 2.5.1 (dvs. at lim(h,k)→(0,0)

∆(h,k)hk =

∂2f∂x∂y (a, b)).

4. I denne oppgaven skal vi se pa en funksjon f : R2 → R slik at ∂2f∂x∂y (0, 0) #=

∂2f∂y∂x (0, 0). Funksjonen er gitt ved

f(x, y) =

x3y−xy3

x2+y2 nar (x, y) #= (0, 0)

0 nar (x, y) = (0, 0)

a) Vis at f(x, 0) = 0 for alle x og at f(0, y) = 0 for alle y. Bruk dette til a vise at∂f∂x (0, 0) = 0 og ∂f

∂y (0, 0) = 0.

b) Vis at for (x, y) #= (0, 0) er

Page 56: Flervariabel analyse med lineær algebra

106 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

∂f

∂x(x, y) =

y(x4 + 4x2y2 − y4)(x2 + y2)2

∂f

∂y(x, y) = −x(y4 + 4x2y2 − x4)

(x2 + y2)2

c) Vis at ∂2f∂y∂x (0, 0) = −1 ved a bruke

∂2f

∂y∂x(0, 0) = lim

h→0

∂f∂x (0, h)− ∂f

∂x (0, 0)h

Vis pa tilsvarende mate at ∂2f∂x∂y (0, 0) = 1.

2.6 Derivasjon av vektorvaluerte funksjoner

Hittil har vi sett pa derivasjon av funksjoner som tar verdier i R. Vi skalna utvide teorien var til ogsa a omfatte funksjoner som tar verdier i Rm derm er større enn 1, altsa til vektorvaluerte funksjoner. Husk at en funksjonF : Rn → Rm kan skrives pa komponentform

F(x) =

F1(x)F2(x)

...Fm(x)

der F1, F2, . . . , Fm er funksjoner med verdier i R (i denne seksjonen er detlurt a tenke pa de fleste vektorer som søylevektorer siden vi skal multipliseredem med matriser). Dersom alle disse funksjonen lar seg derivere, kan visamle alle de partiellderiverte i en stor matrise, den sakalte Jacobi-matrisentil F:

F′(a) =

∂F1∂x1

(a) ∂F1∂x2

(a) · · · ∂F1∂xn

(a)

∂F2∂x1

(a) ∂F2∂x2

(a) · · · ∂F2∂xn

(a)

...... · · ·

...

∂Fm∂x1

(a) ∂Fm∂x2

(a) · · · ∂Fm∂xn

(a)

Legg merke til hvordan denne matrisen er bygget opp: I første linje har vi allepartiellderiverte av førstekomponent F1, i annen linje alle partiellderiverteav annenkomponent F2 osv. Sagt pa en annen mate: Første linje i Jacobi-matrisen er gradienten til F1, andre linje er gradienten til F2 osv. Dersom Fer et skalarfelt (og altsa tar verdier i R), har Jacobi-matrisen bare en linjeog er identisk med gradienten ∇F.

2.6. DERIVASJON AV VEKTORVALUERTE FUNKSJONER 107

Jacobi-matrisen spiller pa mange mater den samme rollen for funksjonerav flere variable som den deriverte gjør for funksjoner av en variabel, og vihar derfor valgt en notasjon F′(a) som ligner pa den notasjonen vi er vanttil.

Hvis man først har lært seg a partiellderivere, er det ingen kunst (menen del arbeid!) a finne en Jacobi-matrise.

Eksempel 1: Finn Jacobi-matrisen til funksjonen

F(x, y) =

xy3

ex+y2

3x2y

I dette tilfellet er

F1(x, y) = xy3, F2(x, y) = ex+y2og F3(x, y) = 3x2y

Vi partiellderiverer og far

∂F1

∂x= y3 og

∂F1

∂y= 3xy2

∂F2

∂x= ex+y2

og∂F2

∂y= 2yex+y2

∂F3

∂x= 6xy og

∂F3

∂y= 3x2

Jacobi-matrisen blir dermed

F′(x, y) =

y3 3xy2

ex+y2 2yex+y2

6xy 3x2

Vi skal na forsøke a finne ut hvordan vi bør definere deriverbarhet for vek-torvaluerte funksjoner F. La oss ga tilbake til den generelle Jacobi-matrisen

F′(a) =

∂F1∂x1

(a) ∂F1∂x2

(a) · · · ∂F1∂xn

(a)

∂F2∂x1

(a) ∂F2∂x2

(a) · · · ∂F2∂xn

(a)

...... · · ·

...

∂Fm∂x1

(a) ∂Fm∂x2

(a) · · · ∂Fm∂xn

(a)

Page 57: Flervariabel analyse med lineær algebra

108 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Ganger vi denne med en søylevektor

r =

r1

r2...

rn

far vi

F′(a)r =

∂F1∂x1

(a) ∂F1∂x2

(a) · · · ∂F1∂xn

(a)

∂F2∂x1

(a) ∂F2∂x2

(a) · · · ∂F2∂xn

(a)

...... · · ·

...

∂Fm∂x1

(a) ∂Fm∂x2

(a) · · · ∂Fm∂xn

(a)

r1

r2

...

rn

=

∇F1(a) · r

∇F2(a) · r

...

∇Fm(a) · r

der vi har brukt at første rad i F′(a) er gradienten til F1, andre rad ergradienten til F2 osv. Dersom F1, F2, . . . , Fn er deriverbare funksjoner, er

∇F1(a) · r ≈ F1(a + r)− F1(a)

∇F2(a) · r ≈ F2(a + r)− F2(a)...

......

...

∇Fm(a) · r ≈ Fm(a + r)− Fm(a)

med bedre tilnærming dess mindre r er. Altsa er

F′(a)r ≈

F1(a + r)− F1(a)F2(a + r)− F2(a)

...Fm(a + r)− Fm(a)

= F(a + r)− F(a)

Dette gir oss en indikasjon pa hvordan vi skal definere deriverbarhet forvektorvaluerte funksjoner — vi ønsker at avviket i tilnærmingen

F(a + r)− F(a) ≈ F′(a)r

skal være lite sammenlignet med størrelsen til r:

Definisjon 2.6.1 Anta at F : A → Rm er en funksjon av n variable og ata er et indre punkt i A. Vi sier at F er deriverbar i a dersom funksjonen

σ(r) = F(a + r)− F(a)− F′(a)r

gar mot null fortere enn |r|, dvs. at

limr→0

1|r|σ(r) = 0

(legg merke til at σ na er en vektorvaluert funksjon med verdier i Rm).

2.6. DERIVASJON AV VEKTORVALUERTE FUNKSJONER 109

Mange vil kanskje frykte at vi na ma begynne helt forfra med a utvikleen teori for deriverbarhet akkurat som vi gjorde for skalarfelt i seksjon 2.4,men takket være den neste setningen er det unødvendig.

Setning 2.6.2 En funksjon F : A → Rm er deriverbar i et indre punkta ∈ A hvis og bare hvis hver komponent Fi er deriverbar i a.

Bevis: Vi har

σ(r) = F(a + r)− F(a)− F′(a)r =

=

F1(a + r)− F1(a)−∇F1(a) · rF2(a + r)− F2(a)−∇F2(a) · r

...Fm(a + r)− Fm(a)−∇Fm(a) · r

=

σ1(r)σ2(r)

...σm(r)

Dermed er

1|r|σ(r) =

σ1(r)|r|

σ2(r)|r|...

σm(r)|r|

og vi vet fra setning 2.3.3 at 1|r|σ(r) → 0 hvis og bare hvis σi(r)

|r| → 0 foralle i. Dette betyr at F er deriverbar hvis og bare hvis hver Fi er deriverbar. !

Kombinerer vi dette resultatet med setning 2.4.6, far vi:

Korollar 2.6.3 Anta at F : A → Rm er en funksjon av n variable og at aer et indre punkt i A. Dersom alle komponentene ∂Fi

∂xji Jacobi-matrisen er

definert i en omegn rundt a og er kontinuerlige i a, sa er F deriverbar i a.

Bevis: Ifølge setning 2.4.6 er hver av komponentene Fi til F deriverbar i a,og ifølge setningen ovenfor er da F deriverbar i a. !

Eksempel 2: Vis at funksjonen

F(x, y) =

xy3

ex+y2

3x2y

fra eksempel 1 er deriverbar.Vi har allerede regnet ut Jacobi-matrisen til F, og komponentene er

apenbart kontinuerlige overalt. Altsa er F deriverbar ifølge korollaret. !

Page 58: Flervariabel analyse med lineær algebra

110 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Den neste setningen kan se litt underlig ut, men vi kommer til a ha storglede av den. Setningen sier at ingen annen matrise B kan “stjele jobben”til Jacobi-matrisen F′(a) — dersom B tilfredsstiller en betingelse av sammetype som F′(a) oppfyller i definisjon 2.6.1, sa ma B være lik F′(a). Det finnesogsa andre tolkninger av setningen som vi skal komme tilbake til senere.

Setning 2.6.4 La F : A → Rm være en funksjon av n variable og la a væreet indre punkt i A. Anta at det finnes en m×n-matrise B slik at funksjonen

σ(r) = F(a + r)− F(a)−Br

tilfredsstiller

limr→0

1|r| σ(r) = 0.

Da er F deriverbar i a ogF′(a) = B

Bevis: Vi velger r = rei der

ei =

0...1...0

er den i-te enhetsvektoren og der r ∈ R. Da er

F(a + rei)− F(a) = B(rei) + σ(rei)

Deler vi pa r og bruker at |rei| = r, far vi

F(a + rei)− F(a)r

= Bei +σ(rei)|rei|

Nar r → 0, vil det siste leddet pa høyre side ga mot 0 ifølge antagelsen, sahøyresiden gar mot

Bei =

b1i

b2i...

bmi

Da ma venstresiden konvergere mot det samme, og vi far

2.7. KJERNEREGELEN 111

limr→0

F(a + rei)− F(a)r

=

limr→0F1(a+rei)−F1(a)

r

limr→0F2(a+rei)−F2(a)

r

...

limr→0Fm(a+rei)−Fm(a)

r

=

b1i

b2i

...

bmi

Ved definisjonen av partiellderiverte betyr dette at ∂F1∂xi

= b1i, ∂F2∂xi

= b2i og savidere. Altsa eksisterer alle de partiellderiverte og F′(a) = B. Deriverbarhetfølger na av at limr→0

1|r| σ(r) = 0. !

Oppgaver til seksjon 2.6

1. Finn Jacobi-matrisen til funksjonen.

a) F(x, y) = (x2y, x + y2).

b) F(x, y, z) = (ex2y+z, xyz2).

c) F(x, y) = (x arctan(xy), x ln y, xy cos y2).

d) F(x, y, z, u) = (xy sin(xu2), z2u).

2.7 Kjerneregelen

For funksjoner av en variabel sier kjerneregelen at den deriverte til densammensatte funksjonen h(x) = f(g(x)) er gitt ved h′(x) = f ′(g(x))g′(x).Kjerneregelen for funksjoner av flere variable har akkurat samme form; der-som H er den sammensatte funksjonen H(x) = F(G(x)), sa er

H′(x) = F′(G(x))G′(x) (2.7.1)

Selv om formen er den samme, er innholdet mer komplisert — uttrykkeneH′(x), F′(G(x)) og G′(x) er na matriser, og formelen sier at Jacobi-matrisentil H i punktet x er lik matriseproduktet av Jacobi-matrisen til F i punktetG(x) og Jacobi-matrisen til G i punktet x.

Formel (2.7.1) uttrykker kjerneregelen i en kortfattet form som er letta huske, men som ikke er sa praktisk a bruke i utregninger. Vi skal derfornærme oss kjerneregelen fra en litt annen synsvinkel og heller komme tilbaketil matriseformuleringen i (2.7.1) etter hvert. Vi tenker oss at vi har enfunksjon (et skalarfelt) f(u1, u2, . . . , um) av m variable. For hver variabel ui

Page 59: Flervariabel analyse med lineær algebra

112 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

substituerer vi en funksjon gi(x1, x2, . . . , xn) slik at vi far en sammensattfunksjon

h(x1, x2, . . . , xn) = f(g1(x1, x2, . . . , xn), g2(x1, x2, . . . , xn), . . . , gm(x1, x2 . . . , xn)

)

av n variable. Spørsmalet er: dersom vi kjenner alle de partiellderiverte til deopprinnelige funksjonene f , g1, g2,. . . , gm, kan vi da finne de partiellderivertetil den sammensatte funksjonen h? Svaret er ja, men før vi skriver oppformelen som viser oss hvordan vi kan regne ut de partiellderiverte til h, erdet lurt a komprimere notasjonen litt slik at vi slipper a arbeide med altforlange uttrykk. Dersom vi bruker vektornotasjon og skriver

u = (u1, u2, . . . , um)

x = (x1, x2, . . . , xn)

og

g(x) = ((g1(x1, x2, . . . , xn), g2(x1, x2, . . . , xn), . . . , gm(x1, x2 . . . , xn)),

kan definisjonen av h skrives

h(x) = f(g(x))

Dersom g er deriverbar i punktet x og f er deriverbar i punktet u = g(x),viser det seg at de partiellderiverte til h er gitt ved

∂h

∂xi(x) =

∂f

∂u1(u)

∂g1

∂xi(x) +

∂f

∂u2(u)

∂g2

∂xi(x) + . . . +

∂f

∂um(u)

∂gm

∂xi(x) (2.7.2)

Denne formelen kaller vi kjerneregelen pa komponentform, mens (2.7.1) kal-les kjerneregelen pa matriseform — vi skal senere se at selv om formen erforskjellig, sa uttrykker de to formlene det samme.

Legg merke til at vi i (2.7.2) evaluerer de partiellderiverte til f i punktetu = g(x); det betyr at etter at vi har regnet ut de partiellderiverte til f ,ma vi erstatte u1 med g1(x1, . . . , xn), u2 med g2(x1, . . . , xn) osv. Legg ogsamerke til at det er et system i hvilke derivasjoner vi gjør i formel (2.7.2); videriverer med hensyn pa alle “mellomvariablene” u1, u2, . . . , um, men baremed hensyn pa en av “grunnvariablene” x1, x2, . . . , xn, nemlig den xi-en sominngar i den opprinnelige derivasjonen av h.

Ting blir klarere hvis vi ser pa et eksempel:

Eksempel 1: Vi skal se pa tilfellet der

f(u1, u2) = 2u1u22

ogg1(x1, x2, x3) = x1x2 sin x3

2.7. KJERNEREGELEN 113

g2(x1, x2, x3) = 3x21x2x3

Vi finner den sammensatte funksjonen h = f(g(x)) ved a substituere u1 =g1(x1, x2, x3) = x1x2 sinx3 og u2 = g2(x1, x2, x3) = 3x2

1x2x3 inn i uttrykketfor f :

h(x1, x2, x3) = f(u1, u2) = 2u1u22 =

= 2(x1x2 sinx3)(3x21x2x3)2 = 18x5

1x32x

23 sinx3

Vi kan selvfølgelig finne de partiellderiverte til h ved a derivere dette ut-trykket pa vanlig mate, men la oss se hvordan vi kan bruke kjerneregelenisteden. Ifølge (2.7.2) er

∂h

∂x1(x) =

∂f

∂u1(u)

∂g1

∂x1(x) +

∂f

∂u2(u)

∂g2

∂x1(x)

Regner vi ut de partiellderiverte til f , g1 og g2 og setter inn i dette uttrykket,far vi

∂h

∂x1(x) =

(2u2

2

)(x2 sinx3) + (4u1u2) (6x1x2x3)

Helt til slutt setter vi inn uttrykkene u1 = g1(x1, x2, x3) = x1x2 sinx3 ogu2 = g2(x1, x2, x3) = 3x2

1x2x3:

∂h

∂x1(x) =

(2(3x2

1x2x3)2)(x2 sinx3)+

(4(x1x2 sinx3)(3x2

1x2x3))(6x1x2x3) =

= 18x41x

32x

23 sinx3 + 72x4

1x32x

23 sin x3 = 90x4

1x32x

23 sinx3

Det er god trening i a finne ∂h∂x2

(x) og ∂h∂x3

(x) pa tilsvarende mate. ♣

Bemerkning: Hvis du ser nøyere pa eksemplet ovenfor, vil du oppdage atvi har regnet ut ∂h

∂x1(x) pa en svært tungvinn mate — det gar mye raske-

re a bare derivere uttrykket h(x1, x2, x3) = 18x51x

32x

23 sinx3 pa vanlig mate!

Dette er ganske typisk; kjerneregelen i flere variable er faktisk ikke en særligeffektiv metode for a regne ut partiellderiverte til funksjoner gitt ved formler— regelens styrke ligger isteden i at den er et utmerket redskap til a utledegenerelle sammenhenger mellom varierende størrelser. Før vi ser nærmerepa dette, kan det være lurt a ta med enda et konkret eksempel slik at vi blirlitt bedre kjent med kjerneregelen.

Eksempel 2: I eksemplet ovenfor het de variable u1, u2 og x1, x2, x3 akkuratsom i var generelle formel (2.7.2). Nar man bruker kjerneregelen i andre fag,har de variable vanligvis helt andre navn, og det er viktig at vi da greier akjenne igjen de forskjellige delene av kjerneregelen. La oss na tenke oss atvi har en funksjon

f(s, t) = est2

Page 60: Flervariabel analyse med lineær algebra

114 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

og at s og t er funksjoner av underliggende variable u og v

s = S(u, v) = 3uv3 og t = T (u, v) = cos(uv)

Vi vil bruke kjerneregelen til a finne de partiellderiverte til den sammensattefunksjonen

h(u, v) = f(S(u, v), T (u, v))

I dette tilfellet sier formel (2.7.2)

∂h

∂u(u, v) =

∂f

∂s(s, t)

∂S

∂u(u, v) +

∂f

∂t(s, t)

∂T

∂u(u, v)

og∂h

∂v(u, v) =

∂f

∂s(s, t)

∂S

∂v(u, v) +

∂f

∂t(s, t)

∂T

∂v(u, v)

(husk at vi skal derivere med hensyn pa begge “mellomvariablene” s ogt, men bare med hensyn pa den “opprinnelige” grunnvariablen’ u eller v).Regner vi ut de partiellderiverte og setter inn s = S(u, v) = 3uv3 og t =T (u, v) = cos(uv), far vi

∂h

∂u(u, v) = est23v3 + 2est(− sin(uv)v) =

= e3uv3(cos(uv))23v3 − 2e3uv3

cos(uv) sin(uv)v =

= ve3uv3cos(uv)

(3v2 cos(uv)− 2 sin(uv)

)

Den andre partiellderiverte ∂h∂v (u, v) finner vi pa tilsvarende mate. !

Vi skal ta med et par eksempler pa hvordan kjerneregelen brukes i andrefag. Før vi gjør det, kan det være greit med noen ord om notasjon. Nar vibruker kjerneregelen i praktiske situasjoner, blir uttrykkene ofte lange oguoversiktlige. For a lette lesbarheten er det vanlig a utelate punktene somfunksjonene evalueres i — man skriver altsa

∂h

∂xi=

∂f

∂u1

∂g1

∂xi+

∂f

∂u2

∂g2

∂xi+ · · · + ∂f

∂um

∂gm

∂xi

istedenfor

∂h

∂xi(x) =

∂f

∂u1(u)

∂g1

∂xi(x) +

∂f

∂u2(u)

∂g2

∂xi(x) + . . . +

∂f

∂um(u)

∂gm

∂xi(x)

og setter først inn verdiene til x og u nar man har behov for dem.

2.7. KJERNEREGELEN 115

Eksempel 3: I økonomi er utbyttet til et firma avhengig av forskjelligefaktorer. For en bonde kan vi tenke oss at utbyttet er avhengig av tre fak-torer: arbeidsinnsatsen a, den løpende kapitalinvesteringen k, og arealet avdyrkbar mark m. Utbyttet U er dermed en funksjon

U = F (a, k, m)

Vi tenker oss at de tre faktorene varierer med tiden: a = A(t), k = K(t) ogm = M(t). Kjerneregelen forteller oss na hvordan utbyttet U varierer medtiden:

∂U

∂t=

∂F

∂a

∂A

∂t+

∂F

∂k

∂K

∂t+

∂F

∂m

∂M

∂t

der vi ma huske at vi skal evaluere de partiellderiverte ∂F∂a , ∂F

∂k , ∂F∂m i punktet

(A(t),K(t),M(t)). Legg merke til at i denne formelen er U , A, K og Mbare avhengige av en variabel t, og vi kan derfor skrive vanlige deriverteistedenfor partiellderiverte:

U ′(t) =∂F

∂aA′(t) +

∂F

∂kK ′(t) +

∂F

∂mM ′(t)

I økonomiske modeller antar man ofte at utbyttefunksjonen F er enCobb-Douglasfunksjon, dvs. at den har formen

F (a, k, m) = Caαkβmγ

der C, α, β og γ er positive konstanter. Deriverer vi dette uttrykket, far vi

∂F

∂a= Cαaα−1kβmγ ,

∂F

∂k= Cβaαkβ−1mγ ,

∂F

∂m= Cγaαkβmγ−1

som innsatt i uttrykket ovenfor gir (etter litt opprydning):

U ′(t) = CA(t)αK(t)βM(t)γ

A′(t)A(t)

+ βK ′(t)K(t)

+ γM ′(t)M(t)

)

I en økonomisk situasjon med begrensede ressurser vil man ofte overveie astyrke noen innsatsomrader pa bekostning av andre. Bonden var kan f.eks.overveie a utvide det dyrkede arealet m ved a kjøpe tilleggsjord, men er datvunget til a redusere kapitalinvesteringen k. Om slike omprioriteringer erlønnsomme eller ikke, viser seg i fortegnet til den deriverte U ′(t) av utbytte-funksjonen. Ifølge formelen ovenfor er dette fortegnet bestemt av fortegnettil uttrykket

αA′(t)A(t)

+ βK ′(t)K(t)

+ γM ′(t)M(t)

(CA(t)αK(t)βM(t)γ er alltid positiv). Fortegnet til den deriverte av utbytte-funksjonen er altsa bestemt av en kombinasjon av de relative veksthastighe-tene A′(t)

A(t) , K′(t)K(t) og M ′(t)

M(t) og Cobb-Douglaseksponentene α, β og γ. For en

Page 61: Flervariabel analyse med lineær algebra

116 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

økonom med trening i a tolke Cobb-Douglaseksponenter gir et slikt uttrykkøkonomisk mening. !

Eksempel 4: Nar en gass oppbevares i en beholder, er trykket P en funksjonav temperaturen T og volumet V ; vi har altsa

P = f(T, V )

Hvilken funksjon f det er naturlig a bruke, avhenger bade av hvilken gassvi ser pa, og av hvor stor nøyaktighet vi ønsker. Foreløpig lar vi f væreuspesifisert slik at regningene vare gjelder for alle modeller. Dersom volumetog temperaturen varierer med tiden t, vil ogsa trykket variere med tiden

P (t) = f(T (t), V (t))

Vi kan finne den deriverte av denne funksjonen ved a bruke kjerneregelen(husk at P (t), T (t) og V (t) bare avhenger av en variabel t slik at vi kanbruke vanlige deriverte P ′(t), T ′(t) og V ′(t) istedenfor partiellderiverte ∂P

∂t ,∂T∂t og ∂V

∂t ):

P ′(t) =∂f

∂TT ′(t) +

∂f

∂VV ′(t)

Dersom gassen er tynn og kreftene mellom gasspartiklene er svake (fysi-kerne kaller dette en ideell gass), kan man anta at trykket P er proporsjo-nalt med temperaturen T og omvendt proporsjonalt med volumet V , dvs.P = k T

V der k er en konstant som blant annet avhenger av hvor mye gassdet er i beholderen. Vi har altsa

P = f(T, V ) = kT

V

I dette tilfellet er∂f

∂T= k

1V

og∂f

∂V= −k

T

V 2

Setter vi dette inn i formelen for P ′(t), far vi

P ′(t) = k1V

T ′(t)− kT

V 2V ′(t)

Vi har tidligere regnet oss frem til denne formelen pa en litt annen mate (seeksempel 6 i seksjon 2.4).

Regning med partiellderiverte og kjerneregelen star sentralt i termo-dynamikken, og utregningene ovenfor er bare et enkelt eksempel. ♣

Vi begynte denne seksjonen med a skrive opp kjerneregelen pa matrise-form:

H′(x) = F′(G(x))G′(x),

2.7. KJERNEREGELEN 117

men siden har vi bare arbeidet med regelen pa komponentform:

∂h

∂xi(x) =

∂f

∂u1(u)

∂g1

∂xi(x) +

∂f

∂u2(u)

∂g2

∂xi(x) + . . . +

∂f

∂um(u)

∂gm

∂xi(x)

La oss na se litt pa sammenhengen mellom de to formene.Nar vi arbeider med kjerneregelen pa matriseform, tenker vi oss at vi

starter med to funksjoner G : Rn → Rm, F : Rm → Rk og at vi danner densammensatte funksjonen H : Rn → Rk ved H(x) = F(G(x)) som vist pafiguren.

/

0

1

2Rn

/

0

1

2

/

0

1

2Rm Rk

3(A

H

GF3 3

u = G(x)Ax H(x) = F(u)

= F(G(x))

Skriver vi ut komponentene til H′(x), F′(G(x)), og G′(x), far kjerne-regelen H′(x) = F′(G(x))G′(x) denne formen:

∂H1∂x1

(x) ∂H1∂x2

(x) · · · ∂H1∂xn

(x)

∂H2∂x1

(x) ∂H2∂x2

(x) · · · ∂H2∂xn

(x)

...... · · ·

...

∂Hk∂x1

(x) ∂Hk∂x2

(x) · · · ∂Hk∂xn

(x)

=

=

∂F1∂u1

(G(x)) ∂F1∂u2

(G(x)) · · · ∂F1∂um

(G(x))

∂F2∂u1

(G(x)) ∂F2∂u2

(G(x)) · · · ∂F2∂um

(G(x))

...... · · ·

...

∂Fk∂u1

(G(x)) ∂Fk∂u2

(G(x)) · · · ∂Fk∂um

(G(x))

∂G1∂x1

(x) ∂G1∂x2

(x) · · · ∂G1∂xn

(x)

∂G2∂x1

(x) ∂G2∂x2

(x) · · · ∂G2∂xn

(x)

...... · · ·

...

∂Gm∂x1

(x) ∂Gm∂x2

(x) · · · ∂Gm∂xn

(x)

Den ij-te komponenten i den første matrisen er ∂Hi∂xj

(x). Denne kompo-nenten ma være skalarproduktet av den i-te linjen i den andre matrisen ogden j-te søylen i den tredje matrisen, altsa:

∂Hi

∂xj(x) =

∂Fi

∂u1(G(x))

∂G1

∂xj(x)+

∂Fi

∂u2(G(x))

∂G2

∂xj(x)+· · ·+ ∂Fi

∂um(G(x))

∂Gm

∂xj(x)

Page 62: Flervariabel analyse med lineær algebra

118 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Dette er ikke noe annet enn kjerneregelen pa komponentform anvendt pafunksjonen Hi(x) = Fi(G(x)). Vi har dermed vist at kjerneregelen pa kom-ponentform rett og slett er det vi far nar vi ganger ut matriseproduktet iformelen H′(x) = F′(G(x))G′(x) og sjekker hva som skjer med hver enkeltkomponent. Nar vi na skal bevise kjerneregelen, holder det derfor a beviseden pa matriseform.

Teorem 2.7.1 (Kjerneregelen pa matriseform) Anta at vi har to meng-der A ⊂ Rn, B ⊂ Rm og to funksjoner G : A → B, F : B → Rk. DersomG er deriverbar i punktet a ∈ A, og F er deriverbar i punktet b = G(a), saer den sammensatte funksjonen H(x) = F(G(x)) deriverbar i a, og Jacobi-matrisen til H er gitt ved

H′(a) = F′(G(a))G′(a)

Bevis: Dette beviset er ikke sa vanskelig nar man har forstatt ideen, men deter langt og litt kronglete. Ideen er a bruke setning 2.6.4 med F′(G(a))G′(a)i rollen som matrisen B. Alt vi da behøver a vise, er at funksjonen

σ(r) = H(a + r)−H(a)− (F′(G(a))G′(a))r (2.7.3)

tilfredsstiller kravetlimr→0

1|r| σ(r) = 0 (2.7.4)

For a vise dette, ma vi bruke at G og F er deriverbare. Siden G er deriverbari a, vet vi at funksjonen

σ1(r) = G(a + r)−G(a)−G′(a)r (2.7.5)

tilfredsstiller kravetlimr→0

1|r|σ1(r) = 0 (2.7.6)

Siden F er deriverbar i b = G(a), vet vi tilsvarende at funksjonen

σ2(s) = F(b + s)− F(b)− F′(b)s = (2.7.7)

= F(G(a) + s)− F(G(a))− F′(G(a))s

tilfredsstiller kravetlims→0

1|s|σ2(s) = 0 (2.7.8)

Vi setter s = G(a + r) −G(a). Da er G(a + r) = G(a) + s, og fra (2.7.5)ser vi dessuten at s = G′(a)r + σ1(r). Dermed er

H(a + r) = F(G(a + r)) = F(G(a) + s) = F(G(a)) + F′(G(a))s + σ2(s)

2.7. KJERNEREGELEN 119

der vi i siste trinn har brukt (2.7.7). Siden s = G′(a)r + σ1(r), gir dettevidere

H(a + r) = F(G(a))) + F′(G(a))(G′(a)r + σ1(r)

)+ σ2(s) =

= H(a) + F′(G(a))G′(a)r + F′(G(a))σ1(r) + σ2(s)

Sammenligner vi dette med (2.7.3), ser vi at

σ(r) = F′(G(a))σ1(r) + σ2(s)

Ifølge (2.7.4) er var oppgave dermed a vise at

limr→0

1|r| σ(r) = lim

r→0

1|r|

(F′(G(a))σ1(r) + σ2(s)

)= 0 (2.7.9)

Vi tar ett ledd av gangen. Fra setning 1.6.3 vet vi at

|F′(G(a))σ1(r)| ≤ ||F′(G(a))|| |σ1(r)|

der ||F′(G(a))|| bare er et fast tall (normen til matrisen F′(G(a))). Dermedhar vi ∣∣∣∣

1|r|

(F′(G(a))σ1(r)

)∣∣∣∣ ≤ ||F′(G(a))|| |σ1(r)||r| −→ 0

siden σ1(r)|r| → 0 nar r → 0. Dette viser at den første delen av uttrykket i

(2.7.9) gar mot 0. Den andre delen

limr→0

1|r|σ2(s) = 0

er litt verre. Vi legger først merke til at siden σ2(0) = 0, har vi ingenproblemer med tilfellet s = 0. Vi kan derfor anta at s #= 0, og multiplisereuttrykket 1

|r|σ2(s) med |s| i teller og nevner:

limr→0

1|r|σ2(s) = lim

r→0

|s||r| ·

σ2(s)|s|

Nar r→ 0, vil s = G(a)r + σ1(r) → 0, og dette medfører at

limr→0

σ2(s)|s| = lim

s→0

σ2(s)|s| = 0

ifølge (2.7.8). Det gjenstar derfor a vise at faktoren |s||r| er begrenset og ikke

kan ga mot uendelig. Bruker vi at s = G′(a)r + σ1(r), far vi

|s||r| =

|G′(a)r + σ1(r)||r| ≤ |G′(a)r|

|r| +|σ1(r)||r| ≤ ||G′(a)|| + |σ1(r)|

|r|

Page 63: Flervariabel analyse med lineær algebra

120 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

som er begrenset siden σ1(r)|r| → 0. Dermed har vi vist at

limr→0

1|r| σ(r) = lim

r→0

1|r|

(F′(G(a))σ1(r) + σ2(s)

)= 0

og beviset er fullført. !

Bemerkning: Legg merke til at kjerneregelen garanterer at H er deriver-bar i a sa lenge G er deriverbar i a og F er deriverbar i b = G(a). Sidenderiverbarhet kan være vanskelig a sjekke, er denne garantien ofte til storhjelp i teoretisk arbeid.

Vi skriver ogsa opp den presise formuleringen av kjerneregelen pa kom-ponentform:

Teorem 2.7.2 (Kjerneregelen pa komponentform) Anta at vi har tomengder A ⊂ Rn, B ⊂ Rm og to funksjoner G : A → B, F : B → Rk.Dersom G er deriverbar i punktet a ∈ A og F er deriverbar i punktet b =G(a), sa er den sammensatte funksjonen H(x) = F(G(x)) deriverbar i a,og de partiellderiverte til H er gitt ved

∂Hi

∂xj(a) =

m∑

p=1

∂Fi

∂up(G(a))

∂Gp

∂xj(a) =

=∂Fi

∂u1(G(a))

∂G1

∂xj(a) +

∂Fi

∂u2(G(a))

∂G2

∂xj(a) + · · · + ∂Fi

∂um(G(a))

∂Gm

∂xj(a)

Bevis: Som vi allerede har sett, følger denne formuleringen direkte fra ma-triseformen nar man utfører matrisemultiplikasjonen og sammenligner koef-fisientene pa begge sider av likhetstegnet. !

Oppgaver til seksjon 2.7

1. La f(u, v) = u2 + v, g(x, y) = 2xy, h(x, y) = x + y2. Bruk kjerneregelen til afinne de partiellderiverte av k(x, y) = f(g(x, y), h(x, y)).

2. La f(u, v) = ue−v, g(x, y, z) = 2xy+z, h(x, y, z) = 2y(z+x). Bruk kjerneregelentil a finne de partiellderiverte av k(x, y, z) = f(g(x, y, z), h(x, y, z)).

3. Bruk kjerneregelen til a regne ut ∂h∂x2

og ∂h∂x3

i eksempel 1.

4. Bruk kjerneregelen til a regne ut ∂h∂v i eksempel 2.

5. Vi har to funksjoner G : R2 → R3 og F : R3 → R2. Anta at G(1,−2) = (1, 2, 3)og at

G′(1,−2) =

1 −23 12 −1

, F′(1, 2, 3) =(

2 1 40 2 2

)

2.7. KJERNEREGELEN 121

Finn Jacobi-matrisen til den sammensatte funksjonen H(x) = F(G(x)) i punktet(1,−2).

6. Vi har to funksjoner G : R3 → R2 og F : R2 → R2. Anta at G(−1,−2, 1) = (2, 4)og at

G′(−1,−2, 1) =(

4 −2 01 3 −1

), F′(2, 4) =

(2 −30 2

)

Finn Jacobi-matrisen til den sammensatte funksjonen H(x) = F(G(x)) i punktet(−1,−2, 1).

7. To vareslag konkurrerer om det samme markedet. Etterspørselen E1 etter detførste vareslaget varierer med prisene p1 og p2 pa begge vareslagene.

Vi har altsa en funksjon E1 = E1(p1, p2). Anta at vi vet hvordan prisene p1 =p1(t) og p2 = p2(t) varierer med tiden. Vis at etterspørselens variasjon med tidenkan uttrykkes ved

dE1

dt=

∂E1

∂p1p′1(t) +

∂E1

∂p2p′2(t)

8. Temperaturen T i et omrade avhenger av posisjonen; vi kan tenke oss at den ergitt som en funksjon T = f(x, y) av to variable der x og y er vanlige koordinater.Vi innfører na polarkoordinater r og θ pa vanlig mate slik at x = r cos θ, y = r sin θ.Vi far da temperaturen som en funksjon T = f(r cos θ, r sin θ) av r og θ.

a) Vis at∂T

∂r=

∂f

∂xcos θ +

∂f

∂ysin θ

∂T

∂θ= −∂f

∂xr sin θ +

∂f

∂yr cos θ

b) En radiomerket fugl beveger seg i omradet. Radiosignalene viser hvordanavstanden r og vinkelen θ varierer med tiden; vi har r = g(t) og θ = h(t).Vis at temperaturendringene fuglen opplever er gitt ved

T ′(t) =(

∂f

∂xcos θ +

∂f

∂ysin θ

)g′(t) +

(− ∂f

∂xr sin θ +

∂f

∂yr cos θ

)h′(t)

der vi ma sette inn r = g(t), θ = h(t), x = g(t) cos h(t), y = g(t) sinh(t).

9. La f : Rn+1 → R være en deriverbar funksjon av n + 1 variable og anta at detfinnes en deriverbar funksjon g : Rn → R slik at

f(x1, x2, . . . , xn, g(x1, x2, . . . , xn)) = 0

for alle x1, x2, . . . , xn. (Tenk deg at y = g(x1, x2, . . . .xn) er det uttrykket du fardersom du løser ligningen f(x1, x2, . . . , xn, y) = 0 med hensyn pa y).

a) Vis at

∂g

∂xi(x1, x2, . . . , xn) = −

∂f∂xi

(x1, x2, . . . , xn, g(x1, x2, . . . , xn))∂f

∂xn+1(x1, x2, . . . , xn, g(x1, x2, . . . , xn))

Page 64: Flervariabel analyse med lineær algebra

122 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

b) La f(x, y) = x2 + y2 −R2 der R er en positiv konstant, og anta at y = g(x)er en deriverbar funksjon slik at f(x, g(x)) = 0.Vis at

g′(x) = − x

g(x)

Gi en geometrisk tolkning av resultatet.

c) La f(x, y, z) = x2 + y2 + z2 − R2 der R er en positiv konstant og anta atz = g(x, y) er en deriverbar funksjon slik at f(x, y, g(x, y)) = 0. Vis at

∂g

∂x(x, y) = − x

g(x, y)

og∂g

∂y(x, y) = − y

g(x, y)

Gi en geometrisk tolkning av resultatet.

2.8 Lineæravbildninger

I de to siste seksjonene i dette kapitlet skal vi se pa to spesielle og nærtbeslektede typer av funksjoner fra Rn to Rm — lineæravbildninger og affin-avbildninger. Disse funksjonstypene knytter teorien i dette kapitlet nærmeretil teorien for matriser og vektorer i forrige kapittel.

Vi begynner med definisjonen av lineæravbildninger.

Definisjon 2.8.1 En funksjon T : Rn → Rm kalles en lineæravbildningdersom vi for alle c ∈ R og alle x,y ∈ Rn har:(i) T(cx) = cT(x)(ii) T(x + y) = T(x) + T(y)

De aller fleste funksjoner fra Rn til Rm er ikke lineæravbildninger, mendisse funksjonene er allikevel sa viktige at det er en hel gren av matematikkensom hovedsakelig handler om dem — denne grenen kalles lineær algebra.

La oss begynne med en enkel og nyttig generalisering av definisjonen.

Setning 2.8.2 Anta at T : Rn → Rm er en lineæravbildning. Da er

T(c1x1 + c2x2 + · · · + ckxk) = c1T(x1) + c2T(x2) + · · · + ckT(xk)

for alle tall c1, c2, . . . , ck ∈ R og alle vektorer x1,x2, . . . ,xk ∈ Rn.

Bevis: Vi spalter av ett og ett ledd. Siden vi kan oppfatte c1x1 +c2x2 + · · ·+ckxk som en sum av to ledd c1x1 og c2x2 + · · · + ckxk, har vi

T(c1x1 + c2x2 + · · · + ckxk) = T(c1x1) + T(c2x2 + · · · + ckxk) =

= c1T(x1) + T(c2x2 + · · · + ckxk)

2.8. LINEÆRAVBILDNINGER 123

der vi har brukt de to punktene i definisjonen av lineæravbildning. Vi kanna spalte av leddet c2x2 pa akkurat sammme mate, og fortsetter vi slik, starvi til slutt igjen med

T(c1x1 + c2x2 + · · · + ckxk) = c1T(x1) + c2T(x2) + · · · + ckT(xk)

!

Det neste resultatet viser oss at lineæravbildninger finnes:

Setning 2.8.3 Anta at A er en m×n-matrise. Da er funksjonen T : Rn →Rm definert ved

T(x) = Ax

en lineæravbildning.

Bevis: Etter regnereglene for matrisemultiplikasjon er T(cx) = A(cx) =c(Ax) = cT(x) og T(x + y) = A(x + y) = Ax + Ay = T(x) + T(y). !

Eksempel 1: Hvis A er 2× 3-matrisen

A =(

2 −1 31 −4 2

),

far vi en lineæravbildning T : R3 → R2 ved

T(x, y, z) =(

2 −1 31 −4 2

)

xyz

=(

2x− y + 3zx− 4y + 2z

)

Den neste setningen er nok mer overraskende — den sier at det ikkefinnes andre lineæravbildninger enn de som er gitt av matriser!

Setning 2.8.4 Anta at T : Rn → Rm er en lineæravbildning. Da finnes deten m× n-matrise A slik at

T(x) = Ax for alle x ∈ Rn

Matrisen A er gitt ved at den j-te søylen er lik T(ej) der ej er den j-teenhetsvektoren

ej =

0...1...0

←− j-te komponent

Page 65: Flervariabel analyse med lineær algebra

124 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Bevis: Vi begynner med a sette navn pa komponentene til T(ej) (som duvil se, er navnvalget inspirert av resultatet vi skal frem til!):

T(ej) =

a1j...

aij...

amj

Siden enhver vektor x ∈ Rn kan uttrykkes ved hjelp av enhetsvektorene padenne maten

x =

x1

x2...

xn

= x1

10...0

+ x2

01...0

+ · · · + xn

00...1

=

= x1e1 + x2e2 + · · · + xnen,

har vi ifølge setningen ovenfor

T(x) = T(x1e1 +x2e2 + · · ·+xnen) = x1T(e1)+x2T(e2)+ · · ·+xnT(en) =

= x1

a11

a21...

am1

+ x2

a12

a22...

am2

+ · · · + xn

a1n

a2n...

amn

=

=

a11x1 + a12x2 + · · · + a1nxn

a21x1 + a22x2 + · · · + a2nxn...

am1x1 + am2x2 + · · · + amnxn

= Ax

der

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

Dermed er setningen bevist. !

Vi skal na se hvordan vi kan bruke resultatet ovenfor pa refleksjoner ogrotasjoner i planet. Dette er viktige eksempler i geometri.

Eksempel 2: Vi skal na se pa avbildningen T : R2 → R2 som avbilderenhver vektor pa sitt speilbilde om x-aksen. Det er lett a overbevise seg om

2.8. LINEÆRAVBILDNINGER 125

at T er en lineæravbildning, og vi skal bruke setningen ovenfor til a finneden tilhørende matrisen. Siden speilingen er om x-aksen, har vi

T(e1) = e1 =(

10

)og T(e2) = −e2 =

(0

−1

)

Ifølge setningen ovenfor far vi matrisen til T ved a bruke disse vektorenesom søylevektorer:

A =(

1 00 −1

)

Hvis x =(

xy

), er dermed

T(x) =(

1 00 −1

) (xy

)=

(x−y

)

I eksemplet ovenfor er avbildningen sa enkel at det ikke ville by pa noeproblem a skrive opp formelen for T(x) direkte uten a ga veien om T(e1) ogT(e2). I litt mer kompliserte eksempler blir imidlertid regningene atskilligmer oversiktlige om vi gar veien om T(e1) og T(e2).

Eksempel 3: Avbildningen Tθ : R2 → R2 er gitt ved at den dreier enhvervektor x en vinkel θ i positiv omløpsretning (se figur 1).

!

"

))))*11112

x

Tθ(x)

θ

Figur 1: Dreining en vinkel θ

Det er ikke vanskelig a overbevise seg om at Tθ er en lineæravbildning(f.eks. sier regelen Tθ(x + y) = Tθ(x) + Tθ(y) i dette tilfellet at dersomvi først legger sammen to vektorer x og y, og sa dreier resultatet en vinkelθ, sa far vi det samme som om vi først dreier begge vektorene en vinkel θ,og sa legger sammen de nye vektorene). For a finne matrisen til Tθ ma viberegne Tθ(e1) og Tθ(e2). Dreier vi enhetsvektoren e1 en vinkel θ, ender

den i punktet(

cos θsin θ

)(dette er bare definisjonen av cosinus og sinus til

generelle vinkler). Dette betyr altsa at

Tθ(e1) =(

cos θsin θ

)

Page 66: Flervariabel analyse med lineær algebra

126 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Siden e2 ligger en vinkel π/2 foran e1 nar vi dreier i positiv retning, far vi

Tθ(e2) =(

cos(θ + π2 )

sin(θ + π2 )

)=

(− sin(θ)cos(θ)

)

(for a fa til den siste overgangen kan du enten resonnere geometrisk eller bru-ke formlene for sinus og cosinus til en sum). Matrisen til lineæravbildningenTθ er altsa

Aθ =(

cos θ − sin θsin θ cos θ

)

Dersom vi dreier en vektor x =(

xy

)en vinkel θ i positiv retning, far vi

dermed en ny vektor

x′ = Aθx =(

cos θ − sin θsin θ cos θ

) (xy

)=

(x cos θ − y sin θx sin θ + y cos θ

)

Vi har na løst den opprinnelige oppgaven var som var a finne matrisentil lineæravbildningen Tθ. La oss ga litt videre for a se hva som skjer narvi kombinerer to rotasjoner. Dersom vi dreier en annen vinkel φ, far viselvfølgelig matrisen

Aφ =(

cos φ − sin φsinφ cos φ

)

La oss na anta at vi først dreier en vinkel θ og deretter en vinkel φ. I alt harvi da dreiet en vinkel φ + θ tilsvarende matrisen

Aφ+θ =(

cos(φ + θ) − sin(φ + θ)sin(φ + θ) cos(φ + θ)

)

Pa den annen side vet vi at nar vi gjør to transformasjoner etter hverandre,svarer dette til a multiplisere de tilhørende matrisene med hverandre. Medandre ord ma

Aφ+θ = AφAθ

Skriver vi ut komponentene, ser vi at

Aφ+θ =(

cos(φ + θ) − sin(φ + θ)sin(φ + θ) cos(φ + θ)

)

og

AφAθ =(

cos φ − sinφsinφ cos φ

) (cos θ − sin θsin θ cos θ

)=

=(

cos φ cos θ − sinφ sin θ − sinφ cos θ − cos φ sin θsinφ cos θ + cos φ sin θ cos φ cos θ − sinφ sin θ

)

Sammenligner du komponentene i de to uttrykkene, vil du gjenkjenne form-lene for sinus og cosinus til en sum. Vi har altsa brukt matriser til a gi etnytt bevis for disse formlene. ♣

2.8. LINEÆRAVBILDNINGER 127

Egenverdier

Det er ofte et omstendelig arbeid a regne ut T(x) for en lineæravbildning Tog en vektor x. For noen vektorer gar det imidlertid raskt — alt vi behøvera gjøre, er a gange vektoren med et tall λ. Slike vektorer kalles egenvektorer.Egenvektorer kan bare finnes nar T avbilder et rom inn i seg selv, altsanar den gar fra et rom Rn til det samme rommet Rn. Her er den formelledefinisjonen:

Definisjon 2.8.5 Anta at T : Rn → Rn er en lineæravbildning. Vi kallerx #= 0 en egenvektor for T dersom det finnes et tall λ slik at

T(x) = λx

Tallet λ kaller vi egenverdien til x.

Bemerkning: I definisjonen ovenfor har vi knyttet egenvektorer til lineær-avbildninger, men vi kunne like godt ha knyttet dem til matriser. Vektorenx #= 0 er en egenvektor for matrisen A dersom det finnes et tall λ slik atAx = λx.

Eksempel 4: La oss undersøke om a =(

2−1

)er en egenvektor for li-

neæravbildningen T(x) = Ax der A =(

1 −8−2 1

). Vi har

T(a) =(

1 −8−2 1

) (2

−1

)=

(10−5

)= 5a

sa a er en egenvektor med egenverdi 5.

Gjør vi tilsvarende beregninger for b =(

21

), far vi

T(b) =(

1 −8−2 1

) (21

)=

(−6−3

)= (−3)b

Altsa er b en egenvektor med egenverdi −3.Anta na at en tredje vektor c kan skrives som en lineærkombinasjon av

egenvektorene a og b, dvs. at det finnes tall x og y slik at c = xa + yb (detviser seg faktisk at alle vektorer i R2 kan skrives pa denne maten). Da er

T(c) = T(xa + yb) = xT(a) + yT(b) = 5xa− 3yb

Det viser seg altsa at ikke bare egenvektorene selv, men ogsa deres lineær-kombinasjoner kan behandles pa en enkel mate. ♣

Page 67: Flervariabel analyse med lineær algebra

128 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Observasjonen i slutten av eksemplet ovenfor er viktig. Det viser segat for “de fleste” lineæravbildninger T : Rn → Rn finnes det egenvektorerv1,v2, . . . ,vn slik at enhver vektor v kan skrives som en lineærkombinasjon

v = x1v1 + x2v2 + · · · + xnvn

Hvis egenverdiene er henholdsvis λ1,λ2, . . . ,λn, far vi da

T(v) = T(x1v1 + x2v2 + · · · + xnvn) =

= x1T(v1) + x2T(v2) + · · · + xnT(vn) =

= x1λ1v1 + x2λ2v2 + · · · + xnλnvn

Bruker vi T pa begge side av dette uttrykket, far vi pa tilsvarende mate

T2(v) = T(T(x)) = x1λ21v1 + x2λ

22v2 + · · · + xnλ2

nvn

Fortsetter vi pa denne maten, far vi generelt

Tk(v) = x1λk1v1 + x2λ

k2v2 + · · · + xnλk

nvn

Denne formelen forteller oss at dersom vi kjenner egenvektorene og egen-verdiene til en lineæravbildning T, sa har vi god oversikt bade over T selvog over alle dens potenser. I mange anvendelser forteller Tk(x) hvordan etsystem utvikler seg nar vi starter i en tilstand x og lar tiden ga (T1(x)er tilstanden etter ett tidsintervall, T2(x) tilstanden etter to tidsintervallerosv.) Formelen ovenfor forteller oss da at veksten til systemet hovedsake-lig er bestemt av den største egenverdien (eller, for a være helt presis, denegenverdien som har størst tallverdi).

Vi skal vente til kapittel 4 med a forklare hvordan man kan finne egen-verdier i praksis. Det er likevel viktig a vite litt om begrepet og dets anven-delser allerede na siden det vil gjøre det lettere a forsta hensikten med myeav teorien som kommer senere.

Bemerkning: Ser du nøyere pa definisjon 2.8.5, vil du se at den er litt upre-sis nar det gjelder hva slags tall egenverdien λ skal være og hva slags vektoregenvektoren x skal være. Det viser seg at det finnes reelle matriser somhar komplekse egenverdier og egenvektorer. Om man vil “regne med” disseavhenger av problemstillingen man ser pa — i noen tilfeller er det nyttig aha dem med, i andre tilfeller ma man ekskludere dem. Situasjonen minnerom den vi har for ligninger av n-te grad; noen ganger er det nyttig a ha medde komplekse løsningene og andre ganger ikke.

Eksempel 5: Dersom θ ikke er multiplum av π, viser det seg at rotasjons-matrisene

Aθ =(

cos θ − sin θsin θ cos θ

)

2.8. LINEÆRAVBILDNINGER 129

ikke har reelle egenvektorer og egenverdier (kan du forklare dette geome-trisk?) De har imidlertid de komplekse egenvektorene

v1 =(

1−i

)og v2 =

(1i

)

med tilhørende egenverdier λ1 = cos θ + i sin θ og λ2 = cos θ− i sin θ. La osssjekke dette for λ1 og v1:

Aθv1 =(

cos θ − sin θsin θ cos θ

) (1−i

)=

(cos θ + i sin θsin θ − i cos θ

)=

= (cos θ + i sin θ)(

1−i

)= λ1v1

Du kan pa tilsvarende mate sjekke at Aθv2 = λ2v2. ♣

Oppgaver til seksjon 2.8

1. Finn matrisen til lineæravbildningen T : R3 → R2 gitt ved

T(x, y, z) =(

2x− y + z−x + y − 3z

)

2. En lineæravbildning T : R2 → R4 tilfredsstiller

T(e1) =

−12

−34

T (e2) =

0−2

47

Finn matrisen til T.

3. La a,b ∈ R2. Lineæravbildningen T : R2 → R2 tilfredsstiller T(a) =(−2

1

),

T(b) =(

03

). Finn T(3a− 2b).

4. Lineæravbildningen T : R2 → R2 avbilder ethvert punkt pa sitt speilbilde omy-aksen. Finn matrisen til T.

5. Lineæravbildningen T : R2 → R2 fordobler alle annenkomponenter, men endrerikke førstekomponenter. Finn matrisen til T.

6. Lineæravbildningen T : R2 → R2 gjør alle vektorer dobbelt sa lange og dreierdem en vinkel θ i positiv retning. Finn matrisen til T.

7. Lineæravbildningen T : R3 → R3 avbilder alle vektorer pa sin projeksjon ned ixy-planet. Finn matrisen til T.

Page 68: Flervariabel analyse med lineær algebra

130 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

8. Lineæravbildningen T : R2 → R2 speiler alle vektorer om x-aksen og dreier demderetter en vinkel θ i positiv retning. Finn matrisen til T (det kan være lurt a tenkepa T som sammensetningen av to enklere avbildninger).

9. La Aθ være rotasjonsmatrisen i eksempel 3. Forklar at A−θ er den inverse ma-trisen til Aθ uten a regne. Kontroller ved a regne ut AθA−θ.

10. L er linjen gjennom origo som fremkommer nar vi dreier x-aksen en vinkel θ ipositiv retning. Lineæravbildningen T : R2 → R2 speiler alle punkter om linjen L.La Aφ være matrisen til avbildningen som dreier alle vektorer en vinkel φ i positivretning, og la B være matrisen til avbildningen som speiler alle punkter om x-aksen.Forklar at matrisen C til T er gitt ved

C = AθBA−θ

og bruk denne formelen til a finne C.

11. La a =(−2

1

)og b =

(13

).

a) Finn tall x, y, z, u slik at e1 = xa + yb og e2 = za + ub.

b) Lineæravbildningen T : R2 → R2 tilfredsstiller T (a) =(

11

), T (b) =

(1

−1

).

Finn T (e1) og T (e2).

c) Finn matrisen til T.

12. a) Finn tall x, y slik at e1 = xa+ yb der a,b er som i eksempel 4. Finn T4(e1)der T er lineæravbildningen i eksemplet.

b) Finn tall u, v slik at e2 = ua + vb. Finn T4(e2). Hva er matrisen til T4?

13. Fullfør eksempel 5 ved a sjekke at v2 er en egenvektor med egenverdi λ2.

14. La A=(

1 22 1

).

a) Vis at v1 =(

11

)er en egenvektor for A med egenverdi λ1 = 3.

b) Vis at v2 =(

1−1

)er en egenvektor for A med egenverdi λ1 = −1.

c) La a =(

3−1

). Finn tall x, y slik at a = xv1 + yv2. Regn ut A10a.

15. Anta at F : Rn → Rm tilfredsstiller

F(cx + dy) = cF(x) + dF(y)

for alle c, d ∈ R og alle x,y ∈ Rn. Vis at F er en lineæravbildning.

16. Anta at a1,a2 ∈ R2 (a1,a2 #= 0) ikke er parallelle, og la b1,b2 være to vektoreri R2. Vis at de finnes nøyaktig en lineæravbildning T : R2 → R2 slik at T(a1) = b1

2.9. AFFINAVBILDNINGER OG LINEARISERINGER 131

og T(a2) = b2.

2.9 Affinavbildninger og lineariseringer

Som vi sa i eksemplene i forrige seksjon, er lineæravbildninger ofte nyttigenar vi skal beskrive geometriske transformasjoner som refleksjoner og rota-sjoner. De har imidlertid en stor svakhet; siden en lineæravbildning alltidtilfredsstiller T(0) = 0, kan ikke lineæravbildninger brukes til a forskyvefigurer i planet. Vi skal na utvide klassen av avbildninger slik at vi ogsa kanbehandle forskyvninger (eller translasjoner som matematikere liker a kalledem).

Definisjon 2.9.1 En funksjon F : Rn → Rm kalles en affinavbildning der-som det finnes en m× n-matrise A og en vektor c ∈ Rm slik at

F(x) = Ax + c for alle x ∈ Rn

Vi kaller A matrisen til F og c konstantleddet til F.

Vi ser at lineæravbildninger rett og slett er affinavbildninger med kon-stantledd c lik 0. Vi ser ogsa at translasjonen F(x) = x + c som forskyveralle vektorer en distanse c, er en affinavbildning siden den kan skrives

F(x) = Inx + c

(husk at In er n× n-identitetsmatrisen og at Inx = x for alle x ∈ Rn).En viktig egenskap ved affinavbildninger er at de avbilder rette linjer pa

rette linjer. La oss være helt sikre pa at vi skjønner hva dette betyr. Anta atL er den rette linjen i Rn som gar gjennom punktet a og har retningsvektorb (det betyr at L er samlingen av alle punkter pa formen r(t) = a + tb slikvi sa i seksjon 1.2). Dersom F er en kontinuerlig funksjon fra Rn til Rm, kanvi bruke F pa alle punktene som ligger pa linjen L. Vi far da en samling avpunkter i Rm som vi kaller bildet av L under F. Vanligvis vil dette bildetvære en kurve i Rm. Nar F er en affinavbildning, er denne kurven en rettlinje.

Setning 2.9.2 Anta at F(x) = Ax + c er en affinavbildning fra Rn til Rm,og la r(t) = a+ tb være parameterfremstillingen til en linje L i Rn. DersomAb #= 0, vil bildet av L under F være linjen i Rm som gar gjennom punktetF (a) og har retningsvektor Ab.

Bevis: Vi ser at

F(r(t)) = A(a + tb) + c = Aa + c + t(Ab) = F(a) + t(Ab)

Page 69: Flervariabel analyse med lineær algebra

132 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

som er parameterfremstillingen til en rett linje om gar gjennom punktetF (a) og har retningsvektor Ab. !

Bemerkning. Dersom Ab = 0, ser vi at bildet av L degenererer til etteneste punkt. Legg ogsa merke til at dersom vi bruker F pa to parallelle linjer(dvs. to linjer med samme retningsvektor b), sa blir ogsa de resulterendelinjene parallelle (fordi de far samme retningsvektor Ab).

Determinanten som forstørrelsesfaktor

Som vi akkurat har sett, er bildet av en rett linje under en affinavbildningselv en rett linje. Vi vet ogsa at affinavbildninger avbilder parallelle linjer paparallelle linjer. Figur 1 illustrerer dette for en affinavbildning F : R2 → R2;rutenettet i punkt a) avbildes pa det forskjøvede og fordreide rutenettet ipunkt b). Kvadratet med markerte hjørner i a) avbildes pa parallellogram-met med markerte hjørner i b).

a)

= ===

!

"b)

!

"

33333333333

33333333333

33333333333

33333333333

33333333333

33333333333

111111111

111111111

111111111

111111111

111111111

111111111

= == =

!

!Q

F

Figur 1: En affinavbildning F anvendt pa et rutenett

Et spørsmal som ofte dukker opp, er hvor mye avbildningen F forstørrereller forminsker arealet: Hvor stort er arealet til parallellogrammet vi enderopp med, sammenlignet med arealet til kvadratet vi startet med? Figur 2viser et kvadrat før og etter vi har brukt F pa det. Arealet til kvadratet ipunkt a) er h2. Parallellogrammet i b) er utspent av vektorene F(a+he1)−F(a) og F(a + he2)− F(a). La oss se nærmere pa disse størrelsene.

Siden F : R2 → R2 er en affinavbildning, er den pa formen

F(x) = Ax + c

der A =(

a11 a12

a21 a22

)er en 2 × 2-matrise og c =

(c1

c2

)er en vektor i

2.9. AFFINAVBILDNINGER OG LINEARISERINGER 133

R2 (siden det er matrisemultiplikasjon involvert, ma vi skrive vektorene somsøylevektorer). Vi ser na at

a)

!

"

a a + he1

a + he2 a + he1 + he2

! !! !

!

!! !

RRRRRRRRRRRR

SSSS S

SSS

b)

!

"

F(a)

F(a + he1)

F(a + he2)

F(a + he1 + he2)

Figur 2: Bildet av et kvadrat under F

F(a + he1)− F(a) = (A(a + he1) + c)− (Aa + c) = hAe1 = h

(a11

a21

)

F(a + he2)− F(a) = (A(a + he2) + c)− (Aa + c) = hAe2 = h

(a12

a22

)

Parallellogrammet er derfor utspent av vektorene (ha11, ha21) og (ha12, ha22),og har — ifølge setning 1.8.1 — areal

|(

ha11 ha21

ha12 ha22

)| = |h2a11a22 − h2a12a21| = h2|det(A)|

Vi ser altsa at arealet har endret seg med en faktor |det(A)|; tallverdien tildeterminanten er forstørrelsesfaktoren til affinavbildningen F .

Vi kan gjennomføre akkurat det samme resonnementet i det tredimen-sjonale tilfellet ved a dele rommet opp i sma terninger med sider parallellemed aksene. En affinavbildning F(x) = Ax + c vil avbilde disse terninge-ne pa parallellepipeder, og volmet til parallellepipedene vil være |det(A)|ganger volumet til terningene. La oss oppsummere resultatene.

Setning 2.9.3 Dersom F : R2 → R2 er en affinavbildning med matrise A,sa forstørrer F arealer med en faktor |det(A)|. Dersom F : R3 → R3 eren affinavbildning med matrise A, sa forstørrer F volumer med en faktor|det(A)|. !

Bemerkning: Det kan se ut som vi tar i litt vel kraftig i setningen ovenfor— strengt tatt har vi vel bare vist at |det(A)| er forstørrelsesfaktoren forarealet til kvadrater, og ikke for mer generelle arealer? Det viser seg imid-lertid at alle andre mengder vi kan definere arealet til, kan tilnærmes medkvadrater, og resultatet gjelder derfor generelt. Tilsvarende gjelder for ter-ninger i det tredimensjonale tilfellet. Vi skal komme grundigere tilbake tildisse spørsmalene i kapittel 6.

Page 70: Flervariabel analyse med lineær algebra

134 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Det er naturlig a spørre om fortegnet til determinanten har en geometrisktolkning ogsa for avbildninger. Det har det: Fortegnet er positivt dersom Fbevarer orienteringen til enhetsvektorene i og j (i, j og k i det tredimensjo-nale tilfellet) og negativt om F reverserer orienteringen.

Linearisering

Til slutt i denne seksjonen skal vi se hvordan vi kan bruke affinavbildningertil a generalisere tangentbegrepet fra funksjoner f : R → R til funksjonerF : Rn → Rm. Vi skal først se pa Jacobi-matrisen til en affinavbildning F.Anta at F er gitt ved F(x) = Ax + c der

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og

c =

c1

c2...

cm

Skriver vi ut definisjonen F(x) = Ax + c pa komponentform, far vi

F(x) =

F1(x)F2(x)

...Fm(x)

=

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

x1

x2...

xn

+

c1

c2...

cm

=

=

a11x1 + a12x2 + · · · + a1nxn + c1

a21x1 + a22x2 + · · · + a2nxn + c2...

am1x1 + am2x2 + · · · + amnxn + cm

Deriverer vi den i-te komponenten Fi med hensyn pa den j-te variabelen xj ,far vi

∂Fi

∂xj=

∂xj(ai1x1 + ai2x2 + · · · + ainxn + ci) = aij

Dette betyr at Jacobi-matrisen til en affinavbildning F rett og slett er ma-trisen A til F.

Setning 2.9.4 Anta at affinavbildningen F : Rn → Rm er gitt ved F(x) =Ax + c. Da er Jacobi-matrisen til F lik matrisen A til F. !

2.9. AFFINAVBILDNINGER OG LINEARISERINGER 135

Vi er na klare til a studere hvordan affinavbildninger kan brukes til atilnærme mer generelle funksjoner. Husk at hvis f : R → R er en funksjonav en variabel, er tangenten Taf i punktet a gitt ved

Taf(x) = f(a) + f ′(a)(x− a)

Starter vi isteden med en funksjon F : Rn → Rm, kan vi pa tilsvarende matedefinere en funksjon TaF ved a etterligne uttrykket ovenfor:

TaF(x) = F(a) + F′(a)(x− a)

Ganger vi ut parentesen, far vi

TaF(x) = F(a)− F′(a)a + F′(a)x

som viser at TaF er en affinavbildning med matrise F′(a) og konstantleddF(a)− F′(a)a.

Definisjon 2.9.5 Anta at F : A → Rm er en funksjon av n variable somer deriverbar i punktet a. Affinavbildningen TaF : Rn → Rm gitt ved

TaF(x) = F(a) + F′(a)(x− a)

kalles lineariseringen til F i punktet a.

Legg merke til at TaF(a) = F(a). Siden vi allerede har observert at ma-trisen til affinavbildningen TaF er F′(a), vet vi fra setning 2.9.4 at Jacobi-matrisen til TaF er F′(a). Dette betyr at lineariseringen TaF har sammeverdi og samme deriverte i punktet a som den opprinnelige funksjonen F.Dette er akkurat samme egenskap som tangenten har for funksjoner av envariabel. En annen viktig (og nært beslektet) egenskap ved tangenten er atden er linjen som smyger seg tettest inntil funksjonsgrafen til f i nærhetenav punktet a. Vi skal snart vise en tilsvarende egenskap for lineariseringen— at den er affinavbildningen som ligger tettest opptil F i nærheten av a.Men før vi gjør dette, kan det være lurt a kikke pa et eksempel.

Eksempel 1: Vi skal finne lineariseringen til funksjonen F : R3 → R2 gittved

F(x, y, z) =(

x2y2xyz

)

i punktet a =

1

−2−1

. La oss først regne ut Jacobi-matrisen til F:

F′(x, y, z) =

(∂F1∂x

∂F1∂y

∂F1∂z

∂F2∂x

∂F2∂y

∂F2∂z

)=

(2xy x2 02yz 2xz 2xy

)

Page 71: Flervariabel analyse med lineær algebra

136 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

I punktet a har vi dermed

F′(1,−2,−1) =(

2 · 1 · (−2) 12 02 · (−2) · (−1) 2 · 1 · (−1) 2 · 1 · (−2)

)=

=(−4 1 0

4 −2 −4

)

Vi har ogsa

F(1,−2,−1) =(

12 · (−2)2 · 1 · (−2) · (−1)

)=

(−24

)

Vi kan na regne ut lineariseringen. Med x =

xyz

far vi:

TaF(x) = F(a) + F′(a)(x− a) =

=(−24

)+

(−4 1 0

4 −2 −4

)

xyz

1−2−1

=

=(−24

)+

(−4x + y

4x− 2y − 4z

)−

(−612

)=

(−4x + y + 4

4x− 2y − 4z − 8

)

Altsa erTaF(x, y, z) =

(−4x + y + 4

4x− 2y − 4z − 8

)

La oss vende tilbake til resultatet vi annonserte ovenfor, det som sierat lineariseringen TaF er den affinavbildningen som ligger tettest opptil Fi nærheten av a. Et punkt x i nærheten av a kan vi skrive x = a + r derr er liten. Vi ønsker a vise at differensen F(a + r) − TaF(a + r) er litensammenlignet med |r| for sma r, og at tilnærmingen blir bedre og bedre narr gar mot 0. En naturlig mate a formulere dette pa er a kreve at

limr→0

1|r|

(F(a + r)− TaF(a + r)

)= 0

Bruker vi at

TaF(a + r) = F(a) + F′(a)((a + r)− a

)= F(a) + F′(a)r

ser vi at

F(a + r)− TaF(a + r) = F(a + r)− F(a)− F′(a)r = σ(r)

der σ er som i definisjon 2.6.1. Na er det ikke sa vanskelig a formulere ogbevise resultatet.

2.9. AFFINAVBILDNINGER OG LINEARISERINGER 137

Teorem 2.9.6 Anta at F : A → Rm er en funksjon av n variable som erderiverbar i punktet a, og la TaF være lineariseringen til F i a. Da er

limr→0

1|r|

(F(a + r)− TaF(a + r)

)= 0

Det finnes ingen annen affinavbildning G : Rn → Rm slik at

limr→0

1|r|

(F(a + r)−G(a + r)

)= 0

Bevis: Det følger av definisjonen av deriverbarhet (definisjon 2.6.1) og reg-ningene ovenfor at

limr→0

1|r|

(F(a + r)− TaF(a + r)

)= lim

r→0

1|r|σ(r) = 0

Dermed er første del av teoremet bevist. For a bevise den andre delen, antarvi at G(x) er en affinavbildning slik at

limr→0

1|r|

(F(a + r)−G(a + r)

)= 0

Vi ma vise at G = TaF. Siden G er en affinavbildning, vet vi at G(x) =Ax + c for en matrise A og en vektor c. Setter vi dette inn i uttrykketovenfor, far vi

limr→0

1|r|

(F(a + r)−G(a + r)

)= lim

r→0

1|r|

(F(a + r)−Aa−Ar− c

)= 0

Skal dette være mulig, ma F(a + r) − Aa − Ar − c → 0 nar r → 0, og deter bare tilfellet hvis F(a) = Aa + c. Setter vi Aa + c = F(a) inn i det sisteuttrykket ovenfor, ser vi at

limr→0

1|r|

(F(a + r)− F(a)−Ar

)= 0

og ifølge setning 2.6.4 er det bare mulig dersom A = F′(a). Siden vi alleredevet at F(a) = Aa+c, følger det at c = F(a)−Aa = F(a)−F′(a)a. Dermeder

G(x) = Ax + c = F′(a)x + F(a)−F′(a)a = F(a) + F′(a)(x− a) = TaF(x)

!

Det som er viktigst a ta med seg fra teoremet ovenfor, er at lineariserin-gen TaF er en svært god tilnærming til F i omradet rundt a. Dette skal vifa bruk for bade nar vi studerer Newtons metode i flere variable i kapittel

Page 72: Flervariabel analyse med lineær algebra

138 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

5, og nar vi studerer skifte av variable i multiple integraler (dvs. integralerav funksjoner av flere variable) i kapittel 6.

Bemerkning: Du har kanskje lurt pa hvorfor TaF kalles en linearisering ogikke en affinisering — TaF er tross alt en affinavbildning og ikke (bortsett frai helt spesielle tilfeller) en lineæravbildning. Dessverre er bruken av ordparetlineær/affin svært usystematisk og forvirrende; ordene brukes om hverandrepa en mate som ikke er lett a fa oversikt over. Et annet eksempel pa dennevaklingen far du om du betrakter en funksjon f : R → R pa formen f(x) =ax + c. Nar man studerer funksjoner av en variabel, er alle enige om a kalledette en lineær funksjon, men ifølge terminologien vi na har innført, er denbare en lineæravbildning hvis c = 0; i alle andre tilfeller ma vi nøye ossmed a kalle den en affinavbildning! Heldigvis er det sjelden at den vaklendeterminologibruken skaper misforstaelser, men det er greit a vite om den slikat man kan være litt pa vakt.

Opppgaver til seksjon 2.9

1. Finn matrisen og konstantleddet til affinavbildningen

F(x, y, z) =(

2x− 3y + z − 7−x + z − 2

)

2. L er linjen i R3 med parametrisering

r(t) =

2

−13

+ t

102

og F : R3 → R2 er affinavbildningen

F(x, y, z) =(

1 −1 20 3 −2

)

xyz

+(

2−1

)

Finn en parametrisering av bildet av L under F.

3. Finn lineariseringen til funksjonen F : R2 → R2 gitt ved

F(x, y) =(

x2yxy + x

)

i punktet a = (−2, 1).

4. Finn lineariseringen til funksjonen F : R2 → R3 gitt ved

F(x, y) =

x sin(xy)

xey

2x3 + y

2.9. AFFINAVBILDNINGER OG LINEARISERINGER 139

i punktet a = (2, 0).

5. En affinavbildning F : R2 → R2 tilfredsstiller F(0, 0) =(

1−1

), F(1, 0) =

(23

)og F(0, 1) =

(−10

). Finn matrisen og konstantleddet til F.

6. Affinavbildningen F : R2 → R2 dreier enhver vektor en vinkel π4 i positiv retning,

og flytter den deretter en distanse (3,−1). Finn matrisen og konstantleddet til F.

7. a) Affinavbildningen F : R2 → R2 avbilder ethvert punkt pa sitt speilbilde omden vertikale linjen x = 3. Finn matrisen og konstantleddet til F.

b) Affinavbildningen G : R2 → R2 avbilder ethvert punkt pa sitt speilbilde om denhorisontale linjen y = −2. Finn matrisen og konstantleddet til G.

8. Affinavbildningen F : R2 → R2 avbilder ethvert punkt pa sitt speilbilde omlinjen y = x + 1. Finn matrisen og konstantleddet til F.

9. Anta at punktene a1,a2,a3 ∈ R2 ikke ligger pa samme rette linje, og la b1,b2,b3

være tre punkter i R2. Vis at det finnes nøyaktig en affinavbildning F : R2 → R2

slik at F(a1) = b1, F(a2) = b2 og F(a3) = b3.

Page 73: Flervariabel analyse med lineær algebra

140 KAPITTEL 2. FUNKSJONER FRA RN TIL RM

Kapittel 3

Kurver og flater

I dette kapitlet skal vi benytte teorien vi utviklet i kapittel 1 og 2 til astudere kurver og flater. Kapitlet inneholder dessuten en del anvendelser ifysikk. Disse kan nok virke litt skremmende hvis du ikke har tatt fysikk ivideregaende skole, men det er absolutt verdt a bruke litt tid pa dem. Teorienvi skal se pa, ble i stor grad utviklet for a beskrive fysiske fenomener, ogdet er ingen andre anvendelser som i samme grad illustrerer slagkraften iresultatene.

3.1 Parametriserte kurver

I videregaende skole har du lært om parametriserte kurver i planet og rom-met. Na skal vi ga et skritt videre og studere parametriserte kurver i Rn. Viskal ogsa se pa noen viktige anvendelser som du sannsynligvis ikke har værtborti tidligere.

!

" !r(t)

Figur 1: Et punkt r(t) beveger seg langs en kurve

La oss begynne med litt repetisjon. En parametrisert kurve i planet errett og slett en funksjon r(t) = (x(t), y(t)). Ofte (men ikke bestandig) erdet lurt a tenke pa t som tiden, og r(t) som posisjonen ved tiden t til etpunkt som beveger seg langs en kurve (se figur 1). Pa tilsvarende mate er en

141

Page 74: Flervariabel analyse med lineær algebra

142 KAPITTEL 3. KURVER OG FLATER

parametrisert kurve i R3 en funksjon r(t) = (x(t), y(t), z(t)) som beskriverhvordan et punkt beveger seg langs en kurve i rommet.

Eksempel 1: Parametriseringen

r(t) = (cos t, sin t) t ∈ [0,π]

fremstiller en halvsirkel om origo med radius 1. Startpunktet er (1, 0) ogsluttpunktet (−1, 0). En annen parametrisering av samme kurve far vi veda sette

r(t) = (−t,√

1− t2) t ∈ [−1, 1] ♣

La oss ogsa se pa en parametrisert kurve i rommet.

Eksempel 2: Vi setter

r(t) = (cos t, sin t, t) t ∈ [0,∞)

Denne kurven ser ut som en spiralfjær. Hadde vi bare hatt de to første ko-ordinatene, ville kurven ha beskrevet en sirkulær bevegelse i planet akkuratsom i eksemplet ovenfor, men den tredje koordinaten trekker kurven opp-over i en spiralbevegelse. Prøv a finne ut hvordan kurven ser ut og tegn enskisse av den. ♣

Vi er na klar for den formelle definisjonen av en parametrisert kurve iRn.

Definisjon 3.1.1 En parametrisert kurve i Rn er en kontinuerlig funksjonr : I → Rn der I ⊂ R er et intervall. Vi skriver ofte funksjonen pa kompo-nentform

r(t) = (x1(t), x2(t), . . . , xn(t))

Parametriserte kurver kalles ogsa vektorvaluerte funksjoner.

Husk fra kapittel 2 (setning 2.2.4) at funksjonen r er kontinuerlig hvis ogbare hvis hver komponent x1, x2, . . . , xn er kontinuerlig.

Selv om “parametrisert kurve” i utgangspunktet er et geometrisk begrep,er det mange anvendelser som ikke har sa mye med geometri a gjøre.

Eksempel 3: Et grossistfirma fører n vareslag. Hvis xi(t) er lagerbehold-ningen av vareslag i ved tiden t, kan hele varebeholdningen beskrives ved

r(t) = (x1(t), x2(t), . . . , xn(t))

I dette tilfellet faller det mer naturlig a kalle r en “vektorvaluert funksjon”enn en “parametrisert kurve”. ♣

3.1. PARAMETRISERTE KURVER 143

Et naturlig spørsmal er hvordan man finner lengden til en parametrisertkurve. Dersom vi beveger oss langs den parametriserte kurven fra t = a tilt = b, hvor langt har vi da gatt?

!

"

33++

????>

>>>

a t1 t2 t3 b

r(a)

r(t1)

r(t2)

r(t3)

r(b)

Figur 2: Tilnærming til buelengden

Figur 2 viser en naturlig mate a nærme seg problemet pa — vi delerintervallet [a, b] med delepunkter a = t0 < t1 < t2 . . . < tN = b og regnerut lengden til den brudne kurven fra r(a) til r(t1) videre til r(t2) osv. inntilvi nar r(b). Lar vi oppdelingen bli finere og finere, er det naturlig a tenkeseg at lengde til den brudne kurven nærmer seg lengden til den opprinneligekurven. Var oppgave blir derfor a finne et matematisk uttrykk for dennegrenseverdien.

!

))))))))

ti−1 ti

r(ti−1)

r(ti)

Figur 3: Tilnærming til buelengden

Figur 3 viser et nærbilde av den i-te delen av en slik kurve fra r(ti−1) tilr(ti). Lengden av denne delen av den brudne kurven er gitt ved

|r(ti)− r(ti−1)| =√

(x1(ti)− x1(ti−1))2 + · · · + (xn(ti)− xn(ti−1))2

Hvis vi ganger og deler med (ti − ti−1), ser vi at dette uttrykket er lik

√(x1(ti)− x1(ti−1)

ti − ti−1

)2

+ · · · +(

xn(ti)− xn(ti−1)ti − ti−1

)2

(ti − ti−1) ≈

≈√

x′1(ti)2 + · · ·x′n(ti)2 (ti − ti−1)

Page 75: Flervariabel analyse med lineær algebra

144 KAPITTEL 3. KURVER OG FLATER

Den totale lengden til den brudne veien er derfor

N∑

i=1

√(x1(ti)− x1(ti−1)

ti − ti−1

)2

+ · · · +(

xn(ti)− xn(ti−1)ti − ti−1

)2

(ti − ti−1) ≈

≈N∑

i=1

√x′1(ti)2 + · · · + x′n(ti)2 (ti − ti−1)

(forutsatt at x1, x2, . . . , xn er deriverbare). Dette er en Riemann-sum forfunksjonen

√x′1(t)2 + · · · + x′n(t)2, og gjør vi oppdelingen av intervallet fi-

nere og finere, nærmer dette uttrykket seg derfor∫ b

a

√x′1(t)2 + · · · + x′n(t)2 dt

Følgende definisjon er derfor fornuftig:

Definisjon 3.1.2 Anta at funksjonene x1, x2, . . . , xn er deriverbare med kon-tinuerlige deriverte. Da er buelengden til den parametriserte kurven r(t) =(x1(t), x2(t), . . . , xn(t)) fra a til b

L(a, b) =∫ b

a

√x′1(t)2 + x′2(t)2 + · · · + x′n(t)2 dt

Bemerkning: Definisjonen ovenfor forutsetter at komponentfunksjonenex1, x2, . . . , xn har kontinuerlige deriverte. Fra et teoretisk synspunkt er det-te en svakhet — vi burde ogsa være i stand til a male lengden til en kurvesom ikke har kontinuerlige deriverte. Oppgave 21 skisserer en mer generellmate a angripe problemet pa.

Eksempel 4: La oss bruke formelen ovenfor til a regne ut omkretsen til ensirkel. Bruker vi parametriseringen

r(t) = (x(t), y(t)) = (cos t, sin t) t ∈ [0, 2π]

far vi x′(t) = − sin t og y′(t) = cos t. Dette gir

L(0, 2π) =∫ 2π

0

√x′(t)2 + y′(t)2 dt

=∫ 2π

0

√(− sin t)2 + (cos t)2 dt =

∫ 2π

01 dt = 2π

3.1. PARAMETRISERTE KURVER 145

Pa tilsvarende mate kan vi regne ut buelengden til en omdreining avspiralen i eksempel 2:

Eksempel 5: Siden

r(t) = (x(t), y(t), z(t)) = (cos t, sin t, t),

har vix′(t) = − sin t y′(t) = cos t z′(t) = 1

Dette gir

L(0, 2π) =∫ 2π

0

√x′(t)2 + y′(t)2 + z′(t)2 dt

=∫ 2π

0

√(− sin t)2 + (cos t)2 + 12 dt =

∫ 2π

0

√2 dt = 2

√2π

Bemerkning: Den samme kurven kan parametriseres pa mange mater (ieksempel 1 sa vi to mater a parametrisere en halvsirkel pa), og geometriskeegenskaper slik som buelengde burde være uavhengig av hvilken paramet-risering vi velger. I teorien for kurver finnes det derfor en rekke resultatersom sier at forskjellige geometriske egenskaper er uavhengige av parametri-seringen. Vi skal ikke komme nærmere inn pa dette her, men har tatt mednoen eksempler i oppgavene.

Vi skal na se hvordan vi kan finne farten til gjenstanden var. Fra ti-den a til tiden t har den tilbakelagt en strekning s(t) gitt ved s(t) =L(a, t) =

∫ ta

√x′1(r)2 + x′2(r)2 + · · · + x′n(r)2 dr. Deriverer vi dette uttryk-

ket med hensyn pa t, far vi (ifølge analysens fundamentalteorem)

s′(t) =√

x′1(t)2 + x′2(t)2 + · · · + x′n(t)2

Siden farten er den deriverte av strekningen med hensyn pa tiden, fortellerdette oss at farten til gjenstanden var ved tiden t er

v(t) = s′(t) =√

x′1(t)2 + x′2(t)2 + · · · + x′n(t)2

Formelen ovenfor gir oss farten ved tidspunktet t som en skalar størrelsev(t). I mange sammenhenger er vi ikke bare interessert i hvor fort en gjen-stand beveger seg, men ogsa hvilken retning den beveger seg i. Vi er altsainteressert i a oppfatte hastigheten som en vektor som har bade størrelse ogretning. La oss tenke gjennom problemet fra begynnelsen av.

Page 76: Flervariabel analyse med lineær algebra

146 KAPITTEL 3. KURVER OG FLATER

!

"

111111112

++

++

+,

::

:T

::

::

::T

r(t)

r(t + ∆t)

r(t+∆t)−r(t)∆t

Figur 4: Tilnærming til tangenten

I løpet av et lite tidsintervall [t, t + ∆t] vil partikkelen flytte seg fra r(t)til r(t + ∆t). Forflytningen er altsa r(t + ∆t)− r(t) og den gjennomsnittligeforflytningen per tidsenhet er (r(t + ∆t)− r(t))/∆t. Dersom ∆t er liten, vilvektoren r(t + ∆t) − r(t) (og dermed den parallelle vektoren(r(t + ∆t) −r(t))/∆t) nesten være en tangent til kurven, og denne tilnærmingen blirbedre og bedre dess mindre ∆t er (se figur 4).

Den deriverte vektoren

r′(t) = lim∆t→0

r(t + ∆t)− r(t)∆t

= lim∆t→0

(x1(t + ∆t)− x1(t)∆t

,x2(t + ∆t)− x2(t)

∆t, . . . ,

xn(t + ∆t)− xn(t)∆t

)=

= (x′1(t), x′2(t), . . . , x

′n(t))

blir derfor bade en tangent til kurven og en beskrivelse av forflytning pertidsenhet ved tidspunktet t. Dette er motivasjonen for følgende definisjon.

Definisjon 3.1.3 Anta at funksjonene x1, x2, . . . , xn er deriverbare i punk-tet t. Da sier vi at den parametriserte kurven r(t) = (x1(t), x2(t), . . . , xn(t))er deriverbar i t, og at den deriverte er

v(t) = r′(t) = (x′1(t), x′2(t), . . . , x

′n(t))

I situasjoner der r(t) representerer posisjonen til en gjenstand ved tiden t,kaller vi v(t) for hastigheten til gjenstanden.

Bemerkning: Legg merke til terminologien — vektorstørrelsen v(t) kallervi hastigheten, mens tallet (skalaren) v(t) kaller vi farten. Dette pleide avære standard terminologi i matematikk- og fysikkbøker, men i senere arhar det blitt mer og mer vanlig a bruke betegnelsen fart om bade vektor-størrelsen r(t) og skalarstørrelsen v(t). Jeg synes den gamle terminologiener oversiktlig og grei og holder derfor fast pa den i dette kompendiet (det eren tilsvarende distinksjon pa engelsk; farten kalles “speed” og hastigheten

3.1. PARAMETRISERTE KURVER 147

kalles “velocity”). Legg forøvrig merke til at |v(t)| = v(t) slik at farten erlengden til hastighetsvektoren.

Det er pa tide med et eksempel:

Eksempel 6: Finn hastigheten og farten til den parametriserte kurvenr(t) = (t cos t, t sin t) (prøv a finne ut hvordan denne kurven ser ut!). Vifar

v(t) = r′(t) = ((t sin t)′, (t cos t)′) = (sin t + t cos t, cos t− t sin t)

Farten blir

v(t) = |v(t)| =√

(sin t + t cos t)2 + (cos t− t sin t)2

=√

sin2 t + 2t sin t cos t + t2 cos2 t + cos2 t− 2t sin t cos t + t2 sin2 t

=√

1 + t2

De vanlige derivasjonsreglene gjelder ogsa for derivasjon av vektorvaluertefunksjoner.

Setning 3.1.4 Dersom r1(t) og r2(t) er to deriverbare parametriserte kur-ver, gjelder:(i) (r1(t) + r2(t))′ = r′1(t) + r′2(t)(ii) (r1(t)− r2(t))′ = r′1(t)− r′2(t)(iii) (r1(t) · r2(t))′ = r′1(t) · r2(t) + r1(t) · r′2(t)(iv) (r1(t)× r2(t))′ = r′1(t)× r2(t) + r1(t)× r′2(t)(v) Dersom r(t) er en deriverbar parametrisert kurve og u(t) er en deriverbarfunksjon, er (u(t)r(t))′ = u′(t)r(t) + u(t)r′(t)

Bevis: Vi tar (iii) som et eksempel (de andre bevises pa lignende mate).Dersom

r1(t) = (x1(t), x2(t), . . . , xn(t))

ogr2(t) = (y1(t), y2(t), . . . , yn(t))

sa er r1(t) · r2(t) = x1(t)y1(t) + x2(t)y2(t) + · · · + xn(t)yn(t). Bruker vi denvanlige regelen for den deriverte til et produkt (husk at x1, x2, . . . , xn ogy1, y2, . . . , yn er vanlige funksjoner fra R til R), far vi:

(r1(t) · r2(t))′ = (x1(t)y1(t) + x2(t)y2(t) + · · · + xn(t)yn(t))′

= x′1(t)y1(t)+x1(t)y′1(t)+x′2(t)y2(t)+x2(t)y′2(t)+· · ·+x′n(t)yn(t)+xn(t)y′n(t)

Page 77: Flervariabel analyse med lineær algebra

148 KAPITTEL 3. KURVER OG FLATER

=(x′1(t)y1(t) + x′2(t)y2(t) + · · · + x′n(t)yn(t)

)+

+(x1(t)y′1(t) + x2(t)y′2(t) + · · · + xn(t)y′n(t)

)=

= r′1(t) · r2(t) + r1(t) · r′2(t)

!

Som et eksempel pa hvordan regnereglene kan brukes i mer teoretiskarbeid, tar vi med en konsekvens av (iii) som vi skal fa bruk for senere:

Korollar 3.1.5 Dersom |r(t)| er konstant, sa er r(t) og r′(t) ortogonale.

Bevis: Vi vet r(t) · r(t) = |r(t)|2 = C er konstant. Bruker vi punkt (iii) isetningen ovenfor til a derivere r(t) · r(t), far vi dermed:

2r(t) · r′(t) = 0

Følgelig er r(t) og r′(t) ortogonale. !

Bemerkning: Legg merk til at korollaret ovenfor har en geometrisk tolk-ning: Beveger vi oss pa et kuleskall, vil alltid hastigheten (som er tangenttil kulen) sta normalt pa posisjonsvektoren (som er en radius i kulen).

Den dobbeltderiverte til r(t) er

a(t) = v′(t) = (x′′1(t), x′′2(t), . . . , x

′′n(t)

Dersom r(t) representerer posisjonen til en gjenstand ved tiden t, kalles a(t)for akselerasjonen. Dette er en vektor som forteller oss hvordan hastighetenendrer seg, bade i størrelse og retning. I dagliglivet er det vanligere a snakkeom akselerasjon i en litt annen betydning, nemlig som fartsendring per tids-enhet, dvs. som a(t) = v′(t) (legg merke til at vi her deriverer skalarstørrelsenv(t) og ikke vektorstørrelsen v(t)). Vi skal kalle a(t) for baneakselerasjonenved tiden t. Det er naturlig a spørre om sammenhengen mellom vektorena(t) og skalaren a(t). Mange vil kanskje tippe at |a(t)| = a(t), men følgendeeksempel viser at det ikke er tilfellet.

Eksempel 7: Lar(t) = (cos t, sin t)

Da erv(t) = (− sin t, cos t)

som gir v(t) = |v(t)| = 1. Følgelig er a(t) = v′(t) = 0, mens

a(t) = (− cos t,− sin t)

3.1. PARAMETRISERTE KURVER 149

Dette gir |a(t)| = 1. Vi ser altsa at 0 = a(t) #= |a(t)| = 1. Det er ikke savanskelig a forsta hva som foregar. Gjenstanden var gar i en sirkelbane medkonstant fart. Siden farten er konstant, er baneakselerasjonen 0. Hastighetenskifter imidlertid retning hele tiden, og det medfører at a(t) er forskjellig fra0. ♣

Forutsatt at v(t) #= 0, kan vi definere enhetstangentvektoren T(t) ved

T(t) =v(t)v(t)

Som navnet sier, har denne vektoren lengde 1 for alle t. Snur vi pa ligningenovenfor, far vi v(t) = v(t)T(t), og deriverer vi dette uttrykket, ser vi at(husk setning 3.1.4(v)):

a(t) = v′(t) = v′(t)T(t) + v(t)T′(t) = a(t)T(t) + v(t)T′(t)

Ifølge korollar 3.1.5 star T′(t) normalt pa T(t) (og dermed pa v(t)). Vi hardermed vist:

Setning 3.1.6 Dersom v(t) #= 0, kan akselerasjonen a(t) dekomponeres ito ortogonale vektorer

a(t) = a(t)T(t) + v(t)T′(t)

der a(t)T(t) er parallell med tangenten og v(t)T′(t) star normalt pa tangen-ten.

Vi ser hva som skjer; baneakselerasjonen a(t) maler hvor mye fartenv(t) endrer seg, mens v(t)T′(t) maler hvor mye retningen endrer seg. Det ermulig a finne et mer informativt uttrykk for leddet v(t)T′(t), men vi skalikke komme nærmere inn pa dette her.

La oss avslutte dette kapittelet med to eksempler som viser hvordan vikan bruke parametriserte kurver til a beskrive fenomener i virkeligheten.

Eksempel 8: Hvilken kurve beskriver et punkt pa et hjul nar hjulet rullerbortover? Tenk deg av du har festet en refleksbrikke til et sykkeldekk og vilfinne kurven som det lysende punktet beskriver i nattemørket.

!

"

02/1

02/1

! !! ! DD

t#!r sin t

"$r − r cos t

!# rt

Figur 5: Et punkt pa et rullende hjul.

Page 78: Flervariabel analyse med lineær algebra

150 KAPITTEL 3. KURVER OG FLATER

Vi tenker oss at x-aksen er bakken som hjulet ruller pa, og at punktetvart starter i origo. Etter at hjulet har dreiet seg en vinkel t, har hjuletflyttet seg en distanse rt mot høyre, der r er radien i hjulet. Koordinatenetil det lysende punktet blir dermed (rt− r sin t, r − r cos t) (se figur 5).

Vi har dermed parameterfremstillingen

r(t) = (rt− r sin t, r − r cos t)

Denne kurven kalles en sykloide (se figur 6). ♣

Figur 6: En sykloide

Det neste eksemplet forutsetter litt kunnskaper om fysikk og differen-sialligninger.

Eksempel 9: I dette eksemplet skal vi studere en stein som kastes (eller etprosjektil som skytes ut) under luftmotstand. Vi skal beskrive bevegelsen i etkoordinatsystem som vist pa figur 7 der x-aksen ligger vannrett og y-aksenloddrett.

!

"

x

y

Figur 7: Kast med luftmotstand.

Vi trenger litt kunnskaper om fysikk. Dersom den totale kraften somvirker pa prosjektilet er F og akselerasjonen er a, sa forteller Newtons annenlov oss at F = ma der m er massen til steinen. Det er to krefter som virkerpa steinen i luften. Den ene er tyngdekraften som er gitt ved −mgj der g ertyngdens akselerasjon (g ≈ 9.8m/s2), og der j = (0, 1). Den andre kraftener luftmotstanden som vi skal anta er lik −kv der k er en konstant og v erhastigheten til steinen (i virkeligheten er luftmotstand en komplisert affæreog var formel er bare en av flere mulige tilnærminger).

3.1. PARAMETRISERTE KURVER 151

Vi lar r(t) = (x(t), y(t)) være posisjonen til steinen ved tiden t. Da erv(t) = (x′(t), y′(t)) og a(t) = (x′′(t), y′′(t)). Newtons lov F = ma kan naskrives

ma(t) = −mgj− kv

Deler vi pa m og ser pa første- og annenkomponenten hver for seg, far vi:

x′′(t) = − k

mx′(t) og y′′(t) = −g − k

my′(t)

For a finne kurven r(t) ma vi løse disse differensialligningene med passendebegynnelsesbetingelser. Vi antar at bevegelsen starter i origo med hastig-het v(0) = (u1, u2). Da blir begynnelsesbetingelsene x(0) = 0, x′(0) = u1,y(0) = 0, y′(0) = u2. Løser vi differensialligningene med disse begynnelses-betingelsene (gjør det!), far vi

x(t) =mu1

k

(1− e−

ktm

)

y(t) = −mg

kt +

(mu2

k+

m2g

k2

) (1− e−

ktm

)

Vi har dermed parametriseringen

r(t) =mu1

k

(1− e−

ktm

)i +

(−mg

kt +

(mu2

k+

m2g

k2

) (1− e−

ktm

))j

Legger du denne formelen inn i MATLAB (se nedenfor) eller en lommeregnerog velger verdier for m og k, kan du f.eks. eksperimentere med hvilken utkast-vinkel som gir den største kastlengden (sett u1 = v0 cos(α), u2 = v0 sin(α)der v0 er passende utgangsfart, og undersøk hvordan kastlengden varierermed vinkelen α). ♣

I fysikk og beslektede fag brukes parametriserte kurver til a beskrivehvordan objekter beveger seg, for eksempel hvordan planeter, stjerner og me-teorer beveger seg i verdensrommet. Eksempelet ovenfor gir en liten følelseav hvordan man kommer frem til slike parameterfremstillinger: Ved a brukeNewtons lov F = ma far vi satt opp differensialligninger som forbinder ak-selerasjonen x′′(t) = a(t), hastigheten x′(t) = v(t) og posisjonen x(t). Løservi disse differensialligningene med passende begynnelsesbetingelser, finnervi parametriseringen.

MATLAB-kommentar: Du kan fa MATLAB til a tegne parametrisertekurver i planet ved a bruke kommandoen plot pa vanlig mate. Vil du tegnesirkelen

r(t) = (cos t, sin t) t ∈ [0, 2π]

kan du for eksempel taste

Page 79: Flervariabel analyse med lineær algebra

152 KAPITTEL 3. KURVER OG FLATER

t=linspace(0,2*pi,100); % dette gir deg 100 jevnt% fordelte punkter fra 0 til 2π

x=cos(t);y=sin(t);plot(x,y)axis(’equal’)

Kommandoen axis(’equal’) sørger for at MATLAB bruker samme lengde-enhet langs begge aksene — utelater du den, blir sirkelen seende ut som enellipse. Kommandoen virker tilbake pa det siste plottet du har utført, og børderfor brukes etter kommandoen plot(x,y).

For a lage kurver i rommet, kan du bruke kommandoen plot3 pa tilsva-rende mate. Vil du plotte kurven

r(t) = (cos t, sin t, t2) t ∈ [0, 2π],

kan du f.eks. taste

t=linspace(0,2*pi,100);x=cos(t);y=sin(t);z=t.^2;plot3(x,y,z)axis(’equal’)

Oppgaver til seksjon 3.1

1. En parametrisert kurve er gitt ved r(t) = (t3, t2). Finn v(t), v(t), a(t) og a(t).

2. En kurve er parametrisert ved r(t) = (cos t, t sin t). Finn v(t), v(t), a(t) og a(t).

3. Finn hastigheten og akselerasjonen nar r(t) = (t, e−t, sin t).

4. Finn hastigheten og akselerasjonen nar r(t) = (ln t, t2, cos t).

5. Bruk MATLAB til a tegne kurvene:

a) r(t) = t cos t i + t sin t j, t ∈ [0, 6π]

b) r(t) = 5 cos t i + 3 sin t j, t ∈ [0, 2π]

c) r(t) = sin(2t) cos t i + sin(2t) sin t j, t ∈ [0, 2π]

d) r(t) = t cos t i + t sin t j + tk, t ∈ [0, 6π]

e) r(t) = t i + sin t j + cos tk, t ∈ [−20, 20]

6. Bruk MATLAB til a tegne kurven r(t) i eksempel 9. Velg m = 1, g = 9.8 ogeksperimenter med forskjellige verdier for k, u1 og u2.

7. En kurve er parametrisert ved

r(t) = (a cos t, b sin t) t ∈ [0, 2π]

3.1. PARAMETRISERTE KURVER 153

a) Vis at denne kurven er ellipsen med ligning x2

a2 + y2

b2 = 1

b) Finn hastigheten, farten og akselerasjonen.

c) Vis at omkretsen til ellipsen er∫ 2π0

√a2 sin2 t + b2 cos2 t dt. Sett a = 5, b = 3

og finn omkretsen ved a bruke numerisk integrasjon pa en lommeregner elleren datamaskin.

8. Finn buelengden til kurven

r(t) = (t2, t3) t ∈ [0, 10]

9. En kurve er parametrisert ved r(t) = (t, ln(cos t)) for t ∈ [0,π/4].

a) Finn hastigheten v(t) og farten v(t).

b) Finn buelengden (Hint: For a integrere 1cos x kan det være nyttig a bruke at

1cos x = cos x

1−sin2(x) ).

10. Vi har r(t) = (2 cos t,√

2 sin t,√

2 sin t).

a) Finn hastigheten, farten og akselerasjonen.

b) Finn buelengden fra t = 0 til t = 2π.

c) Vis at kurven ligger pa en kuleflate med sentrum i origo.

d) Vis at kurven ligger i planet y − z = 0.

e) Hva slags kurve fremstiller r? Bruk MATLAB til a tegne kurven.

11. Vi har r(t) = (t cos t, t sin t, t)

a) Finn hastigheten, farten og akselerasjonen.

b) Vis at buelengden fra t = 0 til t = 2π er∫ 2π0

√2 + t2 dt. Bruk numerisk

integrasjon til a beregne dette integralet.

c) Løs integralet i b) ved regning. Bruk substitusjonen t = eu−e−u√

2.

12. La r(t) være sykloiden i eksempel 8.

a) Finn hastigheten og akselerasjonen.

b) Vis at lengden punktet gjennomløper mens hjulet dreier en gang rundt, err√

2∫ 2π0

√1− cos t dt

c) Forklar hvorfor√

1− cos t = | sin t|√1+cos t

.

d) Regn ut integralet i b).

13. Bevis (i), (ii), (iv) og (v) i setning 3.1.4.

14. En partikkel gar i en sirkelbane med radius r om origo. Farten er konstant likv. Partikkelen starter i punktet (0, 1) ved tiden t = 0 og beveger seg mot urviserne.

a) Vis at posisjonen ved tiden t er r(t) = (r cos(vtr ), r sin(vt

r )).

Page 80: Flervariabel analyse med lineær algebra

154 KAPITTEL 3. KURVER OG FLATER

b) Vis at a(t) = −(vr )2r(t).

15. En kanonkule skytes ut med en fart v0. I utskytingsøyeblikket danner kulensbane en vinkel α med horisontalplanet. Kulens posisjon etter t sekunder kaller vir(t) = (x(t), y(t)). Dersom vi kan se bort fra luftmotstanden, vil x(t) = v0t cos α ogy(t) = v0t sinα− 1

2gt2 der g er tyngdens akselerasjon.

a) Finn v og a.

b) Hvor høyt over bakken er kulen pa det høyeste?

c) Hvor langt kan kanonen skyte (vi antar at bakken er horisontal)?

16. Nar er steinen i eksempel 9 i det høyeste punktet pa banen? Hvor høyt er dettepunktet?

17. Avstanden mellom det stedet der bakhjulet til en sykkel berører bakken, ogdet stedet der forhjulet berører bakken, er 1 meter. Nar vi sykler, etterlater badeforhjulet og bakhjulet et spor i bakken.

a) Anta at sporet bakhjulet etterlater seg, er gitt ved r1(t). Vis at sporet for-hjulet etterlater seg, har parametrisering r2(t) = r1(t) + T1(t), der T1(t) erenhetstangentvektoren til r1(t).

b) Anta at bakhjulet følger kurven r1(t) = (t, sin t). Finn parametriseringenr2(t) til kurven som forhjulet følger.

c) Bruk MATLAB til a tegne kurvene r1 og r2 i samme koordinatsystem.

.

d) Figuren ovenfor viser sporene etter en sykkel som har vinglet forbi. Kjørtesykkelen fra venstre mot høyre eller i motsatt retning?

18. Et hjul med radius a ruller pa utsiden av en sirkel med radius b (se figuren).Finn en parameterfremstilling for den kurven et punkt pa hjulet følger. Du kan selvvelge hvordan du vil legge koordinatsystemet og hvor startpunktet er.

02/1>E

EF

#!b

19. (Eksamen i MAT 100A/C, 8/12-2000) I denne oppgaven er r(t) = (t, t2) enparametrisert kurve og b = (0, y), y > 0, er et punkt pa den positive y-aksen.

3.1. PARAMETRISERTE KURVER 155

a) Skisser kurven og finn r′(t). Vis at den deriverte til funksjonen

f(t) = |r(t)− b|2

kan skrives f ′(t) = 2r′(t) · (r(t)− b).

b) Vi er interessert i a finne de punktene pa kurven som ligger nærmest b. Visat dersom r(t0) er et slik punkt, sa er

r′(t0) · (r(t0)− b) = 0

Forklar denne likningen geometrisk.

c) Finn de punktene pa kurven som ligger nærmest b.

20. En parametrisert kurve er gitt ved r(t) = (x(t), y(t)), a ≤ t ≤ b, der x og yhar kontinuerlige deriverte x′, y′. Anta at g : [c, d] → [a, b] er en voksende funksjonmed kontinuerlig derivert og at g(c) = a, g(d) = b.

a) Forklar at s(t) = r(g(t)), c ≤ t ≤ d, er en annen parametrisering av densamme kurven.

I resten av denne oppgaven skal vi vise at et par grunnleggende geometriske egen-skaper til kurven er de samme uansett hvilken av de to parametriseringene vi velger.

b) La a = s(t0) = r(g(t0)) være et punkt pa kurven. Vi kan regne ut to tan-gentvektorer i punktet a, nemlig s′(t0) og r′(g(t0)). Vis at disse vektorene erparallelle (vi godtar at den ene eller begge er lik 0).

c) Vis at buelengden til kurven blir den samme uansett hvilken av de to para-metriseringene vi velger.

21. En partikkel beveger seg i et kraftfelt der kraften hele tiden er rettet mot eller fraorigo (dette gjelder blant annet partikler i et gravitasjonsfelt eller et elektrisk felt dermassen eller ladningen er konsentrert i origo). Ifølge Newtons annen lov er F = ma,sa akselerasjonen er ogsa rettet mot eller fra origo. Det betyr at akselerasjonen vedtiden t er gitt ved a(t) = k(t)r(t) der k(t) er en skalar størrelse.

a) Vis at ddt [r(t)× v(t)] = 0.

b) Forklar hvorfor r(t)× v(t) = c der c er en konstant vektor (uavhengig av t).

c) Vis at partikkelen hele tiden beveger seg i planet gjennom punktene 0, r(0)og v(0).

22. Anta at v : [a, b] → Rn er en parametrisert kurve.

a) La a = t0 < t1 < . . . < tN = b være en partisjon av [a, b]. Vis at∣∣∣∣∣

N∑

i=1

v(ti)(ti − ti−1)

∣∣∣∣∣ ≤N∑

i=1

|v(ti)| (ti − ti−1)

b) Vi definerer∫ b

av(t) dt =

( ∫ b

av1(t) dt,

∫ b

av2(t) dt, . . . ,

∫ b

avn(t) dt

)

Page 81: Flervariabel analyse med lineær algebra

156 KAPITTEL 3. KURVER OG FLATER

dvs. at vi integrerer v komponentvis. Vis at∣∣∣∣∣

∫ b

av(t) dt

∣∣∣∣∣ ≤∫ b

a|v(t)| dt

c) Anta at r : [a, b] → Rn er en paramertrisert kurve med kontinuerlig derivertv(t) = r′(t). Vis at

|r(b)− r(a)| ≤∫ b

av(t) dt

der som vanlig v(t) = |v(t)|.

23. Definisjonen vi har gitt av buelengde er grei for regnetekniske formal, men denhar teoretiske svakheter. I denne oppgaven skal vi se pa en mer tilfredsstillendemate a definere buelengde pa. Deler av oppgaven bygger pa oppgave 20 ovenfor, ogdet kan derfor være lurt a regne den først.

Vi starter med en parametrisert kurve r : [a, b] → Rn. For hver partisjon

Π = {a = t0 < t1 < t2 < . . . tN = b}

av [a, b], lar vi

l(Π) =N∑

i=1

|r(ti)− r(ti−1)|

være lengden til den tilhørende brudne stien. Vi definerer na

Λ(a, b) = sup{l(Π) |Π er en partisjon av [a, b]}

der vi setter Λ(a, b) = ∞ hvis mengden er ubegrenset. Dersom Λ(a, b) er endelig,sier vi at den parametriserte kurven er rektifiserbar og definerer lengden til r til avære Λ(a, b).

a) Anta at r er rektifiserbar. Vis at dersom a < c < b sa er Λ(a, b) = Λ(a, c) +Λ(c, b)

b) I resten av oppgaven antar vi at r er deriverbar og at den deriverte r′(t) = v(t)er kontinuerlig. Vis at for alle partisjoner Π er l(Π) ≤

∫ ba v(t) dt, og at r derfor

er rektifiserbar (her kan du fa bruk for oppgave 20).

c) Definer s : [a, b] → R ved s(t) = Λ(a, t). I neste punkt skal vi vise at s′(t) =v(t). Forklar at dette vil medføre at s(t) =

∫ ta v(r) dr.

d) Forklar ulikhetene

∣∣∣∣r(t + h)− r(t)

h

∣∣∣∣ ≤s(t + h)− s(t)

h≤ 1

h

∫ t+h

tv(s) ds

(du vil sannsynligvis fa bruk for resultatene i oppgave 20) og vis at demedfører at s′(t) = v(t).

3.2. KJERNEREGELEN FOR PARAMETRISERTE KURVER 157

3.2 Kjerneregelen for parametriserte kurver

I seksjon 2.7 studerte vi kjerneregelen bade pa matrise- og koordinatform.Vi skal na kikke litt pa hvordan regelen blir seende ut nar kjernefunksjonener en parametrisert kurve. Det er ingen ny matematikk i dette, bare littnotasjon som gjør kjerneregelen enklere a bruke i praksis.

Setning 3.2.1 Hvis den parametriserte kurven r(t) = (x1(t), . . . , xn(t)) erderiverbar i punktet t ∈ I, og skalarfeltet f : Rn → R er deriverbart i punktetr(t), sa er funksjonen u(t) = f(r(t)) deriverbar i t, og

u′(t) =∂f

∂x1(r(t))x′1(t)+

∂f

∂x2(r(t))x′2(t)+· · ·+ ∂f

∂xn(r(t))x′n(t) = ∇f(r(t))·r′(t)

Bevis: Bruker vi kjerneregelen pa komponentform pa uttrykket

u(t) = f(r(t)) = f(x1(t), x2(t), . . . , xn(t))

far vi

u′(t) =∂f

∂x1(r(t))

∂x1(t)∂t

+∂f

∂x2(r(t))

∂x2(t)∂t

+ · · · + ∂f

∂xn(r(t))

∂xn(t)∂t

=

=∂f

∂x1(r(t))x′1(t) +

∂f

∂x2(r(t))x′2(t) + · · · + ∂f

∂xn(r(t))x′n(t) = ∇f(r(t)) · r′(t)

der vi i siste skritt bruker at ∇f(r(t)) = ( ∂f∂x1

(r(t)), ∂f∂x2

(r(t)), . . . , ∂f∂xn

(r(t))og r′(t) = (x′1(t), x′2(t), . . . , x′n(t)) !

Som det fremgar av beviset, er setningen ovenfor bare et spesialtilfel-le av den generelle kjerneregelen. Siden gradienten har en viktig geome-trisk betydning, er det imidlertid lurt a være klar over skrivematen u′(t) =∇f(r(t)) · r′(t).

Eksempel 1. Et primitivt havdyr svømmer slik at det alltid befinner seget sted der havtemperaturen er 20◦. Anta at T (x, y, z) er havtemperaturen ipunktet (x, y, z), og at r(t) er posisjonen til dyret ved tiden t. Vi skal vise athastigheten r′(t) alltid star normalt pa gradienten ∇T (r(t)) til temperatur-funksjonen.

Siden gradienten peker i den retningen hvor temperaturen vokser raskest,virker det ikke unaturlig at dyret ma bevege seg “pa tvers” av gradientenfor a holde temperaturen konstant. For a vise dette observerer vi at hvisu(t) er havtemperaturen i dyrets posisjon ved tiden t, sa er pa den ene sideu(t) = 20, og pa den annen side

u(t) = T (r(t))

Page 82: Flervariabel analyse med lineær algebra

158 KAPITTEL 3. KURVER OG FLATER

Deriverer vi disse uttrykkene, far vi hhv. u′(t) = 0 og

u′(t) = ∇T (r(t)) · r′(t)

Dermed er ∇T (r(t)) · r′(t) = 0 og følgelig star ∇T (r(t)) og r′(t) normalt pahverandre. ♣

Ofte trenger vi resultatet i setning 3.2.1 pa en litt utvidet form fordifunksjonen f ikke bare avhenger av posisjonen r(t), men ogsa av tiden t. Viønsker altsa a derivere et uttrykk av typen

u(t) = f(r(t), t)

Ved a bruke kjerneregelen pa akkurat samme mate som ovenfor, ser vi at

u′(t) =∂f

∂x1(r(t), t)x′1(t) + · · · + ∂f

∂xn(r(t), t)x′n(t) +

∂f

∂t(r(t), t) (3.2.1)

(siden den deriverte av t mhp. t er 1, far ikke det siste leddet en faktor avtypen x′1(t), . . . , x′n(t)).

Vi tar ogsa med en variant av kjerneregelen for vektorvaluerte funksjoner.Dersom

F(x, t) =

F1(x, t)F2(x, t)

...Fm(x, t)

er en funksjon av n + 1 variable med verdier i Rm, skal vi bruke notasjonen

∂F∂xi

(x, t) =

∂F1∂xi

(x, t)∂F2∂xi

(x, t)

...∂Fm∂xi

(x, t)

og

∂F∂t

(x, t) =

∂F1∂t (x, t)

∂F2∂t (x, t)

...∂Fm∂t (x, t)

Setning 3.2.2 La F : A → Rm være en funksjon av n + 1 variable. Der-som den parametriserte kurven r(t) = (x1(t), x2(t), . . . , xn(t)) er deriverbari punktet t, og F er deriverbar i punktet (r(t), t), sa er den sammesattefunksjonen U(t) = F(r(t), t) deriverbar i t og

U′(t) =∂F∂x1

(r(t), t)x′1(t) + · · · + ∂F∂xn

(r(t), t)x′n(t) +∂F∂t

(r(t), t)

Bevis: Den i-te komponenten til U er

Ui(t) = Fi(r(t), t)

3.2. KJERNEREGELEN FOR PARAMETRISERTE KURVER 159

Bruker vi formel (3.2.1) pa dette uttrykket, far vi

U ′i(t) =

∂Fi

∂x1(r(t), t)x′1(t) + · · · + ∂Fi

∂xn(r(t), t)x′n(t) +

∂Fi

∂t(r(t), t)

Kombinerer vi alle komponentene, far vi

U′(t) =∂F∂x1

(r(t), t)x′1(t) + · · · + ∂F∂xn

(r(t), t)x′n(t) +∂F∂t

(r(t), t) !

Denne varianten av kjerneregel brukes mye i fysikk og hydrodynamikk. Herer et typisk eksempel:

Eksempel 2: I en strømmende væske er hastigheten i punktet (x, y, z) vedtiden t gitt ved

F(x, y, z, t) =

F1(x, y, z, t)F2(x, y, z, t)F3(x, y, z, t)

Vi skal finne akselerasjonen til en partikkel i væsken.Dersom r(t) = (x(t), y(t), z(t)) er posisjonen til partikkelen ved tiden t,

vet vi at hastigheten er gitt ved

v(t) = F(r(t), t)

Akselerasjonen a(t) er den tidsderiverte til hastigheten, sa ifølge setningenovenfor er

a(t) = v′(t) =∂F∂x

(r(t), t)x′(t)+∂F∂y

(r(t), t)y′(t)+∂F∂z

(r(t), t)z′(t)+∂F∂t

(r(t), t)

Siden v(t) = F(r(t), t), har vi

x′(t) = F1(r(t), t), y′(t) = F2(r(t), t) og z′(t) = F3(r(t), t)

Setter vi dette inn i uttrykket ovenfor, far vi

a(t) =∂F∂x

(r(t), t)F1(r(t), t) +∂F∂y

(r(t), t)F2(r(t), t) +

+∂F∂z

(r(t), t)F3(r(t), t) +∂F∂t

(r(t), t)

Dette uttrykket for akselerasjonen til en partikkel i et hastighetsfelt kankobles sammen med Newtons annen lov, og blir da et av utgangspunktenefor de grunnleggende ligningene i hydrodynamikken. ♣

Page 83: Flervariabel analyse med lineær algebra

160 KAPITTEL 3. KURVER OG FLATER

Middelverdisetningen for funksjoner av flere variable

Til slutt i denne seksjonen tar vi med en utvidelse av middelverdisetningen(setning 6.2.3 i Kalkulus) til funksjoner av flere variable. Vi skal fa bruk fordette resultatet flere steder i kapittel 5.

Setning 3.2.3 (Middelverdisetning for funksjoner av flere variable)Anta at f : A → R er en funksjon av m variable, og at f er deriverbar i etomrade som inneholder linjestykket mellom punktene a,b ∈ Rm. Da finnesdet et punkt c pa linjestykket fra a til b slik at

f(b)− f(a) = ∇f(c) · (b− a)

Bevis: Definer en funksjon g : [0, 1] → R av en variabel ved

g(t) = f(r(t))

der r(t) = a+ t(b− a), t ∈ [0, 1], er en parametrisering av linjestykket fra atil b. Ved kjerneregelen er

g′(t) = ∇f(r(t)) · r′(t) = ∇f(r(t)) · (b− a)

Etter den vanlige middelverdisetningen (Kalkulus, setning 6.2.3) finnes detet tall c mellom 0 og 1 slik at

g(1)− g(0) = g′(c) = ∇f(r(c)) · (b− a)

Setter vi c = r(c), har vi dermed

f(b)− f(a) = ∇f(c) · (b− a)

og setningen er bevist. !

Oppgaver til seksjon 3.2

1. Anta at f(x, y) = x2y3 og r(t) = t2 i + 3t j. Regn ut g′(t) nar g(t) = f(r(t)).

2. Anta at f(x, y) = x2exy2og r(t) = sin t i+cos t j. Regn ut g′(t) nar g(t) = f(r(t)).

3. Anta at f(x, y, z) = x2z − y sin(yz) og r(t) = et i + t j + cos t2 k. Regn ut g′(t)nar g(t) = f(r(t)).

4. Anta at f(x, y, t) = ty2 ln(x2 + 1) og r(t) = t3 i + (3t + 1) j. Regn ut g′(t) narg(t) = f(r(t), t).

5. Anta at F(x, y) =(

x2yxy + x

)og at r(t) = sin t i + cos t j. Regn ut G′(t) nar

G(t) = F(r(t)).

3.3. LINJEINTEGRALER FOR SKALARFELT 161

6. Anta at F(x, y, t) =

x2t + ycos(xy)

t2x

og at r(t) = (1− t2) i + sin t j. Regn ut G′(t)

nar G(t) = F(r(t), t).

7. Temperaturen i et punkt (x, y) ved tiden t er

f(x, y, t) = 20 + 2t− x2 + y2

En person befinner seg ved tiden t i punktet

r(t) = (3t− t2

4) i + (2t +

t2

8) j

Er temperaturen som personen opplever økende eller avtagende ved tiden t = 1?

8. Anta at f : R2 → R har kontinuerlige annenordens partiellderiverte, og atr(t) = x(t) i + y(t) j der x og y er to ganger deriverbare. La g(t) = f(r(t)).Vis at

g′′(t) =∂2f

∂x2(r(t))x′(t)2 + 2

∂2f

∂x∂y(r(t))x′(t)y′(t) +

∂2f

∂y2(r(t)) y′(t)2+

+∂f

∂x(r(t))x′′(t) +

∂f

∂y(r(t)) y′′(t)

3.3 Linjeintegraler for skalarfelt

I denne og den neste seksjonen skal vi se pa to forskjellige metoder for aintegrere en funksjon langs en kurve C. De to integraltypene betegnes medhenholdsvis ∫

Cf ds og

CF dr

og de har litt forskjellige bruksomrader.Vi starter med integraltypen

∫C f ds, og tenker oss at C er en kurve

parametrisert vedr : [a, b] → Rn

La oss videre tenke oss at C er en trad med varierende tykkelse, og at tett-heten til traden i et punkt x er f(x). Det betyr at hvis vi kutter ut en litenbit av traden med lengde s rundt punktet x, sa er massen til den delentilnærmet lik f(x)s. Hvis vi har lyst til a finne et tilnærmet uttrykk for helemassen til traden, deler vi den opp i flere smadeler med lengde s1, s2,. . . ,sN

og velger punkter x1, x2, . . . ,xN pa de forskjellige delene. Massen til tradenvil da være tilnærmet lik

f(x1)s1 + f(x2)s2 + · · · + f(xn)sN =N∑

i=1

f(xi)si

Page 84: Flervariabel analyse med lineær algebra

162 KAPITTEL 3. KURVER OG FLATER

med bedre tilnærming dess finere oppdelingen er. Dette minner sterkt omRiemann-summen til et integral, og gir oss et hint om at massen kan uttryk-kes som et integral. La oss ta et skritt tilbake og begynne med parametrise-ringen

r : [a, b] → Rn

Vi deler opp intervallet [a, b] pa den vanlige maten

a = t0 < t1 < . . . < tN = b

og velger et punkt ci ∈ [ti−1, ti] i det i-te delintervallet. Den delen av sno-ren som er parametrisert av dette delintervallet, vil ha en lengde som eromtrent v(ci)(ti − ti−1) (strekning er fart ganger tid) og en tetthet som eromtrent f(r(ci)). Massen til denne delen av traden er altsa tilnærmet likf(r(ci))v(ci)(ti − ti−1), og massen til hele traden blir tilnærmet lik

N∑

i=1

f(r(ci))v(ci)(ti − ti−1)

Dette er en Riemann-sum for funksjonen f(r(t))v(t) og konvergerer motintegralet ∫ b

af(r(t))v(t) dt

nar oppdelingen blir finere og finere. Massen til traden er derfor gitt ved

M =∫ b

af(r(t))v(t) dt

Argumentet ovenfor er ikke et matematisk bevis (vi har ikke gitt en matema-tisk definisjon av begrepene som inngar, og vi har vært temmelig uforsiktigemed begrepet “tilnærmet lik”), men det gir oss en sterk indikasjon pa at inte-graler av typen

∫ ba f(r(t))v(t) dt er nyttige nar vi skal regne ut totaleffekten

av noe som varierer langs en kurve. Vi skal ta dette som utgangspunkt forvar definisjon av integraler av typen

∫C f ds, men før vi ser pa den formelle

definisjonen, ma vi ble enige om hva slags kurver vi skal arbeide med.Vi skal si at en parametrisering r : [a, b] → Rn er glatt dersom funksjonen

r er kontinuerlig pa [a, b] og den deriverte r′(t) er kontinuerlig pa det indreintervallet (a, b). Hvis kurven er glatt, varierer altsa hastighetsvektoren paen kontinuerlig mate nar vi flytter oss langs kurven. En kontinuerlig para-metrisering r : [a, b] → Rn er stykkevis glatt dersom vi kan dele [a, b] i etendelig antall delintervaller slik at r er glatt pa hvert av disse delintervallene.Pa en stykkevis glatt kurve kan det finnes unntakspunkter der hastighets-vektoren ikke eksisterer eller varierer pa en diskontinuerlig mate. Figurennedenfor viser et typisk eksempel pa en stykkevis glatt kurve; kurven C ersatt sammen av de glatte delene C1, C2, C3, C4 og C5.

3.3. LINJEINTEGRALER FOR SKALARFELT 163

C1

C2

C3

C4

C5

Figur 1: En stykkevis glatt kurve C

Definisjon 3.3.1 Anta at f : A → R er en funksjon av n variable, og at r :[a, b] → A er en stykkevis glatt parametrisering av en kurve C. Linjeintegralet∫C f ds er definert ved

Cf ds =

∫ b

af(r(t))v(t) dt

forutsatt at dette integralet eksisterer som et vanlig eller uegentlig integral.

Legg merke til at v(t) kan ga mot uendelig nar vi nærmer oss et avpunktene der r ikke er glatt, og at integralet derfor kan divergere. I deeksemplene vi vanligvis skal arbeide med, vil v(t) være begrenset, og detteproblemet vil ikke oppsta.

La oss se pa et eksempel pa hvordan vi regner ut et linjeintegral.

Eksempel 1: La oss regne ut∫C f ds nar C er enhetssirkelen parametrisert

vedr(t) = cos t i + sin t j t ∈ [0, 2π]

og f(x, y) = xy2.Vi regner først ut v(t) =

√x′(t)2 + y′(t)2 =

√(− sin t)2 + (cos t)2 = 1.

Siden f(r(t)) = f(cos t, sin t) = cos t sin2 t, har vi∫

Cf ds =

∫ 2π

0cos t sin2 t · 1 dt =

∫ 2π

0cos t sin2 t dt

Vi løser dette integralet ved a sette u = sin t. Da er du = cos t dt, u(0) = 0,u(2π) = 0, sa vi far

Cf ds =

∫ 2π

0cos t sin2 t dt =

∫ 0

0u2 du = 0

(du kan ogsa se dette direkte fra integralet∫ 2π0 cos t sin2 t dt ved symmetri-

betraktning). ♣

Kurveintegraler tilfredsstiller de samme reglene som vanlige integraler:

Page 85: Flervariabel analyse med lineær algebra

164 KAPITTEL 3. KURVER OG FLATER

Setning 3.3.2 Anta at r er en stykkevis glatt parametriseing og at f, g erto kontinuerlige funksjoner slik at integralene

∫C f ds og

∫C g ds eksisterer.

Da er(i)

∫C(f + g) ds=

∫C f ds +

∫C g ds

(ii)∫C(f − g) ds=

∫C f ds−

∫C g ds

(iii)∫C af ds=a

∫C f ds for alle a ∈ R.

Disse resultatene følger direkte fra tilsvarende resultater for vanlige inte-graler, og vi tar ikke med bevisene her. Det neste resultatet forteller oss atvi kan regne ut et linjeintegral ved a dele opp kurven i mindre deler og regneut integralet over hver del. Ogsa i dette tilfellet følger resultatet direkte fratilsvarende resultat for vanlige integraler, og vi sløyfer beviset.

Setning 3.3.3 Anta at r er en stykkevis glatt parametriseing av kurven C ogat f er en kontinuerlig funksjon slik at integralet

∫C f ds eksisterer. Dersom

a = t0 < t1 < . . . < tm = b

er en partisjon av [a, b], og Ci er kurven parametrisert ved r : [ti−1, ti] → Rn

(vi deler altsa kurven opp i m biter og lar Ci være den i-te biten), sa er∫

Cf ds =

C1

f ds +∫

C2

f ds + · · · +∫

Cm

f ds

Den samme kurven kan parametriseres pa forskjellige mater, og det ernaturlig a spørre om integralet

∫C f ds far samme verdi nar vi bruker to

forskjellige parametriseringer. Som vi na skal se, er svaret “ja” forutsattat vi har en fornuftig definisjon av hva det vil si at to parametriseringerfremstiller den samme kurven. La oss begynne med en parametrisering r1 :[a, b] → Rn, og se hva som skal til for a lage enn annen parametriseringr2 : [c, d] → Rn av den samme kurven. Hvis vi tenker pa t som tiden,vil den første parametriseringen være i punktet r1(t) ved tiden t. Den andreparametriseringen ma være i dette punktet ved et tidspunkt φ(t) i intervallet[c, d]. Vi far altsa sammenhengen

r2(φ(t)) = r1(t)

der φ er en funksjon med definisjonsmengde |a, b] og verdimengde [c, d].Funksjonen φ ma være injektiv (hvis ikke tillater vi den ene parametrise-ringen a ga frem og tilbake langs kurven) og siden parametriseringene skalvære (stykkevis) deriverbare med kontinuerlige deriverte, er det naturlig akreve at φ ogsa er deriverbar med kontinuerlig derivert. Av litt mer tekniskegrunner skal vi anta at φ′(t) #= 0 for alle t ∈ [a, b]. I utgangspunktet kandet virke naturlig a anta at φ er voksende slik at de to parametriseringenegjennomløper kurven i samme retning, men det viser seg a være lurt ogsa atillate avtagende φ (i sa fall vil r2 gjennomløpe kurven i motsatt retning avr1). La oss oppsummere denne diskusjonen i en definisjon.

3.3. LINJEINTEGRALER FOR SKALARFELT 165

Definisjon 3.3.4 Anta at r1 : [a, b] → Rn og r2 : [c, d] → Rn er to stykkevisglatte parametriseringer. Vi sier at r1 og r2 er ekvivalente dersom det finnesen funksjon φ : [a, b] → [c, d] slik at:(i) r2(φ(t)) = r1(t) for alle t ∈ [a, b].(ii) φ er kontinuerlig med verdimengde [c, d].(iii) φ′ er kontinuerlig og forskjellig fra 0 pa intervallet (a, b).Dersom φ er strengt voksende, sier vi at r1 og r2 har samme orientering;dersom φ er strengt avtagende, sier vi at de har motsatt orientering.

Legg merke til at siden funksjonen φ′ er kontinuerlig og forskjellig fra 0,ma den (ifølge skjæringssetningen) enten være positiv overalt eller negativoveralt. Det betyr at φ enten er strengt voksende eller strengt avtagende.

Vi kan na bevise resultatet vi ønsker oss:

Setning 3.3.5 Anta at r1 : [a, b] → Rn og r2 : [c, d] → Rn er to ekvivalen-te, stykkevis glatte parametriseringer av kurven C. Da har integralet

∫C f ds

samme verdi uansett hvilken av parametriseringene vi bruker.

Bevis: Vi skal anta at parametriseringene er glatte; det generelle tilfellet farvi ved a skjøte sammen de glatte delene av stykkevis glatte parametriserin-ger. Vi skal ogsa anta at funksjonen φ er voksende; beviset for avtagende φgar pa samme mate, men er litt mer komplisert fordi vi ma bytte fortegn toganger underveis.

Bruker vi parametriseringen r1, har vi

I1 =∫

Cf ds =

∫ b

af(r1(t))v1(t) dt

Siden r1(t) = r2(φ(t)), gir kjerneregelen

v1(t) = r′1(t) = r′2(φ(t))φ′(t) = v2(φ(t))φ′(t)

Siden φ′(t) > 0, gir dette v1(t) = |v1(t)| = |v2(φ(t))φ′(t)| = v2(φ(t))φ′(t).Vi setter inn i uttrykket for I1 ovenfor, og far

I1 =∫

Cf ds =

∫ b

af(r1(t))v1(t) dt =

∫ b

af(r2(φ(t)))v2(φ(t))φ′(t) dt

Hvis vi na innfører en ny variabel u = φ(t), far vi du = φ′(t) dt. Sidenφ(a) = c og φ(b) = d, har vi dermed

I1 =∫ b

af(r2(φ(t)))v2(φ(t))φ′(t) dt =

∫ d

cf(r2(u))v2(u) du

Det siste integralet er nøyaktg det vi far dersom vi prøver a regne ut linje-integralet

∫C f ds ved hjelp av parametriseringen r2, og beviset er dermed

Page 86: Flervariabel analyse med lineær algebra

166 KAPITTEL 3. KURVER OG FLATER

fullført. !

Siden parametriseringen ikke spiller noen rolle, skal vi ofte referere tilintegralet

∫C f ds uten a spesifisere hviken parametrisering vi tenker pa. I

det neste eksemplet far vi anledning til a bruke en del av de egenskapene vina har sett pa.

Eksempel 2: Regn ut integralet∫C f ds nar f(x, y) = x + y2 og C er om-

kretsen til trekanten med hjørner (0, 0), (1, 0) og (0, 1).I dette eksemplet arbeider vi med en lukket kurve, dvs. en kurve som

starter og ender i samme punkt. Det følger fra resultatene ovenfor (undersøkhvordan!) at det ikke spiller noen rolle hvilket punkt vi bruker som start-og endepunkt. Vi velger derfor a begynne i (0, 0). Kurven C bestar av trenaturlige deler; det horisontale linjestykket C1 fra (0, 0) til (1, 0), det skralinjestykket C2 fra (1, 0) til (0, 1) og det vertikale linjestykket C3 fra (0, 1) til(0, 0). Ifølge setning 3.3.3 er

Cf ds =

C1

f ds +∫

C2

f ds +∫

C3

f ds

og vi kan derfor ta for oss ett linjestykke av gangen.Vi begynner med C1. Den enkleste parametriseringen av denne kurven

err1(t) = t i + 0 j = t i t ∈ [0, 1]

Deriverer vi, far viv1(t) = 1 i = i

som gir v1(t) = 1. Dermed er∫

C1

f ds =∫ 1

0f(r1(t)) v1(t) dt =

∫ 1

0(t + 02) · 1 dt =

∫ 1

0t dt =

12

Neste skritt er a se pa C2. En grei parametrisering av denne linjen er

r2(t) = (1− t) i + t j t ∈ [0, 1]

Vi farv2(t) = −i + j

som gir v2(t) =√

2. Dermed er∫

C2

f ds =∫ 1

0f(r2(t))v2(t) dt =

∫ 1

0((1− t) + t2) ·

√2 dt =

=√

2∫ 1

0(1− t + t2) dt =

√2[t− t2

2+

t3

3

]1

0

=56√

2

3.3. LINJEINTEGRALER FOR SKALARFELT 167

Til slutt tar vi for oss C3. Vi bruker parametriseringen

r3(t) = 0 i + t j t ∈ [0, 1]

(den parametriserer riktignok kurven “gal vei” i forhold til den retningen vihittil har gatt i, men det spiller ingen rolle). Vi far

v3(t) = j

og v3(t) = 1. Dermed er∫

C3

f ds =∫ 1

0f(r3(t))v3(t) dt =

∫ 1

0(0 + t2) · 1 dt =

∫ 1

0t2 dt =

13

Kombinerer vi alle disse resultatene, far vi∫

Cf ds =

12

+56√

2 +13

=56(1 +

√2)

!

Vi avslutter med et eksempel pa hvordan linjeintegraler kan brukes ipraktiske situasjoner.

Eksempel 3: En bil befinner seg ved tiden t ∈ [0, 2] i punktet

r(t) = 30t i + 40t j + 8t32 k

Tiden er malt i timer og alle avstander i kilometer. Bensinforbruket i literper kilometer er 0.05 + 0.002v der v er farten. Var oppgave er a finne dettotale bensinforbruket.

Dersom bilen kjører med fart v i et tidsrom ∆t, tilbakelegger den enstrekning ∆s = v∆t, og bensinforbruket i denne perioden er dermed

(0.05 + 0.002v)∆s = (0.05 + 0.002v)v∆t

Bruker vi Riemann-summer, ser vi at det totale forbruket i løpet av kjøreturener

F =∫

C(0.05 + 0.002v) ds =

∫ 2

0(0.05 + 0.002v)v dt

For a finne v, regner vi først ut

v(t) = 30 i + 40 j + 12t12 k

som girv(t) =

√2500 + 144t

Page 87: Flervariabel analyse med lineær algebra

168 KAPITTEL 3. KURVER OG FLATER

Forbruket blir dermed

F =∫ 2

0

(0.05

√2500 + 144t + 0.002(2500 + 144t)

)dt =

=∫ 2

0(0.05

√2500 + 144t + 5 + 0.288t) dt =

=[0.05144

· 23(2500 + 144t)

32 + 5t + 0.144t2

]2

0

≈ 15.7

Regningene i dette eksemplet er ikke direkte festlige, men slik er det oftemed linjeintegraler — utregningene blir stygge dersom de i det hele tatt larseg utføre for hand. ♣

Oppgaver til seksjon 3.3

1. Regn ut linjeintegralet∫C f ds nar f(x, y) = x og C er parametrisert ved

r(t) = sin t i + cos t j t ∈ [0, 2π]

2. Regn ut linjeintegralet∫C f ds nar f(x, y) = xy og C er parametrisert ved

r(t) = 3t i + 4t j t ∈ [0, 2]

3. Regn ut linjeintegralet∫C f ds nar f(x, y, z) = z cos(xy) og C er parametrisert

vedr(t) = 3t i + 4t j + 5tk t ∈ [0,

√π]

4. Regn ut linjeintegralet∫C f ds nar f(x, y, z) = xz og C er parametrisert ved

r(t) = 2t3 i + 3√

2t2 j + 6tk t ∈ [0, 1]

5. Regn ut linjeintegralet∫C f ds nar f(x, y, z) = z og C er parametrisert ved

r(t) = t sin t i + t cos t j + tk t ∈ [0, 2π]

6. Regn ut linjeintegralet∫C f ds nar f(x, y, z) = xyz og C er parametrisert ved

r(t) = et i− e−t j +√

2tk t ∈ [0, 1]

7. Bevis setning 3.3.2.

8. Bevis setning 3.3.3.

9. Gjennomfør beviset for setning 3.3.5 nar de to parametriseringene har motsattorientering.

10. En prosjektert vei har form som kurven

r(t) = (2t− t2) i +83t

32 j for t ∈ [0, 1]

3.4. LINJEINTEGRALER FOR VEKTORFELT 169

nar den sees ovenfra (alle avstander er malt i kilometer). Utbygningskostnadenevarierer langs veien pa grunn av ulikheter i terrenget, og man regner med at prisenper kilometer er gitt ved en funksjonen av typen p(x, y) = K(10 + y) der K er enkonstant. Finn de totale utbygningskostnadene.

11. (Eksamen i MA 105, 24/5-1991) En vei er parametrisert ved

r(t) =t2

2i +

2√

29

t3/2j +t

9k 1 ≤ t ≤ 7

(alle avstander er malt i kilometer). En bil som kjører langs veien har et bensinfor-bruk som avhenger av hvor bratt veien er — den bruker 1

15 + 12

dzds liter per kılometer

(s er buelengden). Finn det totale bensinforbruket.

12. En kurve i polarkordinater er gitt ved en funksjon r = f(θ) der θ ∈ [a, b] (kurvenbestar altsa av alle de punktene som har polarkoordinater r og θ der r = f(θ) ogθ ∈ [a, b]).

a) Vis at kurven har parametriseringen

r(θ) = f(θ) cos θ i + f(θ) sin(θ) j der θ ∈ [a, b]

b) Vis at farten er gitt ved

v(θ) =√

f(θ)2 + f ′(θ)2

c) En kurve er gitt i polarkoordinater ved f(θ) = sin θ der θ ∈ [0,π]. Skisserkurven og regn ut buelengden.

d) Regn ut linjeintegralet∫C g ds der C er kurven i punkt c) og g(x, y) = xy.

3.4 Linjeintegraler for vektorfelt

Vi skal na studere den andre typen linjeintegral∫C F·dr. Disse integralene har

sine viktigste anvendelser i fysikk, og for at alle skal forsta de grunnleggendeproblemstillingene, begynner vi med et lynkurs i kraft og arbeid.

Pa ungdomsskolen lærte du at arbeid er kraft ganger vei; dersom dubruker en kraft F til a flytte en gjenstand en strekning s, sa utfører kraftenet arbeid W = Fs. Dette er riktig sa sant du trekker med konstant krafti bevegelsens retning. Dersom kraften ikke virker i bevegelsens retning, erdet bare den komponenten av kraften som peker i bevegelsens retning sombidrar til arbeidet. Dersom kraften er gitt ved vektoren F, og strekningen ergitt ved vektoren s, er arbeidet W derfor lik |F||s| cos(v) der v er vinkelenmellom F og s (se figur 1). Siden |F||s| cos(v) = F · s, er arbeidet W følgeliggitt av skalarproduktet W = F · s.

Page 88: Flervariabel analyse med lineær algebra

170 KAPITTEL 3. KURVER OG FLATER

))))))))*

++

++,8

88

)))))*!!

A

BsF

v|F| cos v

Figur 1: Kraften F utfører et arbeid W = |F||s| cos(v) = F · s fra A til B

Spørsmalet vi skal se pa, er hva som skjer nar kraften varierer og beve-gelsen skjer langs en kurve. Vi tenker oss at gjenstanden som beveger seg,er i punktet r(t) ved tiden t, og at kraften som da virker pa den, er gittved F(r(t)). I løpet av et kort tidsrom ∆t vil gjenstanden forflytte seg tilpunktet r(t + ∆t) (se figur 2).

!

"

111111112

++

++

+,

::

:T

''''''(F(r(t))

r(t)

r(t + ∆t)

Figur 2: Arbeidet i tidsrommet fra t til t + ∆t

Arbeidet i dette tidsrommet ma med god tilnærming være lik

F(r(t)) · (r(t + ∆t)− r(t))

Ganger og deler vi med ∆t, ser vi at

F(r(t)) · (r(t + ∆t)− r(t)) = F(r(t)) · r(t + ∆t)− r(t)∆t

∆t ≈ F(r(t)) · r′(t)∆t

Vi tenker oss na at hele arbeidet skjer i løpet av tidsintervallet [a, b], og atvi har delt opp dette intervallet i sma delintervaller pa vanlig mate

a = t0 < t1 < t2 < . . . < tN = b

I det i-te delintervallet [ti−1, ti] utfører kraften da et arbeid som ifølge be-regningene ovenfor er tilnærmet lik

F(r(ti)) · r′(ti)(ti − ti−1)

Det totale arbeidet er dermed tilnærmet likN∑

i

F(r(ti)) · r′(ti)(ti − ti−1)

3.4. LINJEINTEGRALER FOR VEKTORFELT 171

med bedre og bedre tilnærming dess finere oppdelingen blir. Vi ser at detteuttrykket er en Riemann-sum for funksjonen F(r(t))·r′(t), og det konvergererderfor mot ∫ b

aF(r(t)) · r′(t) dt

nar oppdelingene blir finere og finere. Ut i fra slike betraktninger definererfysikerne det arbeidet som en kraft F utfører nar en gjenstand flyttes langsen kurve r, til a være

W =∫ b

aF(r(t)) · r′(t) dt

Matematikerne bruker formelen til a definere en ny type linjeintegral (somblant annet kan brukes til a regne ut arbeid):

Definisjon 3.4.1 Anta at F : A → Rn er en kontinuerlig funksjon av nvariable, og at r : [a, b] → A er en stykkevis glatt parametrisering av en(orientert) kurve C. Da er linjeintegralet

∫C F · dr definert ved

CF · dr =

∫ b

aF(r(t)) · r′(t) dt

forutsatt at integralet til høyre eksisterer som et vanlig eller uegentlig inte-gral.

Bemerkning: Legg merke til at selv om bade F(r(t)) og r′(t) er vektorer,sa er F(r(t)) · r′(t) en skalar, og

∫ b

aF(r(t)) · r′(t) dt

er derfor et helt vanlig integral. Det viser seg (som vi snart skal se) at salenge vi gjennomløper kurven i samme retning, spiller det ingen rolle hvil-ken parametrisering vi bruker til a regne ut kurveintegralet

∫C F · dr, men

bytter vi gjennomløpsretning, skifter integralet fortegn. I definisjonen har viderfor kalt C en orientert kurve for a understreke at gjennomløpsretningenma være bestemt før det gir mening a regne ut integralet

∫C F · dr .

I definisjonen ovenfor er F en funksjon fra (en delmengde av) Rn til Rn,dvs. at definisjonsmengden og verdimengden har samme dimensjon n. Enslik funksjon kalles ofte et vektorfelt, spesielt nar man tenker pa anvendelseri geometri og fysikk.

La oss regne ut et linjeintegral:

Eksempel 1: Vi skal regne ut integralet∫C F · dr nar

F(x, y, z) = −x i + yz j + z k

Page 89: Flervariabel analyse med lineær algebra

172 KAPITTEL 3. KURVER OG FLATER

ogr(t) = cos t i + sin t j + tk, t ∈ [0, 2π]

Vi regner først utr′(t) = − sin t i + cos t j + k

og observerer atF(r(t)) = − cos t i + t sin t j + tk

Dermed er ∫

CF · dr =

∫ 2π

0F(r(t)) · r′(t) dt =

=∫ 2π

0(− cos t i + t sin t j + tk) · (− sin t i + cos t j + k) dt =

=∫ 2π

0(sin t cos t + t sin t cos t + t) dt

Na gjenstar det bare vanlig integrasjon. Det første integralet∫

sin t cos t dtkan løses ved substitusjon, men vi velger a bruke at sin 2t = 2 sin t cos tisteden. Det gir

∫sin t cos t dt =

12

∫sin 2t dt = −1

4cos 2t + C

Bruker vi den samme omskrivningen i det andre integralet, ser vi at∫

t sin t cos t dt =12

∫t sin 2t dt

Her kan vi bruke delvis integrasjon med u = t og v′ = 12 sin 2t. Det gir u′ = 1

og v = −14 cos 2t, og dermed

∫t sin t cos t dt =

12

∫t sin 2t dt = − t

4cos 2t +

14

∫cos 2t dt =

= − t

4cos 2t +

18

sin 2t + C

Det tredje integralet er enkelt:∫

t dt =t2

2+ C

Kombinerer vi alle resultatene vare, har vi na∫

CF · dr ==

∫ 2π

0(sin t cos t + t sin t cos t + t) dt =

=[− 1

4cos 2t− t

4cos 2t +

18

sin 2t +t2

2

]2π

0

= −π

2+ 2π2 ♣

3.4. LINJEINTEGRALER FOR VEKTORFELT 173

Eksemplet ovenfor er ganske typisk; den verste jobben nar man skal regneut et linjeintegral, er ofte a løse de vanlige integralene man sitter igjen medtil slutt!

De vanlige regnereglene for integraler gjelder ogsa for linjeintegraler avvektorfelt.

Setning 3.4.2 Anta at r er en stykkevis glatt parametriseing av en kurveC og at F,G er to kontinuerlige vektorfelt slik at integralene

∫C F · dr og∫

C G · dr eksisterer. Da er(i)

∫C(F + G) · dr=

∫C F · dr +

∫C G · dr

(ii)∫C(F−G) · dr=

∫C F · dr−

∫C G · dr

(iii)∫C aF · dr=a

∫C F · dr for alle a ∈ R.

Disse resultatene følger direkte fra tilsvarende resultater for vanlige inte-graler, og vi tar ikke med bevisene her. Det neste resultatet forteller oss atvi kan regne ut et linjeintegral ved a dele opp kurven i mindre deler og regneut integralet over hver del. Ogsa i dette tilfellet følger resultatet direkte fratilsvarende resultat for vanlige integraler, og vi sløyfer beviset.

Setning 3.4.3 Anta at r er en stykkevis glatt parametriseing av kurven Cog at F er et kontinuerlig vektorfelt slik at integralet

∫C F · dr eksisterer.

Dersoma = t0 < t1 < . . . < tm = b

er en partisjon av [a, b], og Ci er kurven parametrisert ved r : [ti−1, ti] → Rn

(vi deler altsa kurven opp i m biter og lar Ci være den i-te biten), sa er∫

CF · dr =

C1

F · dr +∫

C2

F · dr + · · · +∫

Cm

F · dr

Som allerede nevnt, er kurveintegralet∫C F · dr uavhengig av parametri-

seringen sa lenge vi gjennomløper kurven i samme retning. Her er det presiseresultatet:

Setning 3.4.4 Anta at r1 : [a, b] → Rn og r2 : [c, d] → Rn er to ekvivalente,stykkevis glatte parametriseringer av kurven C. Dersom de to parametrise-ringene har samme orientering, far integralet

∫C F · dr samme verdi uansett

hvilken av dem vi bruker. Dersom parametriseringene har motsatt oriente-ring, far integralene samme tallverdi, men motsatt fortegn.

Bevis: Vi skal anta at parametriseringene er glatte; det generelle tilfelletfar vi ved a skjøte sammen de glatte delene av stykkevis glatte paramet-riseringer. For a se hvor minusen kommer fra, tar vi for oss tilfellet derparametriseringene har motsatt orientering. Vi har altsa to parametriserin-ger

r1 : [a, b] → Rn

Page 90: Flervariabel analyse med lineær algebra

174 KAPITTEL 3. KURVER OG FLATER

r2 : [c, d] → Rn

forbundet med en funksjon φ : [a, b] → [c, d] slik at

r2(φ(t)) = r1(t)

Siden parametriseringene har motsatt orientering, er φ avtagende og φ(a) =d, φ(b) = c.

Bruker vi parametriseringen r1 til a regne ut integralet, har vi

I1 =∫

CF · dr =

∫ b

aF(r1(t)) · r′1(t) dt

Siden r1(t) = r2(φ(t)), gir kjerneregelen

r′1(t) = r′2(φ(t))φ′(t)

Vi setter inn i uttrykket for I1 ovenfor, og far

I1 =∫ b

aF(r1(t)) · r′1(t) dt =

∫ b

aF(r2(φ(t))) · r′2(φ(t))φ′(t) dt

Hvis vi na innfører en ny variabel u = φ(t), far vi du = φ′(t) dt. Sidenφ(a) = d og φ(b) = c, har vi dermed

I1 =∫ b

aF(r2(φ(t))) · r′2(φ(t))φ′(t) dt =

∫ c

dF(r2(u)) · r′2(u) du =

= −∫ d

cF(r2(u)) · r′2(u) du

Det siste integralet er nøyaktg det vi far dersom vi prøver a regne utlinjeintegralet

∫C F · dr ved hjelp av parametriseringen r2, og beviset er der-

med fullført. !

Siden parametriseringen ikke spiller noen rolle, skal vi ofte referere tilintegralet

∫C F ·dr uten a spesifisere hviken parametrisering vi tenker pa. Vi

ma imidlertid spesifisere retningen dersom det ikke fremgar fra sammenhen-gen.

Det neste eksemplet vi skal se pa, er litt mer teoretisk, men det er slike“teoretiske” anvendelser som viser seg a ha de største praktiske konsekven-sene. For virkelig a verdsette eksemplet er det sikkert en fordel a kunne littfysikk, men her kommer et lynkurs i det aller viktigste. En gjenstand medmasse m som beveger seg med en fart v, har en kinetisk energi 1

2mv2. Ek-semplet viser at nar en kraft virker pa en gjenstand, gar det tilførte arbeidetmed til øke gjenstandens kinetiske energi.

3.4. LINJEINTEGRALER FOR VEKTORFELT 175

Eksempel 2: Vi har en partikkel med masse m. I løpet av tidsrommet [a, b]forflytter partikkelen seg langs en bane C, pavirket av en (total) kraft F. Viskal vise at

W =∫

CF · dr =

12mv(b)2 − 1

2mv(a)2

dvs. at det tilførte arbeidet er lik endringen i kinetisk energi.Ifølge Newtons annen lov er F = ma, der a = v′ = r′′ er akselerasjonen.

Dermed er

W =∫

CF · dr = m

Ca · dr = m

∫ b

aa(t) · v(t) dt

Vi observerer na at siden v(t)2 = v(t) · v(t), sa sier regneregel 3.1.4(iii) at

(v(t)2)′ = (v(t) · v(t))′ = 2a(t) · v(t)

Dermed er

W = m

∫ b

aa(t) · v(t) dt =

12m

∫ b

a(v(t)2)′ dt =

12mv(b)2 − 1

2mv(a)2

ifølge analysens fundamentalteorem. Vi skal arbeide videre med dette ek-semplet i neste seksjon. ♣

Vi har na sett pa to typer linjeintegraler∫C f ds og

∫C F · dr som virker

nært beslektet til tross for at de har sine ulikheter. Det er faktisk mulig aoppfatte linjeintegraler av typen

∫C F · dr som spesialtilfeller av den andre

typen. Vi tar da utgangspunkt i definisjonen

CF · dr =

∫ b

aF(r(t)) · r′(t) dt

og innfører enhetstangentvektoren

T(t) =r′(t)v(t)

Skriver vi denne ligningen pa formen r′(t) = T(t)v(t) og setter inn i formelenovenfor, far vi

CF · dr =

∫ b

aF(r(t)) ·T(t)v(t) dt =

CF ·T ds

Linjeintegralet av vektorfeltet F er altsa det samme som linjeintegralet avskalarfeltet F · T. Pa grunn av denne sammenhengen bruker enkelte bøkernotasjonen

∫C F ·T ds for linjeintegraler av vektorfelt.

Page 91: Flervariabel analyse med lineær algebra

176 KAPITTEL 3. KURVER OG FLATER

Oppgaver til seksjon 3.4

1. Regn ut linjeintegralet∫C F·dr nar F(x, y) = y i+x j, og kurven C er parametrisert

vedr(t) = 2t i− 3t j der t ∈ [1, 3]

2. Regn ut linjeintegralet∫C F · dr nar F(x, y) = x2 i + xy j, og kurven C er para-

metrisert vedr(t) = cos t i− sin t j der t ∈ [0,

π

2]

3. Regn ut linjeintegralet∫C F · dr nar F(x, y, z) = zy i + x2 j + xz k, og kurven C

er parametrisert ved

r(t) = t i + t2 j + t3 k der t ∈ [0, 2]

4. Regn ut linjeintegralet∫C F · dr nar F(x, y, z) = z

x i + y j + xk, og kurven C erparametrisert ved

r(t) = et i + ln t j + sin tk der t ∈ [1, 2]

5. Regn ut linjeintegralet∫C F · dr nar F(x, y, z) = yz i + x j + xy k, og kurven C er

parametrisert ved

r(t) = t i + arctan t j + tk der t ∈ [0, 1]

6. Regn ut linjeintegralet∫C F · dr nar F(x, y) = x i + y j, og C er sirkelen med sen-

trum i origo og radius 5. C skal gjennomløpes i positiv retningen (dvs. mot klokken).

7. Regn ut linjeintegralet∫C F · dr nar F(x, y) = x2y i + xy j, og C er den delen av

parabelen y = x2 som tilsvarer x ∈ [−2, 2]. Kurven skal parametriseres fra venstremot høyre.

8. La C være omkretsen til trekanten med hjørner i punktene (0, 0), (π, 0) og (π,π).Regn ut

∫C F · dr nar F(x, y) = cos x sin y i + x j og C er positivt orientert.

9. Bevis setning 3.4.2.

10. Bevis setning 3.4.3.

11. Gjenomfør beviset for setning 3.4.4 nar de to parametriseringene har sammeorientering.

12. Anta at kurven C er lukket. Vis at integralet∫C F · dr har samme verdi uansett

hvilket punkt pa kurven vi bruker som start-/stoppsted (forutsatt at orienteringener den samme).

13. Helt til slutt i seksjonen pastod vi at linjeintegral av typen∫C F · dr kan opp-

fattes som integral av typen∫C f ds; alt vi behøver a gjøre er a velge f = F · T.

Hvordan kan dette være mulig nar den ene typen integral er avhengig av oriente-ringen til kurven mens den andre typen ikke er det?

3.4. LINJEINTEGRALER FOR VEKTORFELT 177

14. Figuren viser en bat som blir dratt bortover en flat strand med et tau. Tauet gargjennom en talje som er festet i punktet (20, 5), og trekkraften i tauet er konstantlik K. Posisjonen til baten ved tiden t ∈ [0, 20] er (t, 0).

"

!!! !

RRRRRRRK:

:T

talje

bat::T

x

y

(t, 0)

(20, 5)

a) Vis at arbeidet som kraften utfører er gitt ved

W = K

∫ 20

0

20− t√25 + (20− t)2

dt

b) Finn W .

15. Figuren viser en last som skal dras opp en islagt skraning ved hjelp av et tau.Med passende valgte enheter befinner lasten seg ved tiden t i punktet r(t) = t i+t2 jder t ∈ [0, 1]. Trekkraften i tauet er konstant lik K.

"

!

!

!

!

UU

UU

UU

UU

UU

K

(t, t2)

::=

talje plassert i punktet (1, 1)

last# x

y

a) Vis at kraften som virker pa lasten ved tiden t er

K(t) =K√

2 + 2t + t2

(i + (1 + t) j

)

b) Vis at arbeidet som kraften K utfører pa lasten fra bunn til topp er gitt ved:

W = K

∫ 1

0

1 + 2t + 2t2√2 + 2t + t2

dt

c) Deriver uttrykket (t− 1)√

t2 + 2t + 2.

d) Bruk resultatet i punkt c) til a regne ut arbeidet W .

Page 92: Flervariabel analyse med lineær algebra

178 KAPITTEL 3. KURVER OG FLATER

e) (Forutsetter at du kjenner de hyperbolske funksjonene sinh og cosh; se ka-pittel 7.7 i Kalkulus). Løs integralet

W =∫ 1

0

1 + 2t + 2t2√2 + 2t + t2

dt

ved hjelp av substitusjonen sinhu = t + 1.

3.5 Gradienter og konservative felt

Fra forrige seksjon husker vi at et vektorfelt er en funksjon F fra (en del-mengde av) Rn inn i Rn. Det er en type vektorfelt vi har arbeidet ganskemye med allerede, nemlig gradienter. Husk at dersom φ : Rn → R er et(deriverbart) skalarfelt, er gradienten til φ gitt ved;

∇φ(x) =(

∂φ

∂x1(x),

∂φ

∂x2(x), . . . ,

∂φ

∂xn(x)

)

Linjeintegraler av gradienter har en ganske spesiell egenskap.

Setning 3.5.1 Anta at φ : A → R er en funksjon av n variable med kon-tinuerlig gradient. Dersom r : [a, b] → A parametriserer en stykkevis glattkurve C som begynner i punktet a og ender i punktet b (dvs. r(a) = a ogr(b) = b), sa er ∫

C∇φ dr = φ(b)− φ(a)

Bevis: Vi skal først vise resultatet nar C er glatt. For a unnga problemer iendepunktene ser vi først pa en litt kortere kurve Cc,d gitt ved r : [c, d] → Ader a < c < d < b. Ifølge kjerneregelen (se versjonen i setning 3.2.1) er

(φ(r(t)))′ = ∇φ(r(t)) · r′(t)

for alle t ∈ [c, d], og dermed er∫

Cc,d

∇φ dr =∫ d

c∇φ(r(t)) · r′(t) dt =

∫ d

c(φ(r(t))′ dt = φ(r(d))− φ(r(c))

ifølge analysens fundamentalteorem. Tar vi grenseverdiene nar c → a ogd → b, far vi ∫

C∇φ dr = φ(b)− φ(a)

Anta sa at C er en stykkevis glatt kurve satt sammen av de glatte deleneC1, C2, . . . , CN , og la a = a0,a1,a2, . . . ,aN = b være start- og endepunktenetil disse kurvene slik at Ci starter i ai−1 og ender i ai. Siden vi allerede harvist resultatet for glatte kurver, vet vi at

Ci

∇φ · dr = φ(ai)− φ(ai−1)

3.5. GRADIENTER OG KONSERVATIVE FELT 179

Dermed er∫

C∇φ · dr =

C1

∇φ · dr +∫

C2

∇φ · dr + · · · +∫

CN

∇φ · dr =

=(φ(a1)− φ(a0)

)+

(φ(a2)− φ(a1)

)+ · · · +

(φ(aN )− φ(aN−1)

)=

φ(aN )− φ(a0) = φ(b)− φ(a)

og setningen er bevist. !

Setningen ovenfor forteller oss at nar vi integrerer en gradient fra etpunkt a til et punkt b, sa spiller det ingen rolle hvilken kurve C vi følger;svaret blir alltid φ(b)−φ(a). Vi sier at linjeintegralet

∫C ∇φ ·dr er uavhengig

av veien. Spesielt ser vi at integralet langs en lukket kurve (dvs. en kurvesom begynner og ender i samme punkt) alltid er 0.

Eksempel 1: Dersom vi deriverer skalarfeltet φ(x, y, z) = yz2ex, far vi

F(x, y, z) = ∇φ(x, y, z) = yz2ex i + z2ex j + 2yzex k

Hvis C er kurven parametrisert ved

r(t) = t i + 2e−t j + t2 k, t ∈ [0, 2]

vet vi at∫

CF · dr = φ(r(2))− φ(r(0)) = φ(2, 2e−2, 4)− φ(0, 2, 0) =

= 2e−2 · 42 · e2 − 2 · 02 · e0 = 32

Vi kan altsa regne ut linjeintegralet uten a integrere. ♣

La oss innføre litt terminologi.

Definisjon 3.5.2 Dersom vektorfeltet F er lik gradienten til et skalarfelt φi et omrade A (vi har altsa F(x) = ∇φ(x) for alle x ∈ A), sier vi at F erkonservativt i A, og vi kaller φ en potensialfunksjon for F i A.

Bemerkning: Ordet “konservativt” innebærer ikke at feltene vare har enspesiell politisk overbevisning — navnet skyldes at konservative kraftfelt be-varer (konserverer) energi. Vi skal vise dette til slutt i seksjonen. Legg forøvrig merke til at potensialfunksjonene til et vektorfelt bare er definert opptil en konstant; er φ en potensialfunksjon for F, er φ + C det ogsa.

Page 93: Flervariabel analyse med lineær algebra

180 KAPITTEL 3. KURVER OG FLATER

To av de viktigste kreftene i naturen, gravitasjonskraft og elektrostatiskkraft, har samme matematiske form. Dersom kilden til kraften er plassert iorigo, er kraften i punktet x #= 0 gitt ved

F(x) =k

|x|3x

der k er en konstant. Det neste eksemplet viser at disse kreftene er konser-vative med potensialfunksjon

φ(x) = − k

|x|

Eksempel 2: Dersom vi deriverer funksjonen

φ(x) = − k

|x| = −k(x21 + x2

2 + · · · + x2i + · · · + x2

n)−12

med hensyn pa xi, far vi

∂φ

∂xi= −k(−1

2)(x2

1 + x22 + · · · + x2

i + · · · + x2n)−

32 2xi =

k

|x|3 xi

Dermed er

∇φ(x) =k

|x|3 (x1, x2, . . . , xi, . . . , xn) =k

|x|3x

akkurat som vi skulle vise. ♣

At de grunnleggende fysiske kreftene er konservative, har store konse-kvenser bade teoretisk og beregningsmessig. Pa den beregningsmessige si-den vet vi na at dersom en partikkel beveger seg fra punkt a til punktb pavirket av en kraft F(x) = k

|x|3 x, sa er arbeidet rett og slett gitt vedφ(b)− φ(a) = k

|a| −k|b| . Fra et teoretisk synspunkt er resultatet enda større

og viktigere — vi skal se et eksempel pa dette mot slutten av seksjonen.Det er to viktige spørsmal vi na ma se pa: Hvordan avgjør vi om et

vektorfelt er konservativt, og hvordan finner vi i sa fall en potensialfunksjon?Vi begynner med en nødvendig betingelse.

Setning 3.5.3 Anta at F(x) = (F1(x), F2(x), . . . , Fn(x)) er et vektorfeltmed kontinuerlige partiellderiverte. Dersom F er konservativt i omradet A,er

∂Fi

∂xj(x) =

∂Fj

∂xi(x)

for alle x ∈ A og alle indekser i, j.

3.5. GRADIENTER OG KONSERVATIVE FELT 181

Bevis: Siden F er konservativt, finnes det en potensialfunksjon φ slik atFi = ∂φ

∂xi. Dermed er

∂Fi

∂xj(x) =

∂2φ

∂xj∂xi

Tilsvarende er∂Fj

∂xi(x) =

∂2φ

∂xi∂xj

Siden blandede partiellderiverte er like, følger setningen. !

Legg merke til at setningen ovenfor ikke garanterer at det finnes en po-tensialfunksjon nar betingelsene ∂Fi

∂xj(x) = ∂Fj

∂xi(x) er oppfylt — alt den sier

er at nar disse betingelsene ikke er oppfylt, sa kan feltet ikke være konser-vativt. I det neste eksemplet er betingelsene oppfylt (i alle punkter unntattorigo), men feltet er allikevel ikke konservativt.

Eksempel 3: Vi ser pa feltet

F(x, y) = F1(x, y) i + F2(x, y) j = − y

x2 + y2i +

x

x2 + y2j

for (x, y) #= (0, 0). Regner vi ut de partiellderiverte, far vi

∂F1

∂y=

y2 − x2

(x2 + y2)2

og∂F2

∂x=

y2 − x2

(x2 + y2)2

Betingelsene for de partiellderiverte er altsa oppfylt, men feltet er likevelikke konservativt i R2 \ {0, 0}. For a vise dette, integrerer vi F en gangrundt enhetssirkelen. Dersom feltet var konservativt, ville dette integraletblitt 0 ifølge setning 3.5.1, men bruker vi parametriseringen

r(t) = cos t i + sin t j t ∈ [0, 2π]

far vi:∫

CF · dr =

∫ 2π

0(− sin t i + cos t j) · (− sin t i + cos t j) dt =

∫ 2π

01 dt = 2π

Dette viser at feltet ikke er konservativt i R2 \ {0, 0}. ♣

Eksemplet ovenfor er ikke fullt sa problematisk som man kanskje skulletro — vanskelighetene skyldes at vi har forsøkt a finne en potensialfunksjonpa et omrade som ikke er enkeltsammenhengende. At et apent omrade Aer enkeltsammenhengende, betyr at det er sammenhengende, og at enhver

Page 94: Flervariabel analyse med lineær algebra

182 KAPITTEL 3. KURVER OG FLATER

lukket, kontinuerlig kurve i A kan snurpes sammen til et punkt uten at denforlater A. Omradet R2 \ {(0, 0)}, som var funksjon F er definert pa, erikke enkeltsammenhengende siden en kurve som omslutter origo, ikke kansnurpes sammen til et punkt uten a forlate omradet.

Man kan vise at et vektorfelt F med kontinuerlige partiellderiverte har enpotensialfunksjon pa et apent, enkeltsammenhengende omrade A ⊂ Rn hvisog bare hvis betingelsene ∂Fi

∂xj(x) = ∂Fj

∂xi(x) er oppfylt for alle x ∈ A (beviset

er litt for vanskelig for oss, men vi skal vise at resultatet holder i stjernefor-mede omrader i seksjon 5.3). Spesielt betyr dette at dersom ∂Fi

∂xj(x) = ∂Fj

∂xi(x)

er oppfylt for alle x ∈ Rn, sa har F en potensialfunksjon pa hele Rn.Neste post pa programmet er a studere hvordan man finner potensial-

funksjoner nar de eksisterer. Vi viser fremgangsmaten gjennom et eksempel:

Eksempel 4: Vi skal finne en potensialfunksjon til vektorfeltet

F(x, y, z) = (2xyz + y) i + (x2z + x) j + (x2y + 1)k

Det er lett a sjekke at ∂F1∂y = ∂F2

∂x , ∂F1∂z = ∂F3

∂x og ∂F2∂z = ∂F3

∂y overalt, sa ifølgedet vi nettopp har lært, har F en potensialfunksjon φ. Denne funksjonen matilfredsstille

∂φ

∂x= F1(x, y, z) = 2xyz + y

∂φ

∂y= F2(x, y, z) = x2z + x

∂φ

∂z= F3(x, y, z) = x2y + 1

Integrerer vi den første av disse ligningene med hensyn pa x, ser vi at φ mavære pa formen

φ(x, y, z) = x2yz + xy + C1(y, z)

der C1(y, z) er en funksjon som bare avhenger av y og z (en slik funksjonblir borte nar vi deriverer mhp. x). Integrerer vi den andre av ligningenemed henyn pa y, ser vi at φ ma være pa formen

φ(x, y, z) = x2yz + xy + C2(x, z)

der C2(x, z) er en funksjon som bare avhenger av x og z. Integrerer vi dentredje av ligningene med henyn pa z, ser vi at φ ma være pa formen

φ(x, y, z) = x2yz + z + C3(x, y)

der C3(x, y) er en funksjon som bare avhenger av x og y. Samler vi sammenledd fra hver av disse ligningene, ser vi at

φ(x, y, z) = x2yz + xy + z

3.5. GRADIENTER OG KONSERVATIVE FELT 183

tilfredsstiller alle kravene (det tilsvarer a velge C1(y, z) = z, C2(x, z) = z ogC3(x, y) = xy). Det er lett a sjekke ved derivasjon at φ er en potensialfunk-sjon til F. ♣

Vi skal avslutte med et litt mer teoretisk eksempel. Dersom F er et kon-servativt kraftfelt med potensialfunksjon φ, sa kalles funksjonen Ep(x) =−φ(x) den potensielle energien (det kan virke litt merkelig med minusteg-net, men det er naturlig ut i fra fysiske betraktninger — man ønsker atenergien skal være større dess mer “kraftfull” situasjonen er). Den totaleenergien til en funksjon er summen av potensiell og kinetisk energi; dersomen partikkel befinner seg i punktet x med hastighet v, er altsa den totaleenergien E = −φ(x)+ 1

2mv2. Vi skal na vise at nar en partikkel beveger segi et konservativt kraftfelt, er den totale energien bevart. Dette er et av deviktigste prinsippene i klassisk mekanikk.

Eksempel 5: Vi ser pa en partikkel som beveger seg langs en kurve r :[a, b] → Rn i et kraftfelt F. I eksempel 2 i forrige seksjon sa vi at detarbeidet kraften utfører pa partikkelen, fører til en endring i den kinetiskeenergien

W =∫

CF · dr =

12mv(b)2 − 1

2mv(a)2

Dersom kraften er konservativ (F = ∇φ), har vi i tillegg∫

CF · dr = φ(r(b))− φ(r(a))

Kombinerer vi disse ligningene, ser vi at

−φ(r(b)) +12mv(b)2 = −φ(r(a)) +

12mv(a)2

Siden Ep(x) = −φ(x), er dette det samme som

Ep(r(b)) +12mv(b)2 = Ep(r(a)) +

12mv(a)2

som viser at energien er den samme før og etter bevegelsen. ♣

Oppgaver til seksjon 3.5

I oppgave 1 til 6 skal du avgjøre om feltet er konservativt og i sa fall finne en po-tensialfunksjon.

1. F(x, y) = (2xy + 2x) i + x2 j

2. F(x, y) = (2xey) i + (x2ey + x) j

Page 95: Flervariabel analyse med lineær algebra

184 KAPITTEL 3. KURVER OG FLATER

3. F(x, y) = (sinxy + xy cos xy + 3) i + (x2 cos xy − 2) j

4. F(x, y, z) = (y2z + z) i + (2xyz − 2) j + (xy2 + x)k

5. F(x, y, z) = (y sin z + 2z) i + (x sin z + 3) j + (xy cos z + 2x)k

6. F(x, y, z) = x2exy i + x3exy j + xyzex k

7. Regn ut linjeintegralet∫C F · dr nar F(x, y) = 2xy i + x2 j og C er kurven para-

metrisert ved

r(t) = 2t cos t i + sin t j t ∈ [0,π

2]

8. Regn ut linjeintegralet∫C F·dr nar F(x, y) = (cos(xy)−xy sin(xy)) i−x2 sin(xy) j

og C er kurven parametrisert ved

r(t) = −t cos t i + (sin t− cos t) j t ∈ [0,π]

9. Regn ut linjeintegralet∫C F · dr nar F(x, y) = y2exy2

i + (2xyexy2+ 1) j og C

sirkelen med sentrum i (1,−1) og radius 5 (vi gir C positiv orientering).

10. Regn ut linjeintegralet∫C F · dr nar F(x, y, z) = (y2z + 2xy) i + (2xyz + x2) j +

(xy2 + 1)k og C er kurven parametrisert ved

r(t) = t i + t2 j + t sinπt

2k t ∈ [0, 1]

11. Regn ut linjeintegralet∫C F · dr nar F(x, y, z) = zexz+y i + (exz+y + 2z) j +

(xexz+y + 2y)k og C er skjæringskurven kurven mellom kulen x2 + y2 + z2 = 25 ogplanet x− 2y + 3z = 1. Kurven har positiv orientering sett ovenfra.

12. I denne oppgaven skal vi se nærmere pa vektorfeltet

F(x, y) = − y

x2 + y2i +

x

x2 + y2j

i eksempel 3.

a) La φ1(x, y) = arctan yx + C der C er en konstant. Vis at ∇φ1(x, y) = F(x, y)

nar x #= 0.

b) Regn ut∫C F · dr der C er en glatt kurve som ligger til høyre for y-aksen og

som starter i punktet (1,−1) og ender i (3, 3).

c) La φ2(x, y) = − arctan xy +C der C er en konstant. Vis at∇φ2(x, y) = F(x, y)

nar y #= 0.

d) Bruk MATLAB eller en lommeregner til a tegne grafene til φ1 og φ2 (huskat arctan heter atan i MATLAB).

e) Finn sammenhengen mellom arctan yx og − arctan x

y (det kan lønne seg a sepa hver kvadrant for seg).

3.6. KJEGLESNITT 185

f) Finn en potensialfunksjon φ for F i omradet

A = {(x, y) ∈ R2 | y ligger ikke pa den negative y-aksen}

Forklar hvorfor du ikke kan utvide denne funksjonen φ til en kontinuerligfunksjon pa hele R2.

3.6 Kjeglesnitt

I denne seksjonen skal vi se pa en familie av kurver som dukker opp i mangesammenhenger — parabler, ellipser og hyperbler. Med et fellesnavn kallesdisse kurvene kjeglesnitt fordi de fremkommer som snittkurver nar man skjæ-rer over en kjegle pa skra. Figur 1 viser hvordan dette foregar. Vi startermed en dobbeltkjegle som vist øverst i venstre hjørne. Skjærer vi denne dob-beltkjeglen med et plan som er mindre bratt en sidekanten i kjeglen, far vifiguren øverst til høyre. Snittkurven mellom kjeglen og planet er en ellipse.I figuren nederst til venstre har vi skaret dobbeltkjeglen med et plan som erbrattere enn kjeglekanten. Planet skjærer na bade den nedre og øvre delenav kjeglen, og vi far en skjæringskurve som bestar av to deler — en hyperbel.I den siste figuren har vi skaret over kjeglen med et plan som er paralleltmed sidekanten. Skjæringskurven blir i dette tilfellet en parabel.

Figur 1: Romgeometrisk definisjon av kjeglesnitt

Selv om den romgeometriske definisjonen ovenfor forklarer ordet kjegle-snitt, er det i vare dager vanligere a behandle disse kurvene med plan-geometriske metoder. Vi skal følge denne tradisjonen, men helt pa sluttenav seksjonen skal vi ta oss tid til a vise at det er en sammenheng mellom deromgeometriske definisjonene ovenfor og de plangeometriske definisjonen viellers benytter oss av.

Page 96: Flervariabel analyse med lineær algebra

186 KAPITTEL 3. KURVER OG FLATER

Parabler

Vi starter med parablene som pa mange mater er de enkleste kjeglesnittene.Tenk deg at du har en linje l og et punkt F i planet. Vi antar at F ikkeligger pa l, og er pa jakt etter de punktene P som ligger like langt fra l somfra F . Disse punktene danner en kurve, og denne kurven kaller vi parabelenmed brennpunkt F og styrelinje l.

l

!F

! P

UU

UU

UU

UU

Figur 2: Punkter som ligger like langt fra l som fra F

For a finne en ligning som beskriver kurven, legger vi inn et koordinat-system som vist pa figur 3 med x-akse gjennom F loddrett pa l, og medy-akse midtveis mellom l og F . Kaller vi avstanden fra F til l for 2a, vil Fha koordinater (a, 0) og l ha ligning x = −a. Pa figuren er avstanden fra ltil P lik avstanden fra A til P , dvs. x + a. Ifølge Pythagoras er avstandenfra F til P lik

√(x− a)2 + y2. Disse avstandene skal være like, dvs.

x + a =√

(x− a)2 + y2

! x

"yl

!F (a, 0)

! P (x, y)

UU

UU

UU

UU

!A(−a, y)

Figur 3: Ligningen for en parabel

Kvadrerer vi pa begge sider, far vi

(x + a)2 = (x− a)2 + y2

3.6. KJEGLESNITT 187

Ganger vi ut og forkorter, sitter vi igjen med

y2 = 4ax

Alle punkter pa parabelen ma altsa tilfredsstille denne ligningen, og det erlett a sjekke at alle punkter som tilfredsstiller ligningen, ligger pa parabelen(det har altsa ikke kommet med noen “falske løsninger” nar vi kvadrerteligningen). Vi har dermed vist:

Setning 3.6.1 Parabelen med brennpunkt F (a, 0) og styrelinje x = −a harligning

y2 = 4ax

!

"l

styrelinje brennpunkt

toppunkt

!

++V

++,

!! x

y

Figur 4: Parabel med brennpunkt og toppunkt

Punktet pa parabelen som ligger nærmest styrelinjen, kaller vi for topp-punktet (selv om det ikke ligger pa toppen!). Avstanden a fra brennpunktettil toppunktet kaller vi brennvidden til parabelen (se figur 4).

I de parablene vi hittil har sett pa, ligger toppunktet i origo, men det garselvfølgelig an a flytte parabelen slik at toppunktet far en annen posisjon.Flytter vi toppunktet til (m, n), far parabelen ligning

(y − n)2 = 4a(x−m)

Eksempel 1: Vis at ligningen

y2 + 4y − 8x + 20 = 0

beskriver en parabel, og finn toppunkt og brennpunkt.Vi fullfører først kvadratet:

y2 + 4y − 8x + 20 = y2 + 4y + 4− 4− 8x + 20 = (y + 2)2 − 8x + 16

Page 97: Flervariabel analyse med lineær algebra

188 KAPITTEL 3. KURVER OG FLATER

Ligningen kan dermed skrives

(y + 2)2 − 8x + 16 = 0 ⇐⇒ (y + 2)2 = 8(x− 2)

som beskriver en parabel med toppunkt (2,−2) og brennvidde 2. Brennpun-tet ligger i (4,−2). ♣

For a fa en parabel som vender den andre veien (dvs. med apningen motvenstre), trenger vi et minustegn:

(y − n)2 = −4a(x−m)

Bytter vi om rollene til x og y, dvs. at vi lar

(x−m)2 = 4a(y − n),

far vi en liggende parabel som i figur 5:

!

"

x

y

Figur 5: En parabelen pa formen (x−m)2 = 4a(y − n)

Putter vi pa et minus slik at vi far (x −m)2 = −4a(y − n), vil parabelensnu slik at den har toppunktet øverst (sic!) og apningen nedover.

!

"

???????

#?

??

?W

++, #

#

$

::

::

::

::: #:

:::=

F!! x

y

Figur 6: Lysstraler reflekteres gjennom brennpunktet

3.6. KJEGLESNITT 189

Vi skal na se pa en viktig egenskap ved parabler. Vi tenker oss at para-belen i figur 6 er belagt med speil pa innsiden. Lysstraler kommer inn paral-lelt med aksen og reflekteres nar de treffer parabelen. Det viser seg at allelysstralene da blir reflektert gjennom brennpunktet F (det er nettopp derfordet heter brennpunkt).

Denne refleksjonsegenskapen for parabler brukes i parabolantenner fora samle alle signalene som treffer antennen i ett omrade. Egenskapen bru-kes ogsa i billykter og lommelykter, men da i motsatt retning — plassererman lyspæren i brennpunktet, vil det parabolske speilet reflektere alt lyseti samme retning.

++

++

++

++

#

$

v

v

innkommende lysstrale

speil

tangent

utgaende lysstrale

Figur 7: Vinkler ved refleksjon

For a bevise refleksjonsegenskapen trenger vi tre ingredienser.

1. Først litt fysikk: Nar en lysstrale treffer et kurveformet speil, reflekte-res det slik at den innkommende og utgaende stralen danner sammevinkel v med tangenten, se figur 7. (Du husker kanskje fra naturfag-timene at “innfallsvinkel er lik utfallsvinkel”?)

2. Sa litt matematikk som ligner forbløffende: Anta at du har en linje log to punkter P og Q pa samme side av l. Den korteste veien fra P tilQ via l er den som gjør vinklene v og w pa figur 8 like.

! !:

::U

UU

U

v w

PQ

l

Figur 8: Korteste vei

Dette kan du vise bade geometrisk og som et uoppstilt minimumspro-blem (se Kalkulus, oppgave 7.1.18).

3. Vi vet at en parabel bestar av de punktene som har samme avstandtil styrelinjen som til brennpunktet. Punktene som ligger utenfor pa-

Page 98: Flervariabel analyse med lineær algebra

190 KAPITTEL 3. KURVER OG FLATER

rabelen har kortere vei til styrelinjen enn til brennpunktet, mens desom ligger inni parabelen har kortest vei til brennpunktet. Dette erintuitivt ganske opplagt, men kan du bevise det?

Vi er na klare til a bevise refleksjonsegenskapen.

Setning 3.6.2 (Refleksjonsegenskap for parabler) Enhver strale somkommer inn parallelt med aksen til en parabel, reflekteres gjennom brenn-punktet.

Bevis:

l

!F

!P !Q333333333333

UU

UU

UU

UU

v

w

Figur 9: Brudden linje gjennom Q og brennpunktet

Pa figur 9 har vi tegnet en brudden linje som begynner parallelt med aksen,gar gjennom et punkt Q, treffer parabelen i P og fortsetter til brennpunktetF . For a vise at dette er veien en strale vil følge, ma vi ifølge punkt 1 ovenforvise at vinklene v og w er like. Ifølge punkt 2 ovenfor er det tilfellet dersomP er det punktet pa tangenten som gjør den samlede veien |QP | + |PF |minst mulig.

l

!F

!P !Q333333333333

UU

UU

UU

UU

!A

!T!B

Figur 10: Et annet punkt T pa tangenten

3.6. KJEGLESNITT 191

Pa figur 10 har vi tegnet inn et annet punkt T pa tangenten. Var oppgaveer a vise at |QT |+ |TF | > |QP |+ |PF |. Som hjelp har vi tegnet inn punktetA der stralen hadde truffet styrelinjen om den ikke var blitt reflektert. Vi harogsa tegnet inn punktet B som ligger pa styrelinjen i samme høyde som T .Per definisjon av parabel er |AP | = |PF |, og følgelig er |QP |+ |PF | = |QA|.Siden T ligger pa utsiden av parabelen, er |BT | < |TF | ifølge punkt 3ovenfor. Det betyr at |QT | + |TF | > |QT | + |TB|. Men |QT | + |TB| erapenbart større enn |QA| siden QA er den korteste veien fra Q til linjen l.Kombinerer vi disse resultatene, far vi

|QP | + |PF | = |QA| < |QT | + |TB| < |QT | + |TF |

som er det vi matte vise. !

Vi skal senere i denne seksjonen se pa lignende refleksjonsegenskaper forellipser og hyperbler.

Ellipser

Anta at vi har to punkter F1 og F2 i planet. Vi ser pa alle punkter P slik atsummen av avstandene |PF1| og |PF2| er lik et fast tall 2a (for at det skalfinnes slike punkter ma 2a være større enn avstanden mellom F1 og F2).

! !!

33333333

????

F1 F2

P

Figur 11: Definisjon av ellipse

Samlingen av alle disse punktene kalles ellipsen med brennpunkter F1 og F2

og store halvakse a. Du kan tegne ellipsen ved a ta en hyssing med lengde2a, feste endene med tegnestift i punktene F1 og F2, dra hyssingen strammed spissen av en blyant og sa føre blyanten rundt pa papiret mens du heletiden holder hyssingen stram.

Figur 12 viser en fullt tegnet ellipse. Avstanden fra sentrum i ellipsentil brennpunktene kalles for brennvidden og betegnes gjerne med c, mensb =

√a2 − c2 kalles den lille halvaksen. En ellipse ser ut som en flatklemt

sirkel, og grunnen til at man kaller a og b for henholdsvis store og lillehalvakse, ser du pa figuren; a er den lengste avstanden fra sentrum til etpunkt pa ellipsen, og b er den korteste avstanden fra sentrum til et punktpa ellipsen.

Page 99: Flervariabel analyse med lineær algebra

192 KAPITTEL 3. KURVER OG FLATER

!F1

!# !#$

"

c a

b

Figur 12: Ellipse med halvakser og brennvidde

For a finne en formel for ellipsen var legger vi inn et koordinatsystemmed origo i sentrum av ellipsen, x-aksen langs store halvakse, og y-aksenlangs lille halvakse (se figur 13).

! !!

33333333

????

F1(−c, 0) F2(c, 0)

P (x, y)

!

"

x

y

Figur 13: Ligning for en ellipse

Vi ser at |PF1| =√

(x + c)2 + y2 og |PF2| =√

(x− c)2 + y2. Punktet Pligger altsa pa ellipsen dersom

√(x + c)2 + y2 +

√(x− c)2 + y2 = 2a

For a forenkle uttrykket fører vi den ene kvadratroten over pa den andresiden og kvadrerer:

(√(x + c)2 + y2

)2=

(2a−

√(x− c)2 + y2

)2

Dette gir først

(x + c)2 + y2 = 4a2 − 4a√

(x− c)2 + y2 + (x− c)2 + y2

men multpliserer vi ut parentesene og forkorter, sitter vi igjen med

a2 − cx = a√

(x− c)2 + y2

3.6. KJEGLESNITT 193

Vi kvadrerer en gang til:

a4 − 2a2cx + c2x2 = a2(x− c)2 + a2y2

Rydder vi opp og forkorter, sitter vi igjen med

(a2 − c2)x2 + a2y2 = a2(a2 − c2)

Siden b2 = a2 − c2, kan dette skrives

b2x2 + a2y2 = a2b2

Til slutt deler vi med a2b2 og far

x2

a2+

y2

b2= 1

Vi har dermed vist at alle punktene som ligger pa ellipsen tilfredsstillerligningen x2

a2 + y2

b2 = 1, og det viser seg ogsa at de punktene som tilfredsstillerdenne ligningen, faktisk ligger pa ellipsen (kvadreringene vare har altsa ikkeført til falske løsninger).

I utregningene ovenfor er a > b (fordi b er definert som√

a2 − c2), menligningen x2

a2 + y2

b2 = 1 gir ogsa mening nar b er større enn a. Den fremstillerda en ellipse der x- og y-aksen har byttet roller — den store halvaksen harna lengde b og ligger langs y-aksen, mens den lille halvaksen har lengde a ogligger langs x-aksen. Brennpunktene ligger pa y-aksen i posisjonene (0, c) og(0,−c) der c =

√b2 − a2. Figur 14 viser en ellipse av denne typen.

Figur 14: En ellipse x2

a2 + y2

b2 = 1 der b > a

La oss oppsummere resultatene vare:

Setning 3.6.3 Ligningenx2

a2+

y2

b2= 1

fremstiller en ellipse med sentrum i origo og halvakser a og b. Dersom a > b,er brennpunktene (c, 0) og (−c, 0) der c =

√a2 − b2. Dersom a < b, er

brennpunktene (0, c) og (0,−c) der c =√

b2 − a2. Dersom a = b er ellipsenen sirkel med radius r = a = b. Brennpunktene faller da sammen og ligger isentrum av sirkelen.

Page 100: Flervariabel analyse med lineær algebra

194 KAPITTEL 3. KURVER OG FLATER

En ellipse kan selvfølgelig ha sentrum andre steder enn origo. Ligningen

(x−m)2

a2+

(y − n)2

b2= 1

fremstiller en ellipse med sentrum i punktet (m,n) og halvakser a, b.

Eksempel 2: Vi skal vise at ligningen

9x2 + 4y2 − 36x + 24y + 36 = 0

fremstiller en ellipse, og finne sentrum, halvakser og brennpunkter.Planen er a skrive ligningen pa formen (x−m)2

a2 + (y−n)2

b2 = 1 slik at vi kanlese av sentrum og halvakser. Vi begynner med a gjøre kvadratene i x og yfullstendige:

9x2 + 4y2 − 36x + 24y + 36 = 9x2 − 36x + 4y2 + 24y + 36 =

= 9(x2−4x)+4(y2+6y)+36 = 9(x2−4x+4)−36+4(y2+6y+9)−36+36 =

= 9(x− 2)2 + 4(y + 3)2 − 36

Ligningen kan dermed skrives

9(x− 2)2 + 4(y + 3)2 = 36

For a fa det ønskede ett-tallet pa høyresiden, deler vi med 36:

(x− 2)2

4+

(y + 3)2

9= 1

Denne ligningen kan ogsa skrives

(x− 2)2

22+

(y + 3)2

32= 1

og dermed ser vi at vi har en ellipse med sentrum i (2,−3) med halv-akser a = 2, b = 3. Siden b er den største halvaksen, blir brennviddenc =

√b2 − a2 =

√32 − 22 =

√5. Brennpunktene ligger dermed i punktene

F1(2,−3−√

5) og F2(2,−3 +√

5) (husk at den store halvaksen er parallellmed y-aksen). ♣

Det er ikke vanskelig a parametrisere en ellipse. Ved a sette inn i ligningen(x−m)2

a2 + (y−n)2

b2 = 1 ser du at

r(t) = (m + a cos t) i + (n + b sin t) j t ∈ [0, 2π]

er en parametrisering av ellipsen med sentrum i (m,n) og halvakser a og b.Figur 15 viser refleksjonsegenskapen til ellipser; en strale som starter i

det ene brennpunktet, reflekteres gjennom det andre brennpunktet. Du kan

3.6. KJEGLESNITT 195

oppleve dette prinsippet i praksis i enkelte ovale rom (f.eks. “WhisperingGallery” i St. Paul’s Cathedral i London); en lavmælt samtale nær det enebrennpunktet, oppfattes tydelig i nærheten av det andre brennpunktet man-ge meter unna. Har du et fat eller en kjele som er (tilnærmet) ellipseformet,kan du eksperimentere med refleksjonsegenskapen. Hvis du fyller litt vann ibunnen og slipper en drape i det ene brennpunktet, vil du fa en bølge sombrer seg utover til den treffer kanten, og sa samles i det andre brennpunktet.

! !F1 F2

UU

UU

UU

UUXK

KK

KK

KK

KY$3333333333333

ZZZZZZ[[[[[[[[[[[[[[[

4

W

\

Figur 15: Refleksjonsegenskapen for ellipser

Beviset for refleksjonsegenskapen for ellipser er enklere enn beviset forrefleksjonsegenskapen for parabler, men bygger pa den samme ideen. I til-legg til det vi allerede vet (det kan være lurt a repetere de tre punktene omrefleksjon som vi skrev opp da vi gjennomgikk parabelen), trenger vi en ob-servasjon til: Ellipsen med brennpunkter F1 og F2 og store halvakse a, bestarav de punktene P slik at den samlede avstandene fra P til brennpunkteneer nøyaktig 2a, dvs:

|PF1| + |PF2| = 2a

De punktene som ligger pa utsiden av ellipsen, har en samlet avstand somer større en 2a, mens de som ligger pa innsiden av ellipsen har en samletavstand som er mindre enn 2a (dette virker intuitivt rimelig, men kan dubevise det?)

Setning 3.6.4 (Refleksjonsegenskapen for ellipser) En strale som garut fra det ene brennpunktet til en ellipse, reflekteres gjennom det andre.

Bevis: Pa figur 16 har vi tegnet den brudne linjen fra det ene brennpunktetF1, via et punkt P pa ellipsen til det andre brennpunktet F2. For a vise atdette er veien en lysstrale vil følge, ma vi vise at vinklene v og w er likestore. Det er tilfellet dersom P er det punktet pa tangenten som har minst

Page 101: Flervariabel analyse med lineær algebra

196 KAPITTEL 3. KURVER OG FLATER

samlet avstand til F1 og F2, men det er opplagt — alle andre punkter patangenten ligger utenfor ellipsen, og har derfor en samlet avstand som erstørre enn 2a. !

! !

!

3333333333333]]]]]

]]]]

F1 F2

P

v

w

Figur 16: Bevis for refleksjonsegenkapen for ellipse

Ellipser har forskjellig form, noen er langstrakte, mens andre er nestensirkelformede. Eksentrisiteten er et tradisjonelt mal pa hvor langstrakt enellipse er. Den er definert ved

e =brennvidden

store halvakse=

c

a

En sirkel har eksentrisitet 0, mens en svært langstrakt ellipse har en eksen-trisitet tett oppunder 1.

Hyperbler

Vi skal na se pa den siste klassen av kjeglesnitt — hyperbler. Definisjo-nen ligner pa definisjonen til ellipser, men vi bruker differenser istedenforsummer.

! !!

33333333

????

F1 F2

P

Figur 17: Definisjon av hyperbel

Vi starter med to punkter F1 og F2 i planet, og ser pa alle punkter Pslik at avstandene |PF1| og |PF2| har en fast differense. Kaller vi dennedifferensen 2a, er vi altsa interessert i alle punkter P slik at

|PF1|−| PF2| = ±2a

(vi skriver ± foran 2a siden vi ikke er interessert i hvilken av avstandenesom er størst, bare at differensen mellom den største og den minste er 2a).

Som figur 18 viser, er en hyperbel ikke en sammenhengende kurve, menbestar av to deler. Den høyre av disse hyperbelgrenene bestar av de punktene

3.6. KJEGLESNITT 197

P der|PF1|−| PF2| = 2a

mens den venstre bestar av de punktene P der

|PF1|−| PF2| = −2a

Vi kaller a for halvaksen. Pa figuren er a avstanden fra sentrum i hyperbelentil “snuten” av hver av hyperbelgrenene. Som for ellipsen er brennviddenc avstanden fra sentrum til brennpunktene. For hyperbler er c > a, ogvi definerer hjelpestørrelsen b =

√c2 − a2 som ikke har noen umiddelbar

geometrisk tolkning, men som likevel spiller en viktig rolle.

!! !

"

F1 F2

!#!# ac x

y

Figur 18: Hyperbel med halvakse og brennvidde

For a finne formelen til en hyperbel, legger vi inn et kordinatsystem somvist pa figur 19.

! !!

33333333

????

F1(−c, 0) F2(c, 0)

P (x, y)

!

"

x

y

Figur 19: Ligning for en hyperbel

Vi ser at |PF1| =√

(x + c)2 + y2 og |PF2| =√

(x− c)2 + y2. Punktet Pligger altsa pa hyperbelen dersom

√(x + c)2 + y2 −

√(x− c)2 + y2 = ±2a

Page 102: Flervariabel analyse med lineær algebra

198 KAPITTEL 3. KURVER OG FLATER

Akkurat som for ellipsen kan vi forenkle dette uttrykket ved a føre den enekvadratroten over pa den andre siden og kvadrere:

(√(x + c)2 + y2

)2=

(±2a +

√(x− c)2 + y2

)2

Dette gir først

(x + c)2 + y2 = 4a2 ± 4a√

(x− c)2 + y2 + (x− c)2 + y2

men multipliserer vi ut parentesene og forkorter, sitter vi igjen med

a2 − cx = ∓a√

(x− c)2 + y2

Vi kvadrerer en gang til:

a4 − 2a2cx + c2x2 = a2(x− c)2 + a2y2

Rydder vi opp og forkorter, sitter vi igjen med

(a2 − c2)x2 + a2y2 = a2(a2 − c2)

Siden b2 = c2 − a2, kan dette skrives

−b2x2 + a2y2 = −a2b2

Til slutt deler vi med −a2b2 og far

x2

a2− y2

b2= 1

Vi har dermed vist at alle punktene pa hyperbelen tilfredsstiller ligningenx2

a2 − y2

b2 = 1, og det viser seg ogsa at de punktene som tilfredsstiller denneligningen, faktisk ligger pa hyperbelen (kvadreringene vare har altsa ikkeført til falske løsninger).

Dersom vi plasserer minustegnet foran x-leddet istedenfor y-leddet, altsay2

b2 −x2

a2 = 1, sa fremstiller ligningen fortsatt en hyperbel, men na har x- ogy-aksen byttet roller. Det er b som er halvaksen, brennpunktene ligger pay-aksen i posisjonene (0,−c) og (0, c), og hyperbelen “ligger” istedenfor asta, slik figur 20 viser.

3.6. KJEGLESNITT 199

!

!

"

!

"

$

b

!

F1(0,−c)

F2(0, c)

x

y

Figur 20: Hyperbel med ligning y2

b2 −x2

a2 = 1

La oss oppsummere resultatene vare sa langt.

Setning 3.6.5 Ligningenx2

a2− y2

b2= 1

fremstiller en hyperbel med halvakse a og med brennpunkter i (−c, 0) og (c, 0)der c =

√a2 + b2. Ligningen

y2

b2− x2

a2= 1

fremstiller en hyperbel med halvakse b og med brennpunkter i (0,−c) og (0, c).

Ogsa hyperbler kan ha sentrum andre steder enn i origo. Ligningene

(x−m)2

a2− (y − n)2

b2= 1

og(y − n)2

b2− (x−m)2

a2= 1

fremstiller hyperbler med sentrum i (m, n).

Eksempel 3: Vi skal vise at ligningen

−3x2 + 4y2 + 6x + 32y + 49 = 0

Page 103: Flervariabel analyse med lineær algebra

200 KAPITTEL 3. KURVER OG FLATER

fremstiller en hyperbel, og finne sentrum og brennpunkter.Akkurat som for ellipsen og parabelen fullfører vi kvadratene og forsøker

a bringe ligningen over pa en av standardformene ovenfor. Vi har:

−3x2 + 4y2 + 6x + 32y + 49 = −3x2 + 6x + 4y2 + 32y + 49 =

−3(x2−2x)+4(y2+8y)+49 = −3(x2−2x+1)+3+4(y2+8y+16)−64+49 =

= −3(x− 1)2 + 4(y + 4)2 − 12

Ligningen var kan altsa skrives

−3(x− 1)2 + 4(y + 4)2 = 12

og deler vi pa 12, far vi

−(x− 1)2

4+

(y + 4)2

3= 1

Dette er det samme som(y + 4)2

(√

3)2− (x− 1)2

22= 1

Dette er ligningen til en hyperbel med sentrum i (1,−4), med a = 2 og

b =√

3. Brennvidden er c =√

a2 + b2 =√

22 + (√

3)2 =√

7. Siden aksentil parabelen er parallell med y-aksen, ligger brennpunktene i (1,−4 −

√7)

og (1,−4 +√

7). ♣

!! !

"

F1 F2

x

y

++

++

++

++

++

++

++

++

++

++:

::

::

::

::

::

::

::

::

::

:Figur 21: Hyperbel med asymptoter

Asymptoter er et viktig hjelpemiddel nar vi skal tegne hyperbler (se figur21). Det viser seg at hyperblene (x−m)2

a2 − (y−n)2

b2 = 1 og (y−n)2

b2 − (x−m)2

a2 = 1har de samme asymptotene.

3.6. KJEGLESNITT 201

Setning 3.6.6 Hyperblene (x−m)2

a2 − (y−n)2

b2 = 1 og (y−n)2

b2 − (x−m)2

a2 = 1 harasymptotene

y − n = ± b

a(x−m)

nar x → ±∞.

Bevis: For at ikke regningene skal bli altfor uoversiktelig, nøyer vi oss meda vise at y = b

ax er en asymptote for hyperbelen x2

a2 − y2

b2 = 1 nar x →∞:Løser vi ligningen x2

a2 − y2

b2 = 1 med hensyn pa y, far vi

y = ± b

a

√x2 − a2

Siden vi apenbart er interessert i den positive delen, ma vi vise at

limx→∞

(b

a

√x2 − a2 − b

ax

)= 0

Bruker vi trikset med a gange med den konjugerte over og under brøkstreken,far vi

limx→∞

(b

a

√x2 − a2 − b

ax

)=

b

alim

x→∞

(√x2 − a2 − x

)=

=b

alim

x→∞

(√x2 − a2 − x

) (√x2 − a2 + x

)

√x2 − a2 + x

=

=b

alim

x→∞

−a2

√x2 − a2 + x

= 0

!

Vi tar med et eksempel.

Eksempel 4: Finn asymptotene til hyperbelen

(x− 3)2

32− (y + 4)2

42= 1

Formelen ovenfor sier at asymptotene er

y + 4 = ±43(x− 3)

Tar vi de to fortegnene hver for seg, far vi

y =43x− 8

og

y = −43x ♣

Page 104: Flervariabel analyse med lineær algebra

202 KAPITTEL 3. KURVER OG FLATER

Akkurat som de andre kjeglesnittene har hyperbelen en refleksjonsegen-skap. Den er ikke sa mye brukt som refleksjonsegenskapene til parabelen ogellipsen, men for ordens skyld tar vi den med (uten bevis).

!! !

"

F1 F2

x

y^^^^^^^

)))))))))))))

C

.

Figur 22: Refleksjonsegenskapen for hyperbler

Setning 3.6.7 En strale som kommer fra utsiden av en hyperbel med ret-ning mot det ene brennpunktet, reflekteres i retning av det andre brennpunk-tet (se figur 22). !

La oss helt til slutt ta med et par ord om parametrisering. Hyperbelen(x−m)2

a2 − (y−n)2

b2 = 1 kan parametriseres ved

r(t) = (m + a cosh t) i + (n + b sinh t) j

dercosh t =

et + e−t

2og

sinh t =et − e−t

2er henholdsvis hyperbolsk sinus og cosinus (se seksjon 7.7 i Kalkulus). Dukan sjekke dette ved a bruke at

cosh2 t− sinh2 t = 1

Dandelins iskrembevis

Helt i begynnelsen av seksjonen (figur 1) sa vi hvordan kjeglesnitt fremkom-mer nar vi snitter en kjegle med et plan. I dette avslutningsavsnittet skal

3.6. KJEGLESNITT 203

vi se hvordan vi kan knytte denne romgeometriske beskrivelsen til de plan-geometriske definisjonene vi ellers har brukt. Vi skal gjennomføre beviset forellipser, men det finnes tilsvarende argumenter for hyperbler og parabler (seoppgavene). Beviset stammer fra den belgiske matematikeren Germinal P.Dandelin (1794-1847) og er et sjeldent eksempel pa at det finnes elegante ognaturlige geometriske argumenter som ikke ble funnet av de gamle grekerne!

Før vi begynner, er det nyttig a være klar over følgende lille kjensgjer-ning: Dersom du har et punkt P utenfor en kule, er det uendelig mangelinjer som gar gjennom P og tangerer kulen. Uansett hvilken av disse lin-jene du velger, vil avstanden fra P til tangeringspunktet alltid være densamme. Den enkleste maten a se dette pa geometrisk, er nok a tenke segat punktet ligger rett over toppen av kulen som polarstjernen over Nord-polen — da vil alle tangenter berøre jordkloden langs samme breddegrad.

Figur 23: Dandelins iskrembevis

Figur 23 viser utgangspunktet for Dandelins bevis. Vi kutter over enkjegle med et plan som er mindre bratt enn sidekanten til kjeglen. Inni ikjeglen legger vi to kuler som “hviler” i kjeglen slik en perfekt iskremkulevil hvile i en kjegleformet kjeks— en som tangerer planet fra undersiden ogen som tangerer planet fra oversiden (se figuren). Disse to kulene tangereroverskjæringsplanet i to punkter F1 og F2, og vi skal vise at snittkurventil kjeglen og planet er en ellipse med brennpunkter i F1 og F2. Ifølge den

Page 105: Flervariabel analyse med lineær algebra

204 KAPITTEL 3. KURVER OG FLATER

geometriske definisjonen av en ellipse er det nok a vise at summen av av-standene |PF1| og |PF2| er den samme uansett hvilket punkt P vi velger pasnittkurven.

Observer at de to kulene tangerer kjeglen i to horisontale sirkler S1 ogS2, og la c være avstanden mellom sirklene malt langs kjeglekanten. Vi skalvise at |PF1| + |PF2| = c.

Trekk linjen gjennom P og bunnpunktet O i kjeglen. Denne linjen skjæ-rer sirklene S1 og S2 i punktene A1 og A2. Vi ser na at |PF1| = |PA1| sidenbegge er tangenter til den nederste kulen. Tilsvarende er |PF2| = |PA2| si-den begge er tangenter til den øverste kulen. Men dermed er |PF1|+|PF2| =|PA1| + |PA2| = c, og beviset er fullført.

Som allerede nevnt, finnes det tilsvarende bevis for hyperbler og parabler.Du finner noen hint i oppgave 16 og 17.

Oppgaver til seksjon 3.6

I oppgave 1 til 7 skal du undersøke om ligningen fremstiller et kjeglesnitt. Bestemi sa fall hva slags kjeglesnitt, og finn sentrum, halvakser, brennpunkter, toppunkt,asymptoter der det er aktuelt. Lag en skisse av kjeglesnittet.

1. 4x2 + 9y2 + 32x− 18y + 37 = 0

2. y2 − 4x− 2y − 7 = 0

3. x2 − y2 − 2x + 4y − 7 = 0

4. 16y2 − 9x2 + 32y + 54x− 209 = 0

5. 3x2 + 5y2 + 6x− 20y + 8 = 0

6. x2 + 4x + 2y − 4 = 0

7. 3x2 + y2 − 6x + 4y + 16 = 0

8. Vis at ligningen til tangenten i et punkt (x0, y0) pa ellipsen x2

a2 + y2

b2 = 1 kanskrives xx0

a2 + yy0b2 = 1.

9. Vis at tangenten til parabelen y2 = 4ax i punktet (x0, y0) skjærer x-aksen ipunktet (−x0, 0).

10. Et punkt P ligger “inni” en parabel. Finn den korteste veien fra P , via para-belen, til brennpunktet F .

11. Figuren viser en parabel og en linje m som er parallell med styrelinjen. Tolysstraler kommer inn parallelt med parabelaksen og brytes nar de treffer parabelen.Den ene stralen skjærer linjen m i punktene A og B, den andre i punktene A′ ogB′. Bruker lyset kortest tid fra A til B eller fra A′ til B′?

3.6. KJEGLESNITT 205

!

"

???????

??? !

#?

??

?W

::

::

::

:::

::!

#::

::=

F!! x

y

m

A

B

A′

B′

12. Figuren viser en linje l og en ellipse med brennpunkter F1 og F2, og storehalvakse a. Vi skal na beskrive hvordan du kan finne en tangent til ellipsen som erparallell med l.

! !F1 F2

!A

B

!!

lm t

33333333333333333

>>

>>

>>

>>

>>

>>

>

]]]]]]]]]]]]]]]]]]

333333333333333

!

Trekk linjen m som gar gjennom F1 og star normalt pa l. Sett av et punkt A pam som har avstand 2a til F2. Trekk midtnormalen t pa linjestykket F1A. Da er tparallell med l og tangent til ellipsen.

I resten av oppgaven skal vi vise at denne metoden er riktig.

a) La B være skjæringspunktet mellom ellipsen og linjestykket F2A. Forklarhvorfor |AB| = |BF1|.

Page 106: Flervariabel analyse med lineær algebra

206 KAPITTEL 3. KURVER OG FLATER

b) Vis at B ligger pa t.

c) La C være et annet punkt pa t. Forklar hvorfor |F2C| + |CF1| = |F2C| +|CA| > 2a.

d) Bruk resultatet i c) til a vise at t tangerer ellipsen i B.

13. Endene til et 34 meter langt tau er festet i to punkter A og B. Avstanden fraA til B er 20 meter. Et lodd er festet til et punkt C pa tauet. Loddet trekker tauetstramt slik at det danner to rette linjestykker AC og CB (se figur 1)!

!!

>>>>?

?????????

B

A

C

Figur 1

a) Forklar at punktet C ligger pa en ellipse med brennpunkter i A og B og medstore halvakse 17 meter. Hva er den andre halvaksen?

!

" !

!>>>>?

?????????

B(16, 12)

A

D !!

x

y

Figur 2

Hvis loddet far gli fritt langs tauet, vil det falle til ro i det laveste punktet paellipsen. I resten av oppgaven skal vi arbeide for a finne dette punktet. I figur 2 harvi lagt punktene inn i et koordinatsystem slik at A har koordinatene (0, 0) og Bhar koordinatene (16, 12).

b) Punktet D ligger pa den negative y-aksen en taulengde (= 34 meter) fra B.Finn koordinatene til D.

Linjen L er parallell med x-aksen og ligger like langt fra A som fra D. Denne linjenskjærer linjestykket DB i et punkt P (se figur 3 nedenfor).

c) Vis at P ligger pa ellipsen.

d) Vis at ingen andre punkter pa L ligger pa ellipsen. Hvorfor betyr dette at Per det laveste punktet pa ellipsen?

3.6. KJEGLESNITT 207

e) Finn koordinatene til P .

!

" !

!!

>>>>?

?????????

??????????

????

!

x

y

D

L

B

A

P

Figur 3

14. O og A er to punkter i planet med koordinater henholdsvis (0, 0) og (0, 6). Etkjeglesnitt bestar av alle de punkter X med koordinater (x, y) slik at |OX|+|AX| =10.

a) Hva slags kjegesnitt er dette? Finn ligningen til kjeglesnittet og tegn figur.

Figuren nedenfor viser en sirkel C1 med sentrum i O og radius 10. En mindre sirkelC2 gar gjennom A og tangerer C2 i punktet B.

b) Vis at sentrum S i C2 ligger pa kjeglesnittet i punkt a).

Et ingeniørfirma planlegger en undersjøisk rørledning. Røret skal ha indre radius 10cm, og det skal blant annet inneholde en elektrisk kabel med radius 3 cm. Figurenovenfor kan oppfattes som et tverrsnitt gjennom røret og kabelen. Pa grunn avstrømtilførselen ma ytterkanten av kabelen ga gjennom punkt A, og for at kabelenskal være minst mulig i veien for de andre installasjonene i røret, ønsker man atden skal tangere innsiden av røret.

c) Finn koordinatene til midtpunktet S i kabelen. Finn ogsa koordinatene tilpunktet B der kabelen skal festes til røret.

15. I denne oppgaven er a og c to positive tall, og c > a.

a) A og B er to punkter i planet. Et kjeglesnitt bestar av alle punkter X slikat |AX|−| BX| = ±2a. Beskriv kjeglesnittet

b) Pa figuren nedenfor er |AB| = |CD| = 2c og |AC| = |BD| = 2a. Forklar at∠BDA = ∠CAD. Forklar ogsa at |DE| = |AE|, og vis at punktet E liggerpa kjeglesnittet i spørsmal a).

Page 107: Flervariabel analyse med lineær algebra

208 KAPITTEL 3. KURVER OG FLATER

Den nederlandske matematikeren Frans van Schooten konstruerte pa 1600-tallet etapparat til a tegne hyperbler (se figuren nedenfor). Instrumentet er laget slik at|AB| = |CD| = 2c og |AC| = |BD| = 2a. I punktene A,B,C, D er stengene festetmed en nagle slik at de kan rotere i forhold til hverandre. Punktene A og B er festettil papiret mens en penn i E tegner en kurve nar man vrir pa instrumentet.

c) Forklar at instrumentet tegner opp (deler av) en hyperbel.

(Takk til Tor Andersen for tegningen av van Schootens instrument).

16. Det finnes en variant av Dandelins iskrembevis for hyperbler. I dette tilfelletarbeider man ogsa med to kuler — den ene i den øvre delen av dobbeltkjeglen, denandre i den nedre delen. Gjennomfør resonnementet.

17. Gjennomfør Dandelins iskrembevis for parabler. I dette tilfellet er det bareen kule a arbeide med. Denne kulen tangerer kjeglen i en sirkel S1. Styrelinjen tilparabelen er skjæringlinjen mellom overskjæringsplanet (som parabelen ligger i) ogplanet til S1.

3.7 Grafisk fremstilling av skalarfelt

I kapittel 2 studerte vi funksjoner fra Rn til Rm. Generelt er det ikke muliga fremstille slike funksjoner grafisk pa en realistisk mate, og vi nøyde ossderfor med stiliserte figurer av typen nedenfor.

3.7. GRAFISK FREMSTILLING AV SKALARFELT 209

/

0

1

2

Rn

/

0

1

2

aRm3 3A

F

b = F(a)

Figur 1: Funksjon F fra Rn til Rm

Det finnes imidlertid tilfeller der man kan gi gode grafiske fremstillinger avfunksjoner av flere variable, og det er dette som er temaet for denne og denneste seksjonen. Før vi setter igang for alvor, tar vi med en liten forsvarstalefor hvorfor det fortsatt er lurt a lære seg a tegne grafer for hand til tross fordet finnes bade lommeregnere og dataprogrammer (slik som MATLAB) somgir flotte grafiske fremstillinger. Det er tre momenter jeg vil trekke frem:

• En tredimensjonal graf kan være vanskelig a tolke, spesielt nar delerav grafen skjuler seg bak andre deler. Det kan ogsa være vanskelig afinne det riktige vinduet; bruker man gal malestokk eller fokuserer pafeil sted, risikerer man a ga glipp av de interessante detaljene. Lager dugrafene for hand, blir du ofte ledet til stedene der det interessante skjer.Det viser seg ogsa ofte at en litt karikert handtegning er lettere a forstaenn en eksakt datautskrift — akkurat som en god karikaturtegning oftesier mer om en politiker enn det et offisielt fotografi gjør.

• Ofte er vi ikke bare interessert i a vite hvordan en funksjon ser ut —vi vil ogsa vite hvorfor den ser ut som den gjør. Nar vi analysereren funksjon matematisk, far vi en helt annen forstaelse av hvorforbunnene og toppene ligger der de gjør, enn nar vi bare studerer etbilde pa en dataskjerm.

• Av og til vil vi lage en graf med et spesielt utseende eller ta en grafvi allerede har, og modifisere den i en spesiell retning. Man kan gjøredette med dataverktøy etter prøve-og-feile-metoden, men det tar oftelang tid og minner om a lete etter en nal i en høystakk. Skjønner manmatematikken som ligger bak grafene, er det mye lettere a se hva somtrengs.

La meg understreke at punktene ovenfor ikke betyr at dataverktøy erunyttig nar man skal fremstille funksjoner grafisk — tvert i mot finnes detmange funksjoner som er sa kompliserte at de bare kan fremstilles grafiskved hjelp av slike hjelpemiddel. Det jeg vil argumentere for, er at man oftekommer lengst nar man kombinerer datamaskinens fremstilling med en ma-tematisk analyse.

Page 108: Flervariabel analyse med lineær algebra

210 KAPITTEL 3. KURVER OG FLATER

La oss komme igang! Vi begynner med a minne om hvordan vi grafiskkan fremstille funksjoner f : R2 → R, altsa skalarfelt av to variable (huskseksjon 2.1). For a unnga altfor mange indekser, skal vi kalle variablene x og yistedenfor x1 og x2, og vi skal bruke z som en betegnelse pa funksjonsverdien.Vi ser altsa pa funksjoner z = f(x, y). For a tegne funksjonsgrafen lager viførst et tre-dimensjonalt koordinatsystem som vist pa figur 2.

"

''''''''''(

))))))* !

!

$

"

f(x, y)

x

y

z

(x, y, 0)

(x, y, f(x, y))

Figur 2: Plotting av skalarfelt

Gitt variabelverdier x og y, finner vi punktet (x, y, 0) i xy-planet. Vi flytteross na loddrett (dvs. parallelt med z-aksen) til vi finner punktet (x, y, f(x, y)).Dette er det første punktet pa funksjonsgrafen var. Gjentar vi denne pro-sedyren for stadig flere variabelverdier (x, y), vokser grafen etterhvert fremsom en flate i rommet (se figur 3).

"

''''''''''(

))))))* !

!

x

y

z

(x, y, 0)

(x, y, f(x, y))

Figur 3: Grafisk fremstilling av skalarfelt

Selv om denne prosedyren pa en grei mate forklarer hva grafen til etskalarfelt er, sa er den i praksis ubrukelig som en oppskrift for hvordan mantegner grafen. Prøver du den, selv pa en enkel funksjon, oppdager du fortat du helt mister romfølelsen i bildet. Vi ma derfor finne frem til andre ogmer effektive mater a tegne grafer pa.

Et godt hjelpemiddel er nivakurvene til funksjonen. For hvert tall c,

3.7. GRAFISK FREMSTILLING AV SKALARFELT 211

bestar nivakurven

Nc = {(x, y) : f(x, y) = c}

av de punktene i xy-planet der funksjonen har verdien c. Figur 4 viser hvor-dan nivakurvene fremkommer — vi tar utgangpunkt i de punktene pa grafenhvor funksjonsverdien er hhv. c1, c2 og c3, og projiserer dem ned i xy-planet.

Figur 4: Fremstilling av nivakurver

Pa figur 5 har vi tegnet opp disse punktene i et todimensjonalt koordi-natsystem. Legg merke til at en av nivakurvene (den som tilsvarer verdienc2) bestar av to deler — en for hver “fjelltopp” pa grafen.

Figur 5: Nivakurver

Pa figur 4 og 5 startet vi med funksjonsgrafen og tegnet inn nivakurveneetterpa. I praksis gar vi som regel den andre veien — vi starter med nivakurveneog vil bruke dem som et utgangspunkt for a tegne grafen. Her er et eksempel:

Eksempel 1: Vi skal skissere grafen til funksjonen f(x, y) = x2 + 4y2.Nivakurvene blir

x2 + 4y2 = c.

Page 109: Flervariabel analyse med lineær algebra

212 KAPITTEL 3. KURVER OG FLATER

Er c negativ, finnes det ingen punkter som oppfyller denne ligningen. Er cpositiv, far vi ellipsene

x2

(√

c)2+

y2

(√c

2

)2 = 1.

Figur 6 viser noen av nivakurvene (de tilhørende c-verdiene star pa). Nivakurvenetil f er altsa ellipser med samme form som ligger tettere og tettere dess størrec blir.

Figur 6: Nivakurver til f(x, y) = x2 + 4y2

Vi kan tenke oss at flaten bestar av elliptiske ringer lagt oppa hver-andre. For a fa et bedre inntrykk av hvordan disse ringene vokser nar vigar oppover, kan det være lurt a se pa de sakalte konturene til flaten, dvs.skjæringskurvene mellom flaten og plan parallelle med henholdsvis xz-planetog yz-planet. Setter vi for eksempel y = 0 i uttrykket z = x2 + 4y2, far viligningen z = x2 for skjæringskurven mellom flaten og xz-planet. Dette be-tyr at ringene vokser pa en slik mate at de passer inn i en parabel. Settervi isteden x = 0, far vi uttrykket z = 4y2 som gir skjæringen mellom flatenog yz-planen. Dette er ogsa en parabel, men en som er “slankere” enn denforrige.

Figur 7: Flaten z = x2 + 4y2

3.7. GRAFISK FREMSTILLING AV SKALARFELT 213

Kombinerer vi den informasjonen vi na har, far vi et ganske godt bilde avflaten – den er pokalformet med et litt avlangt tverrsnitt. Figur 7 viser entredimensjonal tegning med nivakurver. ♣

La oss na se pa et eksempel hvor det lønner seg a modifisere teknikkenovenfor en smule.

Eksempel 2: Vi skal skisser grafen til funksjonen

f(x, y) = x2 − y2

Nivakurvene til denne funksjonen er gitt ved

x2 − y2 = c

Disse kurvene ser litt forskjellige ut avhengig av om c er positiv, negativeller 0. Er c positiv, far vi “staende” hyperbler

x2

(√

c)2− y2

(√

c)2= 1

Er c negativ, far vi “liggende” hyperbler

y2

(√−c)2

− x2

(√−c)2

= 1

Er c = 0, far vi ligningen x2−y2 = 0, som gir oss de to rette linjene y = ±x.Noen av nivakurvene er vist pa figur 8 (de tilhørende c-verdiene star pa).

Nivakurvene gir oss et hovedinntrykk av funksjonen. Starter vi i origo,vokser funksjonen hvis vi gar langs x-aksen (uansett om vi gar mot høyreeller venstre), mens den synker nar vi gar langs y-aksen. Noe godt utgangs-punkt for a tegne funksjonsgrafen har vi allikevel ikke sa langt.

Figur 8: Nivakurver for f(x, y) = x2 − y2

La oss bruke trikset fra forrige gang med a sette x og y lik 0 etter tur for afinne konturene til grafen. Vi far z = x2 og z = −y2 som er to parabler – den

Page 110: Flervariabel analyse med lineær algebra

214 KAPITTEL 3. KURVER OG FLATER

ene vender oppover og den andre nedover. Tegner vi begge disse parablenei et tre-dimensjonalt aksekors, far vi figur 9 der det ser ut som om den eneparabelen henger pa tvers over den andre.

Figur 9: Skjæring med xz- og yz-planet

For a skaffe oss et enda bedre inntrykk av grafen, kan vi velge a sette xlik en annen konstant k for a se hvordan grafen skjærer planet x = k. Dafar vi parabelen z = −y2 + k2 (se figur 10).

Figur 10: Skjæring med planet x = k

Figur 11: Skisse av flaten z = x2 − y2

3.7. GRAFISK FREMSTILLING AV SKALARFELT 215

Setter vi sammen den informasjonen vi na har, far vi bildet i figur 11 der detser ut som en serie av parabler er hengt opp pa en parabelformet klessnor.

Figur 12. Flaten z = x2 − y2

Tar vi utgangspunkt i denne forestillingen, er det lett a lage en tegning somi figur 12. Flaten ser ut omtrent som en sal (pa en hest). ♣

Ved a kombinere teknikkene i eksemplene ovenfor kan du skissere defleste funksjonsgrafer. I kapittel 5 vil du i tillegg lære teknikker for a finnemaksimums- og minimumspunkter. Men det er ikke bare matematiske knepsom er nyttige nar man skal tegne en graf, det kan ogsa være lurt a tenkelitt pa det tegnetekniske. Ofte vil du finne at en flate blir enklere a tegnedersom du skifter synsvinkel og ser den fra en annen kant.

Polarkoordinater

Nar vi skal angi posisjonen til et punkt i planet, er det vanligste a oppgi x- ogy-koordinaten. I en del sammehenger er det imidlertid enklere og nyttigere abruke polarkoordinater (r, θ). Polarkoordinatene fungerer pa akkurat sammemate her som i teorien for komplekse tall (se figur 13).

!

"

3333333!x

y

θ

(x, y)r

Figur 13: Polarkoordinater

For a finne polarkoordinatene til punktet (x, y) regner vi først ut

r =√

x2 + y2 .

Page 111: Flervariabel analyse med lineær algebra

216 KAPITTEL 3. KURVER OG FLATER

Deretter regner vi utsin θ =

y

r.

(du kan godt regne ut cos θ = xr isteden). Det er to vinkler i første omløp

med samme sinus, men ved a se pa hvilken kvadrant punktet (x, y) ligger i,er det ikke vanskelig a plukke ut den riktige vinkelen.

Det hender ogsa at vi ma ga den andre veien – at vi kjenner polarkoor-dinatene r og θ, og ønsker a finne x og y. Dette er lettere – vi observererbare at

x = r cos θ

y = r sin θ .

Siden vi kan angi punkter i planet ved hjelp av polarkoordinater (r, θ)istedenfor kartesiske koordinater (x, y), kan vi ogsa beskrive funksjoner avto variable ved hjelp av polarkoordinater z = g(r, θ) istedenfor kartesiskekoordinater z = f(x, y). Ofte kan det være nyttig a skrive om en funksjontil polarkoordinater for a fa et bedre inntrykk av grafen.

Eksempel 3: Hvis vi skriver om z = e−(x2+y2) til polarkoordinater, far viz = e−r2 . Tegner vi z = e−r2 som en funksjon av en variabel, far vi grafen ifigur 14.

Figur 14: Grafen til z = e−r2 .

Grafen til funksjonen z = e−(x2+y2) far vi ved a rotere denne grafen omz-aksen. Figur 15 viser rotasjonen, og figur 16 viser resultatet.

.Figur 15: Rotasjon av grafen z = e−r2 .

3.7. GRAFISK FREMSTILLING AV SKALARFELT 217

Figur 16: Grafen z = e−(x2+y2). ♣

Vi tar med et eksempel til:

Eksempel 4: Skriver vi om funksjonen z = x2 − y2 i eksempel 2 til polar-koordinater, far vi

z = x2 − y2 = (r cos θ)2 − (r sin θ)2 = r2(cos2 θ − sin2 θ) = r2 cos 2θ .

Dette betyr at hvis vi holder vinkelen θ konstant og varierer avstandenr, sa følger z en parabelbue z = r2 cos 2θ. Fortegnet til cos 2θ avgjør omparabelen vokser oppover eller nedover nar r øker, og størrelsen til | cos 2θ|avgjør hvor rask denne veksten er. Forsøk a lage en skisse av grafen ut i fraden informasjonen du na har. ♣

Funksjoner av tre variable

Hittil har vi holdt oss til funksjoner av to variable. Det er ikke mulig ategne grafen til funksjoner av flere enn to variable pa samme mate, menmye av den intuisjonen vi far fra det todimensjonale tilfellet, kan overførestil funksjoner av flere variable. For funksjoner u = f(x, y, z) av tre variablekan vi fa en viss informasjon ved a se pa nivaflater. Gitt et tall c, er dentilhørende nivaflaten gitt ved

Nc = {(x, y, z) : f(x, y, z) = c}

Disse mengdene kalles nivaflater fordi de ofte danner flater i rommet. Tarvi funksjonen

f(x, y, z) = x2 + y2 + z2

som et eksempel, ser vi at nivaflaten Nc er et kuleskall med radius√

c narc > 0. Nar c = 0, bestar nivaflaten bare av punktet (0, 0, 0), og nar c < 0,inneholder ikke Nc noen punkter i det hele tatt. Dette gir oss et visst inntrykkav hvordan funksjonen f er — den er null i origo, konstant pa kuleskall og

Page 112: Flervariabel analyse med lineær algebra

218 KAPITTEL 3. KURVER OG FLATER

har tettere og tettere nivaflater dess lenger ut vi kommer (dvs. den vokserraskere og raskere),

Ogsa for funksjoner av tre variable kan det ofte lønne seg a skrive omtil andre koordinatsystemer. Vi skal se raskt pa to slike koordinatsyste-mer – sylinderkoordinater og kulekoordinater. Figur 17 viser grunnideen forsylinderkoordinater; vi angir posisjonen til punktet P ved hjelp av de trestørrelsene r, θ og z, der z er P ’s høyde over xy-planet, mens r og θ erpolarkoordinatene til P ’s projeksjon ned i xy-planet. Sylinderkoordinater eraltsa nært beslektet med polarkoordinater — vi har bare hektet pa en tredjekoordinat z for a kunne beskrive punktets høyde.

'''''''''(

"

))))))))*

"

$ !#

!

!x

y

z

θ

z

r

P

Figur 17: Sylinderkoordinater

Eksempel 5: Vi skriver funksjonen

u = f(x, y, z) = (x2 + y2)e−z

ved hjelp av sylinderkoordinater. Siden x2 + y2 = r2, far vi

u = r2e−z

Dette gir oss et visst inntrykk av hvordan f oppfører seg; sa lenge vi holdeross i en fast høyde, vokser funksjonen proporsjonalt med kvadratet av av-standen r til z-aksen, men nar vi forflytter oss rett oppover, avtar funksjonenproporsjonalt med e−z. !

'''''''''(

"

))))))))*

__

__

__

__

__

!#

!

!x

y

z

θ

ρ

φ

r

P

O!Figur 18: Kulekoordinater

3.7. GRAFISK FREMSTILLING AV SKALARFELT 219

I kulekoordinater beskrives posisjonen til et punkt P ved hjelp av enlengde ρ og to vinkler θ og φ. Figur 18 viser ideen: ρ er avstanden fra P

til origo, φ er vinkelen mellom z-aksen og vektoren−−→OP , og θ er den samme

vinkelen som for sylinderkoordinatene, nemlig vinkelen mellom x-aksen ogprojeksjonen

−−→OP ′ av

−−→OP ned i xy-planet. Vinkelen φ ligger mellom 0 og π,

mens θ ligger mellom 0 og 2π.For a uttrykke x, y og z ved hjelp av ρ,φ og θ, observerer vi først at

z = ρ cos φ .

Vi ser ogsa at |−−→OP ′| = |−−→OP | sin φ = ρ sinφ. Dette betyr at

x = |−−→OP ′| cos θ = ρ cos θ sinφ

y = |−−→OP ′| sin θ = ρ sin θ sin φ

La oss se hvordan disse formlene brukes i praksis:

Eksempel 6: Vi skal skrive om

u = x2 + y2 − z2

til kulekoordinater. Vi ser at

x2 + y2 = (ρ cos θ sinφ)2 + (ρ sin θ sin φ)2 = ρ2 sin2 φ

z2 = ρ2 cos2 φ

sau = ρ2 sin2 φ− ρ2 cos2 φ = −ρ2 cos 2φ .

Dette betyr at u er uavhengig av vinkelen θ. Holder vi vinkelen φ konstant,vokser eller avtar u proporsjonalt med ρ2. Om u er positiv eller negativavhenger av størrelsen pa φ; u er positiv for φ ∈

(π4 , 3π

4

)og negativ for

φ ∈(0, π

4

)∪

(3π4 ,π

).

Advarsel: Det er litt forskjellige konvensjoner ute og gar nar det gjeldervinkelen φ i kulekoordinater. Vi har gjort det valget som er vanlig i mate-matikkbøker, nemlig at φ er vinkelen mellom z-aksen og radius vektor

−−→OP ,

mens det i enkelte andre fag er vanlig a bruke vinkelen mellom−−→OP og xy-

planet isteden. Figur 19 viser de to vinklene (vi har kalt dem φ og ϕ sombare er to forskjellige utforminger av den greske bokstaven “phi”). “Var”vinkel φ er markert av buen fra A til B, mens den “alternative” vinkelen ϕer markert av buen fra B til C. Vi ser at φ og ϕ er komplementvinkler, dvs.at φ + ϕ = π

2 . Det betyr at

sin φ = cos ϕ og cos φ = sinϕ

Page 113: Flervariabel analyse med lineær algebra

220 KAPITTEL 3. KURVER OG FLATER

Bytter du fra en konvensjon til den andre, ma du altsa bytte ut alle sinus’ermed cosinus’er og omvendt (men bare dem som gjelder φ, den andre vinkelenθ er lik i begge tilfeller!)

'''''''''(

"

))))))))*

__

__

__

__

__

!#

!

!!

!

!x

y

z

θ

ρφ

ϕr

B

A

C

P

O!

Figur 19: De to variantene av vinkelen “phi” i kulekoordinater

Du kommer til a fa bruk for sylinder- og kulekoordinater for alvor nar dukommer til integraler av funksjoner av tre variable. I et slikt integral skal duintegrere en funksjon over et omrade i rommet, og hvis funksjonen og/elleromradet er lettere a beskrive i sylinder- eller kulekoordinater, lønner det segofte a bytte til disse (omtrent som du bytter variabel i et vanlig integral).

Nivaflater og tangentplan

La oss avslutte denne seksjonen med to litt mer teoretiske temaer. Vi harallerede definert nivakurver for funksjoner av to variable og nivaflater forfunksjoner av tre variable. Den generelle definisjonen ser slik ut:

Definisjon 3.7.1 Anta at f : A → R er en funksjon av n variable, og atc ∈ R er et tall. Da kalles mengden

Nc = {x ∈ A | f(x) = c}

en nivaflate for f .

Vi vet allerede at gradienten∇f(a) peker i den retningen hvor funksjonenf vokser raskest i punktet a. Ikke overraskende star denne retningen alltidnormalt pa nivaflaten gjennom a:

Setning 3.7.2 Anta at f : A → R er en funksjon av n variable og at fer deriverbar i punktet a. Dersom f(a) = c, star gradienten ∇f(a) alltidnormalt pa nivaflaten Nc i følgende forstand: Dersom r er en deriverbarkurve som ligger pa nivaflaten (dvs. f(r(t)) = c for alle t), og r er i punkteta ved tiden t0, sa er

∇f(a) · r′(t0) = 0

dvs. tangentvektoren til kurven i punktet a star normalt pa gradienten ∇f(a)i punktet.

3.7. GRAFISK FREMSTILLING AV SKALARFELT 221

Bevis: Vi bruker kjerneregelen i versjon 3.2.1. Siden r ligger pa nivaflaten Nc

er funksjonen u(t) = f(r(t)) konstant lik c, og har derfor derivert 0. Brukervi kjerneregelen, far vi imidlertid

u′(t0) = ∇f(r(t0)) · r′(t0) = ∇f(a) · r′(t0)

Følgelig er ∇f(a) · r′(t0) = 0, og setningen er bevist. !

Det neste temaet vi skal se pa, er tangentplan. Vi begynner med enfunksjon z = f(x, y) av to variable og tenker oss at vi har et punkt b =(x0, y0, f(x0, y0)) pa funksjonsgrafen. Vi tenker oss ogsa at vi har en stor,bevegelig, plan flate som vi skrur fast til funksjonsgrafen i punktet b. Etter-hvert som skruen fastner, far flaten mindre og mindre rom til a bevege seg, ogtil slutt sitter den helt fast inntil flaten. Det planet som flaten na definerer,er tangentplanet til f i punktet b.

La oss se om vi kan finne en mer matematisk beskrivelse av tangentpla-net. For a finne ligningen til et plan (se seksjon 1.4) trenger vi to ting; etpunkt i planet og en normalvektor. Vi vet at tangentplanet vart gar gjen-nom b, sa alt vi trenger er en normalvektor. Det er flere mater a finne ennormalvektor pa, og vi skal først bruke et lite triks som bygger pa det vinettopp har lært om gradienter.

De punktene (x, y, z) som ligger pa funksjonsgrafen tilfredsstiller lignin-gen z = f(x, y) eller, om vi flytter litt rundt pa leddene,

z − f(x, y) = 0

Lar vi g(x, y, z) = z − f(x, y) være en funksjon av tre variable, ser vi atfunksjonsgrafen var rett og slett er nivaflaten N0 til funksjonen g. Sidengradienten til g star normalt pa flaten, ma den ogsa sta normalt pa tangent-planet. Alt vi behøver a gjøre for a finne en normalvektor, er derfor a regneut gradienten til g(x, y, z) = z − f(x, y) i punktet b = (x0, y0, f(x0, y0)).Generelt har vi

∂g

∂x(x, y, z) = −∂f

∂x(x, y),

∂g

∂y(x, y, z) = −∂f

∂y(x, y),

∂g

∂z(x, y, z) = 1

som gir

∇g(x, y, z) = −∂f

∂x(x, y) i− ∂f

∂y(x, y) j + k

En normalvektor i punktet b = (x0, y0, f(x0, y0)) er dermed

n = ∇g(x0, y0, f(x0, y0)) = −∂f

∂x(x0, y0) i−

∂f

∂y(x0, y0) j + k

Ligningen for planet gjennom b med normalvektor n er

0 = n · (x− b) =

Page 114: Flervariabel analyse med lineær algebra

222 KAPITTEL 3. KURVER OG FLATER

(−∂f

∂x(x0, y0) i−

∂f

∂y(x0, y0) j+k) · ((x−x0) i+ (y− y0) j+ (z− f(x0, y0))k)

som etter litt opprydning gir

z = f(x0, y0) +∂f

∂x(x0, y0)(x− x0) +

∂f

∂y(x0, y0)(y − y0)

Vi har dermed kommet frem til en fornuftig definisjon av tangentplanet:

Definisjon 3.7.3 Anta at f : A → R er en funksjon av to variable og at f erderiverbar i punktet (x0, y0). Tangentplanet til f i punktet (x0, y0, f(x0, y0))er da definert ved ligningen

z = f(x0, y0) +∂f

∂x(x0, y0)(x− x0) +

∂f

∂y(x0, y0)(y − y0)

Normalretningen i punktet er gitt ved vektoren

n = −∂f

∂x(x0, y0) i−

∂f

∂y(x0, y0) j + k

Figur 20 viser en annen mate vi kan finne frem til normalvektoren n pa.Vi tenker oss at vi starter i punktet b = (x0, y0, f(x0, y0)) pa funksjons-grafen, og at vi gar pa tangentplanet med konstant y-koordinat (“skyggen”var i xy-planet starter dermed i punktet c = (x0, y0, 0) og beveger seg pa-rallelt med x-aksen). Siden stigningstallet i x-retning er ∂f

∂x , vil vi ha steget∂f∂x (x0, y0) enheter i z-retning nar vi har gatt en enhet i x-retning. Dette giross vektoren T1 = (1, 0, ∂f

∂x (x0, y0)) (se figur 20). Beveger vi oss pa tilsvaren-de mate i y-retning, far vi vektoren T2 = (0, 1, ∂f

∂y (x0, y0)) pa figur 19. BadeT1 og T2 er tangentvektorer til flaten, og vektorproduktet deres ma derforvære en normalvektor. Regner du ut dette produktet, ser du at

n = T1 ×T2

der n er som ovenfor.

"

''''''''''(

))))))* !

!

! !

)))*++,

MM

MM

M

MM

MMMN

x

y

z

n

b

c '''``

T1

T2

Figur 20: Normalvektoren n og tangentvektorene T1 og T2

3.7. GRAFISK FREMSTILLING AV SKALARFELT 223

Det er pa tide med et eksempel.

Eksempel 7. Vi skal finne en normalvektor for funksjonen f(x, y) = x3y2 ipunktet (2,−1). Vi skal dessuten finne ligningen til tangentplanet i punktet.

Først trenger vi de partiellderiverte:

∂f

∂x(x, y) = 3x2y2 =⇒ ∂f

∂x(2,−1) = 12

∂f

∂y(x, y) = 2x3y =⇒ ∂f

∂y(2,−1) = −16

Setter vi inn i formelen for normalvektor i definisjon 3.7.3, far vi

n = −∂f

∂x(x0, y0) i−

∂f

∂y(x0, y0) j + k = −12 i + 16 j + k

For a finne ligningen for tangentplanet, kan vi f.eks. bruke den øverste lig-ningen i definisjon 3.7.3.

z = 8 + 12(x− 2)− 16(y + 1)

(der vi ogsa har brukt at f(2,−1) = 8). Denne formelen kan ogsa skrives

12x− 16y − z = 32

La oss gjøre en observasjon til. Innfører vi notasjonen a = (x0, y0), r =(x, y), kan ligningen for tangenplanet skrives

z = f(x0, y0) +∂f

∂x(x− x0) +

∂f

∂y(y − y0) = f(a) +∇f(a) · (r− a)

Dette minner om formelen for lineariseringen til f (se definisjon 2.9.4). For etskalarfelt er Jacobi-matrisen det samme som gradienten, og lineariseringener dermed gitt ved

Ta(r) = f(a) +∇f(a) · (r− a)

Altsa er tangentplanet i a rett og slett grafen til lineariseringen i a. Dette erikke sa rart — lineariseringen er den affinavbildningen som tilnærmer f besti nærheten av a, og tangentplanet er det planet som tilnærmer grafen til fbest i nærheten av a. Det er ikke vanskelig a vise at en funksjon f : R2 → Rer en affinavbildning hvis og bare hvis grafen er et plan, og dermed er ringensluttet.

Definisjon 3.7.3 har en generalisering til høyere dimensjoner som vi tarmed for ordens skyld.

Page 115: Flervariabel analyse med lineær algebra

224 KAPITTEL 3. KURVER OG FLATER

Definisjon 3.7.4 Anta at f : A → R er en funksjon av n variable og atf er deriverbar i punktet a. Normalretningen til funkjonsgrafen i punktet(a, f(a)) er gitt ved vektoren

n =(− ∂f

∂x1(a),− ∂f

∂x2(a), . . . ,− ∂f

∂xn(a), 1

)

Tangentplanet til f i punktet (a, f(a)) bestar av de punktene (x, z) ∈ Rn+1

som tilfredsstiller ligningen:

z = f(a) +∇f(a) · (x− a)

MATLAB-kommentarer

MATLAB er et utmerket hjelpemiddel for a fremstille grafer til funksjonerz = f(x, y). For a tegne en slik graf med MATLAB ma du først definere etrutenett (et “grid”) i xy-planet. Deretter ma du fa MATLAB til a regne utfunksjonsverdiene i alle hjørnene i rutenettet, og til slutt ma du fa MAT-LAB til a tegne resultatet (MATLAB vil da plotte alle punkter av typen(x, y, f(x, y)) der (x, y) er et hjørne i rutenettet, og sa forbinde alle nabo-punkter med rette streker).

Eksempel 8: Vi skal tegne grafen til f(x, y) = x3 − 4y2 over rektangeletx ∈ [−3, 3], y ∈ [−5, 5].

Vi lager først en oppdeling av de to intervallene vi er interessert i, ved askrive

>> r=-3:0.1:3;

>> s=-5:0.1:5;

(husk semikolon etter kommandoene, ellers vil du fa lange tallremser somoutput!) Her har vi valgt a dele opp begge intervallene i skritt med lengde0.1, men du kan godt velge en finere eller grovere oppdeling. Det kan værelurt a prøve en skikkelig grov oppdeling (f.eks. skrittlengde 0.5) en gang slikat du virkelig ser hvordan MATLAB tegner grafer.

Neste skritt er a lage et rutenett av oppdelingene vare. Dette gjør vi medkommandoen

>> [x,y]=meshgrid(r,s);

Vi kan na definere funksjonen:

>> z=x.^3-4*y.^2;

3.7. GRAFISK FREMSTILLING AV SKALARFELT 225

(husk a bruke .-versjonene av de algebraiske operasjonene!) Dermed er viklare til selve plottingen som utføres av kommandoen

>> mesh(x,y,z)

Grafen kommer opp i et eget vindu pa vanlig mate. Husk at du kan dreiepa grafen ved først a klikke pa ikonet som symboliserer dreining, og sa dragrafen rundt med musa. Bruker du kommandoen surf(x,y,z) istedenformesh(x,y,z), vil MATLAB tegne grafen med fargelegging av hvert ruteele-ment. Det er ofte klargjørende nar grafen varierer mye.

Vil du se nivakurvene istedenfor grafen, bytter du ut den siste komman-doen ovenfor med

>> contour(x,y,z)

Nar du bruker contour pa denne maten, velger MATLAB selv hvilke niva-kurver den skal tegne. Siden MATLAB ikke er veldig dyktig til a finnede mest interessante nivakurvene, hender det at du ma hjelpe til. Dersomvektoren v = (v1, v2, . . . , vn) er lagt inn, vil kommandoen

>> contour(x,y,z,v)

tvinge MATLAB til a tegne nivakurvene med verdier v1, v2, . . . , vn. Vil dubare regulere antall nivakurver, men ikke spesifisere verdiene, kan du brukedenne kommandoen

>> contour(x,y,z,n)

som far MATLAB til a tegne opp n nivakurver. Med kommandoen clabelfar du MATLAB til a skrive nivaet til nivakurvene pa grafen. Prøv

>> clabel(contour(x,y,z,12))

MATLAB vil normalt tegne nivakurvene i forskjellige farger. Dette er nyttigpa skjermen, men kan være mindre praktisk dersom du ønsker a lime figureninn i et svart-hvitt dokument. Skriver du

>> contour(x,y,z,8,’k’)

far du 8 nivakurver tegnet i svart (’k’ er symbolet for svart farge). Ønskerdu at MATLAB skal tegne nivakurvene og grafen i samme plot, bruker dukommandoen

>> meshc(x,y,z)

Det finnes mange andre kommandoer du ogsa kan bruke (og mange fleremater a modifisere kommandoene ovenfor pa!). Skriv

>> help graph3d

for a fa en oversikt.

Page 116: Flervariabel analyse med lineær algebra

226 KAPITTEL 3. KURVER OG FLATER

Oppgaver til seksjon 3.7

1. Finn nivakurvene til funksjonen. Tegn nok av dem til at du kan danne deg etbilde av funksjonsgrafen

a) f(x, y) = 4x2 + 3y2 d) f(x, y) = ex2−y

b) f(x, y) = 1x2−y2 e) f(x, y) = x

x2+y2

c) f(x, y) = ex2−y2

2. Skisser grafen til funksjonen og sammenlign resultatet med det du far nar dubruker MATLAB.

a) f(x, y) = 2x2 + y2 d) f(x, y) = x2 − 4y2

b) f(x, y) = y2 − x e) f(x, y) = ln(xy)c) f(x, y) = sin(x2 + y2)

3. Skriv om funksjonen til polarkoordinater. Skisser grafen og sammenlign resultatetmed det du far nar du bruker MATLAB.

a) f(x, y) = 1√x2+y2

d) f(x, y) = x2 − 4y2

b) f(x, y) = xx2+y2 e) f(x, y) = exy

c) f(x, y) = yx

4. Skriv om funksjonen til bade sylinder- og kulekoordinater. Avgjør hva du syneser mest informativt i hvert enkelt tilfelle.

a) f(x, y, z) = (x2 + y2)e−z2d) f(x, y, z) = x2−y2

zb) f(x, y, z) = 1

x2+y2+z2 e) f(x, y, z) = z · arctan( yx )

c) f(x, y, z) = x2+y2

z2 f) f(x, y, z) = x2 + y2 − 2z2

5. Finn en ligning for tangentplanet til funksjonen i det angitte punktet.

a) f(x, y) = x2y i punktet (1,−2)

b) f(x, y) = xe−xy i punktet (1, 0)

c) f(x, y) = x2y − xy2 i punktet (2,−2)

6. I eksempel 3 i seksjon 2.2 studerte vi funksjonen

f(x, y) =

{x2y

x4+y2 for (x, y) #= (0, 0)0 nar (x, y) = 0

som et eksempel pa en funksjon som “oppfører seg kontinuerlig” nar vi nærmer ossorigo langs rette linjer, men ikke nar vi følger parabelen y = x2. Bruk MATLABtil a tegne grafen til funksjonen, og studer fenomenet ved a dreie pa grafen. Tegnogsa inn kurven r(t) = t i + t2 j + 1

2 k i samme figur. Tegn til slutt konturkurvenetil funksjonen.

7. I oppgave 2.5.4 studerte vi funksjonen

f(x, y) =

{x3y−xy3

(x2+y2)2 for (x, y) #= (0, 0)0 nar (x, y) = 0

som et eksempel pa en funksjon der de blandede annenordens partiellderiverte erforskjellige. Bruk MATLAB til a tegne grafen og konturkurvene til funksjonen, ogprøv a forsta fra figuren hvorfor ∂2f

∂y∂x (0, 0) er negativ mens ∂2f∂x∂y (0, 0) er positiv.

3.8. GRAFISK FREMSTILLING AV VEKTORFELT 227

3.8 Grafisk fremstilling av vektorfelt

I denne seksjonen skal vi se pa grafisk fremstilling av vektorfelt i to og tredimensjoner, altsa av funksjoner F : R2 → R2 og F : R3 → R3. Det er lettesta forsta disse fremstillingene hvis man tenker litt praktisk. Dersom F(x, y)angir vindretningen i punktet (x, y), er det naturlig a illustrere dette somvist pa figur 1; vi plasserer rett og slett vektoren F(x, y) med startpunkt(x, y).

!

"

!33334

(x, y)

F(x, y)

y

x

Figur 1: Vektorfeltet F(x, y)

Gjør vi det samme i mange punkter, far vi en oversikt over hvordanvindfeltet er (se figur 2).

!

"

3333433334

3333433334

33334++

++,

++

++,

++

++,

++

++,

++

++,

[[[[\[[[[\

[[[[\[[[[\

[[[[\

y

x

Figur 2: Vektorfeltet F(x, y)

Det gar an a lage slike fremstillinger for hand, men det er tidkrevende oggir ikke noen spesiell innsikt i hvordan vektorfeltet oppfører seg. MATLABhar en praktisk kommando som heter quiver for a lage slike diagrammer.Vi skal se litt pa hvordan denne kommandoen fungerer. Dersom du har lagtinn to m× n matriser u og v, vil kommandoen

>> quiver(u,v)

fa MATLAB til a produsere et bilde der det ut fra hvert punkt med heltalligekoordinater (i, j) (der 1 ≤ i ≤ m og 1 ≤ j ≤ n) gar en vektor som erproporsjonal med (uij , vij). Vektoren er proporsjonal med (uij , vij) (og ikkelik (uij , vij) som man kanskje skulle tro) siden MATLAB automatisk skalerervektorene slik at de ikke overlapper. Alle vektorene skaleres likt slik at detinnbyrdes størrelsesforholdet er korrekt. MATLAB lager altsa et rutenett

Page 117: Flervariabel analyse med lineær algebra

228 KAPITTEL 3. KURVER OG FLATER

med m × n ruter, der hver rute har sidekant 1, og der det fra hvert hjørnegar en vektor spesifisert av de korresponderende elementene i u og v.

Ofte ønsker vi selv a spesifisere hvilket rutenett vektorene vare skal startei (og ikke bruke “standardnettet” ovenfor). Dersom x og y er vektorer medhhv. m og n komponenter, kan vi bruke kommandoen

>> quiver(x,y,u,v)

Dette far MATLAB til a lage en figur der det ut fra hvert punkt av typen(xi, yj) gar en vektor parallell med (uij , vij) (se figur 3).

.Figur 3: Vektorfelt fremstilt med quiver.

Eksempel 1: Vi skal lage en fremstilling av vektorfeltet

F(x, y) = xy i + x sin(xy) j

over mengden −5 ≤ x ≤ 5, −3 ≤ y ≤ 3.Vi starter med a lage rutenettet. Vi bør ikke lage oppdelingen for fin,

for da blir det vanskelig a se vektorene. Vi velger en rutelengde pa 0.5:

>> x=-5:0.5:5;>> y=-3:0.5:3;

Vi lager sa et rutenett av x og y.

>> [x,y]=meshgrid(x,y);

Na kan vi legge inn vektorfeltet:

3.8. GRAFISK FREMSTILLING AV VEKTORFELT 229

>> u=x.*y;>> v=x.*sin(x.*y);

Dermed er vi klare til a lage figuren

>> quiver(x,y,u,v)

MATLAB svarer med figur 3 (se ovenfor). ♣

Vi kan fremstille vektorfelt F : R3 → R3 pa samme mate, men resultateneer ofte vanskeligere a tolke fordi det ikke er sa lett a fa romfølelse i bildet.MATLAB har en kommando quiver3 som fungerer pa samme mate somquiver, men som tar tre variable der quiver tar to.

La oss se pa en kommando til. Vi tenker oss at vektorfeltet F angir has-tigheten til noe som strømmer, f.eks. at F(x, y) angir strømningshastighetentil havet i punktet (x, y). Anta at en partikkel som flyter med strømmen eri punktet r(t) = (x(t), y(t)) ved tiden t; da er v(t) = r′(t) = F(x(t), y(t)).Dette betyr at banen som partikkelen følger, hele tiden har vektorfeltet somtangent. Vi kaller slike baner for strømningslinjer.

Eksempel 2: La oss bruke MATLAB til a finne en strømningslinje forvektorfeltet i eksempel 1. Vi ma først legge inn x, y, u og v pa samme matesom ovenfor. I dette tilfellet kan det imidlertid være lurt a bruke et rutenettsom er mindre grovt, sa vi starter med sekvensen

>> x=-5:0.05:5;>> y=-3:0.05:3;>> [x,y]=meshgrid(x,y);>> u=x.*y;>> v=x.*sin(x.*y);

For a lage strømningslinjen som starter i punktet (1,−1) skriver vi na

>> streamline(x,y,u,v,1,-1)

Hvis du taster inn den siste kommandoen pa nytt med et annet startpunkt,f.eks.

>> streamline(x,y,u,v,0.5,1)

tegner MATLAB en ny strømningslinje i det samme figurvinduet. Det erogsa instruktivt a tegne inn vektorfeltet og strømningslinjene i samme figur(prøv!). ♣

De grafiske fremstillingene vi hittil har sett pa, er naturlige i situasjonerder man tenker pa F(x, y) som en vektor som starter i punktet (x, y). I andre

Page 118: Flervariabel analyse med lineær algebra

230 KAPITTEL 3. KURVER OG FLATER

situasjoner er det mer naturlig a tenke pa F som en avbildning som senderpunkter (x, y) i R2 til nye punkter (u, v) i R2 (se figur 4).

!

"

!(x, y)

!

"

!a (u, v) = F(x, y)

y

x

v

u

F

Figur 4: F avbilder (x, y) pa (u, v).

For a fa et godt bilde av funksjonen, ma vi se hvordan den virker pa flerepunkter. I figur 5 har vi tegnet opp hvordan F virker pa punktene i etrutenett.

!

"

!

"

a

y

x

v

u

!!F

Figur 5: Bildet av et rutenett under F.

Figur 5 ovenfor minner om figur 1 i seksjon 2.9. Det er samme situasjonsom er avbildet, den eneste forskjellen er at i seksjon 2.9 er F en affinav-bildning, mens den her er en generell avbildning. Affinavbildninger avbilderparallelle linjer pa parallelle linjer, og bildet av rutnettet bestar av parallel-logrammer av samme størrelse. I det generelle tilfellet avbildes rette linjerpa krumme kurver, og bildene av kvadratene har varierende størrelse.

I figur 6 har vi tegnet opp hvordan F virker pa et lite kvadrat med side-kant h. Vi ønker a estimere hvor stort bildet av kvadratet er sammenlignetmed kvadratet. Arealet av kvadratet er apenbart h2. Arealet av bildet ertilnærmet lik parallellogrammet utspent av vektorene F(a + he1)−F(a) ogF(a + he2)− F(a). Siden h er liten, er disse størrelsene tilnærmet lik

3.8. GRAFISK FREMSTILLING AV VEKTORFELT 231

!

"

! !! !!

a a + he1

a + he2

!!

!!

!

"

!aF(a)

F(a + he1)

F(a + he2)

y

x

v

u

F

Figur 6: Avbildning av et kvadrat

henholdsvis ∂F∂x (a)h og ∂F

∂y (a)h. Arealet utspent av disse størrelsene er

|

∣∣∣∣∣∣∣

∂F1∂x (a) ∂F1

∂y (a)

∂F2∂x (a) ∂F2

∂y (a)

∣∣∣∣∣∣∣|h2 = |det(F′(a))|h2

Dette viser at (tallverdien til) determinanten til Jacobi-matrisen F′(a) er etgodt mal pa hvor mye F forstørrer arealer. Legg merke til at denne størrelsennormalt avhenger av a, og derfor varierer fra sted til sted.

Som vi observerte i seksjon 2.9, kan vi ogsa finne frem til dette pa en littannen mate. I nærheten av a er lineariseringen TaF en svært god tilnærmingtil F. Dette er en affinavbildning med matrise

F′(a) =

∂F1∂x (a) ∂F1

∂y (a)

∂F2∂x (a) ∂F2

∂y (a)

og har derfor forstørrelsesfaktor |det(F′(a))|.Determinanten til Jacobi-matrisen kalles Jacobi-determinanten og spiller

en viktig rolle nar vi skal skifte variabel i integraler av flere variable. Detskyldes nettopp at den er et mal pa den lokale forstørrelsesfaktoren til enavbildning.

Oppgaver til seksjon 3.8

1. Bruk kommandoen quiver til a tegne vektorfeltet. Tegn ogsa inn noen strømningslinjer.

a) F(x, y) = cos x i + sinx j

b) F(x, y) = − x

(x2+y2)32

i− y

(x2+y2)32

j

c) F(x, y) =(

1−x(x−1)2+y2 + 1+x

(x+1)2+y2

)i +

(−y

(x−1)2+y2 + y(x+1)2+y2

)j

2. I denne oppgaven skal vi se nærmere pa vektorfeltet

F(x, y) = − y

x2 + y2i +

x

x2 + y2j

i eksempel 3 i seksjon 3.5

Page 119: Flervariabel analyse med lineær algebra

232 KAPITTEL 3. KURVER OG FLATER

a) Bruk kommandoen quiver til a tegne vektorfeltet. Bruk en forholdsvis grovoppdeling pa aksene.

b) Forklar at strømningslinjene til F er sirkler med sentrum i origo.

c) Tegn strømningslinjen som starter i punktet (1, 0) pa samme figur som vek-torfeltet i a). Sammenlign resultatet med b).

d) Gjenta punkt a) og c) med mye finere oppdeling av aksene. Hva skjer medstrømningslinjene?

3. I denne oppgaven skal vi bruke MATLAB til a eksperimentere litt med avbild-ninger slik som demonstrert i figur 5. Vi har altsa en funksjon (u, v) = F(x, y)og vil se hvordan den avbilder et rutenett i xy-planet. For a slippe a lage et foromfattende MATLAB-program, skal vi nøye oss med en tilnærming der MATLABtegner opp hjørnene i det fordreide rutenettet og forbinder dem med rette streker(som i de fleste eksemplene burde vært buede kurver). Her er programmet i dettilfellet u = 3x− y og v = x + 2y:

>> r=-2:0.25:2; %lager oppdeling av x-aksen>> s=-2:0.25:2; %lager oppdeling av y-aksen>> [x,y]=meshgrid(r,s); %lager rutenett av opppdelingene>> u=3.*x-y; %regner ut u av alle hjørnene i rutenettet>> v=x+2.*y; %regner ut v av alle hjørnene i rutenettet>> plot(u,v,u’,v’) %tegner opp bildet av alle hjørnene i%rutenettet og forbinder dem med rette streker%Den første delen av kommandoen (dvs. plot(u,v))%tegner opp strekene mellom "loddrette naboer", mens den%andre delen (dvs. plot(u’,v’)) tegner opp strekene mellom%"vannrette naboer".

a) Kjør programmet ovenfor med de angitte funksjonene u = 3x − y og v =

x + 2y. Beskriv rutenettet du ser (avbildningen F(x, y) =(

3x− yx + 2y

)er

lineær).

b) Kjør programmet pa nytt, men la u = x cos y, v = x sin y, og bruk en opp-deling slik at 0 ≤ x ≤ 5, 0 ≤ y ≤ 2π. Beskriv rutenettet, og forklar sammen-hengen med polarkoordinater.

c) Kjør programmet igjen med u =√

xy og v = √

xy. Velg en oppdeling slik atx ≥ 0 og y ≥ 0. Beskriv rutenettet.

3.9 Parametriserte flater

De flatene vi hittil har studert, har enten vært gitt ved funksjonsgraferz = f(x, y) eller ved ligninger g(x, y, z) = 0. Vi skal na se pa en mer generellmate a fremstille flater pa. Den minner om parameterfremstilling av kurverog kalles da ogsa parameterfremstilling av flater. En slik fremstilling er rett

3.9. PARAMETRISERTE FLATER 233

og slett gitt ved et omrade A i R2 og en kontinuerlig funksjon r : A → R3.Det er ofte praktisk a skrive funksjonen pa denne maten

r(u, v) = X(u, v) i + Y (u, v) j + Z(u, v)k, der (u, v) ∈ A

Figur 1 viser hvordan en slik funksjon avbilder omradet A opp pa en flate.Vi kaller r en parametrisering av flaten.

"

u

v

!

(u, v)!A

"

''''''''''(

))))))*

!

x

y

z

r(u, v) = X(u, v) i + Y (u, v) j + Z(u, v)k(

Figur 1: Parametrisert flate

Akkurat som samme kurve kan parametriseres pa mange mater, kan ogsaen flate parametriseres pa forskjellig vis. Vær ogsa oppmerksom pa at ikkealle funksjoner r av typen ovenfor gir opphav til en flate, det kan f.eks. hendeat vi bare far et punkt eller en kurve. Dette avhenger bade av omradet Aog av funksjonene X, Y, Z, men er ikke noe du behøver a bekymre deg omfor øyeblikket.

Det enkleste tilfellet er der omradet A ligger i (x, y)-planet og løftes opppa flaten av en funksjon z = f(x, y) (se figur 2). I sa fall er parametriseringenr gitt ved

r(x, y) = x i + y j + f(x, y)k

"

''''''''''(

))))))* !"

(x, y)

!r(x, y) = x i + y j + f(x, y)k

''''''))))

+++

x

y

z

A

Figur 2: Parametrisering av typen r(x, y) = x i + y j + f(x, y)k

Page 120: Flervariabel analyse med lineær algebra

234 KAPITTEL 3. KURVER OG FLATER

Parametriseringer av denne typen er enkle a forsta, men de er ikke alltidde beste a arbeide med. Den øvre delen av en kuleflate vil f.eks. fa paramet-riseringen

r(x, y) = x i + y j +√

R2 − x2 − y2 k

der x2+y2 ≤ R2. Dette uttrykket er tungt a arbeide med pga. kvadratroten,og det har ogsa den ulempen at det bare beskriver halve kuleflaten — ønskervi ogsa a fa med den nedre halvkulen, ma vi bruke en parametrisering til:

s(x, y) = x i + y j−√

R2 − x2 − y2 k

For de fleste formal er det bedre a beskrive kuleflaten ved hjelp av en annenparametrisering. Tar vi utgangspunkt i kulekoordinatene ρ,φ, θ, ser vi atalle punktene pa kulen fremkommer om vi setter ρ = R og lar φ og θ løpeover intervallene [0,π] og [0, 2π). For polarkoordinater har vi den generellesammenhengen x = ρ sinφ cos θ, y = ρ sinφ sin θ, z = ρ cos φ (se seksjon 3.9).Det betyr at punktene pa kuleflaten kan fremstilles ved

r(φ, θ) = R sinφ cos θ i + R sinφ sin θ j + R cos φk,

der 0 ≤ φ ≤ π, 0 ≤ θ < 2π. Dette gir oss en parametrisering av hele kule-flaten pa en gang, og det uten at vi ma ty til ubehagelige kvadratrøtter.Legg forøvrig merke til at “nordpolen” og “sydpolen” pa kulen blir repre-sentert flere ganger; ethvert punkt av typen (0, θ) havner pa nordpolen (iden forstand at r(0, θ) = (0, 0, R)), og hvert punkt av typen (π, θ) havnerpa tilsvarende vis pa sydpolen. Slike “multiple representasjoner” er umuliga unnga, men de skaper innimellom litt problemer for teorien.

La oss se pa en enkel parametrisering til. Vi ønsker a parametriserekjegleflaten z =

√x2 + y2 (lag en figur). Det kan vi gjøre rett og slett ved

r(x, y) = x i + y j +√

x2 + y2 k

men dette gir oss en kvadratrot som er ubehagelig i noen sammenhenger.Det kan derfor være lurere a bruke sylinderkoordinater siden vi da far z =√

x2 + y2 = r. Dette gir parametriseringen

r(r, θ) = r cos θ i + r sin θ j + r k

der 0 ≤ θ < 2π, r ≥ 0.La oss forsøke oss pa en litt vanskeligere parametrisering. Vi skal para-

metrisere en torus (dvs. overflaten til en smultring). Figur 3 viser en torusfremstilt ved hjelp av MATLAB.

3.9. PARAMETRISERTE FLATER 235

Figur 3: En torus

Vi tenker oss at flaten fremkommer nar vi roterer sirkelen pa figur 4 engang rundt z-aksen. Legg merke til at sirkelen vi dreier rundt har radius rog at sentrum S i denne sirkelen ligger en avstand R fra origo. Pa sirkelenhar vi merket av et punkt A slik at vinkelen mellom

−→SA og x-aksen er u.

"

x

z

!

02/1

!UUXUUb!#

!ArR

S

u

Figur 4: Torus som omdreiningslegeme om z-aksen

Et typisk punkt A′ pa flaten fremkommer altsa nar vi dreier et punktsom A pa figuren en vinkel v om z-aksen.

"

!????G

02/1

! !AUU[[[[[[[[[[[[!111

!A′R

r u

v x

z

y

Figur 5: Punktet A roteres til A′

Punktet A′ pa flaten kan dermed beskrives av to vinkler; vinkelen usom forteller oss hvor pa den opprinnelige sirkelen A ligger, og vinkelen v

Page 121: Flervariabel analyse med lineær algebra

236 KAPITTEL 3. KURVER OG FLATER

som forteller oss hvor mye vi dreier (se figur 5). Litt trigonometri viser atkoordinatene til det dreide punktet A′ er

x = (R + r cos u) cos v, y = (R + r cos u) sin v, z = r sinu

Dermed far vi parametriseringen

r(u, v) = (R + r cos u) cos v i + (R + r cos u) sin v j + r sinuk ,

der u, v ∈ [0, 2π).Tidligere i dette kapitlet har vi sett hvordan vi kan integrere funksjoner

langs en parametrisert kurve, og det er naturlig a spørre om vi kan integrerefunksjoner over en parametrisert flate pa tilsvarende mate. Det kan vi, menfør vi ser pa denne teorien, ma vi lære litt om dobbeltintegraler. Det ertemaet for kapittel 6.

Parametriserte flater i MATLAB

Det er lett a bruke MATLAB til a tegne parametriserte flater. Fremgangs-maten er en variant av den vi bruker nar vi tegner grafen til en funksjon avto variable, og burde fremga av følgende eksempel.

Eksempel 1: Vi skal bruke MATLAB til a tegne den parametriserte flaten

r(u, v) = (u + v) i + (u− v) j + uv k, der − 5 ≤ u, v ≤ 5

Vi taster da:

>> u=-5:.1:5;>> v=-5:.1:5;>> [U,V]=meshgrid(u,v);>> x=U+V;>> y=U-V;>> z=U.*V;>> surf(x,y,z)

og MATLAB tegner flaten. ♣

I det neste eksemplet lar vi MATLAB tegne en kuleflate med radius 3og sentrum i origo.

Eksempel 2: For a slippe for lange variabelnavn, bruker vi u for den va-riabelen som i kulekoordinater vanligvis heter φ og v for den som vanligvisheter θ. Kommandoen linspace(a,b,n) gir oss en vektor med n kompo-nenter som begynner med a og ender med b.

3.9. PARAMETRISERTE FLATER 237

>> u=linspace(0,pi,100);>> v=linspace(0,2*pi,200);>> [U,V]=meshgrid(u,v);>> x=3*sin(U).*cos(V);>> y=3*sin(U).*sin(V);>> z=3*cos(U);>> surf(x,y,z)>> axis(’equal’)

Husk kommandoen >> axis(’equal’) som gir samme malestokk langs alleakser — uten den ser kulen ut som en ellipsoide. ♣

Oppgaver til seksjon 3.9

1. Finn to parametriseringer av paraboloiden z = x2 + y2, en ved hjelp av vanligekoordinater (x, y) og en ved hjelp av polarkoordinater (r, θ).

2. Finn en parametrisering av den delen av kuleflaten x2 + y2 + z2 = 4 som liggeri første oktant (dvs. i omradet der x ≥ 0, y ≥ 0, z ≥ 0).

3. Finn en parametrisering av den delen av sylinderflaten x2 + y2 = 1 som liggermellom z = 0 og z = 1.

4. Finn en parametrisering av sylinderen y2 + z2 = 9.

5. Finn en parametrisering av kjegleflaten x =√

y2 + z2.

6. Finn en parametrisering av ellipsoiden

x2

a2+

y2

b2+

z2

c2= 1

7. En flate er parametrisert ved

r(u, v) = u i + 2 cos v j + 2 sin v k, der 0 ≤ u ≤ 2, 0 ≤ v < 2π

Beskriv flaten med ord.

8. Finn en parametrisering av den delen av kuleflaten x2 + y2 + z2 = 4 som liggerover xy-planet og inni kjeglen z2 = 3(x2 + y2).

9. Bruk MATLAB til a lage en tegning av den delen av kulen x2 + y2 + z2 = 4 somligger i første oktant (dvs. omradet der x, y, z ≥ 0.

10. Bruk MATLAB til a lage en tegning av flaten i oppgave 7.

11. Bruk MATLAB til a lage en tegning av flaten parametrisert ved

r(u, v) = uv2 i + u j + sin(uv)k, der − 1 ≤ u ≤ 1, 0 ≤ v ≤ 3

Page 122: Flervariabel analyse med lineær algebra

238 KAPITTEL 3. KURVER OG FLATER

12. Bruk MATLAB til a lage en tegning av sylinderen x2 + y2 = 9, nar 0 ≤ z ≤ 2.

12. Bruk MATLAB til a lage en tegning av ellipsoiden i oppgave 6. Bruk sammemalestokk pa alle akser.

13. Bruk MATLAB til a lage en tegning av en torus der r = 3 og R = 5.Kapittel 4

Lineær algebra i Rn

I dette kapitlet skal vi se næmere pa en del spørsmal om vektorer og matrisersom vi sa vidt har vært borti tidligere, men som vi hittil ikke har gitt noenskikkelig svar pa — spørsmal som: nar er en matrise inverterbar og hvordanregner vi ut den inverse matrisen, hva er determinanter og hvordan regnervi dem ut pa en effektiv mate, hvordan finner vi egenverdier og egenvektorerog hva kan de brukes til? Disse spørsmalene er viktige dels fordi mangepraktiske problemer kan formuleres ved hjelp av vektorer og matriser, ogdels fordi mange problemer i andre deler av matematikken kan løses vedhjelp av matrisemetoder. Vi skal se eksempler pa begge disse fenomenene idette og de neste kapitlene.

Den videregaede teorien for vektorer og matriser (og deres generaliserin-ger) kalles lineær algebra og blir etter hvert ganske abstrakt, men den har etytterst konkret utgangspunkt, nemlig de lineære ligningssystemene du lærtea løse pa ungdomsskolen, slike som

2x− y = 3

x + 3y = 4

Senere har du truffet slike ligningssystemer i mange sammenhenger, ofte medflere ligninger og flere ukjente. Et typisk eksempel er delbrøkoppspalting dervi bruker lineære ligningssystemer til a finne konstantene i oppspaltingen.

Det viser seg at nøkkelen til alle de spørsmalene vi startet med, ligger iet nærmere studium av slike lineære ligningssystemer (dvs. ligningssystemerder de ukjente bare opptrer i første potens og ikke inni mer kompliserte funk-sjoner). Kanskje kan et slikt studium virke unødvendig siden vi vet hvordanvi skal løse disse ligningssystemene i praksis, men det viser seg at det er myea tjene pa a ga systematisk til verks og studere litt mer teoretiske spørsmalsom: nar har et lineært ligningssystem løsninger, og hvor mange løsningerhar det i sa fall? Etter hvert som kapitlet skrider frem, vil du se hvordankunnskap om lineære ligningssystemer kaster lys over spørsmalene vi star-tet med. Du vil ogsa se hvordan systematiske løsningsmetoder for lineære

239

Page 123: Flervariabel analyse med lineær algebra

240 KAPITTEL 4. LINEÆR ALGEBRA I RN

ligninger kan brukes til a utvikle raske metoder for a invertere matriser ogregne ut determinater.

Som allerede antydet er lineær algebra en av de delene av matematikkensom har størst umiddelbar nytte — det viser seg at svært mange sentraleproblemstillinger i matematikk, fysikk, informatikk, statistikk, økonomi ogandre fag kan formuleres (i hvert fall tilnærmet) ved hjelp av lineære lig-ningssystemer og løses ved hjelp av lineær algebra. Disse ligningssystemenebestar ofte av mange tusen ligninger og ukjente, og de kan bare løses vedhjelp av datamaskiner. Nar man skal programmere en datamaskin til a løseslike problemer, kan man ikke stole pa snarveier og smarte triks — man maha systematiske metoder som alltid fungerer. Vi skal begynne med a se paen metode som kalles Gauss-eliminasjon eller Gauss-Jordan-eliminasjon.

4.1 Noen eksempler pa Gauss-eliminasjon

La oss introdusere metoden gjennom et enkelt eksempel. Vi skal løse lig-ningssystemet

2y + z = −1

3x + 5y + z = 2 (4.1.1)

x + 2y + z = 1

ved a omforme det til stadig enklere ligningssystemer som har nøyaktig desamme løsningene (som vi skal se senere, kan et lineært ligningssystem haen, ingen eller uendelig mange løsninger). Til slutt sitter vi igjen med etligningssystem som er sa enkelt at vi kan løse det med hoderegning. Ideenbak metoden er a eliminere (fjerne) ukjente fra sa mange ligninger som mulig— først eliminerer vi den første variablen x fra alle ligninger unntatt denøverste, deretter eliminerer vi den andre variablen y fra alle ligninger unntattde to øverste osv. Det ligningssystemet vi sitter igjen med til slutt, kan løsesnedenfra — først finner vi verdien til den siste variablen fra den nedersteligningen, deretter bruker vi denne verdien til a finne verdien til variablenforan osv. Dette kan høres komplisert ut, men nar vi bruker metoden paligningssystemet ovenfor, vil du fort se hvordan den virker.

Siden vi skal eliminere x fra alle ligningene unntatt den øverste, passerdet darlig at den øverste ligningen mangler x-ledd. Vi begynner derfor meda bytte om den første og siste ligningen:

x + 2y + z = 1

3x + 5y + z = 2 (4.1.2)

2y + z = −1

4.1. NOEN EKSEMPLER PA GAUSS-ELIMINASJON 241

Det nye ligningssystemet har selvfølgelig akkurat de samme løsningene somdet gamle; rekkefølgen av ligningene spiller ingen rolle. Neste skritt i meto-den er a bruke x-leddet i den øverste ligningen til a eliminere x-leddet i deandre. Ganger vi den første ligningen med -3, far vi −3x − 6y − 3z = −3,og legger vi denne ligningen til ligning nummer to i (4.1.2), far vi detteligningssystemet:

x + 2y + z = 1

− y − 2z = −1 (4.1.3)

2y + z = −1

Dette ligningssystemet ma ha nøyaktig de samme løsningene som det fore-gaende (vær sikker pa at du skjønner hvorfor!). Normalt ville vi na fortsettemed a eliminere x-en i den nederste linjen, men siden den allerede er borte,kan vi konsentrere oss om y-ene isteden. Vi skal bruke y-leddet i den nestøverste ligningen til a eliminere y-leddet i den nederste ligningen. Multipli-serer vi den nest øverste ligningen med 2, far vi −2y − 4z = −2, og leggervi dette til den nederste ligningen, far vi

x + 2y + z = 1

− y − 2z = −1 (4.1.4)

− 3z = −3

Igjen ser vi at dette ligningssystemet har akkurat de samme løsningene somdet foregaende. Na er vi nesten ferdige, men vi kan forenkle ligningene yt-terligere ved a gange den midterste med -1 og den nederste med −1

3 :

x + 2y + z = 1

y + 2z = 1 (4.1.5)

z = 1

Dette ligningssystemet er enkelt a løse; fra den nederste ligningen ser vi atz = 1, setter vi dette inn i den midterste, far vi at y = −1, og setter vidisse verdiene for y og z inn i den øverste ligningen, ser vi at x = 2. Sidenalle ligningssystemene vare har de samme løsningene, betyr dette at x = 2,y = −1, z = 1 ogsa er (den eneste) løsningen til det opprinnelige lignings-systemet (4.1.1).

Bemerkning: Det finnes raskere mater a løse ligningssystemet (4.1.1) pa.Sammenligner vi den første og den siste ligningen, ser vi med en gang atx = 2, og deretter er det ikke vanskelig a finne y og z. Slike snarveier erviktige nar vi løser ligningssystemer for hand, men det er ikke det som erpoenget for oss na — vi er pa jakt etter systematiske metoder som fungerer

Page 124: Flervariabel analyse med lineær algebra

242 KAPITTEL 4. LINEÆR ALGEBRA I RN

for alle lineære ligningssystemer.

Av apenbare grunner sier vi at ligningssystemet (4.1.5) er pa trappeform,og malet for metoden vi er iferd med a beskrive, er a føre et hvilket som helstlineært ligningssystem over pa trappeform. Legg merke til at vi i prosessenovenfor har brukt tre operasjonstyper:

(i) Bytte om to ligninger i ligningssystemet

(ii) Gange en ligning i systemet med et tall forskjellig fra 0

(iii) Velge en av ligningene i systemet og erstatte den med det vi far nar vilegger til et multiplum av en av de andre ligningene

Det viser seg at alle lineære ligningssystemer kan føres over pa trappeformved a bruke disse tre operasjonene.

Nar vi bruker operasjonene ovenfor, endrer vi ikke løsningene til lignings-systemet — vi mister ikke løsninger og padrar oss heller ikke nye, “falske”løsninger. Det betyr at løsningene til det enkle trappeformede systemet viender opp med, er de samme som løsningene til det mer kompliserte syste-met vi startet med. Det er lettere a forsta hvorfor dette er viktig dersom viser pa et ligningssystem med uendelig mange løsninger.

Vi skal se pa ligningssystemet

x + 2y + z − u = 3−x− y − 4z + 2u = −1

2x + 5y − z = 9x + 7z − 5u = −3

Vi bruker først x-leddet i den øverste ligningen til a kvitte oss med x-leddenei de andre ligningene. Legger vi den øverste linjen til den andre, far vi

x + 2y + z − u = 3y − 3z + u = 2

2x + 5y − z = 9x + 7z − 5u = −3

For a bli kvitt x-leddet i ligning nummer tre, ganger vi først den øversteligningen med -2 og far −2x − 4y − 2z + 2u = −6. Legger vi dette til dentredje ligningen, far vi

x + 2y + z − u = 3y − 3z + u = 2

y − 3z + 2u = 3x + 7z − 5u = −3

4.1. NOEN EKSEMPLER PA GAUSS-ELIMINASJON 243

For a kvitte oss med x-leddet i den nederste linjen, ganger vi den øverstelinjen med −1 og far −x− 2y− z + u = −3. Legger vi dette til den nederstelinjen, far vi

x + 2y + z − u = 3y − 3z + u = 2

y − 3z + 2u = 3−2y + 6z − 4u = −6

Na har vi kvittet oss med alle de x-leddene vi ønsket a fjerne. Neste trinnpa programmet er a bruke y-leddet i ligning nummer to til a eliminere y-leddet i alle ligningene nedenfor. Ganger vi linje nummer to med -1, far vi−y + 3z − u = −2, og legger vi dette til linje nummer tre, far vi

x + 2y + z − u = 3y − 3z + u = 2

u = 1−2y + 6z − 4u = −6

For a bli kvitt y-leddet i den nederste ligningen, ganger vi først ligningnummer to med 2 og far 2y − 6z + 2u = 4. Legger vi dette til den nederstelinjen, far vi

x + 2y + z − u = 3y − 3z + u = 2

u = 1−2u = −2

Ifølge systemet vart skulle vi na ha brukt z-leddet i den tredje ligningen tila kvitte oss med z-leddet i den fjerde, men det er ikke noe z-ledd i tredjeligning, og vi kan heller ikke skaffe oss noe ved a bytte om pa ligning 3 og4. Vi gar derfor videre til den neste variabelen u, og bruker u-leddet i dentredje ligningen til a eliminere u-leddet i fjerde. Ganger vi ligning 3 med 2,far vi 2u = 2, og legger vi dette til ligning 4, far vi

x + 2y + z − u = 3y − 3z + u = 2

u = 10 = 0

Vi har na fatt ligningssystemet over pa trappeform, men trappen er littmindre regelmessig enn i stad siden ikke alle trappetrinnene er like lange.Dette er helt greit og ikke til a unnga i mange tilfeller.

Page 125: Flervariabel analyse med lineær algebra

244 KAPITTEL 4. LINEÆR ALGEBRA I RN

La oss na prøve a løse ligningssystemet ovenfor. Den siste ligningen eralltid oppfylt og kan bare glemmes. Den nest nederste ligningen forteller ossat u = 1. Ligningen over gir oss ikke noe krav pa z, men forteller oss at vikan regne ut y nar vi kjenner z. Dette betyr at vi kan velge z helt fritt, mennar valget er gjort, ma vi la y = 2 + 3z − u = 1 + 3z (husk at u = 1). Denøverste ligningen lar oss pa tilsvarende mate regne ut x nar z er valgt — vifar x = 3 − 2y − z + u = 3 − 2(1 + 3z) − z + 1 = 2 − 7z. Dette betyr atligningen har uendelig mange løsninger, nemlig

x = 2− 7z

y = 1 + 3z

z = z

u = 1

der z er et fritt valgt tall. Det er instruktivt a sette disse uttrykkene inn idet opprinnelige ligningssystemet og se at de passer.

Nar man arbeider med ligningssystemer med uendelig mange løsninger,er det lett a forsta fordelene ved bare a bruke operasjoner som ikke endrerløsningsmengden til ligningssystemet — i systemet ovenfor hadde det ikkevært enkelt a holde styr pa hvilke falske løsninger vi hadde padratt oss oghvilke ekte vi hadde mistet.

Vi tar med enda et eksempel som viser hva som skjer nar ligningssystemetikke har løsninger. Vi starter med ligningssystemet

x− y + z − u = 12x− 2y − z + u = 0−x + 2y + u = 2

2x− y + u = 2

og bruker pa vanlig mate x-leddet i den første ligningen til a eliminere x-leddene i de andre ligningene. Ganger vi den øverste ligningen med -2 oglegger resultatet til den nest øverste, far vi

x− y + z − u = 1−3z + 3u = −2

−x + 2y + u = 22x− y + u = 2

Legger vi den øverste linjen til den tredje, far vi

x− y + z − u = 1−3z + 3u = −2y + z = 3

2x− y + u = 2

4.1. NOEN EKSEMPLER PA GAUSS-ELIMINASJON 245

Til slutt ganger vi den øverste linjen med -2 og legger resultatet til dennederste:

x− y + z − u = 1−3z + 3u = −2

y + z = 3y − 2z + 3u = 0

Neste post pa programmet er vanligvis at vi bruker y-leddet i den andreligningen til a kvitte oss med y-leddene nedenfor, men i dette tilfellet er detikke noe y-ledd i den andre ligningen. Vi bytter derfor om pa ligning 2 og 3:

x− y + z − u = 1y + z = 3−3z + 3u = −2

y − 2z + 3u = 0

Ganger vi den andre linjen med -1 og legger resultatet til den nederste linjen,far vi

x− y + z − u = 1y + z = 3−3z + 3u = −2−3z + 3u = −3

Det gjenstar a bruke z-leddet i tredje linje til a eliminere z-leddet i dennederste linjen. Ganger vi den tredje linjen med -1 og legger resultatet tilden nederste, far vi

x− y + z − u = 1y + z = 3−3z + 3u = −2

0 = −1

Dermed har vi fatt ligningssystemet pa trappeform. Siden den nederste lin-jen er umulig a oppfylle (ingen valg av x, y, z, u kan fa 0 til a bli lik −1), harsystemet ingen løsning. Det betyr at det opprinnelige systemet heller ikkehar noen løsning.

Det viser seg at vi na har sett alle de mulighetene som finnes — et lineærtligningssystem kan ha enten en, uendelig mange eller ingen løsninger. Dettekan virke underlig, men det er ikke vanskelig a fa et geometrisk innblikk

Page 126: Flervariabel analyse med lineær algebra

246 KAPITTEL 4. LINEÆR ALGEBRA I RN

i det som foregar. La oss se pa et ligningssystem med tre ligninger og treukjente:

a11x + a12y + a13z = b1

a21x + a22y + a23z = b2

a31x + a32y + a33z = b3

Hver av disse ligningene beskriver et plan — la oss kalle dem I, II og III.En løsning til ligningssystemet vil være (koordinatene til) et punkt som lig-ger i alle tre planene. “Normalt” vil plan I og II skjære hverandre langs enrett linje m (unntakene er hvis I og II er parallelle eller sammenfallende).Denne linjen m vil normalt skjære det tredje planet i ett eneste punkt, ogkoordinatene til dette punktet gir oss da den eneste løsningen til lignings-systemet. Det finnes imidlertid unntak; dersom skjæringslinjen m ligger iplanet III, vil alle punktene pa denne linjen gi oss en løsning — i dette til-fellet har vi altsa uendelig mange løsninger. En tredje mulighet er at linjenm ikke skjærer planet III i det hele tatt — i sa fall har ligningssystemetingen løsning.

I den neste seksjonen skal vi se grundigere pa metoden ovenfor, men førvi begynner, kan det være lurt a gjøre en enkel observasjon. I alle regnin-gene vare har variablene x, y, z, u spilt en underordnet rolle — de har barevært med som en slags “plassholdere” som har fortalt oss hvilke koeffisientersom hører sammen. Vi kan spare skrivearbeid og tjene oversikt ved a fjer-ne variablene og isteden organisere koeffisientene i en matrise. Vart førsteligningssystem

2y + z = −13x + 5y + z = 2x + 2y + z = 1

kan f.eks. ertattes med matrisen

B =

0 2 1 −13 5 1 21 2 1 1

Legg merke til hvordan B er laget: Elementene i den første søylen er koeffisi-enten til x i ligningssystemet, elementene i den andre søylen er koeffisientenetil y, elementene i den tredje søylen er koeffisientene til z, mens den fjerdesøylen bestar av konstantene pa høyresiden av ligningssystemet. Vi kallerB den utvidede matrisen til ligningssystemet (4.1.1) (utvidet fordi vi ikkebare har med koeffisientene, men ogsa konstantene pa høyresiden). Vi kanna utføre akkurat de samme operasjonene pa denne matrisen som vi i stad

4.1. NOEN EKSEMPLER PA GAUSS-ELIMINASJON 247

utførte pa ligningssystemet. Vi far da denne sekvensen

0 2 1 −13 5 1 21 2 1 1

1 2 1 13 5 1 20 2 1 −1

1 2 1 10 −1 −2 −10 2 1 −1

1 2 1 10 −1 −2 −10 0 −3 −3

1 2 1 10 1 2 10 0 1 1

Nar vi na har fatt matrisen pa trappeform, kan vi ga tilbake til ligningssys-temet ved a sette inn variablene igjen:

x + 2y + z = 1y + 2z = 1

z = 1

Siden matrisenotasjonen er mer oversiktlig enn ligningsnotasjonen, skal vistort sett holde oss til den i fortsettelsen.

Bemerkning: Som vi allerede har nevnt, ma man i praksis ofte løse storeligningssystemer med tusenvis av ligninger og ukjente. Dette ma selvfølgeliggjøres med datamaskin, men selv for en datamaskin kan regneoppgavene bliuoverkommelige dersom vi ikke bruker effektive metoder. Et godt mal paeffektiviteten til en metode er a telle hvor mange regneoperasjoner den kre-ver. Nar vi løser et ligningssystem ved hjelp av Gauss-eliminasjon, er det totrinn som krever utregninger — a gange en ligning/rad med et tall, og a sub-trahere et multiplum av en ligning/rad fra en annen. Begge disse trinnenekrever flere utregninger siden vi ma behandle alle ikke-null koeffisienter i lig-ningen/raden. Teller vi opp alle de regneoperasjonen vi trenger for a løse etligningssystem med n ligninger og n ukjente ved hjelp av Gauss-eliminasjon,far vi omtrent n3

3 . Er n = 1000, trenger vi altsa omtrent 3.3 · 108 operasjo-ner! Det viser seg at det er mulig a senke dette tallet noe ved a benytteandre metoder, men disse metodene er ofte sa tungvinne a bruke at de bareanvendes nar man er helt pa grensen av det maskinene kan greie.

I anvendt lineær algebra er effektivitetsberegninger av denne typen sværtviktige, men vi har sa mye annet a konsentrere oss om i dette kompendietat vi skal nøye oss med noen fa rad her og der om hvordan man bør ga frem— eller helst: hvordan man ikke bør ga frem!

Oppgaver til seksjon 4.1

1. Finn alle løsningene til ligningssystemet

x + 2y − z = 32x + 3y − 3z = −1−x + 2y + 3z = 1

Page 127: Flervariabel analyse med lineær algebra

248 KAPITTEL 4. LINEÆR ALGEBRA I RN

2. Finn alle løsningene til ligningssystemet

x− y + 2z = 32x− 2y = 4

−3x + 2y + z = 0

3. Finn alle løsningene til ligningssystemet

2x− 4y + 6z = −2−3x + 2y − z = 8x− 6y + 11z = 4

4. Finn alle løsningene til ligningssystemet

x− 2y + 3z = 1−x + y − 2z = 0

−3x + 5y − 8z = 2

5. Figuren viser et nettverk av ledninger. Temperaturen i hvert av punktene X, Yog Z er lik gjennomsnittet av temperaturen i nabopunktene (dvs. punktene som deer forbundet til ved hjelp av en ledning). Anta at temperaturen i hjørnepunkteneA, B og C er henholdsvis a, b og c. Finn temperaturene x, y og z i punktene X, Yog Z.

++

++

++

++

++

+

++

++

++

! ! !

! !

!

A B

C

Z

Y X

6. I et game i tennis ma du vinne med minst to poeng. Nar man kommer til stillingen40-40, vil spilleren som vinner den neste ballvekslingen fa “fordel”. Vinner hun ogsaden neste ballvekslingen, vinner hun gamet, hvis ikke gar stillingen tilbake til “like”.Spilleren som vinner den neste ballvekslingen vil sa fa fordel, osv. I denne delen avspillet er det altsa tre mulige stillinger: “like”, “fordel spiller A” og “fordel spillerB”. I tennis lønner det seg a serve, og vi antar at i det gamet vi ser pa, er det spillerA som har serven og dermed har 60% sjanse for a vinne en ballveksling.

Vi lar x være spiller As sannsynlighet for a vinne gamet dersom stillingen erlike, y hennes sannsynlighet for a vinne gamet dersom hun har fordel og z hennessannsynlighet for a vinne gamet dersom motstanderen har fordel.

a) Forklar at

x = 0.6y + 0.4z

y = 0.4x + 0.6z = 0.6x

b) Finn x, y og z.

4.2. TRAPPEFORM 249

4.2 Trappeform

Vi skal na ta en nærmere kikk pa prosedyren vi introduserte i forrige sek-sjon. For oversiktens skyld skal vi stort sett arbeide med matriser og ikkeligningssystemer, sa vi antar at vi starter med en matrise

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

Med en radoperasjon pa A mener vi en av følgende operasjoner:

(i) Bytte om to rader i A

(ii) Gange en av radene i A med et tall forskjellig fra 0

(iii) Velge en av radene i A og erstatte den med det vi far nar vi legger tilet multiplum av en av de andre radene.

Legg merke til at dette er nøyaktig de samme operasjonene som vi bruktepa ligningssystemene i forrige seksjon.

Definisjon 4.2.1 Vi sier at to m×n-matriser A, B er radekvivalente der-som det finnes en sekvens av radoperasjoner som forvandler A til B. Viskriver A ∼ B nar A og B er radekvivalente.

Eksempel 1: Matrisene

A =

2 4 −21 2 0

−1 3 1

og

B =

1 2 −10 1 00 0 1

er radekvivalente siden A kan forvandles til B gjennom denne sekvensen avradoperasjoner (radene i matrisen kalles I, II og III, og symbolene over∼-tegnene antyder hvilke operasjoner vi bruker):

A =

2 4 −21 2 0

−1 3 1

12 I∼

1 2 −11 2 0

−1 3 1

II+(−1)I∼

1 2 −10 0 1

−1 3 1

III+I∼

III+I∼

1 2 −10 0 10 5 0

II↔III∼

1 2 −10 5 00 0 1

15 II∼

1 2 −10 1 00 0 1

= B ♣

Page 128: Flervariabel analyse med lineær algebra

250 KAPITTEL 4. LINEÆR ALGEBRA I RN

Det er lett a se at dersom vi kan forvandle A til B ved hjelp av radope-rasjoner, sa kan vi ogsa bruke radoperasjoner til a forvandle B til A. Alt vibehøver a gjøre, er a “reversere” de operasjonene som forvandlet A til B —der vi tidligere ganget en rad med 3, ganger vi den na med 1

3 ; der vi tidligerela til 7 ganger en rad, legger vi na til -7 ganger den samme raden, og der vitidligere byttet om to rader, bytter vi dem na tilbake igjen. I tillegg ma vipasse pa a begynne bakfra; vi begynner med a reversere den siste operasjo-nen som var med pa a forvandle A til B. Det neste eksemplet viser hvordandette foregar i praksis.

Eksempel 2: I forrige eksempel forvandlet vi matrisen

A =

2 4 −21 2 0

−1 3 1

til B =

1 2 −10 1 00 0 1

,

og vi skal na vise hvordan vi kan reversere denne prosedyren slik at B blirforvandlet til A. Siden den siste operasjonen vi brukte da vi forvandlet Atil B, var a gange rad 2 med 1

5 , gjør vi na det omvendte — vi ganger rad 2med 5:

B =

1 2 −10 1 00 0 1

5II∼

1 2 −10 5 00 0 1

Den nest siste operasjonen vi brukte, var a bytte om rad 2 og 3, sa na byttervi tilbake igjen:

1 2 −10 5 00 0 1

II↔III∼

1 2 −10 0 10 5 0

Operasjonen før dette var a legge rad 1 til rad 3, sa na trekker vi istedenrad 1 fra rad 3 (for a holde oss i var offisielle sprakbruk, burde vi heller siat vi ganger rad I med −1 og legger resultatet til rad 3):

1 2 −10 0 10 5 0

III+(−1)I∼

1 2 −10 0 1

−1 3 1

Den neste operasjonen vi ma reversere, er a legge −1 ganger rad 1 til rad 2.Vi legger derfor rad 1 til rad 2:

1 2 −10 0 1

−1 3 1

II+I∼

1 2 −11 2 0

−1 3 1

4.2. TRAPPEFORM 251

Det gjenstar na bare a reverse en operasjon. Den var a gange rad 1 med 12 ,

sa na ganger vi rad 1 med 2:

1 2 −11 2 0

−1 3 1

III+(−1)I∼

2 4 −21 2 0

−1 3 1

= A

Dermed har vi reversert hele prosedyren og gjort B om til A. ♣

Som antydet i forrige seksjon, er hensikten med radoperasjoner a for-vandle en vilkarlig matrise til en matrise pa trappeform. Aller først ma videfinere hva dette betyr:

Definisjon 4.2.2 En matrise er pa trappeform dersom:

(i) Enhver rad bestar enten bare av nuller, eller sa er det første ikke-nullelementet et ett-tall.

(ii) Enhver rad som ikke bare bestar av nuller, begynner med minst en nullmer enn raden over.

En matrise pa trappeform blir ogsa kalt en trappematrise.

Legg merke til at dersom en trappematrise har rader som bare bestar avnuller, ma disse være samlet nederst i matrisen (det følger fra punkt (ii)ovenfor).

Eksempel 3: Følgende matriser er pa trappeform:

1 2 0 −10 0 1 40 0 0 00 0 0 0

,

0 1 2 −1 20 0 1 3 40 0 0 1 20 0 0 0 1

,

1 3 0 0 20 1 0 7 40 0 0 1 2

Disse matrisene er ikke pa trappeform (forklar hvorfor):

2 2 0 −10 0 1 40 0 0 0

,

0 1 2 −1 20 1 1 3 40 0 0 1 20 0 0 0 1

,

0 0 0 0 20 1 0 7 40 0 0 1 2

For a kunne beskrive matriser pa trappeform trenger vi litt terminologi.Det første ikke-null elementet i en rad (det er nødvendigvis et ett-tall) kalleset pivotelement, og søylen det star i, kalles en pivotsøyle (se illustrasjonen

Page 129: Flervariabel analyse med lineær algebra

252 KAPITTEL 4. LINEÆR ALGEBRA I RN

nedenfor). Pivotelementer og pivotsøyler kommer til a spille en sentral rollei teorien i dette kapitlet.

1 2 0 −10 0 1 40 0 0 0

" "

pivotsøyler

> >++V c

cccd

pivotelementer

Vi har allerede nevnt flere ganger at poenget med radoperasjoner er aforvandle en gitt matrise til en matrise pa trappeform. Det neste resultatetforteller oss at dette alltid er mulig.

Setning 4.2.3 Enhver matrise er radekvivalent med en matrise pa trappe-form.

Bevis: Dette beviset er bare en systematisering av den metoden vi har brukti eksemplene. Først ser vi pa søylene i matrisen og plukker ut den første somikke bare bestar av nuller. Ved eventuelt a bytte om to rader kan vi sørgefor at det øverste elementet i denne søylen ikke er null, og ved a gangeden øverste raden med et passende tall, kan vi gjøre om dette elementettil et ett-tall. Ved hjelp av dette ett-tallet kan vi na eliminere alle ikke-nullelementer i søylen under — vi bare ganger den øverste linjen med et passetall og adderer resultatet til den raden vi arbeider med. Nar dette arbeidet erferdig, star ett-tallet alene igjen i søylen og er blitt vart første pivotelement.Vi “glemmer” na den øverste raden i matrisen og arbeider bare med resten(sa nar vi na sier “restmatrisen” mener vi det som star igjen etter at vi harfjernet første rad).

Vi begynner na prosedyren pa nytt med a lete oss frem til den førstesøylen i “restmatrisen” som ikke bare bestar av nuller. Ved eventuelt a bytteom rader sikrer vi oss at det øverste elementet ikke er 0, og ved a gange radenmed et passende tall, forvandler vi elementet til et ett-tall. Pa vanlig matebruker vi dette ett-tallet til a eliminere elementene i søylen nedenfor. Nahar vi funnet vart andre pivotelement, sa vi “glemmer” raden det star i, oggjentar prosedyren pa radene nedenfor.

Denne prosedyren fortsetter inntil en av to ting skjer. Enten er det ikkeflere rader igjen (og da er vi ferdige fordi det star et pivotelement i hvereneste rad), eller sa bestar alle søylene i den “restmatrisen” vi ser pa, avbare nuller (og da er vi ferdige fordi vi har pivotelementer i alle de radenesom ikke bare bestar av nuller). !

Bemerkning: Nar vi bruker radoperasjoner til a bringe en matrise A overpa trappeform, sier vi at vi radreduserer A. Det er greit a være klar over

4.2. TRAPPEFORM 253

at matriser kan radreduseres pa forskjellige vis — nar du bruker metoden,har du ofte et valg mellom flere muligheter (f.eks. hvilke rader du vil bytteom pa), og det endelige resultatet vil ofte avhenge av hvilke valg du gjørunderveis. Det kan derfor godt hende at fasitsvaret pa en oppgave er for-skjellig fra ditt svar, selv om ditt ogsa er riktig. Det viser seg imidlertid atalle trappeformene til en matrise har de samme pivotsøylene (og dermed desamme pivotelementene), og dette kan du bruke som en sjekk pa at svaretditt er rimelig.

Ligningssystemer pa trappeform

Vi skal na vende tilbake til lineære ligningssystemer og se dem i lys av detvi nettopp har lært. Vi starter med et generelt, lineært ligningssystem medn ligninger og m ukjente (vi insisterer altsa ikke pa at det skal være likemange ligninger som ukjente — det finnes en del problemstillinger der deter aktuelt a se pa bade “for fa” og “for mange” ligninger):

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...am1x1 + am2x2 + · · · + amnxn = bm

Vi tar na den utvidede matrisen

B =

a11 a12 . . . a1n b1

a21 a22 . . . a2n b2...

......

......

am1 am2 . . . amn bm

og bringer den pa trappeform ved hjelp av radoperasjoner. Den matrisenC vi da far, tilhører et ligningssystem med de samme løsningene som detopprinnelige systemet. I dette systemet vil noen variable (“ukjente”) korre-spondere til pivotsøyler, og disse kaller vi basisvariable, mens de andre kallesfrie variable. La oss se pa et eksempel:

Eksempel 4: Vi starter med ligningssystemet

x + 2y + z = 1−x + y − z = 0x + 5y + z = 2

Den utvidede matrisen er

B =

1 2 1 1

−1 1 −1 01 5 1 2

Page 130: Flervariabel analyse med lineær algebra

254 KAPITTEL 4. LINEÆR ALGEBRA I RN

Radreduserer vi B, far vi:

B =

1 2 1 1

−1 1 −1 01 5 1 2

II+I∼

1 2 1 10 3 0 11 5 1 2

III+(−1)I∼

1 2 1 10 3 0 10 3 0 1

III−II∼

1 2 1 10 3 0 10 0 0 0

13 II∼

1 2 1 10 1 0 1

30 0 0 0

= C

I denne trappematrisen C er søyle 1 og 2 pivotsøyler. Søyle 1 og 2 tilsvarervariablene x og y, sa disse er basisvariable, mens z (som tilsvarer søyle 3) eren fri variabel. Vi ser at C er den utvidede matrisen til systemet

x + 2y + z = 1

y =13

0 = 0

Den nederste ligningen er alltid oppfylt og kan neglisjeres. De to andre lig-ningene legger ingen føringer pa den frie variabelen z som kan velges fritt,og nar den er valgt, kan vi regne ut verdiene til basisvariablene x og y. Vifar y = 1

3 og x = 1−2y−z = 13−z (at y er uavhengig av z er en tilfeldighet).

La oss na forandre eksemplet litt. Dersom vi endrer konstantleddet i dentredje ligningen i det opprinnelige problemet fra 2 til 1, far vi ligningssyste-met

x + 2y + z = 1−x + y − z = 0x + 5y + z = 1

med utvidet matrise

B′ =

1 2 1 1

−1 1 −1 01 5 1 1

Radreduserer vi denne matrisen, ender vi opp med trappematrisen

C ′ =

1 2 1 10 1 0 1

30 0 0 1

Na har vi fatt et pivotelement i siste søyle, og det har dramatiske konse-kvenser. Det korresponderende ligningssystemet er nemlig

x + 2y + z = 1

y =13

0 = 1

4.2. TRAPPEFORM 255

og her ser vi at den siste ligningen aldri kan oppfylles. Ligningssystemet harderfor ingen løsninger. ♣

Mønsteret du ser i eksemplet ovenfor er helt generelt:

Setning 4.2.4 Anta at den utvidede matrisen til et lineært ligningssystemkan radreduseres til trappematrisen C. Da gjelder:

(i) Dersom den siste søylen i C er en pivotsøyle, har ligningssystemetingen løsninger.

Dersom den siste søylen ikke er en pivotsøyle, har vi videre:

(ii) Dersom alle de andre søylene i C er pivotsøyler, har ligningssystemetnøyaktig en løsning.

(iii) Dersom minst en av de andre søylene ikke er en pivotsøyle, har lig-ningssystemet uendelig mange løsninger.

Bevis: Siden det opprinnelige ligningssystemet og det som hører til C, harnøyaktig de samme løsningene, kan vi konsentrere oss om ligningssystemettil C. Anta først at den siste søylen i C er en pivotsøyle. Da inneholderligningssystemet en ligning av formen 0 = 1, og har derfor ingen løsninger.

Anta sa at den siste søylen i C ikke er en pivotsøyle. Dersom det finnesandre søyler som ikke er pivotsøyler, har systemet frie variable. Gi dissehvilke som helst verdier du ønsker. Du kan na regne ut verdien til de andrevariablene ved a begynne nedenfra med den nederste (ikke-trivielle) lignin-gen. Denne ligningen gir deg verdien til den siste av basisvariablene. Ga navidere til ligningen over og regn ut den tilhørende basisvariablen. Fortsettoppover i ligningssystemet til du har regnet ut alle basisvariablene. Det-te viser at for hvert valg av frie variable, har ligningssystemet nøyaktig enløsning. Finnes det frie variable, har derfor ligningssettet uendelig mangeløsninger. Finnes det ikke frie variable (dvs. at alle søyler unntatt den sisteer pivotsøyler), ma ligningssettet ha nøyaktig en løsning. !

Det er ofte viktig a vite nar et ligningssystem har nøyaktig en løsning (vikaller dette en entydig løsning), og vi tar derfor med dette som et separatresultat:

Korollar 4.2.5 Anta at den utvidede matrisen til et lineært ligningssystemkan radreduseres til trappematrisen C. Da har ligningssystemet en entydigløsning hvis og bare hvis alle søyler i C unntatt den siste, er pivotsøyler.

Bevis: Dette er bare en omskrivning av punkt (ii) i setningen ovenfor. !

Page 131: Flervariabel analyse med lineær algebra

256 KAPITTEL 4. LINEÆR ALGEBRA I RN

Matrisen nedenfor viser en typisk trappematrise som tilsvarer et lignings-system med entydig løsning:

C =

1 −2 3 0 4 20 1 1 3 −2 60 0 1 −2 3 π0 0 0 1 3 30 0 0 0 1 −10 0 0 0 0 00 0 0 0 0 0

Vi ser at pivotelementene begynner øverst i venstre hjørne og fortsetternedover diagonalen inntil de nar den nest siste søylen. Under dette nivaetkan det godt være noen rader med bare nuller.

Ligningssystemer med samme venstreside

Bade i teori og praksis hender det ofte at vi har behov for a løse “det samme”ligningssystemet gang pa gang med forskjellig høyreside. Mer presist betyrdette at vi ønsker a løse systemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...am1x1 + am2x2 + · · · + amnxn = bm

mange ganger for de samme koeffisientene aij , men for forskjellige bi. Etspørsmal som da dukker opp, er nar det er mulig a løse ligningssystemet foralle valg av b1, b2, . . . , bm. For a løse dette problemet ser vi pa matrisen

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

til ligningssystemet (ikke bland denne sammen med den utvidede matrisen

B =

a11 a12 . . . a1n b1

a21 a22 . . . a2n b2...

......

......

am1 am2 . . . amn bm

der b-ene er med!) Vi radreduserer sa A til en trappematrise D. Det viser segat ligningssystemet vart har en løsning for alle valg av b1, b2, . . . , bm dersomalle radene i D inneholder et pivotelement.

4.2. TRAPPEFORM 257

Setning 4.2.6 Anta at

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

kan radreduseres til trappematrisen D. Da har ligningssystemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...am1x1 + am2x2 + · · · + amnxn = bm

en løsning for alle valg av b1, b2, . . . , bm hvis og bare hvis alle radene i Dinneholder pivotelementer.

Bevis: Anta først at D har pivotelementer i alle rader, og velg b1, b2, . . . , bm.La B være den utvidede matrisen

B =

a11 a12 . . . a1n b1

a21 a22 . . . a2n b2...

......

......

am1 am2 . . . amn bm

Vi vet at A lar seg forvandle til D gjennom en sekvens av radoperasjoner,og vi lar na C være den matrisen vi far nar vi lar B gjennomga den sammesekvensen av operasjoner. Da er

C =

d11 d12 . . . d1n b1

d21 d22 . . . d2n b2...

......

......

dm1 dm2 . . . dmn bm

der dij er elementene i D og b1, b2, . . . , bm er resultatet av a bruke disse rad-operasjonene pa b1, b2, . . . , bm. Siden D har et pivotelement i hver rad, kanikke den siste søylen i C være en pivotsøyle, og følgelig har ligningssystemetminst en løsning.

Anta na omvendt at D mangler pivotelement i noen av radene, og la radnummer j være den første av disse. Hvis vi kan finne b1, b2, . . . , bm slik at bj

er lik 1, vil C fa et pivotelement i siste søyle, og ligningssystemet vil da ikkeha en løsning. Siden radoperasjonene er reverserbare, er det ikke vanskeliga finne et slikt sett med b-er. Vi velger oss rett og slett et sett b1, b2, . . . , bm

Page 132: Flervariabel analyse med lineær algebra

258 KAPITTEL 4. LINEÆR ALGEBRA I RN

med den egenskapen vi ønsker oss ved a la bj = 1, mens bi = 0 for alle andreindekser i. Sa danner vi matrisen

C =

d11 d12 . . . d1n b1

d21 d22 . . . d2n b2...

......

......

dm1 dm2 . . . dmn bm

Legg merke til at C er pa trappeform og at bj er et pivotelement i siste rad.Na bruker vi de omvendte av de operasjonene som førte A til B til a føre Ctilbake til en matrise pa formen

B =

a11 a12 . . . a1n b1

a21 a22 . . . a2n b2...

......

......

am1 am2 . . . amn bm

(husk reverseringsprosedyren i eksempel 2). Ligningssystemet til B kan ikkeha en løsning siden vi kan bruke de opprinnelige radoperasjonene til a for-vandle B til C, og C har et pivotelement i siste rad. !

Legg merke til at dersom m > n (dvs. at matrisen A har flere raderenn søyler), sa er det ikke plass til et pivotelement i hver rad (husk atpivotelementene ma flytte seg minst ett skritt mot høyre for hver rad), ogligningssystemet kan derfor ikke ha løsninger for alle b1, b2, . . . , bm.

La oss ogsa se pa betingelsen for at ligningssystemet har en entydigløsning for alle valg at b1, b2, . . . , bm:

Korollar 4.2.7 Anta at

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

kan radreduseres til trappematrisen D. Da har ligningssystemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...am1x1 + am2x2 + · · · + amnxn = bm

en entydig løsning for alle valg av b1, b2, . . . , bm hvis og bare hvis alle rade-ne og alle søylene i D inneholder pivotelementer. Dette betyr at D er enkvadratisk matrise med pivotelementer pa diagonalen.

4.2. TRAPPEFORM 259

Bevis: Vi vet fra setningen ovenfor at det ma være pivotelementer i alle ra-der dersom vi skal ha løsninger for alle valg av b1, b2, . . . , bm. Vi vet ogsa atfor a fa entydige løsninger, ma vi ha pivotelementer i alle søyler. Skal vi faplass til pivotelementer i alle rader og alle søyler, ma D være en kvadratiskmatrise med pivotelementer pa diagonalen (prøv deg frem, sa vil du se). !

Bemerkning: Ifølge resultatet ovenfor er det bare mulig a ha entydigeløsninger for alle b1, b2, . . . , bm dersom D — og dermed A — er en kvad-ratisk matrise, dvs. at vi har like mange ligninger som ukjente. Dette eren viktig observasjon som vi skal møte igjen i ulike forkledninger senere ikapitlet.

Det er pa tide med et eksempel:

Eksempel 5: Vi skal undersøke om ligningssystemet

3x + y − 2z = b1

−x + 2y − z = b2

x + z = b3

har en løsning for alle valg av b1, b2, b3. Matrisen til systemet er

3 1 −2

−1 2 −11 0 1

Bruker vi radoperasjoner pa denne matrisen, far vi (vi tillater oss a ta flereoperasjoner i slengen slik at ikke utledningen skal bli for lang):

3 1 −2

−1 2 −11 0 1

I↔II∼

−1 2 −1

3 1 −21 0 1

II+3IIII+I∼

−1 2 −1

0 7 −50 2 0

17 II∼

−1 2 −1

0 1 −57

0 2 0

III+(−2)II∼

−1 2 −1

0 1 −57

0 0 107

(−1)I710 III∼

1 −2 10 1 −5

70 0 1

Siden den siste matrisen har et pivotelement i hver rad, har ligningssystemeten løsning for alle valg av b1, b2, b3. Siden det ogsa er et pivotelement i hversøyle, er denne løsningen entydig. ♣

Oppgaver til seksjon 4.2

1. Avgjør om matrisene er pa trappeform:

A =

1 −2 30 1 −10 0 1

, B =

0 1 20 0 10 0 0

, C =

1 0 20 2 00 0 1

Page 133: Flervariabel analyse med lineær algebra

260 KAPITTEL 4. LINEÆR ALGEBRA I RN

D =

1 −2 0 −10 0 1 10 0 0 1

, E =

1 3 −20 1 −30 0 10 0 0

, F =

1 −2 0 −10 1 2 10 1 4 −3

2. Reduser matrisen til trappeform:

a) A =

1 2 1

−1 −3 22 1 2

b) B =

0 1 21 1 2

−2 1 3

c) C =

1 1 −2 32 1 3 0

−1 0 −5 2

d) D =

1 2 1 1

−1 3 −1 21 12 1 7

3. Løs ligningssystemet ved a radredusere den utvidede matrisen.

x− y + 2z = 12x + y + z = 1

−2x− y + z = 0

4. Løs ligningssystemet ved a radredusere den utvidede matrisen.

3x− 4y + z = 2x− 2y = 1

−2x + 2y − z = −1

5. Løs ligningssystemet ved a radredusere den utvidede matrisen.

x + 2y + z = 22x− 4y + 3z = 13x− 2y + 4z = 6

6. Løs ligningssystemet ved a radredusere den utvidede matrisen.

x + 3y − z + 3u = 4x + 2y − 2z + 3u = 0

2x + 2y − 5z + 5u = 1

7. Avgjør om ligningssystemet har en løsning for alle valg av b1, b2, b3:

2x + 4y − 4z = b1

2x− y + 3z = b2

x− y + 2z = b3

4.3. REDUSERT TRAPPEFORM 261

8. Avgjør om ligningssystemet har en løsning for alle valg av b1, b2, b3:

x + 2y − 3z = b1

−2x− 4y + z = b2

x + 2y + z = b3

9. (Eksamen i MAT 1110, 14/6 2004, litt tilpasset).

a) Reduser matrisen til trappeform:

A =

1 2 0 2 50 1 1 1 30 −2 1 1 01 2 1 3 7

b) Løs ligningssystemet

x + 2y + 2u = 5y + z + u = 3

−2y + z + u = 0x + 2y + z + 3u = 7

10. Et bilutleiefirma har kontor i tre byer A, B og C. Av de bilene som leies i A,blir 60% returnert i A, 30% i B og 10% i C. Av de bilene som leies i B, blir 30%returnert i A, 50% i B og 20% i C. Av de bilene som leies i C, blir 60% returnerti A, 10% i B og 30% i C. Bilfirmaet har totalt 120 biler. Hvordan skal det fordeledisse bilene i A, B og C slik at det i hver by returneres like mange biler som detleies ut?

4.3 Redusert trappeform

Nar vi omformer en matrise til trappeform, sørger vi for at elementene un-der pivotelementene alltid er null, men vi bryr oss ikke om elementene overpivotelementene. For noen formal lønner det seg a sørge for at disse elemen-tene ogsa er null. Vi sier da at matrisen er pa redusert trappeform. Her erden presise definisjonen:

Definisjon 4.3.1 Vi sier at en matrise er pa redusert trappeform dersomden er pa trappeform og alle elementene i pivotsøylene, unntatt pivotelemen-tene, er 0.

Eksempel 1: Disse matrisene er pa redusert trappeform:

1 0 00 1 00 0 1

,

1 −3 00 0 10 0 0

,

1 2 3 0 0 50 0 0 1 0 10 0 0 0 1 30 0 0 0 0 0

Page 134: Flervariabel analyse med lineær algebra

262 KAPITTEL 4. LINEÆR ALGEBRA I RN

Disse matrisene er pa trappeform, men ikke pa redusert trappeform:

1 3 20 1 40 0 1

,

1 −3 20 1 40 0 0

,

1 2 3 3 3 50 0 0 1 −2 10 0 0 0 1 30 0 0 0 0 0

Alle matriser kan omformes til redusert trappeform ved hjelp av rad-operasjoner. Vi radreduserer dem først til vanlig trappeform, og bruker der-etter pivotelementene til a skaffe oss de resterende nullene i pivotsøylene.Det er lurest a begynne bakfra med de pivotelementene som star lengst tilhøyre. Her er et eksempel:

Eksempel 2: Vi starter med en matrise som er pa vanlig trappeform

A =

1 2 −3 4 20 0 1 2 30 0 0 0 1

Deretter tar vi utgangspunkt i pivotelementet nederst til høyre, og brukerdet til a skaffe oss nuller i posisjonene over:

1 2 −3 4 20 0 1 2 30 0 0 0 1

II+(−3)III∼

1 2 −3 4 20 0 1 2 00 0 0 0 1

I+(−2)III∼

1 2 −3 4 00 0 1 2 00 0 0 0 1

Dermed har vi ordnet opp i den bakerste søylen, og vi gar na mot venst-re pa jakt etter neste pivotsøyle. Det er søyle nummer 3, og vi bruker napivotelementet her til a skaffe flere nuller:

1 2 −3 4 00 0 1 2 00 0 0 0 1

I+3II∼

1 2 0 10 00 0 1 2 00 0 0 0 1

Dermed er matrisen brakt pa redusert trappeform. ♣

Poenget med a starte prosessen bakfra er at vi slipper unna mye regne-arbeid fordi de fleste tallene vi adderer er 0.

Setning 4.3.2 Enhver matrise er radekvivalent med en matrise pa reduserttrappeform.

4.3. REDUSERT TRAPPEFORM 263

Bevis: Vi vet allerede at matrisen er radekvivalent med en matrise pa vanligtrappeform, sa alt vi trenger, er a vise er at enhver matrise pa vanlig trappe-form er ekvivalent med en matrise pa reduset trappeform. Dette følger fraprosedyren vi har beskrevet ovenfor. Det eneste som kunne gatt galt meddenne prosedyren, var hvis noen av de operasjonene vi gjorde underveis,“ødela” nuller vi allerede hadde skaffet oss pa et tidligere tidspunkt, mendet er lett a sjekke at det ikke skjer. !

Bemerkning: Det viser seg at den reduserte trappeformen til en matrise erentydig bestemt — uansett hvilken sekvens av radoperasjoner du bruker fora bringe en matrise pa redusert trappeform, blir sluttresultatet det samme.Vi skal derfor av og til snakke om “den reduserte trappeformen” i bestemtform.

Det neste resultatet skal vi ofte fa bruk for. Husk at korollar 4.2.7 fortelleross at ligningssystemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...am1x1 + am2x2 + · · · + amnxn = bm

bare kan ha en entydig løsning for alle valg av b1, b2, . . . , bm dersom m = n,dvs. dersom vi har like mange ligninger som ukjente.

Setning 4.3.3 Ligningssystemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...an1x1 + an2x2 + · · · + annxn = bn

har en entydig løsning for alle valg av b1, b2, . . . , bn hvis og bare hvis dentilhørende matrisen

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

an1 an2 · · · ann

er radekvivalent med identitetsmatrisen

In =

1 0 . . . 00 1 . . . 0...

... · · ·...

0 0 . . . 1

Page 135: Flervariabel analyse med lineær algebra

264 KAPITTEL 4. LINEÆR ALGEBRA I RN

Bevis: Dersom A er radekvivalent med identitetsmatrisen, følger det umid-delbart fra korollar 4.2.7 at ligningssystemet alltid har en entydig løsning.Pa den annen side: Dersom ligningssystemet alltid har en entydig løsning,vet vi fra korollar 4.2.7 at A er radekvivalent med en trappematrise der allepivotelementene ligger pa diagonalen. Den reduserte trappeformen til en slikmatrise er identitetsmatrisen (hvorfor?), og følgelig er A radekvivalent medidentitetsmatrisen. !

Redusert trappeform i MATLAB

Det er ganske kjedelig a føre store matriser over pa trappeform for hand,men heldigvis finnes det hjelpemidler. Dersom du har tastet inn en matriseA i MATLAB, vil kommandoen >> rref(A) fa MATLAB til a regne ut denreduserte trappeformen til A. Her er et eksempel pa en kjøring:

>> A=[2 -1 4 5 66 -1 3 2 1-2 3 1 0 5];

>> B=rref(A)

B =

1.0000 0 0 -0.4286 -0.75000 1.0000 0 -0.7143 0.50000 0 1.0000 1.2857 2.000

Kommandonavnet rref kan virke litt mystisk, men det skyldes rett ogslett at redusert trappeform heter reduced row echelon form pa engelsk.Vanlig trappeform heter row echelon form.

La oss se hvordan vi kan bruke kommandoen rref til a løse et lignings-system.

Eksempel 3: Vi skal løse ligningssystemet

2x− y + 3z + u + v = 23x + y − z + 2u− v = 3

−x− 2y + 4z + u + 2v = 4

Den utvidede matrisen er

B =

2 −1 3 1 1 23 1 −1 2 −1 3

−1 −2 4 1 2 4

4.3. REDUSERT TRAPPEFORM 265

og putter vi denne inn i MATLAB og bruker rref, far vi

>> B=[2 -1 3 1 1 23 1 -1 2 -1 3-1 -2 4 1 2 4];

>> C=rref(B)

C =

1.0000 0 0.4000 0 0 -0.50000 1.0000 -2.2000 0 -1.0000 -0.50000 0 0 1.0000 0 2.5000

Den reduserte trappeformen er altsa

C =

1 0 0.4 0 0 −0.50 1 −2.2 0 −1 −0.50 0 0 1 0 2.5

Vi ser at pivotsøylene er søyle 1, 2 og 4, og at de frie variablene er z (somkorresponderer til søyle 3) og v (som korresponderer til søyle 5). Vi kanderfor velge z og v fritt og løse for de andre variablene. Det er lettest a gjøredette hvis vi først skriver opp ligningssystemet til C:

x + 0.4z = −0.5y − 2.2z − v = −0.5

u = 2.5

Vi ser at løsningene er gitt ved

x = −0.5− 0.4z

y = −0.5 + 2.2z + v

z = z

u = 2.5

v = v

der z og v kan velges fritt. ♣

Page 136: Flervariabel analyse med lineær algebra

266 KAPITTEL 4. LINEÆR ALGEBRA I RN

Oppgaver til seksjon 4.3

1. Avgjør om matrisene er pa redusert trappeform:

A =

0 1 00 0 10 0 0

, B =

1 1 00 0 10 0 0

, C =

1 0 00 0 00 1 0

D =

1 2 −1 0 00 0 0 1 70 0 0 0 0

, E =

1 0 00 1 00 0 10 0 00 0 0

, F =

1 2 −1 0 00 1 0 1 70 0 1 0 0

2. Omform matrisene til redusert trappeform:

a) A =(

1 23 5

)

b) B =(

2 1 3 41 1 0 3

)

c) C =

1 1 1 2

−1 2 −1 32 2 1 1

d) D =

1 2 32 4 6

−2 −4 5−1 −2 8

3. Bruk MATLAB til a omforme disse matrisene til redusert trappeform:

a) A =

1 3 −2 2 30 2 −3 4 6

−2 3 1 −4 50 −2 −1 −2 82 3 1 0 −1

b) B =

0.25 0.5 1.5 0.751 0.55 0.7 0.25

−0.25 3 0.75 −0.1

c) C =

1 2 0.5 3 −1 22 0.5 −1 −1 2 31 1 1 2 3 42 −1 2 3 −2 0

4. Avgjør om ligningssystemet har en entydig løsning for alle valg av b1, b2, b3. Brukgjerne MATLAB som hjelpemiddel.

x + 2y + z = b1

2x + 4y + 3z = b2

−x + 3y + 2z = b3

4.4. MATRISELIGNINGER 267

5. Avgjør om ligningssystemet har en entydig løsning for alle valg av b1, b2, b3. Brukgjerne MATLAB som hjelpemiddel.

2x− y + z = b1

−x + 3y + 2z = b2

3x− 4y − z = b3

6. Finn alle løsningene til ligningssystemet. Bruk først MATLAB til a skrive denutvidede matrisen pa redusert trappeform.

2x− y + z + 3u = −4−x + 2y + 4z + 3u = 2−2x + y + 3z − 4u = −1

7. Finn alle løsningene til ligningssystemet. Bruk først MATLAB til a skrive denutvidede matrisen pa redusert trappeform.

x + y − z + 2u− v = 1−2x− 2y + z − u + v = 2

3x + 3y − 2u + 2v = 1

4.4 Matriseligninger

Dersom vi starter med en m× n-matrise

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og en søylevektor

x =

x1

x2...

xn

,

kan vi regne ut en søylevektor

b =

b1

b2...

bm

ved a ta produktetAx = b

Page 137: Flervariabel analyse med lineær algebra

268 KAPITTEL 4. LINEÆR ALGEBRA I RN

Vi kan ogsa snu problemstillingen pa hodet: Dersom vi starter med A og b,ønsker vi a finne en vektor x slik at

Ax = b (4.4.1)

Vi kaller dette en matriseligning. Dersom vi skriver ut ligning (4.4.1) pakomponentform, far vi

a11x1 + a12x2 + · · · + a1nxn

a21x1 + a22x2 + · · · + a2nxn...

am1x1 + am2x2 + · · · + amnxn

=

b1

b2...

bm

(4.4.2)

Det a løse matriseligningen (4.4.1) er altsa det samme som a løse lignings-systemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

...am1x1 + am2x2 + · · · + amnxn = bm

All den kunnskapen vi har skaffet oss om lineære ligningssystemer, kan vina overføre til matriseligninger. Først litt notasjon — vi skal skrive

B = (A,b)

for den utvidede matrisen

B =

a11 a12 . . . a1n b1

a21 a22 . . . a2n b2...

......

......

am1 am2 . . . amn bm

La oss na oversette setning 4.2.4 til matrisesprak.

Setning 4.4.1 La B = (A,b) være den utvidede matrisen til matriselignin-gen

Ax = b

og anta at B kan radreduseres til trappematrisen C. Da gjelder:

(i) Dersom den siste søylen i C er en pivotsøyle, har matriseligningeningen løsninger.

Dersom den siste søylen ikke er en pivotsøyle, har vi videre:

4.4. MATRISELIGNINGER 269

(ii) Dersom alle de andre søylene i C er pivotsøyler, har matriseligningennøyaktig en løsning.

(iii) Dersom minst en av de andre søylene ikke er en pivotsøyle, har matrise-ligningen uendelig mange løsninger.

Bevis: Dette er bare en omformulering av setning 4.2.4. !

Eksempel 1: Finn alle løsninger til matriseligningen Ax = b nar

A =

2 −1 3 3 43 0 2 1 −1

−1 2 −4 −5 0

og b =

141

Vi bruker først radoperasjoner pa den utvidede matrisen

B =

2 −1 3 3 4 13 0 2 1 −1 4

−1 2 −4 −5 0 1

Dersom vi velger a bruke MATLAB, far vi

B=[2 -1 3 3 4 13 0 2 1 -1 4-1 2 -4 -5 0 1];

>> C=rref(B)

C =

1.0000 0 0.6667 0.3333 0 1.29630 1.0000 -1.6667 -2.3333 0 1.14810 0 0 0 1.0000 -0.1111

B er altsa radekvivalent med matrisen

C =

1 0 0.6667 0.3333 0 1.29630 1 −1.6667 −2.3333 0 1.14810 0 0 0 1 −0.1111

Vi ser at den siste søylen ikke er en pivotsøyle, sa ligningen har løsninger. Viser ogsa at søyle 3 og 4 ikke er pivotsøyler, sa ligningen har uendelig mangeløsninger. Variablene x3 og x4 er frie, og velger vi verdier for disse, kan viregne ut de andre variablene:

x1 = 1.2963− 0.6667x3 − 0.3333x4

Page 138: Flervariabel analyse med lineær algebra

270 KAPITTEL 4. LINEÆR ALGEBRA I RN

x2 = 1.1481 + 1.6667x3 + 2.3333x4

x5 = −0.1111

Skriver vi løsningen pa vektorform, har vi dermed

x =

1.2963− 0.6667x3 − 0.3333x4

1.1481 + 1.6667x3 + 2.3333x4

x3

x4

−0.1111

=

=

1.29631.1481

00

−0.1111

+ x3

−0.66671.6667

100

+ x4

−0.33332.3333

010

Denne skrivematen gir en god oversikt over løsningene. ♣

La oss na undersøke nar matriseligningen Ax = b har en løsning for allevektorer b. Svaret ligger i setning 4.2.6 og korollar 4.2.7:

Setning 4.4.2 Anta at matrisen A er radekvivalent med trappematrisen D.Da har ligningen

Ax = b

løsning for alle vektorer b ∈ Rm hvis og bare hvis alle radene i D inneholderet pivotelement. Løsningen er entydig dersom ogsa alle søylene i D inne-holder et pivotelement — dette betyr at A er en kvadratisk matrise som erradekvivalent med identitetsmatrisen.

Bevis: Som allerede nevnt er dette bare en omskrivning av setning 4.2.6 ogkorollar 4.2.7 til matrisesprak. !

Homogene ligninger

En matriseligning Ax = b kan ha ingen løsninger for noen verdier av bog en eller uendelig mange løsninger for andre verdier av b. For a forstasammenhengen er det lurt a ta utgangspunkt i homogene ligninger, dvs.ligninger av typen Ax = 0 der høyresiden er null. En homogen ligning haralltid løsningen x = 0, sa spørsmalet er om dette er den eneste løsningen,eller om det finnes uendelig mange andre. Fra setning 4.4.1 far vi:

Korollar 4.4.3 Anta at matrisen A har trappeform D. Dersom alle søylenei D er pivotsøyler, har den homogene ligningen Ax = 0 bare løsningenx = 0. Dersom D har søyler som ikke er pivotsøyler, har ligningen uendelig

4.4. MATRISELIGNINGER 271

mange løsninger. Dersom A er en kvadratisk n × n-matrise, betyr dette atligningen Ax = 0 har 0 som eneste løsning hvis og bare A er radekvivalentmed In.

Bevis: Den generelle delen av korollaret er følger direkte fra setning 4.4.1.Tillegget om kvadratiske matriser følger fordi en kvadratisk matrise har pi-votelementer i alle søyler hvis og bare hvis alle pivotelementene star padiagonalen, og det er det samme som at den kan radresuseres tiil In. !

Den neste setningen gir oss sammenhengen mellom løsningene av homo-gene og inhomogene ligninger. Har du studert differens- eller differensial-ligninger, vil du ha sett lignende resultater før. Indeksene p og h pa vektorenexp og xh star for henholdsvis partikulær og homogen.

Setning 4.4.4 Anta xp er en løsning av matriseligningen Ax = b. De and-re løsningene er da vektorene pa formen

x = xp + xh

der xh er en løsning av den homogene ligningen Ax = 0.

Bevis: Anta først at x = xp + xh der xh er en løsning av den homogeneligningen. Da er

Ax = A(xp + xh) = Axp + Axh = b + 0 = b,

sa x er en løsning av ligningen.Anta sa at x er en løsning av Ax = b, og definer xh = x − xp. Da er

x = xp +xh, og alt vi behøver a vise, er at xh er en løsning av den homogeneligningen. Dette er bare et lite regnestykke:

Axh = A(x− xp) = Ax−Axp = b− b = 0

!

Setningen ovenfor forteller oss at dersom den inhomogene ligningen Ax = bhar løsninger, sa har den like mange løsninger som den homogene løsningenAx = 0.

Simultane løsninger av matriseligninger

Anta at vi ønsker a løse matriseligningen Ax = b for flere verdier av b, laoss si for b = b1, b = b2, . . . , b = bk. Vi ønsker med andre ord a løseligningene

Ax1 = b1, Ax2 = b2, . . . , Axk = bk

Page 139: Flervariabel analyse med lineær algebra

272 KAPITTEL 4. LINEÆR ALGEBRA I RN

Som nevnt tidligere er dette en problemstilling som ofte dukker opp i praksis.Den er mest aktuell nar ligningssystemene har entydig løsning, sa vi antarat A er en kvadratisk matrise som er radekvivalent med identitetsmatrisenIn (husk setning 4.4.2). For a løse ligningene er det naturlige a begynne meda radredusere den utvidede matrisen (A,b1) til den første matriseligningen.Hvis vi gjør dette helt til vi kommer til redusert trappeform, sitter vi igjenmed en matrise pa formen

C1 =

1 0 . . . 0 b11

0 1 . . . 0 b21...

... . . ....

...0 0 . . . 1 bn1

der b11, b21, . . . , bn1 er de tallene vi far nar vi bruker radoperasjonene pakomponentene til b1. Setter vi inn variablene, far vi ligningene

x1 = b11

x2 = b21

......

...xn = bn1

Den siste søylen i C1 gir oss altsa løsningen av den første matriseligningen.Hvis vi gjør det samme med den andre matriseligningen, far vi pa tilsvarendemate en matrise

C2 =

1 0 . . . 0 b12

0 1 . . . 0 b22...

... . . ....

...0 0 . . . 1 bn2

der b21, b22, . . . , bn2 er løsningen av den andre matriseligningen. Vi ser at vihar gjort nesten nøyaktig de samme operasjonene to ganger; i begge tilfellerhar vi radredusert A til idententitsmatrisen In, den eneste forskjellen er at vihar hatt forskjellige sistesøyler a arbeide med. Vi kan effektivisere arbeidetved a putte inn alle høyresidene b1,b2, . . . ,bk pa en gang. Vi starter altsamed matrisen

a11 a12 . . . a1n b11 b12 . . . b1k

a21 a22 . . . a2n b21 b22 . . . b2k...

... . . ....

...... . . .

...an1 an2 . . . ann bn1 bn2 . . . bnk

der

b1 =

b11

b21...

bn1

,b2 =

b12

b22...

bn2

, · · · ,bk =

b1k

b2k...

bnk

4.4. MATRISELIGNINGER 273

Omformer vi denne matrisen til redusert trappeform, sitter vi igjen med

C1 =

1 0 . . . 0 b11 b12 . . . b1k

0 1 . . . 0 b21 b22 . . . b2k...

... . . ....

...... . . .

...0 0 . . . 1 bn1 bn2 . . . bnk

Løsningene av ligningssystemene er altsa søylevektorene som star etter iden-titetsmatrisen.

La oss se pa et enkelt eksempel:

Eksempel 2: Vi skal løse ligningene

Ax1 = b1, Ax2 = b2, Ax3 = b3

derA =

(2 13 −1

)

og

b1 =(

12

),b2 =

(31

),b3 =

(21

)

Vi starter med den utvidede matrisen(

2 1 1 3 23 −1 2 1 1

)

og omdanner denne til redusert trappeform(

2 1 1 3 23 −1 2 1 1

)12 I∼

(1 1

212

32 1

3 −1 2 1 1

)

II+(−3)I∼(

1 12

12

32 1

0 −52

12 −7

2 −2

)− 2

5 II∼

(1 1

212

32 1

0 1 −15

75

45

)

I+(− 12 )II∼

(1 0 3

545

35

0 1 −15

75

45

)

Dette betyr at løsningene til de tre matriseligningene er henholdsvis

x1 =

(35

−15

),x2 =

(4575

),x3 =

(3545

)

Sjekk svarene ved a sette inn i ligningene! ♣

For store ligningssystemer (som er det man ofte støter pa i praksis) lønnerdet seg a bruke MATLAB til a foreta radreduksjonen.

Page 140: Flervariabel analyse med lineær algebra

274 KAPITTEL 4. LINEÆR ALGEBRA I RN

Oppgaver til seksjon 4.4

1. Finn alle løsningene av matriseligning Ax = b nar:

a) A =(

2 11 1

), b =

(2

−1

)

b) A =

1 1 1

−1 2 −12 −2 1

, b =

220

c) A =

2 1 −1 21 1 −1 2

−1 1 2 1

, b =

3

−1−2

d) A =

1 −2 32 −1 31 0 1

, b =

10

−2

2. Løs ligningene Ax1 = b1 og Ax2 = b2 nar A =(

3 1−1 2

), b1 =

(1

−2

),

b2 =(−1

4

)

3. Løs ligningene Ax1 = b1 og Ax2 = b2 nar A =

−2 1 3

1 2 −10 2 1

, b1 =

10

−1

, b2 =

221

4. (Eksamen i MAT 1110, 13/6 2005, litt tilpasset)

a) Bring matrisen pa trappeform:

A =

0 1 2 01 0 −1 16 0 −6 72 1 0 0

b) La

b =

01h0

Avgjør for hvilke verdier av h ligningen Ax = b har løsninger, og finnløsningene nar de finnes.

5. (Eksamen i MAT 1110, 14/6 2006, litt tilpasset) I denne oppgaven er C matrisen

C =

1 0 1 12 1 a2 − a 3

−1 1 −3 a

der a er et reelt tall.

4.5. INVERSE MATRISER 275

a) Reduser C til trappeform.

b) Vi lar A =

1 0 12 1 a2 − a

−1 1 −3

og b =

13a

. For hvilke verdier av a har

ligningssystemet Ax = b henholdsvis en, ingen og uendelig mange løsninger?

6. (Prøveeksamen i MAT 1110, varen 2006) I denne oppgaven er C matrisen

C =

1 1 −1 02 −1 −5 3

−1 2 a2 + 3a −3a

der a er et reelt tall.

a) Reduser C til trappeform.

b) Vi lar A =

1 1 −12 −1 −5

−1 2 a2 + 3a

og b =

03−3a

. For hvilke verdier

av a har ligningssystemet Ax = b henholdsvis en, ingen og uendelig mangeløsninger?

4.5 Inverse matriser

Husk at hvis A er en n × n-matrise, sa er A−1 den inverse matrisen til Adersom

AA−1 = In og A−1A = In (4.5.1)

I seksjon 1.7 viste vi at en kvadratisk matrise kan ha høyst en invers matrise,og at det finnes mange matriser som ikke har en invers. Hittil har vi imid-lertid ikke hatt effektive metoder til a finne ut om en matrise er inverterbar,eller til a regne ut den inverse matrisen nar den finnes. I denne seksjonenskal vi bruke teorien for matriseligninger til a finne slike metoder.

Det er ikke sa rart at det er en nær sammenheng mellom matriseligningerog inverse matriser. Dersom matrisen A er inverterbar, kan vi nemlig løsematriseligningen Ax = b ved a gange med den inverse A−1 pa begge sider. Vifar da A−1(Ax) = A−1b som kan forenkles til x = A−1b siden A−1(Ax) =(A−1A)x = Inx = x. Dette betyr at dersom A er inverterbar, har ligningenAx = b en entydig løsning x = A−1b. Vi kan med andre ord ikke regne med afinne en invers matrise med mindre ligningen Ax = b har en entydig løsningfor alle b, dvs. med mindre A er radekvivalent med identitetsmatrisen In

(husk setning 4.4.2). Et av de teoretiske resultatene i denne seksjonen er atvi faktisk har en fullstendig korrespondanse her — en kvadratisk matrise erinverterbar hvis og bare hvis den er er radekvivalent med identitetsmatrisen(se setning 4.5.4). Det viser seg at beviset for dette resultatet leder oss tilen effektiv mate a finne inverse matriser pa, men før vi kommer sa langt, erdet noen teoretiske spørsmal vi ma rydde opp i.

Page 141: Flervariabel analyse med lineær algebra

276 KAPITTEL 4. LINEÆR ALGEBRA I RN

Det første vi skal vise er at en ensidig invers ogsa er en tosidig invers— det vil si at hvis en matrise tilfredsstiller en av betingelsene i (4.5.1), satilfredsstiller den automatisk den andre. Vi begynner med to hjelpesetninger.

Lemma 4.5.1 Anta at B og C er to m × n-matriser slik at Bx = Cx foralle x ∈ Rn. Da er B = C.

Bevis: Det er nok a vise at dersom B #= C, sa finnes det en vektor x slik atBx #= Cx. Det er ikke sa vanskelig: Siden B #= C, finnes det minst ett parav indekser i, j slik at bij #= cij . Velger vi x = ej , ser vi at Bx #= Cx sidende i-te komponentene til de to vektorene er henholdsvis bij og cij . !

I den neste hjelpesetningen far vi bruk for vare resultater fra forrigeseksjon.

Lemma 4.5.2 La A være en n× n-matrise og anta at det finnes en n× n-matrise B slik at AB = In (B er altsa en høyreinvers til A). Da har matrise-ligningen Ax = c en entydig løsning for alle c ∈ Rn. Søylene b1,b2, . . . ,bn

til B er løsningene til ligningene Ax = e1, Ax = e2, . . . , Ax = en.

Bevis: La bj være den j-te søylen i B. Da er Abj = ej (dette skyldes at nardu regner ut Abj gjør du akkurat det samme som nar du regner ut den j-tesøylen i AB, og den j-te søylen i AB er ej siden AB = In) . Dette betyr atbj er en løsning av ligningen Ax = ej .

For a vise at ligningen Ax = c har en løsning for alle c ∈ Rn, observerervi først at enhver c kan skrives som en lineærkombinasjon av e1, e2, . . . , en.Vi har:

c =

c1

c2...

cn

= c1

10...0

+ c2

01...0

+ · · · + cn

00...1

=

= c1e1 + c2e2 + · · · + cnen

Hvis vi na lar x = c1b1+c2b2+· · ·+cnbn (der b1, b2,. . . ,bn er som ovenfor),far vi

Ax = A(c1b1 + c2b2 + · · · + cnbn) = c1Ab1 + c2Ab2 + · · · + cnAbn =

= c1e1 + c2e2 + · · · + cnen = c

Dette viser at ligningen Ax = c har en løsning for alle c, og det gjenstar avise at denne løsningen er entydig.

Her kobler vi inn teorien fra forrige seksjon. Vi tenker oss først at vi bru-ker radoperasjoner til a redusere A til en trappematrise D. Siden ligningen

4.5. INVERSE MATRISER 277

Ax = c har en løsning for alle c, forteller setning 4.4.2 oss at D har et pivot-element i hver rad. Siden D er kvadratisk, ma D da ogsa ha et pivotelementi hver søyle (ellers er det ikke plass til et pivotelement i hver rad), og ifølgesetning 4.4.2 er da løsningen av Ax = c entydig. !

Vi kan na vise at en ensidig invers er en tosidig invers.

Setning 4.5.3 Anta at A og B er to n× n-matriser. Dersom

AB = In,

sa er A og B inverterbare, og A−1 = B, B−1 = A

Bevis: Det nok a vise at BA = In siden vi da har bade AB = In og BA = In.Ifølge lemma 4.5.1 holder det a vise at

(BA)x = Inx = x

for alle x ∈ Rn. Lar vi y = (BA)x, er det altsa nok a vise at y = x. Bruker viden assosiative lov for matrisemultiplikasjon (setning 1.6.2(i)) flere ganger,ser vi at

Ay = A((BA)x) = A(B(Ax)) = (AB)(Ax) = In(Ax) = Ax

Setter vi b = Ax, har vi dermed bade

Ax = b og Ay = b

Siden ligningen Ax = b ifølge lemma 4.5.2 har en entydig løsning, betyrdette at x = y, og dermed er setningen bevist. !

Det neste resultatet gir var annonserte beskrivelse av nar en matrise erinverterbar.

Setning 4.5.4 En n×n-matrise A er inverterbar hvis og bare hvis matrise-ligningen Ax = c har en entydig løsning for alle vektorer c ∈ Rn, det vil sihvis og bare hvis A er radekvivalent med identitetsmatrisen In.

Bevis: Vi vet fra setning 4.4.2 at ligningen Ax = c har en entydig løsningfor alle c hvis og bare hvis A er radekvivalent med identitetsmatrisen. Deter derfor nok a vise at A er inverterbar hvis og bare hvis Ax = c har entydigløsning for alle c.

Fra setningen 4.5.2 vet vi at dersom A er inverterbar, sa har ligningenAx = c entydig løsning for alle c. Anta omvendt at Ax = c har en entydigløsning for alle c, og la bj være løsningen av ligningen Ax = ej . Hvis B ermatrisen som har bj som j-te søyle, har vi dermed AB = In, og følgelig er

Page 142: Flervariabel analyse med lineær algebra

278 KAPITTEL 4. LINEÆR ALGEBRA I RN

A inverterbar ifølge setning 4.5.3. !

Legg merke til at dersom A er inverterbar, sa er løsningen til ligningenAx = c gitt ved

x = A−1c

(gang ligningen Ax = c fra venstre med A−1).

Eksempel 1: Vi skal undersøke om matrisen

A =

1 3 2

−1 0 10 3 3

er inverterbar. Radreduserer vi A, far vi:

A =

1 3 2

−1 0 10 3 3

II+I∼

1 3 20 3 30 3 3

III+(−1)II∼

1 3 20 3 30 0 0

13 II∼

1 3 20 1 10 0 0

Denne trappematrisen har ikke pivotelementer i siste rad og siste søyle, ogligningen Ax = b har derfor ikke en entydig løsning for alle b. Dermed vetvi at A ikke er inverterbar. ♣

En metode for a finne inverse matriser

Vi vet na at en matrise er inverterbar hvis og bare hvis den er radekvivalentmed identitetsmatrisen. Vi vet ogsa at for a finne den inverse matrisen tilA, er det nok a finne en matrise B slik at

AB = In

I tillegg vet vi at vi kan finne søylene b1,b2, . . .bn i B ved a løse ligningene

Ab1 = e1, Ab2 = e2, . . . , Abn = en

(husk lemma 4.5.2). Fra forrige seksjon vet vi hvordan vi løser slike lignings-sett — vi starter med matrisen

a11 a12 . . . a1n 1 0 . . . 0a21 a22 . . . a2n 0 1 . . . 0

...... . . .

......

... . . ....

an1 an2 . . . ann 0 0 . . . 1

4.5. INVERSE MATRISER 279

der vi har utvidet A med høyresidene i ligningene e1, e2, . . . , en, og omformerden til redusert trappeform:

C =

1 0 . . . 0 b11 b12 . . . b1n

0 1 . . . 0 b21 b22 . . . b2n...

... . . ....

...... . . .

...0 0 . . . 1 bn1 bn2 . . . bnn

Løsningene av matriseligningene er da søylene til høyre for identitetsmatri-sen:

b1 =

b11

b21...

bn1

,b2 =

b12

b22...

bn2

, . . . ,bn =

b1n

b2n...

bnn

og den inverse matrisen blir

A−1 = B =

b11 b12 · · · b1n

b21 b22 · · · b2n...

... · · ·...

bn1 bn2 · · · bnn

Vi kan oppsummere metoden slik: Dersom vi omformer matrisen (A, In)til redusert trappeform, far vi matrisen (In, A−1). La oss demonstrere me-toden pa et eksempel:

Eksempel 2: Vi skal bruke metoden til a invertere matrisen

A =

1 −1 12 −2 5

−2 1 0

Det første vi gjør er “a skjøte pa” A en identitetsmatrise slik at vi farmatrisen

(A, I3) =

1 −1 1 1 0 02 −2 5 0 1 0

−2 1 0 0 0 1

Vi skriver na denne matrisen pa redusert trappeform:

(A, I3) =

1 −1 1 1 0 02 −2 5 0 1 0

−2 1 0 0 0 1

II+(−2)I∼

1 −1 1 1 0 00 0 3 −2 1 0

−2 1 0 0 0 1

III+2I∼

1 −1 1 1 0 00 0 3 −2 1 00 −1 2 2 0 1

II↔III∼

1 −1 1 1 0 00 −1 2 2 0 10 0 3 −2 1 0

Page 143: Flervariabel analyse med lineær algebra

280 KAPITTEL 4. LINEÆR ALGEBRA I RN

(−1)II13 III∼

1 −1 1 1 0 00 1 −2 −2 0 −10 0 1 −2

313 0

I+(−1)IIIII+2III∼

1 −1 0 5

3 −13 0

0 1 0 −103

23 −1

0 0 1 −23

13 0

I+II∼

1 0 0 −5

313 −1

0 1 0 −103

23 −1

0 0 1 −23

13 0

= (I3, B)

Den første halvparten av denne matrisen er identitetsmatrisen, og den andrehalvparten er B = A−1. Vi har altsa

A−1 =

−5

313 −1

−103

23 −1

−23

13 0

Du bør sjekke at dette er riktig ved a utføre multiplikasjonen

1 −1 12 −2 5

−2 1 0

−5

313 −1

−103

23 −1

−23

13 0

Metoden fungerer ogsa i det tilfellet der A ikke er inverterbar. Da vilden reduserte trappeformen til (A, In) ikke begynne med identitetsmatrisenIn, og dette forteller oss at A ikke er inverterbar.

Inverse matriser i MATLAB

Dersom du har lastet inn en inverterbar matrise A i MATLAB, vil komman-doen

>> B=inv(A)

fa MATLAB til a regne ut den inverse matrisen og legge den inn i variabelenB. Dersom du ønsker a løse matriseligningen

Ax = b

kan du na gjøre det ved a skrive

>> x=Bb

(dette forutsetter selvfølgelig at du allerede har lastet inn b). Det er imid-lertid mer effektivt a bruke kommandoen

>> x=A\b

4.5. INVERSE MATRISER 281

Legg merke til at “brøkstreken” \ gar “gal vei” — det skyldes at man her“deler fra venstre” (det vil si at man gjør noe som tilsvarer a gange medA−1 fra venstre). Kommandoen

>> x=b/A

med “normal” brøkstrek, produserer løsningen til ligningen xA = b (i dettetilfellet ma x og b være radvektorer for at dimensjonene skal passe) fordivi her kan løse ligningssystemet ved a gange med A−1 fra høyre — dvs. videler fra høyre.

Vær oppmerksom pa at kommandoene ovenfor bare fungerer etter be-skrivelsen nar A er en inverterbar, kvadratisk matrise; vil du løse andre typerligningssystemer, ma du bruke teknikkene vi har sett pa tidligere i dette ka-pitlet. (Advarsel: Det kan hende at du far svar pa kommandoen >> x=A\bselv om matrisen A ikke er kvadratisk, men løsningen kan da ha en annentolkning — prøv >> help mldivide for mer informasjon).

Oppgaver til seksjon 4.5

1. Finn den inverse matrisen dersom den finnes:

a) A =(

1 23 −1

), b) B =

(2 −11 1

), c) C =

(1 −2

−3 6

)

2. Finn den inverse matrisen dersom den finnes:

a) A =

1 1 2

−1 1 12 3 3

b) B =

1 −2 32 4 04 16 −6

c) C =

0 2 3

−1 1 12 0 3

d) D =

−2 3 1

0 2 11 −1 2

3. Bruk MATLAB til a finne den inverse matrisen dersom den finnes:

a) A =

1 −2 3 −12 3 −1 30 −1 2 −2

−2 2 −1 3

, b) B =

0.1 2.5 1.3 1.10.2 3.3 1.1 0.31.2 −1.2 2.4 −3.2

−2.2 0.2 −1.1 0.2

c) C =

1.1 −2.3 4.3 −0.05 13.4 0.7 −1 3.2 4.1

3 −1.2 4.2 −3.3 0.2−2 2.3 3.1 1.3 2.2

−2.3 3 2.8 1.2 −1.1

4. Bruk MATLAB-kommandoen >> x=A\b til a løse matriseligningen Ax = b nar:

a) A =

2 −1 30 −1 2

−4 3 1

, b =

−1

23

Page 144: Flervariabel analyse med lineær algebra

282 KAPITTEL 4. LINEÆR ALGEBRA I RN

b) A =

3 2 −1 31 −1 −1 −12 −1 2 −32 −2 1 0

, b =

4−3

01

5. Bruk MATLAB-kommandoen >> x=b/A til a løse matriseligningen xA = b nar:

a) A =

2 −1 30 −1 2

−4 3 1

, b = (−1, 2, 3)

b) A =

3 2 −1 31 −1 −1 −12 −1 2 −32 −2 1 0

, b = (4,−3, 0, 1) Sammenlign med svarene pa opp-

gave 4.

6. (Eksamen i MAT1110, 14/6 2004, litt tilpasset)

a) Finn den inverse matrisen til

B =

1 2 00 1 10 −2 1

b) Bruk resultatet i a) til a løse ligningssystemet

x + 2y = 5y + z = 3

−2y + z = 3

c) For hvilke verdier av a og b har ligningssystemet

x + 2y = 5y + z = 3

−2y + (a + 1)z = b2 − 10

henholdsvis en, ingen og uendelig mange løsninger?

7. Anta at A er en inverterbar n× n-matrise, og at b er en radvektor med n kom-ponenter. Vis at x = bA−1 er den entydige løsningen til ligningen xA = b.

8. Anta at A er en inverterbar n × n-matrise og at B er en inverterbar m × m-matrise. Lag en (n+m)×(n+m)–matrise C ved a sette inn A i øvre venstre hjørne,B i nedre høyre hjørne og sa fylle ut med nuller. Symbolsk skriver vi:

C =(

A 00 B

)

Vis at C er inverterbar og at

C−1 =(

A−1 00 B−1

)

4.6. LINEÆRKOMBINASJONER OG BASISER 283

9. Figuren nedenfor viser et elektrisk nettverk. Man kan regulere spenningen i deytre punktene A, B og C, men spenningen i de indre punktene X, Y og Z er alltidgjennomsnittet av spenningen i nabopunktene.

UUU

KKK! ! !!!

!A B

C

Z

X Y

a) La a, b, c, x, y, z være spenningen i henholdsvis A, B, C, X, Y og Z. Vis atdersom

b =

abc

og x =

xyz

sa er Ax = b der

A =

3 −1 −1

−1 3 −1−1 −1 3

b) Finn A−1.

c) Finn x, y og z nar a = 1, b = 2 og c = 3.

d) Hvordan skal du velge de ytre spenningene a, b og c for a fa x = 1, y = 2,z = 3?

4.6 Lineærkombinasjoner og basiser

Anta at vi har n vektorer a1,a2, . . . ,an i Rm. En vektor b ∈ Rm kalles enlineærkombinasjon av a1,a2, . . . ,an dersom det finnes tall x1, x2, . . . , xn ∈ Rslik at

x1a1 + x2a2 + · · · + xnan = b (4.6.1)

Vi kan tenke pa dette som en ligning der a1,a2, . . . ,an og b er gitt, og dervi ønsker a finne x1, x2, . . . , xn.

I lineær algebra er det svært viktig a vite nar en vektor b kan skrivessom en lineærkombinasjon av en utgangsmengde a1,a2, . . . ,an, og pa hvormange mater dette kan gjøres. Det viser seg at dette bare er en ny vri pa despørsmalene vi allerede har studert i dette kapitlet. For a se dette skriver vivektorene pa komponentform pa følgende mate:

a1 =

a11

a21...

am1

,a2 =

a12

a22...

am2

, . . . ,an =

a1n

a2n...

amn

Page 145: Flervariabel analyse med lineær algebra

284 KAPITTEL 4. LINEÆR ALGEBRA I RN

og

b =

b1

b2...

bm

Ligning (4.6.1) kan na skrives

x1

a11

a21...

am1

+ x2

a12

a22...

am2

+ · · · + xn

a1n

a2n...

amn

=

b1

b2...

bm

og trekker vi sammen venstresiden, far vi

a11x1 + a12x2 + · · · + a1nxn

a21x1 + a22x2 + · · · + a2nxn...

am1x1 + am2x2 + · · · + amnxn

=

b1

b2...

bm

Det a finne en lineærkombinasjon av typen (4.6.1) er altsa det samme soma løse ligningssystemet

a11x1 + a12x2 + · · · + a1nxn = b1

a21x1 + a22x2 + · · · + a2nxn = b2

......

......

......

......

am1x1 + am2x2 + · · · + amnxn = bm

Uttrykt ved hjelp av matriseligninger betyr dette at b er en lineærkom-binasjon av a1,a2, . . . ,an hvis og bare hvis matriseligningen Ax = b (dermatrisen A har vektorene a1,a2, . . . ,an som søyler) har en løsning.

Eksempel 1: Skriv

b =

130

som en lineærkombinasjon av

a1 =

3

−12

og a2 =

714

Vi ma altsa finne tall x1, x2 (hvis mulig!) slik at

x1

3

−12

+ x2

714

=

130

4.6. LINEÆRKOMBINASJONER OG BASISER 285

Det tilsvarende ligningssystemet er

3x1 + 7x2 = 1−x1 + x2 = 32x1 + 4x2 = 0

med utvidet matrise

3 7 1

−1 1 32 4 0

Vi radreduserer pa vanlig mate

3 7 1

−1 1 32 4 0

I↔II∼

−1 1 3

3 7 12 4 0

II+3I

III+2I∼

−1 1 3

0 10 100 6 6

110 II16 III∼

−1 1 3

0 1 10 1 1

III+(−1)II∼

−1 1 3

0 1 10 0 0

(−1)I∼

1 −1 −30 1 10 0 0

Vi gar tilbake til ligningene

x1 − x2 = −3x2 = 10 = 0

som gir x2 = 1 og x1 = −3 + x2 = −2. !

Vi legger merke til at vi hadde litt “flaks” i eksemplet ovenfor i og medat vi fikk 0 = 0 i den siste ligningen. Det gjenspeiler at en vektor i R3

vanligvis ikke kan skrives som en lineærkombinasjon av to gitte vektorer —vi trenger faktisk litt flaks for a fa det til! Vi skal na se nærmere pa nar envektor kan skrives som lineærkombinasjoner av andre vektorer — med elleruten “flaks”.

Setning 4.6.1 Anta at

a1 =

a11

a21...

am1

,a2 =

a12

a22...

am2

, . . . ,an =

a1n

a2n...

amn

,b =

b1

b2...

bm

er vektorer i Rm. For a undersøke om b kan skrives som en lineærkombi-nasjon av a1,a2, . . . ,an, radreduserer vi matrisen

a11 a12 . . . a1n b1

a21 a2 . . . a2n b2...

... . . ....

...am1 am2 . . . amn bm

Page 146: Flervariabel analyse med lineær algebra

286 KAPITTEL 4. LINEÆR ALGEBRA I RN

til en trappematrise C. Da gjelder

(i) Dersom den siste søylen i C er en pivotsøyle, er b ikke en lineærkom-binasjon av a1,a2, . . . ,an.

Dersom den siste søylen i C ikke er en pivotsøyle, har vi videre:

(ii) Dersom alle de andre søylene i C er pivotsøyler, kan b skrives som enlineærkombinasjon av a1,a2, . . . ,an pa nøyaktig en mate.

(iii) Dersom minst en av de andre søylene i C ikke er en pivotsøyle, kan bskrives som en lineærkombinasjon av a1,a2, . . . ,an pa uendelig mangemater.

Bevis: Dette er bare en omformulering av setning 4.2.4. !

Et viktig spørsmal er nar alle vektorer b i Rn kan skrives som en li-neærkombinasjon av en gitt samling vektorer a1,a2, . . . ,am. Dette er bareen omformulering av setning 4.2.6.

Setning 4.6.2 Anta at

a1 =

a11

a21...

am1

,a2 =

a12

a22...

am2

, . . . ,an =

a1n

a2n...

amn

er vektorer i Rm, og at matrisen

a11 a12 . . . a1n

a21 a2 . . . a2n...

... . . ....

am1 am2 . . . amn

kan radreduseres til trappematrisen C. Da kan enhver vektor b i Rm skrivessom en lineærkombinasjon av a1,a2, . . . ,an hvis og bare hvis alle radene iC inneholder et pivotelement.

Bevis: Som allerede nevnt er dette bare en omskrivning av setning 4.2.6. !

Anta at vi har en samling vektorer a1,a2, . . . ,an i Rm. Med spennet

Sp(a1,a2, . . . ,an)

til a1,a2, . . . ,an mener vi mengden av alle vektorer b ∈ Rm som kan skri-ves som en lineærkombinasjon av a1,a2, . . . ,an. Setning 4.6.1 forteller osshvordan vi kan sjekke om en spesiell vektor b hører til Sp(a1,a2, . . . ,an),

4.6. LINEÆRKOMBINASJONER OG BASISER 287

mens setning 4.6.2 forteller oss hvordan vi kan sjekke om alle vektorer i Rm

hører til Sp(a1,a2, . . . ,an). I det siste tilfellet er Sp(a1,a2, . . . ,an) = Rm ogvi sier at a1,a2, . . . ,an utspenner hele Rm. Setningen ovenfor har en viktigkonsekvens:

Korollar 4.6.3 Dersom a1,a2, . . . ,an utspenner hele Rm, er n ≥ m.

Bevis: La A være matrisen med a1,a2, . . . ,an som søyler, og radreduser Atil trappematrisen C. Dersom vektorene a1,a2, . . . ,an utspenner hele Rm,ma C ha et pivotelement i hver rad, og det er det bare plass til om n ≥ m. !

Det er ikke sa vanskelig a fa en viss geometrisk forstaelse av korollaret iR3: Har du to vektorer a1,a2 ∈ R3, vil alle lineærkombinasjoner av a1 og a2

ligge i planet som gar gjennom punktene 0, a1 og a2. Du trenger en tredjevektor, som ikke ligger i dette planet, for a kunne skrive enhver vektor i R3

som en lineærkombinasjon.

Lineær uavhengighet

Vi skal være spesielt interessert i situasjoner der elementene i

Sp(a1,a2, . . . ,an)

kan skrives som lineærkombinasjoner av a1,a2, . . . ,an pa en entydig mate,dvs. at det for hver b ∈ Sp(a1,a2, . . . ,an) finnes nøyaktig ett sett av tallx1, x2, . . . , xn slik at b = x1a1 + x2a2 + · · · + xnan.

Definisjon 4.6.4 Vi sier at vektorene a1,a2, . . . ,an ∈ Rm er lineært uav-hengige dersom hver b ∈ Sp(a1,a2, . . . ,an) kan skrives som en lineærkombi-nasjon av a1,a2, . . . ,an pa en entydig mate. Hvis vektorene a1,a2, . . . ,an ∈Rm ikke er lineært uavhengige, sier vi at de er lineært avhengige.

Det er ofte nyttig a formulere lineær uavhengighet pa en annen mate:

Setning 4.6.5 Vektorene a1,a2, . . . ,an ∈ Rm er lineært uavhengig hvis ogbare hvis følgende betingelse er oppfylt:

En lineærkombinasjon x1a1 + x2a2 + · · · + xnan av a1,a2, . . . ,an erbare lik 0 dersom alle koeffisientene x1, x2, . . . , xn er lik 0.

Bevis: Anta først at a1,a2, . . . ,an er linært uavhengige. Vi kan opplagt skrive0 som lineærkombinasjonen

0 = 0a1 + 0a2 + · · · + 0an

Siden lineærkombinasjoner av lineært uavhengige vektorer er entydige, betyrdette at hvis

0 = x1a1 + x2a2 + . . . + xnan

Page 147: Flervariabel analyse med lineær algebra

288 KAPITTEL 4. LINEÆR ALGEBRA I RN

sa er x1 = 0, x2 = 0, . . . , xn = 0.Anta sa at a1,a2, . . . ,an ikke er linært uavhengige. Da ma det finnes en

vektor b som kan skrives som en lineærkombinasjon pa to forskjellige mater:

b = y1a1 + y2a2 + · · · + ynan

b = z1a1 + z2a2 + · · · + znan

Trekker vi disse to ligningene fra hverandre, far vi

0 = (y1 − z1)a1 + (y2 − z2)a2 + · · · + (yn − zn)an

Velger vi x1 = y1 − z1, x2 = y2 − z2, . . . , xn = yn − zn, ma minst en av dissexi-ene være forskjellig fra 0 (siden de to lineærkombinasjonene ovenfor erforskjellige), og vi ser dermed at

0 = x1a1 + x2a2 + . . . + xnan

er oppfylt uten at alle x1, x2, . . . , xn er lik null . !

Vare gamle resultater kan na brukes til a sjekke om vektorer er lineærtuavhengige:

Setning 4.6.6 Anta at

a1 =

a11

a21...

am1

,a2 =

a12

a22...

am2

, . . . ,an =

a1n

a2n...

amn

er vektorer i Rm, og at matrisen

a11 a12 . . . a1n

a21 a2 . . . a2n...

... . . ....

am1 am2 . . . amn

kan radreduseres til trappematrisen C. Da er a1,a2, . . . ,an lineært uavhen-gige hvis og bare hvis alle søylene i C er pivotsøyler.

Bevis: Fra forrige setning vet vi at a1,a2, . . . ,an er lineært uavhengige hvisog bare hvis ligningen

x1a1 + x2a2 + · · · + xnan = 0 (4.6.2)

4.6. LINEÆRKOMBINASJONER OG BASISER 289

har en entydig løsning x1 = x2 = . . . = xn = 0. Den utvidede matrisen tildenne ligningen er

a11 a12 . . . a1n 0a21 a22 . . . a2n 0

...... . . .

......

an1 an2 . . . ann 0

Radreduserer vi denne matrisen til trappeform, vil den siste søylen fortsattbesta av nuller, mens resten av matrisen vil være lik C. Vi ser dermed at(4.6.2) har en entydig løsning hvis og bare hvis alle søylene i C er pivotsøyler.

!

Eksempel 2: Vi skal undersøke om vektorene

a1 =

13

−14

,a2 =

230

−4

og a3 =

−33

−2−1

er lineært uavhengige. Først organiserer vi vektorene som en matrise

A =

1 2 −33 3 3

−1 0 −24 −4 −1

Putter vi denne inn i MATLAB og kjører rref, ser vi at den redusertetrappeformen til A er

1 0 00 1 00 0 10 0 0

Siden denne matrisen bare har pivotsøyler, er vektorene vare lineært uav-hengige. ♣

Før vi gar videre, tar vi med en viktig konsekvens av setningen ovenfor.

Korollar 4.6.7 En lineært uavhengig mengde i Rm har m eller færre ele-menter.

Bevis: Anta at a1,a2, . . . ,an er vektorer i Rm, og la A være matrisen meddisse vektorene som søyler. Reduser A til en trappematrise C. Skal vektore-ne a1,a2, . . . ,an være lineært uavhengige, ma C ha et pivotelement i hversøyle, og det er det bare plass til hvis n ≤ m. !

Page 148: Flervariabel analyse med lineær algebra

290 KAPITTEL 4. LINEÆR ALGEBRA I RN

Anta na at vi har en samling vektorer a1,a2, . . . ,an som utspennerSp(a1,a2, . . . ,an). Vektorene a1,a2, . . . ,an vil vanligvis ikke være lineærtuavhengige, og for noen formal er det en stor ulempe. Det neste resultatetviser at det alltid er mulig a plukke ut noen av vektorene a1,a2, . . . ,an slikat vi far en lineært uavhengig mengde som utspenner hele Sp(a1,a2, . . . ,an).

Setning 4.6.8 Anta at a1,a2, . . . ,an er en samling ikke-null vektorer i Rm.Da er det mulig a finne en lineært uavhengig delmengde ai1 ,ai2 , . . . ,aik ava1,a2, . . . ,an slik at

Sp(ai1 ,ai2 , . . . ,aik) = Sp(a1,a2, . . . ,an)

Bevis: Vi organiserer først de opprinnelige vektorene som en matrise

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

am1 am2 · · · amn

og radreduserer denne til vi far en matrise C pa trappeform. Vi fjerner sa desøylene i C som ikke er pivotsøyler, og star da igjen med en matrise C ′ deralle søylene er pivotsøyler. Vi gar tilbake til A og fjerner de samme søyleneder som vi fjernet i C. Dette gir oss en matrise A′ som inneholder noen avsøylene i A. Vi ser at vi kan radredusere A′ til C ′ ved a bruke de sammeradoperasjonene som reduserte A til C. Dette betyr at A′ er radekvivalentmed en trappematrise med bare pivotsøyler, og følgelig er søylene i A′ lineærtuavhengige.

For a fullføre beviset ma vi vise at enhver vektor b som er en lineær-kombinasjon av søylene i A, ogsa er en lineærkombinasjon av søylene i A′.Hvis vi radreduserer den utvidede matrisen (A,b) ved a bruke de sammeoperasjonene som ovenfor, vet vi fra setning 4.6.1 at den siste søylen ikke eren pivotsøyle. Dersom vi isteden radreduserer (A′,b) ved a bruke de sam-me operasjonene, vil heller ikke na den siste søylen være en pivotsøyle (detskyldes at vi ikke “mister” noen pivotelementer nar vi bytter ut A med A′).Ifølge setning 4.6.1 er da b en lineærkombinasjon av søylene i A′. !

Legg merke til at beviset ovenfor inneholder en metode for hvordan manfinner de lineært uavhengige elementene ai1 ,ai2 , . . . ,aik ; man organiserer deopprinnelige vektorene som en matrise A, radreduserer denne til trappeform,og plukker ut de søylene i A som korresponderer til pivotsøyler i trappefor-men.

4.6. LINEÆRKOMBINASJONER OG BASISER 291

Eksempel 3: La

a1 =

12

−1−1

0

,a2 =

−20213

,a3 =

32

−3−2−3

,a4 =

4−1

022

Vi skal finne en lineært uavhengig delmengde som utspenner Sp(a1,a2,a3,a4).Bruker vi MATLAB, far vi

A=[1 -2 3 42 0 2 -1-1 2 -3 0-1 1 -2 20 3 -3 2];

>>C=rref(B)

C =

1 0 1 00 1 -1 00 0 0 10 0 0 00 0 0 0

Vi ser at den første, andre og fjerde søylen er pivotsøyler. Mengden vi er pajakt etter er da de tilsvarende søylene i A, nemlig

a1 =

12

−1−1

0

,a2 =

−20213

,a4 =

4−1

022

!

Basiser

Basis er kanskje det viktigste begrepet i lineær algebra. Basiser brukes tilsa mangt, men i dette kapitlet skal vi hovedsakelig benytte dem til a studereegenverdier og egenvektorer. Før vi kommer sa langt, trenger vi en kortinnføring i noen grunnleggende egenskaper. Vi begynner med definisjonen:

Page 149: Flervariabel analyse med lineær algebra

292 KAPITTEL 4. LINEÆR ALGEBRA I RN

Definisjon 4.6.9 En basis for Rm er en lineært uavhengig mengde vektorera1,a2, . . . ,an som utspenner hele Rm, dvs. at Sp(a1,a2, . . . ,an) = Rm.

Det er lett a se at enhver basis for Rm ma ha nøyaktig m elementer —korollar 4.6.3 forteller oss nemlig at en mengde som utspenner hele Rm maha minst m elementer, mens korollar 4.6.7 forteller oss at ingen lineærtuavhengig mengde i Rm kan ha flere enn m elementer.

Den enkleste basisen er den som bestar av enhetsvektorene

e1 =

10...0

, e2 =

01...0

, . . . , em =

00...1

Dette kalles ofte standardbasisen i Rm.La A være matrisen med vektorene a1,a2, . . . ,am ∈ Rm som søyler. Da

er a1,a2, . . . ,am ∈ R en basis for Rm hvis og bare hvis matriseligningenAx = b har en entydig løsning for alle b — vektoren

x =

x1

x2...

xm

er nemlig en løsning av matriseligningen hvis og bare hvis

x1a1 + x2a2 + . . . + xmam = b

Det neste resultatet gjør det lett a sjekke om en samling vektorer er enbasis.

Setning 4.6.10 Anta at a1,a2, . . . ,am er vektorer i Rm, og la A være m×m-matrisene med disse vektorene som søyler. Da er a1,a2, . . . ,am en basisfor Rm hvis og bare hvis A er radekvivalent med identitetsmatrisen Im.

Bevis: Vi har allerede observert at a1,a2, . . . ,am er en basis hvis og barehvis matriseligningen Ax = b har en entydig løsning for alle b. Ifølge setning4.4.2 er dette ekvivalent med at A er radekvivalent med Im. !

Setningen ovenfor har noen konsekvenser som ofte er nyttige i mer teore-tisk arbeid.

Korollar 4.6.11 Anta at a1,a2, . . . ,am er m vektorer i Rm. Dersom vek-torene enten er lineært uavhengige eller utspenner hele Rm, sa danner deen basis.

4.6. LINEÆRKOMBINASJONER OG BASISER 293

Bevis: La A være matrisen med a1,a2, . . . ,am som søyler, og la D være denreduserte trappeformen til A. Dersom vektorene er lineært uavhengige, eralle søylene i D pivotsøyler. Siden D er kvadratisk, er det bare plass til detteom alle pivotelementene star pa diagonalen, dvs. hvis D = Im. Men da era1,a2, . . . ,am en basis ifølge setningen ovenfor.

Dersom vektorene a1,a2, . . . ,am utspenner hele Rm ma alle rader i Dinneholder pivotelementer. Siden D er kvadratisk er det bare plass til det-te om alle pivotelementene star pa diagonalen. Men dermed er D = Im oga1,a2, . . . ,am en basis ifølge setningen ovenfor. !

Det neste resultatet gjør det enda lettere a finne basiser — det fortelleross at enhver lineært uavhengig mengde kan utvides til en basis:

Setning 4.6.12 Anta at a1,a2, . . . ,an er en lineært uavhengig mengde avvektorer i Rm. Da finnes det vektorer an+1, an+2 ,. . . , am slik at a1, a2,. . . , an, an+1, . . . , am er en basis for Rm.

Bevis: La A være matrisen med a1,a2, . . . ,an som søyler, og radreduser Atil en trappematrise C. Siden vektorene a1,a2, . . . ,an er lineært uavhengige,er alle søyler i C pivotsøyler. Det betyr at pivotelementene starter øverst ivenstre hjørne av matrisen og fortsetter nedover diagonalen inntil de trefferhøyre kant av matrisen. Utvid C til en kvadratisk matrise C ′ ved a skjøte paflere søyler med pivotelementer pa diagonalen. Reverser de radoperasjonenesom forvandlet A til C, og bruk dem til a forvandle C ′ til en matrise A′. Daer A′ en utvidelse av A (det er kommet til nye søyler bakerst), og søylene iA′ er lineært uavhengige siden A′ er radekvivalent med en matrise C ′ sombare har pivotsøyler. !

Beviset ovenfor blir lettere a forsta hvis vi gjennomfører prosedyren paet eksempel:

Eksempel 4: Vi skal utvide mengden

a1 =

−1−3

21

,a2 =

21

−23

til en basis for R4. Vi begynner med a radredusere matrisen som har a1 oga2 som søyler:

A =

−1 2−3 1

2 −21 3

II+(−3)I∼

−1 20 −52 −21 3

III+2I∼

−1 20 −50 21 3

IV +I∼

Page 150: Flervariabel analyse med lineær algebra

294 KAPITTEL 4. LINEÆR ALGEBRA I RN

IV +I∼

−1 20 −50 20 5

III+ 2

5 II∼

−1 20 −50 00 5

IV +II∼

−1 20 −50 00 0

= C

Vi har na fatt matrisen pa sa god trappeform som vi trenger (for a faskikkelig trappeform bør vi gjøre om “pivotelementene” −1 og −5 til 1’ere,men det fører bare til dobbeltarbeid i dette tilfellet). Nest skritt er a skjøtepa C slik at vi far en diagonalmatrise med pivotelementer pa diagonalen:

C ′ =

−1 2 0 00 −5 0 00 0 1 00 0 0 1

Til slutt bruker vi radoperasjonene ovenfor baklengs:

C ′ =

−1 2 0 00 −5 0 00 0 1 00 0 0 1

IV−II∼

−1 2 0 00 −5 0 00 0 1 00 5 0 1

III− 25 II∼

−1 2 0 00 −5 0 00 2 1 00 5 0 1

IV−I∼

−1 2 0 00 −5 0 00 2 1 01 3 0 1

III−2I∼

−1 2 0 00 −5 0 02 −2 1 01 3 0 1

II+3I∼

−1 2 0 0−3 1 0 0

2 −2 1 01 3 0 1

= A′

Dette viser at

a1 =

−1−3

21

,a2 =

21

−23

,a3 =

0010

,a4 =

0001

er en basis. ♣

Bemerkning: Det kan virke pa eksemplet ovenfor som om den siste delenav prosessen (nemlig a ga tilbake fra C ′ til A′) er unødvendig siden de sisteto søylene ikke endrer seg. Dette skyldes at vi ikke har noe radombytte blantoperasjonene vare — med en gang et slikt ombytte dukker opp, risikerer via matte gjøre endringer i de siste to søylene. La oss legge til at det er mangeandre metoder man kan bruke for a utvide en lineært uavhengig mengde tilen basis, og at metoden ovenfor slett ikke er den raskeste.

4.6. LINEÆRKOMBINASJONER OG BASISER 295

Basiser og lineæravbildninger

Det er ikke sa lett a se pa dette stadiet hvorfor basiser er sa viktige, menvi skal prøve a antyde det. Den aller viktigste grunnen er at basiser spilleren sentral rolle nar man skal studere lineæravbildninger. Husk (fra seksjon2.8) at en lineæravbildning fra Rn til Rm er en funksjon T : Rn → Rm somtilfredsstiller kravene:

(i) T(cx) = cT(x) for alle c ∈ R og alle x ∈ Rn

(ii) T(x + y) = T(x) + T(y) for alle x,y ∈ Rn

Ifølge setning 2.8.2 medfører disse kravene at

T(c1x1 + c2x2 + · · · + ckxk) = c1T(x1) + c2T(x2) + · · · + ckT(xk)

for alle c1, c2, . . . , ck ∈ R og alle x1,x2, . . . ,xk ∈ Rn.Anta na at v1,v2, . . . ,vn er en basis for Rn, og at T : Rn → Rm er

en lineæravbildning. Anta ogsa at vi kjenner hvordan T virker pa basis-vektorene v1,v2, . . . ,vn, la oss si at T(v1) = w1, T(v2) = w2, . . . , T(vn) =wn. Siden v1,v2, . . . ,vn er en basis, kan en hvilket som helst vektor x skrivessom en lineærkombinasjon

x = c1v1 + c2v2 + · · · + cnvn

av v1,v2, . . . ,vn. Bruker vi T pa dette uttrykket, far vi

T(x) = T(c1v1 + c2v2 + · · · + cnvn) =

c1T(v1) + c2T(v2) + · · · + cnT(vn) = c1w1 + c2w2 + · · · + cnwn

Dette betyr at dersom vi vet hvordan T virker pa elementene i en basis, savet vi ogsa hvordan den virker pa alle andre vektorer.

Vi kan snu problemstillingen ovenfor pa hodet. Anta at vi ikke har enlineæravbildning T, men at vi ønsker a definere er lineæravbildning T slikat T(v1) = w1, T(v2) = w2, . . . , T(vn) = wn (dette er en meget vanligproblemstilling i lineær algebra). Den neste setningen forteller oss at dettealltid er mulig:

Setning 4.6.13 Anta at v1,v2, . . . ,vn er en basis for Rn, og at w1, w2 ,. . . , wn er vektorer i Rm. Da finnes det nøyaktig en lineæravbildning T :Rn → Rm slik at T(v1) = w1, T(v2) = w2, . . . , T(vn) = wn.

Bevis: Argumentet ovenfor viser at det kan være høyst en slik lineæravbild-ning. For a vise at det virkelig finnes en, bruker vi at siden v1,v2, . . . ,vn eren basis, kan enhver vektor x ∈ Rn skrives som en lineærkombinasjon

x = x1v1 + x2v2 + · · · + xnvn

Page 151: Flervariabel analyse med lineær algebra

296 KAPITTEL 4. LINEÆR ALGEBRA I RN

pa nøyaktig en mate. Vi kan derfor definere en funksjon T : Rn → Rm ved

T(x) = x1w1 + x2w2 + · · · + xnwn

Siden vi apenbart har T(v1) = w1, T(v2) = w2, . . . , T(vn) = wn, er detnok a vise at T er en lineæravbildning, dvs. at den tilfredsstiller betingelsene(i) og (ii) ovenfor.

For a vise (i), observerer vi at hvis

x = x1v1 + x2v2 + · · · + xnvn

sa ercx = cx1v1 + cx2v2 + · · · + cxnvn

Dermed erT(cx) = cx1w1 + cx2w2 + · · · + cxnwn

Pa den annen side er

cT(x) = c(x1w1 + x2w2 + · · · + xnwn) =

= cx1w1 + cx2w2 + · · · + cxnwn

Dette viser at T(cx) = cT(x), sa betingelse (i) er oppfylt.For a vise at betingelse (ii) er oppfylt, begynner vi med to vektorer

x = x1v1 + x2v2 + · · · + xnvn

y = y1v1 + y2v2 + · · · + ynvn

Da er

x + y = (x1v1 + x2v2 + · · · + xnvn) + (y1v1 + y2v2 + · · · + ynvn) =

= (x1 + y1)v1 + (x2 + y2)v2 + . . . + (xn + yn)vn

og følgelig

T(x + y) = (x1 + y1)w1 + (x2 + y2)w2 + . . . + (xn + yn)wn

Pa den annen side er

T(x) = x1w1 + x2w2 + · · · + xnwn

ogT(y) = y1w1 + y2w2 + · · · + ynwn

Det betyr at T(x+y) = T(x)+T(y), og følgelig er betingelse (ii) oppfylt. !

Man kan lure pa hvorfor det er bruk for andre basiser i Rn enn stan-dardbasisen e1, e2, . . . , en. Svaret er ganske enkelt at i mange eksempler gir

4.6. LINEÆRKOMBINASJONER OG BASISER 297

andre basiser enklere regninger og mer informative svar — spesielt gjelderdette basiser som bestar av egenvektorer for den lineæravbildningen vi stu-derer. Husk at en egenvektor for en lineæravbildning T er en vektor v #= 0slik at T(v) = λv for et eller annet tall λ (λ kalles egenverdien til v). Egen-vektorer er spesielt nyttige nar vi skal studere gjentatt bruk av avbildningenT siden Tn(v) = λnv.

Anta na at vi har en basis v1,v2, . . . ,vn av egenvektorer for T medegenverdier λ1, λ2, . . . , λn. Enhver vektor x kan skrives som en lineærkom-binasjon

x = c1v1 + c2v2, . . . , cnvn

Bruker vi Tn pa dette uttrykket, far vi

Tn(x) = c1λn1v1 + c2λ

n2v1 + . . . + cnλn

nvn

Dersom en av egenverdiene (la oss si λ1) er større enn de andre i tallverdi,vil leddet den tilhører dominere over de andre nar n blir stor. Det betyr atstørrelsesordenen til Tn(x) vokser som λn

1 , og at fordelingen mellom kom-ponentene i vektoren Tn(x) blir mer og mer som fordelingen mellom kom-ponentene i v1. Som vi skal se senere, er informasjon av denne typen uhyreviktige nar man skal studere systemer som utvikler seg med tiden.

Det viser seg at de fleste (men ikke alle!) lineæravbildninger har en basisav egenvektorer. Senere i dette kapitlet skal vi lære mer om hvordan vi kanfinne egenverdier og egenvektorer.

Oppgaver til seksjon 4.6

1. Skriv b som en lineærkombinasjon av a1 og a2 nar a1 =(

1−2

), a2 =

(−4

2

)

og b =(−3

3

).

2. Skriv b som en lineærkombinasjon av a1, a2 og a3 nar a1 =

10

−1

, a2 =

121

, a3 =

3

−12

og b =

−2

51

.

3. Avgjør om alle vektorer i Rn (for relevant n) kan skrives som en lineærkombina-sjon av vektorene:

a) a1 =(−1

2

), a2 =

(34

)

b) a1 =

123

, a2 =

10

−1

, a3 =

147

Page 152: Flervariabel analyse med lineær algebra

298 KAPITTEL 4. LINEÆR ALGEBRA I RN

c) a1 =

2

−13

, a2 =

111

, a3 =

−6

07

.

4. Skriv

74

−31

som en lineærkombinasjon av

10

−12

,

213

−4

,

5−7

63

,

2−1

03

. Bruk gjerne MATLAB som hjelpemiddel.

5. Bruk MATLAB til a skrive

1.25

03

som en lineærkombinasjon av

0.750.3−1

2

,

40.1−2

0.25

,

−13

−40.2

,

4−1

32

.

6. Bruk MATLAB til a sjekke om enhver vektor i R4 kan skrives som en lineær-

kombinasjon av

1−2

32

,

0−3

41

,

2−7105

,

−13

−12

,

0210

.

7. Avgjør om vektorene er lineært uavhengige:

a)(

11

),(

34

)

b)(

21

),(

42

)

c)

1

−23

,

013

,

2

−39

d)

101

,

2

−13

,

−1

25

e)

1−4

32

,

2041

,

−12

−32

8. Finn en lineært uavhengig delmengde:

a)(

2−1

),(−4

2

),(

13

)

b)

13

−1

,

021

,

280

,

231

4.6. LINEÆRKOMBINASJONER OG BASISER 299

c)

41

−32

,

−2340

,

3−1

20

,

12

−52

9. Avgjør om mengden er en basis for det relevante rommet Rn (i noen av tilfellenelønner det seg a tenke før man regner!)

a)(

21

),(

13

),(−1

2

)

b)

213

,

412

c)(−1

1

),(

42

)

d)

−1

3−2

,

201

,

−1

32

10. Utvid mengden av vektorer til en basis for det relevante rommet Rn:

a)

12

−1

,

243

b)

1−1

00

,

2110

,

0101

11. I denne oppgaven er v1 =(

11

), v2 =

(1

−1

).

a) Vis at v1 og v2 danner en basis for R2.

b) Skriv e1 =(

10

)og e2 =

(01

)som lineærkombinasjoner av v1 og v2.

c) Forklar hvorfor det finnes nøyaktig en lineæravbildning T : R2 → R2 slik atT(v1) = 2v1 og T(v2) = −v2.

d) Finn matrisen A til lineæravbildningen T (dvs. 2 × 2-matrisen A slik atT(x) = Ax for alle x ∈ R2)

12. Anta at v1,v2, . . . ,vk er en mengde av ikke-null vektorer som star normalt pahverandre. Vis at v1,v2, . . . ,vk er lineært uavhengige. (Hint: Anta at c1v1 +c2v2 +· · · + ckvk = 0 og ta skalarproduktet med vi pa begge sider.)

Page 153: Flervariabel analyse med lineær algebra

300 KAPITTEL 4. LINEÆR ALGEBRA I RN

4.7 Underrom

I denne seksjonen skal vi utvide, generalisere og systematisere teorien fraforrige seksjon. Resultatene vi skal komme frem til, er svært viktige i vi-deregaende lineær algebra, men ved første møte kan de virke vanskelige oguvante. Det kan derfor være en trøst a vite at med unntak av seksjon 4.12(som hovedsakelig er for spesielt interesserte), har vi ikke bruk for disseresultatene i resten av kapitlet.

Det sentrale begrepet i denne seksjonen er “underrom”. Litt kjapt ogupresist kan vi si at underrom er delmengder av Rn som oppfører seg somRm for en m < n. Et enkelt eksempel er mengden av alle vektorer medformen (x1, x2, . . . , xm, 0, . . . , 0) i Rn — denne mengden er apenbart en kopiav Rm inni Rn. Vi skal se at det faktisk er mange slike kopier av Rm inniRn.

Den grunnleggende definisjonen kan virke ganske abstrakt, men som visnart skal se, er disse objektene ikke sa merkelige som de kan se ut til vedførste øyekast.

Definisjon 4.7.1 En ikke-tom mengde H av vektorer i Rn kalles et under-rom av Rn dersom følgende betingelser er oppfylt.

a) Dersom u ∈ H, sa er cu ∈ H for alle tall c ∈ R.

b) Dersom u,v ∈ H, sa er u + v ∈ H.

Bemerkning: Vi sier at H er lukket under addisjon (betingelse b)) og mul-tiplikasjon med skalar (betingelse a)).

Det minste underrommet til Rn er H = {0} (mengden som bare bestarav nullvektoren 0) og det største er H = Rn. De viktigste eksemplene er desom ligger mellom disse ytterpunktene. Her er en klasse underrom vi kjennerfra før:

Eksempel 1: Husk (fra forrige seksjon) at dersom a1, a2,. . . , am er vektoreri Rn, sa bestar spennet Sp(a1,a2, . . . ,am) av alle lineærkombinasjoner

c1a1 + c2a2 + · · · + cmam

Vi skal vise at H = Sp(a1,a2, . . . ,am) er et underrom av Rn.For a sjekke at betingelse a) er oppfylt, ma vi vise at dersom u ∈ H og

c ∈ R, sa er cu ∈ H. Siden u ∈ H, er u en lineærkombinasjon

u = c1a1 + c2a2 + · · · + cmam

Dermed ercu = cc1a1 + cc2a2 + · · · + ccmam

4.7. UNDERROM 301

som er en lineærkombinasjon av a1, a2,. . . , am, og følgelig er cu ∈ H.For a sjekke at betingelse b) er oppfylt, ma vi vise at dersom u,v ∈ H,

sa er u + v ∈ H. Siden u ∈ H, er u en lineærkombinasjon

u = c1a1 + c2a2 + · · · + cmam

og siden v ∈ H, er v en lineærkombinasjon

v = d1a1 + d2a2 + · · · + dmam

Dermed er

u + v = (c1 + d1)a1 + (c2 + d2)a2 + · · · + (cm + dm)am

en lineærkombinasjon av a1, a2,. . . , am, og følgelig er u + v ∈ H. ♣

Vi skal snart se at alle underrom av H (unntatt det trivielle underrom-met {0}) er pa formen Sp(a1,a2, . . . ,am) for et passende valg av a, a2,. . . ,am. I utgangspunktet kan de imidlertid se ganske annerledes ut:

Eksempel 2: La a ∈ Rn. Vi skal vise at

H = {x ∈ Rn | x · a = 0}

er et underrom av Rn. H bestar altsa av alle vektorene som star ortogonalt(normalt) pa a. Dersom a #= 0, kalles H det ortogonale komplementet til a(dersom a = 0, er H = Rn).

For a vise at H er et underrom av Rn, ma vi sjekke at betingelse a) ogb) i definisjon 4.7.1 er oppfylt. For a vise at a) er oppfylt antar vi at u ∈ Hog at c ∈ R, og ma vise at cu ∈ H. Siden u ∈ H, er u · a = 0. Dermed er(cu) · a = c(u · a) = c · 0 = 0, og følgelig er cu ∈ H.

For a vise at b) er oppfylt, antar vi at u,v ∈ H, og ma vise at u+v ∈ H.Siden u,v ∈ H, er u ·a = 0 og v ·a = 0. Dermed er (u+v) ·a = u ·a+v ·a =0 + 0 = 0, og følgelig er u + v ∈ H. ♣

Vi trenger en liten hjelpesetning før vi gar videre:

Lemma 4.7.2 Anta at H er et underrom av Rn og at a1,a2, . . . ,am ∈ H.Da er

c1a1 + c2a2 + · · · + cmam ∈ H

for alle c1, c2, . . . , cm ∈ R

Bevis: Ifølge punkt a) i definisjon 4.7.1 er c1a1, c2a2, . . . , cmam ∈ H. Ifølgepunkt b) er dermed c1a1 + c2a2 ∈ H. Bruker vi punkt b) en gang til, ser viat c1a1 + c2a2 + c3a3 = (c1a1 + c2a2) + c3a3 ∈ H. Fortsetter vi pa dennematen, far vi til slutt at c1a1+c2a2+ · · ·+cmam ∈ H (bruk gjerne induksjontil a føre et formelt bevis!) !

Her kommer resultatet vi annonserte tidligere:

Page 154: Flervariabel analyse med lineær algebra

302 KAPITTEL 4. LINEÆR ALGEBRA I RN

Setning 4.7.3 Anta at H #= {0} er et underrom av Rn. Da finnes deten lineært uavhengig mengde vektorer a1,a2, . . . ,am ∈ Rn slik at H =Sp(a1,a2, . . . ,am).

Bevis: La m være det største antall lineært uavhengige vektorer man kanfinne i H, og la a1,a2, . . . ,am ∈ H være en maksimal mengde av lineærtuavhengige elementer (vi vet at m ≤ n siden det ikke er mulig a finnemer enn n lineært uavhengige elementer i hele Rn). Vi skal vise at H =Sp(a1,a2, . . . ,am).

Fra lemmaet ovenfor vet vi at Sp(a1,a2, . . . ,am) ⊂ H, sa alt vi behøvera vise er at enhver b ∈ H faktisk ligger i Sp(a1,a2, . . . ,am), dvs. at b kanskrives som en lineærkombinasjon av a1,a2, . . . ,am.

Dette er ikke sa vanskelig: Siden a1,a2, . . . ,am er en maksimal lineærtuavhengig mengde, vet vi at a1,a2, . . . ,am,b er lineært avhengige, og følgeligfinnes det tall c1, c2, . . . , cn, d som ikke alle er 0, slik at

c1a1 + c2a2 + · · · + cmam + db = 0

Vi ser at d ikke kan være 0 for da hadde vi hatt en lineær avhengighetmellom a1,a2, . . . ,am. Men dermed kan vi dele pa d og fa

b = (−d−1c1)a1 + (−d−1c2)a2 + · · · + (−d−1cm)am

Dette viser at b er en lineærkombinasjon av a1,a2, . . . ,am. !

Vi kan na generalisere basisbegrepet til underrom:

Definisjon 4.7.4 Anta at H er et underrom av Rn. En lineært uavhengigmengde a1,a2, . . . ,am slik at H = Sp(a1,a2, . . . ,am) kalles en basis for H.

Setningen ovenfor viser at et underrom alltid har en basis. Den nestesetningen forteller oss at alle basiser for H har like mange elementer.

Setning 4.7.5 Anta H er et underrom av Rn. Da har alle basiser for Hlike mange elementer.

Bevis: Anta for motsigelse at det finnes to basiser a1, a2 , . . . , am og b1,b2 ,. . . , bk for H med et ulikt antall elementer, la oss si k > m. Sidenb1,b2, . . . ,bk ligger i H = Sp(a1,a2, . . . ,am), kan b1,b2, . . . ,bk skrives somlineærkombinasjoner av a1,a2, . . . ,am. Det finnes altsa tall cij slik at

b1 = c11a1 + c12a2 + · · · + c1mam

b2 = c21a1 + c22a2 + · · · + c2mam

......

......

...bk = ck1a1 + ck2a2 + · · · + ckmam

4.7. UNDERROM 303

Vektorene

c1 =

c11

c12...

c1m

, c2 =

c21

c22...

c2m

, . . . , ck =

ck1

ck2...

ckm

ma være lineært avhengige siden k > m. Det finnes altsa tall x1, x2, . . . , xk

som ikke alle er 0, slik at

x1c1 + x2c2 + · · · + xkck = 0

Skriver vi ut dette uttrykket, ser vi at

x1c11 + x2c21 + · · · + xkck1

x1c12 + x2c22 + · · · + xkck2...

x1c1m + x2c2m + · · · + xkckm

=

00...0

Men dermed er

x1b1 + x2b2 + · · · + xkbk == x1(c11a1 + c12a2 + · · · + c1mam)

+x2(c21a1 + c22a2 + · · · + c2mam)...

......

...+xk(ck1a1 + ck2a2 + · · · + ckmam) =

= (x1c11 + x2c21 + · · · + xkck1)a1 ++(x1c12 + x2c22 + · · · + xkck2)a2 +...

......

...+(x1c1m + x2c2m + · · · + xkckm)am =

= 0a1 + 0a2 + · · · + 0am = 0

Dette er en selvmotsigelse siden b1,b2, . . . ,bk er lineært uavhengige. Enestemulige konklusjon er at alle basiser for H har like mange elementer. !

Vi vet fra før at alle basiser for det n-dimensjonale rommet Rn harnøyaktig n elementer. Det er derfor naturlig a utvide dimensjonsbegrepet tilunderrom pa denne maten:

Definisjon 4.7.6 La H #= {0} være et underrom av Rn. Med dimensjonentil H mener vi antall elementer i en basis for H. Dimensjonen til H betegnesmed dim(H).

Page 155: Flervariabel analyse med lineær algebra

304 KAPITTEL 4. LINEÆR ALGEBRA I RN

Rangen til en matrise

Det er to typer underrom som dukker opp naturlig nar vi studerer en m×n-matrise A. Søylerommet til A er underrommet av Rm utspent av søylene iA, men radrommet til A er underrommet av Rn utspent av radene i A. Viskal na studere dimensjonen til disse rommene. Det viser seg at vi alleredehar full kontroll over søylerommet.

Setning 4.7.7 Anta at A er en m × n-matrise. Da er dimensjonen tilsøylerommet til A lik antall pivotsøyler i trappeformen til A.

Bevis: Dette følger fra beviset for setning 4.6.8 (se ogsa teksten rett etterslutten av beviset). !

For a bestemme dimensjonen til radrommet trenger vi en liten observa-sjon.

Lemma 4.7.8 Anta at A′ fremkommer nar vi gjør en radoperasjon pa A.Da har A og A′ samme radrom.

Bevis: Det er lett a se at dersom vi bytter om to rader eller ganger en radmed et tall s #= 0, sa endrer ikke radrommest seg. Vi ser derfor pa tilfelletder A′ fremkommer fra A ved at vi bytter ut den i-te raden ai med ai + saj

der aj er den j-te raden. Anta først at b er i radrommet til A. Da finnes dettall c1, . . . , ci, . . . , cj , . . . , cm slik at

b = c1a1 + . . . + ciai + . . . + cjaj + . . . + cmam

Men da er

b = c1a1 + . . . + ci(ai + saj) + . . . + (cj − cis)aj + . . . + cmam

som viser at b er i radrommet til A′. Anta sa omvendt at b ligger i radrommettil A′, dvs. at

b = d1a1 + . . . + di(ai + saj) + . . . + djaj + . . . + dmam

for passende tall d1, . . . , dm. Da er

b = d1a1 + . . . + diai + . . . + (dj + dis)aj + . . . + dmam

som viser at b er i radrommet til A. !

Vi kan na bevise et nyttig teorem — det sier at i en matrise kan vi alltidfinne like mange lineært uavhengige rader som vi kan finne lineært uavhen-gige søyler. Vi skal fa bruk for dette resultatet nar vi studerer Lagrange-multiplikatorer i neste kapittel.

4.7. UNDERROM 305

Teorem 4.7.9 (Rangteoremet) Dimensjonen til søylerommet til en ma-trise er lik dimensjonen til radrommet.

Bevis: Vi har allerede sett at dimensjonen til søylerommet er lik antall pi-votsøyler (la oss si dette er k), sa vi ma vise at radrommet ogsa har dimensjonk. La A′ være den reduserte trappeformen til A. Siden A′ fremkommer fraA ved en sekvens av radoperasjoner, vet vi fra lemmaet ovenfor at A og A′

har samme radrom, sa alt vi trenger a vise er at radrommet til A′ har di-mensjon k. Siden det et er k pivotelementer, harA′ bare k ikke-null rader, sadet holder a vise at disse er lineært uavhengige. Dette er enkelt.: Siden A′ erpa redusert trappeform, er pivotelementene de eneste ikke-null elementenei sin søyle. Dette betyr at hvis en lineærkombinasjon av “pivotradene” skalvære null, ma hver koeffisient være null. !

Med rangen til en matrise mener vi dimensjonen til søylerommet (eller,om man vil, dimensjonen til radrommet). For a finne rangen, skriver vimatrisen pa trappeform og teller opp antall pivotelementer. Er matrisenstor, er dette mye arbeid, og det kan være lurt a fa MATLAB til a gjørejobben for oss. Har du lastet inn en matrise A, vil kommandoen

>> rank(A)

gi deg rangen til matrisen.

Ortonormale basiser

Standardbasisen e1, e2, . . . , en i Rn er ikke bare en basis, den er ogsa enortonormal mengde, dvs. at elementene ei har lengde en og star normaltpa hverandre. Ortonormale basiser har mange fordeler, og vi skal na viseat alle underrom har slike basiser. Metoden vi skal bruke til a skaffe oss enortonormal basis, kalles Gram-Schmidt-ortogonalisering og er nyttig i mangesammenhenger.

Setning 4.7.10 Ethvert underrom H #= {0} av Rn har en ortonormal basis,dvs. en basis w1,w2, . . . ,wm slik at

wi ·wj =

0 hvis i #= j

1 hvis i = j

Bevis: La v1,v2, . . . ,vm være en basis for H. Vi skal omdanne denne basisentil en ortonormal basis w1,w2, . . . ,wm. Vi gjør dette trinnvis, og sørger heletiden for at w1,w2, . . . ,wk er en ortonormal mengde som utspenner detsamme underrommet som v1,v2, . . . ,vk.

Prosedyren starter med at vi setter w1 = v1|v1| . Vi normaliserer altsa v1

slik at den far lengde 1. Det er klart at v1 og w1 utspenner det sammeunderrommet.

Page 156: Flervariabel analyse med lineær algebra

306 KAPITTEL 4. LINEÆR ALGEBRA I RN

Nest skritt i prosedyren er a finne w2. Vi definerer først en vektor w′2

vedw′

2 = v2 − (w1 · v2)w1

Tar vi skalarproduktet med w1 pa begge sider, ser vi at

w1 ·w′2 = w1 · v2 − (w1 · v2)(w1 ·w1) = 0

siden w1 ·w1 = |w1|2 = 1. Dette viser at w′2 og w1 er ortogonale. Siden w′

2

kan uttrykkes ved hjelp av v2 og w1 (og v2 kan uttrykkes ved hjelp av w′2

og w1), er det lett a se at w1 og w′2 utspenner samme underrom som v1 og

v2. Vi avslutter dette trinnet med a sette w2 = w′2

|w′2|

for a fa en vektor medlengde en (dette ødelegger ikke de egenskapene vi allerede har sjekket).

Vi beskriver na det generelle skrittet i prosedyren. Anta at vi har greid afinne en ortonormal mengde w1,w2, . . . ,wk som utspenner samme underromsom v1,v2, . . . ,vk. Vi definerer først vektoren w′

k+1 ved:

w′k+1 = vk+1− (w1 ·vk+1)w1− (w2 ·vk+1)w2− · · ·− (wk ·vk+1)wk (4.7.1)

Tar vi skalarproduktet med wi (der i ≤ k) pa begge sider, far vi

wi ·w′k+1 = wi · vk+1 − (wi · vk+1) · (wi ·wi) = 0

der vi har brukt at w1,w2, . . . ,wk er ortonormale. Dette betyr at wk+1

star normalt pa w1, w2 ,. . . , wk som allerede star normalt pa hverandre.Ved hjelp av ligning (4.7.1) er det lett a se at w1, . . . , wk, w′

k+1 utspennersamme mengde som w1, . . . , wk, vk+1, som igjen utspenner samme mengdesom v1, . . . , vk, vk+1. Til slutt setter vi wk+1 = w′

k+1

|w′k+1|

for a fa en vektormed lengde 1 (hvordan vet du at |w′

k+1| ikke er lik 0?). Dermed har vi fatten ortonormal mengde w1,w2, . . . ,wk+1 som utspenner samme underromsom v1,v2, . . . ,vk+1.

Fortsetter vi denne prosedyren helt til det ikke er flere v’er igjen, far vien ortonormal basis w1,w2, . . . ,wm for H. !

Legg merke til at beviset ovenfor inneholder en oppskrift vi kan følge fora finne en ortonormal basis. Det er imidlertid ikke morsomt a bruke denneoppskriften for hand, og heldigvis har MATLAB en kommando som gjørarbeidet for oss. Har du lastet inn en matrise A, sa vil kommandoen

>> orth(A)

returnere en ortonormal basis for søylerommet til A.En av grunnene til at ortonormale basiser er sa populære, er at det

er svært enkelt a finne ut hvordan man skriver en vektor som en lineærkombinasjon av en slik basis.

4.7. UNDERROM 307

Setning 4.7.11 Anta at w1,w2, . . . ,wm er en ortonormal basis for et under-rom H av Rn. Hvis v ∈ H, sa er

v = c1v1 + c2v2 + · · · + cmvm

der ci = v · vi

Bevis: Siden v1,v2, . . . ,vm er en basis for H, vet vi at det finnes tallc1, c2, . . . , cm slik at

v = c1v1 + c2v2 + · · · + cmvm

Tar vi skalarproduktet med vi pa begge sider og bruker at

vi · vj ={

0 hvis i #= j1 hvis i = j

,

far vi v · vi = ci !

Oppgaver til seksjon 4.7

1. Finn en basis for underrommet H nar

a) H = Sp(a1,a2,a3) der a1 = (1,−2, 1), a2 = (2,−1, 3), a3 = (−1,−1,−2).

b) H = {x ∈ R3 | x · j = 0} (husk at j = (0, 0, 1)).

c) H = {x ∈ R3 | x · a = 0} der a = (1,−2, 1).

d) H er søylerommet til matrisen A =

3 −12 01 2

.

e) H er radrommet til matrisen A =

3 −12 01 2

.

2. Finn rangen til A nar

a) A =(

1 22 3

)

b) A =(

1 1 22 3 4

)

c) A =

1 2 3

−1 4 10 6 4

3. Bruk MATLAB til a finne rangen til matrisene

A =

1 1 −2 3 −23 1 −2 3 12 3 4 −1 1

, B =

1 0 −2 4 33 −1 −2 3 16 2 −5 11 62 3 −1 4 2

Page 157: Flervariabel analyse med lineær algebra

308 KAPITTEL 4. LINEÆR ALGEBRA I RN

4. Bruk MATLAB til a finne en ortonormal basis for rommet H utspent av

a1 =

1

−21

, a2 =

220

, a3 =

−1

32

5. Vis at v1 =(√

22 ,

√2

2

), v2 =

(√2

2 ,−√

22

)er en ortonormal basis for R2. Skriv

v = (3,−1) som en lineærkombinasjon av v1 og v2.

6. I denne oppgaven er vi i R3.

a) Anta at H er en rett linje gjennom origo. Forklar at H er et underrom avR3. Hva er dimensjonen til H?

b) Anta at H er et plan gjennom origo. Forklar at H er et underrom av R3. Hvaer dimensjonen til H?

7. Anta at A er en ikke-tom mengde vektorer i Rn. Vis at

H = {x ∈ Rn | x · a = 0 for alle a ∈ A}

er et underrom av Rn. H kalles det ortogonale komplementet til A.

8. Anta at H1 og H2 er underrom av Rn.

a) Vis at H = H1 ∩H2 ogsa er et underrom av Rn. (Husk at snittet H1 ∩H2

bestar av de vektorene som er med i bade H1 og H2.)

b) Vis ved et eksempel at H = H1 ∪ H2 ikke alltid er et underrom av Rn.(Husk at unionen H1 ∪H2 bestar av de vektorene som er med i minst en avmengdene H1 og H2.)

9. Anta at H er et underrom av Rn.

a) Vis at dersom v1,v2, . . . ,vm er lineært uavhengige vektorer i H, sa kanv1,v2, . . . ,vm utvides til en basis for H (det kan tenkes at denne utvidelsener lik v1,v2, . . . ,vm).

b) Anta at K er et annet underrom av Rm slik at K ⊂ H. Vis dim(K) <dim(H).

10. I denne oppgaven er A en m× n-matrise.

a) Vis atH = {x ∈ Rn | Ax = 0}

er et underrom av Rn. H kalles nullrommet eller kjernen til A.

b) Vis at dimensjonen til H er n− k der k er antall pivotsøyler i den redusertetrappeformen til A. (Hint: Tenk pa hva som skjer nar du løser ligningssys-temet Ax = 0 ved trappereduksjon. Du far ogsa behov for a vise at noenvektorer er lineært uavhengige).

c) Bevis dimensjonsteoremet som sier at i en m × n-matrise er summen avdimensjonen til søylerommet og dimensjonen til nullrommet alltid lik n.

4.8. ELEMENTÆRE MATRISER 309

11. Anta at H1 og H2 er underrom av Rn. Vi lar

H1 + H2 = {u1 + u2 | u1 ∈ H1,u2 ∈ H2}

dvs. at H1 + H2 bestar av alle elementene i Rn som kan skrives som en sum av etelement i H1 og et element i H2.

a) Vis at H1 + H2 er et underrom av Rn

b) Vis at dim(H1 + H2) = dim(H1) + dim(H2)− dim(H1 ∩H2)

12. I denne oppgaven skal vi se pa projeksjoner av vektorer ned pa underrom.Dersom H er et underrom av Rn og x ∈ Rn, sier vi at y er en projeksjon av x nedpa H dersom y ∈ H og x− y star normalt pa alle vektorer v ∈ H.

a) Tenk deg (bare i dette punktet) at vi er i R3 og at H er et plan gjennomorigo. Lag en tegning av en projeksjon av en vektor x ned pa H.

b) Vis at dersom y og z er to projeksjoner av x ned pa H, sa er y = x, medandre ord at det finnes høyst en projeksjon av x ned pa H. (Hint: Siden badey og z ligger i H, gjør v = y − z det ogsa. Bruk betingelsene x − y ⊥ v ogx− z ⊥ v til a utlede at |y − z| = 0).

c) La v1,v2, . . . ,vm være en ortonormal basis for H. Forklar at denne basisenkan utvides til en ortonormal basis v1,v2, . . . ,vm,vm+1, . . . ,vn for hele Rn.Dersom

x = c1v1 + · · · + cmvm + cm+1vm+1 + . . . + · · · + cnvn.

definerer viP(x) = c1v1 + · · · + cmvm

Vis at P(x) er en projeksjon av x ned pa H.

d) Vis at P(x) = x for alle x ∈ H og at P(P(x)) = x for alle x ∈ Rn.

e) Vis at P : Rn → Rn er en lineæravbildning.

4.8 Elementære matriser

Alt vi hittil har gjort i dette kapitlet er basert pa radoperasjoner. I denneseksjonen skal vi se at det a utføre en radoperasjon, kan tolkes som mul-tiplikasjon med en spesiell type matrise — en sakalt elementær matrise. Iutgangspunktet kan dette virke som en ganske pussig og unyttig observa-sjon, men som vi skal se senere, har den mer sprengkraft enn man skulle tro.La oss begynne med definisjonen:

Definisjon 4.8.1 En m×m elementær matrise er en matrise som fremkom-mer nar vi gjør en radoperasjon pa identitetsmatrisen Im. Enhver elementærmatrise korresponderer altsa til en radoperasjon.

Siden det finnes tre typer radoperasjoner, finnes det ogsa tre typer ele-mentære matriser.

Page 158: Flervariabel analyse med lineær algebra

310 KAPITTEL 4. LINEÆR ALGEBRA I RN

(i) Elementære matriser som fremkommer ved a bytte om to rader iidentitetsmatrisen: Et typisk eksempel er

1 0 0 0 00 0 0 1 00 0 1 0 00 1 0 0 00 0 0 0 1

der vi har byttet om rad 2 og 4.

(ii) Elementære matriser der vi har multiplisert en av radene i identitets-matrisen med et tall forskjellig fra 0: Et typisk eksempel er

1 0 0 0 00 1 0 0 00 0 −3 0 00 0 0 1 00 0 0 0 1

der tredje rad er multiplisert med −3.

(iii) Elementære matriser der vi har lagt et multiplum av en rad til enav de andre radene: Et typisk eksempel er

1 0 0 0 00 1 0 −2 00 0 1 0 00 0 0 1 00 0 0 0 1

der vi har lagt −2 ganger rad 4 til rad 2.

Den grunnleggende observasjonen om elementære matriser er denne.

Setning 4.8.2 Anta at E er en elementær m × m-matrise og la A væreen vilkarlig m × n-matrise. La A′ være den matrisen vi far nar vi brukerradoperasjonen som korresponderer til E pa A. Da er A′ = EA.

Bevis: Det er lettest a sjekke dette selv ved a se hva som skjer nar vi gangeren matrise med de forskjellige typene elementære matriser. !

Den neste setningen er helt essensiell for a utnytte elementære matriser.

Setning 4.8.3 Enhver elementær matrise er inverterbar, og den inverse erogsa en elementær matrise.

4.8. ELEMENTÆRE MATRISER 311

Bevis: Vi har allerede observert (se seksjon 4.2) at enhver radoperasjon kan“reverseres”, det vil si at det finnes en annen radoperasjon som fører matri-sen tilbake til utgangspunktet. Det er lett a sjekke at de korresponderendeelementærmatrisene er inverse. Vi sjekker dette for det vanskeligste tilfelletsom er elmentærmatriser av type (iii) ovenfor:

Anta at E er elementærmatrisen som tilsvarer a addere s ganger radj til rad i. Den inverse matrisen E′ er da den som tilsvarer a addere −sganger rad j til rad i. Det er lett a sjekke at E′E = In: Sammenlignet medidentitetsmatrisen har E en komponent s “for mye” i posisjon (i, j), og E′

fjerner denne ved a addere −s i komponent (i, j). !

Vi har na kommet frem til det første hovedresultatet vart.

Setning 4.8.4 Enhver m× n-matrise A kan skrives som et produkt

A = E1E2 . . . EkB

der E1, E2, . . . , Ek er elementære matriser og B er den reduserte trappe-formen til A. Dersom A er en inverterbar, kvadratisk matrise, kan A altsaskrives som et produkt A = E1E2 . . . Ek av elementære matriser.

Bevis: Vi vet at A kan omdannes til B ved hjelp av en sekvens av radopera-sjoner. Hvis F1, F2, . . . , Fk er de korresponderende elementærmatrisene, vetvi fra setning 4.8.2 at

B = Fk . . . F2F1A

Ganger vi denne ligningen fra venstre med F−11 F−1

2 · · ·F−1k , far vi

F−11 F−1

2 · · ·F−1k B = A

Setter vi E1 = F−11 , E2 = F−1

2 , . . . , Ek = F−1k , vet vi fra setningen ovenfor

at E1, E2, . . . , Ek er elementære matriser. Dermed er

E1E2 . . . EkB = A

som er formelen i setningen. Dersom A er en inverterbar, kvadratisk matrise,er B = In og vi far

A = E1E2 . . . EkIn = E1E2 . . . Ek

!

Bemerkning: Legg merke til at de elementære matrisene i setningen oven-for er de inverse til dem som omdanner A til redusert trappeform, og at dekommer i omvendt rekkefølge.

Page 159: Flervariabel analyse med lineær algebra

312 KAPITTEL 4. LINEÆR ALGEBRA I RN

Vi skal ogsa se raskt pa sammenhengen mellom elementære matriser ogtransponering. Husk at den transponerte matrisen AT til A er den matrisenvi far nar vi bytter om rader og søyler

AT =

a11 a21 . . . am1

a12 a22 . . . am2...

... . . ....

a1n a2n . . . amn

Setning 4.8.5 Den transponerte ET til en elementær matrise E er selv enelementær matrise. Dersom E korresponderer til a bytte om to rader ellertil a gange en rad med et tall s, sa er E = ET . Dersom E korresponderertil a addere s ganger linje j til linje i, sa korresponderer ET til a addere sganger linje i til linje j.

Bevis: Dette er greit a sjekke selv. !

Kombinert med neste resultat vil setningen ovenfor komme til nytte narvi i neste seksjon skal regne ut determinanten til den transponerte matrisen.

Setning 4.8.6 Anta at A = E1E2 . . . EkB der E1, E2, . . . , Ek er elementærematriser og B er pa redusert trappeform. Da er

AT = BT ETk . . . ET

2 ET1

Bevis: Det følger fra setning 1.5.2(v) at den transponerte til et produkt erproduktet av de transponerte i omvendt rekkefølge, dvs. (A1A2 . . . Ak)T =AT

k . . . AT2 AT

1 . Setningen følger umiddelbart fra dette. !

Oppgaver til seksjon 4.8

1. Vis at matrisene er elementære:

a)(

0 11 0

)b)

(1 −30 1

)c)

0 1 01 0 00 0 1

d)

1 0 00 1 00 1

2 1

e)

4 0 00 1 00 0 1

2. Skriv(

1 2−1 1

)som et produkt av elementære matriser.

3. Skriv

1 2 1

−1 −2 30 1 0

som et produkt av elementære matriser.

4. Gjennomfør beviset for setning 4.8.2.

5. Gjennomfør resten av beviset for setning 4.8.3.

6. Gjennomfør beviset for setning 4.8.5.

4.9. DETERMINANTER 313

4.9 Determinanter

I seksjon 1.8 studerte vi 2×2- og 3×3-determinanter, og vi kikket sa vidt pahvordan man kan definere determinanten til 4×4- og 5×5-matriser. I denneseksjonen skal vi se pa teorien for generelle n×n-determinanter. Definisjonenfølger det samme mønsteret som tidligere — hvis vi allerede vet hvordan viregner ut (n− 1)× (n− 1)-determinanter, definerer vi n× n-determinanterved hjelp av denne formelen:

∣∣∣∣∣∣∣∣∣

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

an1 an2 · · · ann

∣∣∣∣∣∣∣∣∣

= a11

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2n

a32 a33 . . . a3n...

... . . ....

an2 an3 . . . ann

∣∣∣∣∣∣∣∣∣

−a12

∣∣∣∣∣∣∣∣∣

a21 a23 . . . a2n

a31 a33 . . . a3n...

... . . ....

an1 an3 . . . ann

∣∣∣∣∣∣∣∣∣

+ . . . + (−1)n+1a1n

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2,n−1

a31 a32 . . . a3,n−1...

... . . ....

an1 an2 . . . an,n−1

∣∣∣∣∣∣∣∣∣

Vi ser hvordan mønsteret er: Hvert element i den første raden ganges medden (n − 1) × (n − 1)-determinanten vi far nar vi stryker raden og søylengjennom elementet. Alle leddene legges sa sammen med alternerende (skif-tende) fortegn.

Eksempel 1: Vi skal starte utregningen av 5× 5-determinanten∣∣∣∣∣∣∣∣∣∣

2 3 −4 5 11 0 3 4 −1

−2 1 1 0 −22 −2 1 3 10 0 2 1 3

∣∣∣∣∣∣∣∣∣∣

(det blir for mye kjedelig arbeid a gjennomføre hele beregningen!) Ifølgedefinisjonen ovenfor er

∣∣∣∣∣∣∣∣∣∣

2 3 −4 5 11 0 3 4 −1

−2 1 1 0 −22 −2 1 3 10 0 2 1 3

∣∣∣∣∣∣∣∣∣∣

= 2

∣∣∣∣∣∣∣∣

0 3 4 −11 1 0 −2

−2 1 3 10 2 1 3

∣∣∣∣∣∣∣∣− 3

∣∣∣∣∣∣∣∣

1 3 4 −1−2 1 0 −2

2 1 3 10 2 1 3

∣∣∣∣∣∣∣∣+

+(−4)

∣∣∣∣∣∣∣∣

1 0 4 −1−2 1 0 −2

2 −2 3 10 0 1 3

∣∣∣∣∣∣∣∣− 5

∣∣∣∣∣∣∣∣

1 0 3 −1−2 1 1 −2

2 −2 1 10 0 2 3

∣∣∣∣∣∣∣∣+ 1

∣∣∣∣∣∣∣∣

1 0 3 4−2 1 1 0

2 −2 1 30 0 2 1

∣∣∣∣∣∣∣∣

Page 160: Flervariabel analyse med lineær algebra

314 KAPITTEL 4. LINEÆR ALGEBRA I RN

Na fortsetter du pa samme mate med hver av 4× 4-determinantene osv. ♣

Eksemplet ovenfor viser at definisjonen er ubrukelig til a regne ut verdientil store determinanter. Det er heller ikke sa lett a se de teoretiske egenska-pene til determinanter direkte fra definisjonen. Vi skal derfor bruke litt tidpa a beskrive determinanter pa andre mater.

Bemerkning: Determinanter er definert induktivt ved at vi definerer deter-minanter av en viss størrelse ved hjelp av determinanter en størrelse mindre.Dette medfører at induksjonsbevis er en naturlig bevismetode nar man skalvise egenskaper ved determinanter. Er du uvant med induksjonsbevis (ellersynes bevisene nedenfor er vanskelige a forsta), kan det være lurt a ta enkikk pa seksjon 1.2 i Kalkulus.

Vi skal først se pa noen tilfeller der determinanten er spesielt enkel aregne ut.

Lemma 4.9.1 Anta at A er en kvadratisk matrise der enten en rad elleren søyle bare bestar av nuller. Da er det(A) = 0.

Bevis: Vi ser pa tilfellet der en søyle er null — beviset for det andre tilfelletligner, men er litt lettere.

Vi skal vise resultatet for n×n-matriser ved induksjon pa n. Det er letta sjekke at en 2× 2-determinant er null dersom en av søylene er null. Antaat resultatet holder for n×n-matriser, og at A er en (n+1)×(n+1)-matriseder j-te søyle er 0. Ifølge definisjonen er

det(A) =

∣∣∣∣∣∣∣∣∣

a11 . . . a1j . . . a1,n+1

a21 . . . a2j . . . a2,n+1... . . .

... . . ....

an+1,1 . . . an+1,j . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

=

= a11

∣∣∣∣∣∣∣∣∣

a22 . . . a2j . . . a2,n+1

a32 . . . a3j . . . a3,n+1... . . .

... . . ....

an+1,2 . . . an+1,j . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)j+1a1j

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2,n+1

a31 a32 . . . a3,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2a1,n+1

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n

a31 a32 . . . a3n...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣

4.9. DETERMINANTER 315

I dette uttrykket er leddet

(−1)j+1a1j

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2,n+1

a31 a32 . . . a3,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

null fordi a1j = 0. De andre leddene er null fordi determinanten inneholderen rad som bare bestar av nuller, og induksjonshypotesen forteller oss at enslik n× n-determinant er null. !

De neste matrisene vi skal beregne determinanten til, er triangulære ma-triser. Vi kaller en kvadratisk matrise øvre triangulær dersom alle elemen-tene under diagonalen er null, og vi kaller den nedre triangulær dersom alleelementer over diagonalen er null. Matrisen A nedenfor er øvre triangulær,mens B er nedre triangulær:

A =

2 1 0 60 3 −1 20 0 0 00 0 0 4

B =

3 0 0 01 0 0 0

−3 4 6 00 1 3 4

Legg merke til at alle trappematriser er øvre triangulære.

Lemma 4.9.2 Dersom matrisen A er øvre eller nedre triangulær, er deter-minanten til A lik produktet av elementene pa diagonalen til A.

Bevis: Vi skal bare vise resultatet for øvre triangulære matriser — bevisetfor nedre triangulære matriser gar pa samme mate, men er lettere. Ogsa idette tilfellet gar beviset ved induksjon pa størrelsen til A. Er A en øvre

triangulær 2× 2-matrise A =(

a b0 d

), ser vi at det(A) = ad− 0b = ad, sa

resultatet stemmer for 2× 2-matriser.Anta na at resultatet stemmer for øvre triangulære n×n-matriser, og la

A =

a11 a12 . . . a1,n+1

0 a22 . . . a2,n+1...

... . . ....

0 0 . . . an+1,n+1

være en øvre triangulær (n + 1)× (n + 1)-matrise. Vi har

det(A) = a11

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1

0 a33 . . . a3,n+1...

... . . ....

0 0 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

−a12

∣∣∣∣∣∣∣∣∣

0 a23 . . . a2,n+1

0 a33 . . . a3,n+1...

... . . ....

0 0 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+· · ·

Page 161: Flervariabel analyse med lineær algebra

316 KAPITTEL 4. LINEÆR ALGEBRA I RN

· · · + (−1)n+2a1,n+1

∣∣∣∣∣∣∣∣∣

0 a22 . . . a2n

0 0 . . . a3n...

... . . ....

0 0 . . . 0

∣∣∣∣∣∣∣∣∣

= a11

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1

0 a33 . . . a3,n+1...

... . . ....

0 0 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

der vi har brukt det forrige lemmaet til a kvitte oss med de determinantenesom har en søyle med bare nuller. Ifølge induksjonshypotesen er

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1

0 a33 . . . a3,n+1...

... . . ....

0 0 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

= a22a33 · · · an+1,n+1

og dermed far vi det(A) = a11a22 · · · an+1,n+1. !

Determinanter og radoperasjoner

Vi er na klare til a starte et litt større prosjekt — vi skal undersøke hvasom skjer med determinanten til en matrise nar vi utfører en radoperasjon.Dette vil gi oss en mer effektiv mate a regne ut determinanter pa, og detvil ogsa gi oss en bedre forstaelse av hva determinanter er. Inspirasjon tilarbeidet finner vi i setningene 1.8.3 og 1.8.5 som forteller oss hva som skjermed 2 × 2- og 3 × 3-determinanter nar vi bruker radoperasjoner. Malet era vise tilsvarende resultater for generelle determinanter. Dette krever en delarbeid (og talmodighet!)

Vi starter med den enkleste radoperasjonen.

Lemma 4.9.3 Anta at B er den matrisen vi far nar vi ganger den i-teraden i A med tallet s. Da er det(B) = sdet(A).

Bevis: Igjen bruker vi induksjon pa størrelsen til matrisen A. Hvis A er en2 × 2-determinant, er pastanden lett a sjekke (vi kjenner den dessuten frasetning 1.8.3). Anta na at setningen holder for n × n-matriser, og at A eren (n + 1) × (n + 1)-matrise. Anta først at B er den matrisen vi far nar viganger den første raden i A med s. Da er

det(B) =

∣∣∣∣∣∣∣∣∣

sa11 sa12 . . . sa1,n+1

a21 a21 . . . a2,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

=

= sa11

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1

a32 a33 . . . a3,n+1...

... . . ....

an+1,2 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

4.9. DETERMINANTER 317

−sa12

∣∣∣∣∣∣∣∣∣

a21 a23 . . . a2,n+1

a31 a33 . . . a3,n+1...

... . . ....

an+1,1 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2sa1,n+1

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n

a31 a32 . . . a3n...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣

= sdet(A)

der vi har brukt at hvert ledd i uttrykket for det(B) har en ekstra s sam-menlignet med uttrykket for det(A).

La oss na anta at det er en rad i > 1 som ganges med s. Da er

det(B) =

∣∣∣∣∣∣∣∣∣∣∣∣

a11 a12 . . . a1,n+1...

... . . ....

sai1 sai2 . . . sai,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

=

= a11

∣∣∣∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1...

... . . ....

sai2 sai3 . . . sai,n+1...

... . . ....

an+1,2 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

−a12

∣∣∣∣∣∣∣∣∣∣∣∣

a21 a23 . . . a2,n+1...

... . . ....

sai1 sai3 . . . sai,n+1...

... . . ....

an+1,1 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2a1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n...

... . . ....

sai1 sai2 . . . sain...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣∣∣∣

=

= sa11

∣∣∣∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1...

... . . ....

ai2 ai3 . . . ai,n+1...

... . . ....

an+1,2 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

Page 162: Flervariabel analyse med lineær algebra

318 KAPITTEL 4. LINEÆR ALGEBRA I RN

−sa12

∣∣∣∣∣∣∣∣∣∣∣∣

a21 a23 . . . a2,n+1...

... . . ....

ai1 ai3 . . . ai,n+1...

... . . ....

an+1,1 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2sa1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n...

... . . ....

ai1 ai2 . . . ain...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣∣∣∣

= sdet(A)

der vi har brukt induksjonshypotesen til a trekke s utenfor n×n-matrisene. !

Vi skal na se pa hva som skjer nar vi bytter om to rader. Dette er littkomplisert, men nøkkelen ligger i først a vise hva som skjer nar vi bytter omde to øverste radene.

Lemma 4.9.4 Anta at B er den matrisen vi far nar vi bytter om de toøverste radene i A. Da er det(A) = −det(B).

Bevis: Vi tenker oss A er en n × n-matrise og at vi gjennomfører de toførste skrittene i utregningen av det(A) — først uttrykker vi det(A) vedhjelp av (n − 1) × (n − 1)-matriser, og sa uttrykker vi hver av disse igjenved hjelp av (n − 2) × (n − 2)-matriser. De (n − 2) × (n − 2)-matrisenevi na har, er fremkommet ved at vi har fjernet de to øverste radene i Asamt to av søylene. Dersom i < j, lar vi Aij være den (n − 2) × (n − 2)-determinanten vi far nar vi fjerner den i-te og den j-te søylen i tillegg tilde to første radene. I utregningene vare oppstar denne determinanten pato mater: Vi kan enten fjerne den i-te søylen i første omgang og den j-tesøylen i andre, eller omvendt. I det første tilfellet far vi en faktor (−1)i+1a1i

i første omgang og en faktor (−1)ja2j i andre omgang (observer at sideni < j, har a2j na rykket frem til (j − 1)-te søyle, og fortegnsfaktoren blirderfor (−1)j og ikke (−1)j+1 som man kanskje ville vente). Totalt gir detteen faktor (−1)i+j+1a1ia2j . I det andre tilfellet far vi en faktor (−1)j+1a1j iførste omgang og en faktor (−1)i+1a2i i andre omgang. Totalt gir dette enfaktor (−1)i+j+2a1ja2i. Alt i alt har vi dermed et bidrag til det(A) pa

(−1)i+j+1 (a1ia2j − a1ja2i) Aij (4.9.1)

Dersom vi gjør tilsvarende beregninger for B, far vi samme svar bortsettfra at elementene i første og annen rad har byttet plass. Dette gir et bidragpa

(−1)i+j+1 (a2ia1j − a2ja1i) Aij (4.9.2)

4.9. DETERMINANTER 319

Disse uttrykkene er motsatt like store, og dermed ser vi at det(B) = −det(A).!

La oss utvide resultatet til alle naborader:

Lemma 4.9.5 Anta at B er en matrise som fremkommer ved at vi bytterom to naborader i A. Da er det(B) = −det(A).

Bevis: Det er lett a se at resultatet holder for 2 × 2-matriser, og vi brukerinduksjon til a vise det generelt. Vi antar at A er en (n + 1) × (n + 1)-matrise, og at resultatet holder for n× n-matriser. Dersom vi bytter om deto første radene, følger resultatet fra foregaende lemma. Dersom vi bytterom to andre rader, følger resultatet fra induksjonshypotesen. Vi har nemlig

det(A) =

∣∣∣∣∣∣∣∣∣

a11 a12 . . . a1,n+1

a21 a22 . . . a2,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

=

= a11

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1

a32 a33 . . . a3,n+1...

... . . ....

an+1,2 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)j+1a1j

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2,n+1

a31 a32 . . . a3,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2a1,n+1

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n

a31 a32 . . . a3n...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣

Nar vi bytter om de to radene i det(A), bytter vi ogsa om to rader i hver avde mindre determinantene. Ifølge induksjonshypotesen bytter de da fortegn,og dermed bytter det(A) fortegn. !

Til slutt utvider vi resultatet til alle rader.

Lemma 4.9.6 Dersom B fremkommer ved at vi bytter om to rader i A, saer det(B) = −det(A).

Page 163: Flervariabel analyse med lineær algebra

320 KAPITTEL 4. LINEÆR ALGEBRA I RN

Bevis: Vi kan bytte om to vilkarlige rader ved systematisk ombytte av nabo-rader: Anta at vi skal bytte om rad i og rad i + k. Vi bytter først om radi + k med rad i + k − 1, deretter bytter vi den med rad i + k − 2 osv. Etterk slike bytter, har raden flyttet seg til i-te posisjon, og den opprinnelige radi er skjøvet ned til (i + 1)-te posisjon. Vi bytter na denne raden nedover tilden er i (i + k)-te posisjon — dette tar k − 1 nabobytter. Na er vi fremmeved matrisen B og har foretatt 2k − 1 ombytter av naborader. Det betyrat determinanten har byttet fortegn et odde antall ganger, og følgelig erdet(B) = −det(A). !

Før vi gar videre, tar vi med oss en nyttig konsekvens av resultatetovenfor.

Korollar 4.9.7 Dersom to av radene i A er like, er det(A) = 0.

Bevis: Dersom vi bytter om de to like radene, vil determinanten ifølge lem-maet ovenfor bytte fortegn. Men determinanten har jo ikke endret seg sidenradene vi byttet om var like. Den eneste løsningen pa dette tilsynelatendeparadokset, er at det(A) = 0. !

Vi er na fremme ved den siste typen radoperasjon — de hvor vi addereret multiplum av en rad til en annen.

Lemma 4.9.8 Anta at B fremkommer fra A ved at vi adderer et multiplumav en av radene i A til en av de andre radene. Da er det(B) = det(A).

Bevis: Igjen gar beviset ved induksjon pa størrelsen til matrisen. For 2× 2-matriser vet vi fra setning 1.8.3 at resultatet holder. Vi antar at resultatetholder for n×n-matriser, og at A er en (n+1)× (n+1)-matrise. Anta førstat vi adderer s ganger rad j til rad i der i > 1. Da er

det(B) =

∣∣∣∣∣∣∣∣∣∣∣∣

a11 a12 . . . a1,n+1...

... . . ....

ai1 + saj1 ai2 + saj2 . . . ai,n+1 + saj,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

=

= a11

∣∣∣∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1...

... . . ....

ai2 + saj2 ai3 + saj3 . . . ai,n+1 + saj,n+1...

... . . ....

an+1,2 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

4.9. DETERMINANTER 321

−a12

∣∣∣∣∣∣∣∣∣∣∣∣

a21 a23 . . . a2,n+1...

... . . ....

ai1 + saj1 ai3 + saj3 . . . ai,n+1 + saj,n+1...

... . . ....

an+1,1 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2a1,n+1

∣∣∣∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n...

... . . ....

ai1 + saj1 ai2 + saj2 . . . a3n + sajn...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣∣∣∣

Siden resultatet gjelder for n × n-matriser, vet vi at disse determinanteneikke endrer seg om vi fjerner “s”-leddene. Følgelig er det(B) = det(A).

La oss na se pa det gjenstaende tilfellet der vi adderer s ganger rad j tilden første raden. Da har vi:

det(B) =

∣∣∣∣∣∣∣∣∣

a11 + saj1 a12 + saj2 . . . a1,n+1 + saj,n+1

a21 a22 . . . a2,n+1...

... . . ....

an+1,1 an+1,2 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

=

= (a11 + saj1)

∣∣∣∣∣∣∣∣∣

a22 a23 . . . a2,n+1

a32 a33 . . . a3,n+1...

... . . ....

an+1,2 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

−(a12 + saj2)

∣∣∣∣∣∣∣∣∣

a21 a23 . . . a2,n+1

a31 a33 . . . a3,n+1...

... . . ....

an+1,1 an+1,3 . . . an+1,n+1

∣∣∣∣∣∣∣∣∣

+ · · ·

· · · + (−1)n+2(a1,n+1 + saj,n+1)

∣∣∣∣∣∣∣∣∣

a21 a22 . . . a2n

a31 a32 . . . a3n...

... . . ....

an+1,1 an+1,2 . . . an+1,n

∣∣∣∣∣∣∣∣∣

Ganger vi ut parentesene og samler ledd med og uten s hver for seg, ser vi atdet(B) = det(A)+sdet(A) der A er den matrisen vi far nar vi erstatter denførste raden med den j-te (hvis du ikke ser dette direkte, sa skriv opp detførste trinnet i utregningen av det(A) og det(A)). Ifølge korollaret ovenforer det(A) = 0 siden to av radene er like. Følgelig er det(B) = det(A) ogsa i

Page 164: Flervariabel analyse med lineær algebra

322 KAPITTEL 4. LINEÆR ALGEBRA I RN

dette tilfellet. !

Vi har na nadd vart mal og kan oppsummere hva som skjer med deter-minanten til en matrise nar vi bruker en radoperasjon.

Teorem 4.9.9 Anta at A er en kvadratisk matrise. Da gjelder:

(i) Hvis A er øvre eller nedre triangulær, er determinanten lik produktetav diagonalelementene.

(ii) Bytter vi om to rader, bytter determinanten fortegn (men beholder sintallverdi).

(iii) Ganger vi en rad med et tall s, endres determinanten med en faktor s.

(iv) Adderer vi et multiplum av en rad til en annen rad, endres ikke deter-minanten

Bevis: Dette er bare en oppsummering av lemmaene 4.9.2, 4.9.3, 4.9.6 og4.9.8. !

Resultatet ovenfor gir oss en effektiv metode for a regne ut determi-nanter. Selv om effektiviteten først viser seg for alvor pa større matriser,illustrerer vi metoden i 3× 3-tilfellet.

Eksempel 2: Vi skal regne ut determinanten til matrisen

A =

3 3 −11 0 −12 2 2

Vi radreduserer A mens vi holder styr pa hvilke operasjoner vi bruker:

AI↔II∼

1 0 −13 3 −12 2 2

II+(−3)I∼

1 0 −10 3 22 2 2

III+(−2)I∼

1 0 −10 3 20 2 4

13 II∼

1 0 −10 1 2

30 2 4

III+(−2)II∼

1 0 −10 1 2

30 0 8

3

= B

Matrisen B er øvre triangulær, og determinanten er produktet av diago-nalelementene: det(B) = 1 · 1 · 8

3 = 83 . Vi kan na regne oss bakover til

determinanten til A ved a bruke teoremet ovenfor — hver ganger vi bytterom to rader, bytter vi fortegn pa determinanten, og hver gang vi gangeren rad med en faktor s, endrer determinanten seg med en faktor s. Denvanligste operasjonen (a addere et multiplum av en rad til en annen) endrer

4.9. DETERMINANTER 323

ikke determinanten i det hele tatt. I prosessen ovenfor er det to operasjonersom endrer determinanten — ett radombytte og en multiplikasjon med 1

3 .Det betyr at det(B) = (−1) · 1

3 ·det(A) (husk pa at det er det(A) som endrestil det(B)). Dermed har vi

det(A) = (−1) · 3 · det(B) = (−1) · 3 · 83

= −8

Prosedyren i eksemplet ovenfor kan brukes pa alle kvadratiske matriser— vil vi regne ut determinanten til A, radreduserer vi A til en trappematriseB, og regner ut determinanten til B ved a gange sammen diagonalelemen-tene. Deretter finner vi det(A) ved formelen

det(A) = s−11 s−1

2 · · · s−1k det(B)

der s1, s2, . . . , sk er faktorene til de radoperasjonene vi brukte nar vi re-duserte A til B. Det burde være klart hva vi mener med faktoren til enradoperasjonen — faktoren til et radombytte er −1, faktoren til det a gangeen rad med s #= 0 er s, mens faktoren til det a addere et multiplum av enrad til en annen, er 1.

Prosedyren ovenfor har ogsa viktige teoretiske konsekvenser slik det nesteteoremet viser. Vi benytter anledningen til ogsa a oppsummere noen tidligereresultater:

Teorem 4.9.10 For n× n-matriser A er følgende ekvivalent:

(i) det(A) #= 0

(ii) A er inverterbar

(iii) Matriseligningen Ax = b har en entydig løsning for alle b

(iv) Matriseligningen Ax = 0 har bare løsningen x = 0

(v) Søylene i A danner en basis for Rn

(vi) A er radekvivalent med In

Bevis: Vi vet allerede at (ii), (iii) (iv) og (v) er ekvivalente med (vi) (detfølger fra hhv. setning 4.5.4, setning 4.3.3, setning 4.4.3 og setning 4.6.10),sa det gjenstar bare a vise at (i) er ekvivalent med (vi). Anta at B erden reduserte trappeformen til A og la s1, s2, . . . , sk være faktorene til deradoperasjonene vi bruker nar vi reduserer A til B. Da er

det(A) = s−11 s−1

2 · · · s−1k det(B)

Page 165: Flervariabel analyse med lineær algebra

324 KAPITTEL 4. LINEÆR ALGEBRA I RN

og følgelig er det(A) #= 0 hvis og bare hvis det(B) #= 0. En matrise Bpa redusert trappeform er øvre triangulær, og determinanten er derfor likproduktet av diagonalelementene. Det betyr at determinanten er forskjelligfra null hvis og bare hvis alle pivotelementene star pa diagonalen, dvs. narB = In. !

Determinanten til et produkt

Vi skal na se hvordan vi kan bruke elementære matriser til a bevise noenviktige setninger om determinanter. Siden en elementær matrise fremkom-mer ved a gjøre en enkelt radoperasjon pa identitetsmatrisen, er det lett aregne ut determinanten.

Lemma 4.9.11 Anta at E er en elementær n× n-matrise. Da er determi-nanten til E lik faktoren til den tilhørende radoperasjonen. Svarer E til abytte om to rader, er altsa det(E) = −1, svarer E til a gange en rad med s,er det(E) = s, og svarer E til a addere et multiplum av en rad til en annen,er det(E) = 1.

Bevis: Dette følger direkte fra Teorem 4.9.9 siden en elementær matrisefremkommer fra identitetsmatrisen nar vi bruker den korresponderende rad-operasjonen. !

Det neste lemmaet er ogsa en omformulering av tidligere resultater.

Lemma 4.9.12 Anta C = EB der E er en elementær matrise. Da erdet(C) = det(E) det(B).

Bevis: Vi vet fra Setning 4.8.2 at C er den matrisen som fremkommernar vi bruker radoperasjonen til E pa B. Fra Teorem 4.9.9 vet vi at daer det(C) = sdet(B), der s er faktoren til denne radoperasjonen. Ifølgeforegaende lemma er s = det(E), og dermed far vi det(C) = det(E) det(B).

!

Konklusjonen i lemmaet ovenfor kan skrives slik: det(EB) = det(E) det(B).Malet vart er a utvide denne formelen til alle matriser A slik at vi genereltfar det(AB) = det(A) det(B). Før vi gar løs pa den generelle formelen,trenger vi litt informasjon om hva som skjer nar en av matrisene A, B hardeterminant lik 0.

Lemma 4.9.13 Anta at A og B er to n×n-matriser. Da er produktmatrisenC = AB inverterbar hvis og bare hvis bade A og B er inverterbare.

Bevis: Dersom bade A og B er inverterbare, vet vi fra setning 1.7.4 at Cer inverterbar med C−1 = B−1A−1. Det gjenstar dermed a vise at dersomenten A eller B ikke er inverterbar, sa er heller ikke C inverterbar.

4.9. DETERMINANTER 325

Anta først at B ikke er inverterbar. Den reduserte trappeformen til Bmangler da pivotelement i (minst) en søyle, og ligningen Bx = 0 har følgeligen løsning x #= 0. Dermed er Cx = (AB)x = A(Bx) = A0 = 0. Dersom Cvar inverterbar, ville ligningen Cx = 0 bare hatt en løsning x = 0, sa dettebetyr at C ikke er inverterbar.

Anta sa at A ikke er inverterbar. Da ma den reduserte trappeformenmangle pivotelement i en rad, sa det finnes en vektor b slik at ligningenAx = b ikke har løsning. Dermed kan heller ikke ligningen Cy = b ha enløsning, for hvis y var en løsning av denne ligningen, ville x = By være enløsning av Ax = b. Vi har nemlig

Ax = A(By) = (AB)y = Cy = b

Dette betyr at ligningen Cy = b ikke har løsning, og følgelig er C ikke in-verterbar. !

Resultatet ovenfor forteller oss at formelen det(AB) = det(A) det(B)holder dersom en av matrisene A, B er singulær (dvs. ikke inverterbar) —i sa fall er en av faktorene pa høyresiden lik null, og det samme er det(AB)ifølge lemmaet. Vi kan derfor konsentrere oss om a vise formelen det(AB) =det(A) det(B) nar A og B er inverterbare.

Setning 4.9.14 For alle n× n-matriser A, B er

det(AB) = det(A) det(B)

Bevis: Vi vet allerede at formelen stemmer nar A eller B er singulær, sa vikan anta at bade A og B er inverterbare. Ifølge setning 4.8.4 er da bade Aog B produkter av elementære matriser

A = E1E2 · · ·Em og B = F1F2 · · ·Fk

Ved gjentatt bruk av lemma 4.9.12, ser vi at

det(A) = det(E1) det(E2) · · ·det(Em)

ogdet(B) = det(F1) det(F2) · · ·det(Fk)

Siden AB = E1E2 · · ·EmF1F2 · · ·Fk far vi pa tilsvarende mate

det(AB) = det(E1) det(E2) · · ·det(Em) det(F1) det(F2) · · ·det(Fk)

og følgelig er det(AB) = det(A) det(B). !

Bemerkning: Dersom vi tenker pa determinanten som en forstørrelses-faktor (se seksjon 2.9), er resultatet ovenfor som forventet — forstørrer

Page 166: Flervariabel analyse med lineær algebra

326 KAPITTEL 4. LINEÆR ALGEBRA I RN

vi først med en faktor det(B) og sa med en faktor det(A), bør den sam-lede forstørrelsesfaktoren det(AB) være lik produktet det(A) det(B). Værforøvrig oppmerksom pa at det ikke finnes noen tilsvarede enkel metode fora regne ut determinanten til en sum.

Setningen ovenfor har mange nyttige konsekvenser:

Korollar 4.9.15 For alle inverterbare matriser A er

det(A−1) =1

det(A)

Bevis: Ifølge setningen ovenfor er

det(A) det(A−1) = det(In) = 1

!

Korollar 4.9.16 For alle n× n-matriser er

det(AT ) = det(A)

Bevis: Observer først at dersom E er en elementær matrise, sa fortellersetning 4.8.5 oss at ET er en elementær matrise med samme faktor. Dermeder det(ET ) = det(E) ifølge lemma 4.9.11.

Ifølge setning 4.8.4 kan enhver matrise A skrives som et produkt A =E1E2 · · ·EmB der E1, E2, . . . , Em er elementære matriser, og B er pa redu-sert trappeform. Ifølge setningen ovenfor er

det(A) = det(E1) det(E2) · · ·det(Em) det(B)

Siden AT = BT ETm · · ·ET

2 ET1 (se setning 4.8.6 om du ikke ser dette direkte),

far vi tilsvarende

det(AT ) = det(BT ) det(ETm) · · ·det(ET

2 ) det(ET1 )

Vi har allerede observert at det(ET1 ) = det(E1), det(ET

2 ) = det(E2),. . . ,det(ET

m) = det(Em), sa det er nok a vise at det(BT ) = det(B). Siden B er enøvre triangulær matrise, er BT nedre triangulær, og begge determinantene erda lik produktet av diagonalelementene ifølge lemma 4.9.2. Diagonalelemen-tene endrer seg ikke nar vi transponerer, og dermed er det(BT ) = det(B). !

Resultatet ovenfor er nyttig nar vi skal regne ut visse determinanter:

Eksempel 3: Tenk deg at vi skal regne ut determinanten til

A =

1 2 −3 40 1 −2 30 2 −1 40 −3 1 1

4.9. DETERMINANTER 327

Ifølge korollaret ovenfor kan vi like godt regne ut determinanten til det(AT ),og da far vi

det(A) = det(AT ) =

∣∣∣∣∣∣∣∣

1 0 0 02 1 −2 −3

−3 −2 −1 14 3 4 1

∣∣∣∣∣∣∣∣=

∣∣∣∣∣∣

1 −2 −3−2 −1 1

3 4 1

∣∣∣∣∣∣

der vi har utnyttet alle nullene til a forenkle regnearbeidet (fullfør utregnin-gene selv). !

Utvikling langs rader og søyler

Nar vi bruker definisjonen til a uttrykke en n × n-determinant ved hjelpav (n − 1) × (n − 1)-determinanter, sier vi at vi utvikler eller ekspandererdeterminanten langs første rad. Det viser seg at vi kan utvikle en determinantogsa langs andre rader — og faktisk ogsa langs søyler (her bruker vi trikseti eksempel 3; vi transponerer matrisen for a gjøre om søyler til rader).

Nar vi utvikler determinanten til en n× n-matrise A langs i-te rad, tarvi det første elementet ai1 i raden og ganger med den (n − 1) × (n − 1)-matrisen vi far nar vi fjerner raden og søylen gjennom ai1. Deretter gjørvi det samme med det andre elementet i raden; vi ganger ai2 med den(n−1)×(n−1)-determinanten vi far nar vi fjerner raden og søylen gjennomai2. Vi fortsetter pa denne maten bortover hele raden, og til slutt legger visammen alle leddene med vekslende fortegn. Her ma vi være litt forsiktige— nar vi utvikler langs første rad, begynner vi alltid med positivt fortegn,men det gjelder ikke generelt. Regelen er at dersom nummeret i pa radener et oddetall, begynner vi med positivt fortegn, dersom i er et partall,begynner vi med negativt fortegn. Figuren nedenfor viser hvilket fortegn deforskjellige leddene far nar vi utvikler en determinant.

+ − + − . . .− + − + . . .+ − + − . . .− + − + . . ....

......

... . . .

Du kan sjekke at fortegnet til det (i, j)-te elementet er gitt ved (−1)i+j . Narvi har utviklet langs i-te rad, sitter vi dermed igjen med

det(A) = (−1)i+1ai1Ai1 + (−1)i+2ai2Ai2 + · · · + (−1)i+nainAin

der Aij er determinanten vi far nar vi fjerner raden og søylen gjennom aij .Det er ofte lurt a utvikle en determinant langs en annen rad enn den

første fordi vi da kan utnytte spesielle egenskaper ved determinanten. Spe-sielt er det lurt a utvikle langs en rad med mange nuller. La oss se pa et

Page 167: Flervariabel analyse med lineær algebra

328 KAPITTEL 4. LINEÆR ALGEBRA I RN

eksempel:

Eksempel 4: Vi skal regne ut determinanten til

A =

2 1 3 −10 −2 2 33 −1 2 10 1 2 0

Vi velger a utvikle langs fjerde rad siden den inneholder to nuller. Sidendette er en “partallsrad”, ma vi begynne med negativt fortegn:

det(A) = −0 ·

∣∣∣∣∣∣

1 3 −1−2 2 3−1 2 1

∣∣∣∣∣∣+ 1 ·

∣∣∣∣∣∣

2 3 −10 2 33 2 1

∣∣∣∣∣∣−

−2 ·

∣∣∣∣∣∣

2 1 −10 −2 33 −1 1

∣∣∣∣∣∣+ 0 ·

∣∣∣∣∣∣

2 1 30 −2 23 −1 2

∣∣∣∣∣∣=

=

∣∣∣∣∣∣

2 3 −10 2 33 2 1

∣∣∣∣∣∣− 2 ·

∣∣∣∣∣∣

2 1 −10 −2 33 −1 1

∣∣∣∣∣∣

Vi fortsetter pa samme mate med 3 × 3-matrisene. Pa grunn av nullen,lønner det seg na a utvikle langs annen rad. For oversiktens skyld tar videterminantene hver for seg. Vi far

∣∣∣∣∣∣

2 3 −10 2 33 2 1

∣∣∣∣∣∣= −0 ·

∣∣∣∣3 −12 1

∣∣∣∣ + 2 ·∣∣∣∣

2 −13 1

∣∣∣∣− 3 ·∣∣∣∣

2 33 2

∣∣∣∣ =

= 2 · (2 · 1− 3 · (−1))− 3 · (2 · 2− 3 · 3) = 25

og∣∣∣∣∣∣

2 1 −10 −2 33 −1 1

∣∣∣∣∣∣= −0 ·

∣∣∣∣1 −1

−1 1

∣∣∣∣ + (−2) ·∣∣∣∣

2 −13 1

∣∣∣∣− 3 ·∣∣∣∣

2 13 −1

∣∣∣∣ = 5

= (−2) · (2 · 1− 3 · (−1))− 3 · (2 · (−1)− 3 · 1) = 5

Dermed har vi det(A) = 25− 2 · 5 = 15. !

Hvorfor far vi riktig svar nar vi utvikler en determinant langs en annenrad enn den første? Det er ikke sa vanskelig a forklare. Anta at vi ønskera utvikle determinanten til A langs i-te rad. Vi kan flytte denne raden til

4.9. DETERMINANTER 329

toppen av matrisen gjennom i−1 radombytter — først bytter vi raden medden (i− 1)-te, sa med rad nummer (i− 2) osv. Til slutt far vi en matrise Bder den i-te raden i A star øverst, mens alle de andre kommer i opprinneligrekkefølge. Siden determinanten bytter fortegn for hvert radombytte, ser viat det(B) = (−1)i−1 det(A), dvs. at det(B) = det(A) hvis i er et oddetall,og det(B) = −det(A) hvis i er et partall. Hvis vi na regner ut determinan-ten til B ved a utvikle langs første rad (altsa i henhold til definisjonen),far vi nøyaktig de samme leddene som nar vi utvikler det(A) langs i-te rad,bortsett fra at fortegnene til leddene er motsatt dersom i er et partall. Dettefortegnsbyttet kompenserer for at det(B) = −det(A) nar i er et partall, ogdermed ser vi at prosedyren gir riktig svar i alle tilfeller.

Vi kan ogsa utvikle determinanter langs søyler istedenfor rader. Ønsker via utvikle determinanten til n×n-matrisen A langs j-te søyle, starter vi meddet første elementet a1j i søylen, og ganger det med den (n− 1)× (n− 1)-determinanten vi far nar vi fjerner raden og søylen gjennom a1j . Vi gjørtilsvarende med de andre elementene i søylen, og til slutt legger vi sammenalle leddene med vekslende fortegn. Fortegnet følger det samme sjakkbrett-mønsteret som tidligere. Det er lett a se hvorfor denne prosedyren gir riktigsvar — a utvikle determinanten til A etter j-te søyle, er det samme som autvikle determinanten til AT etter j-te rad, og vi vet at det(AT ) = det(A).La oss se pa et enkelt eksempel.

Eksempel 5: Vi skal regne ut determinanten til

A =

2 1 04 2 33 1 0

Det lønner seg a utvikle langs siste søyle siden den inneholder to nuller:

det(A) = 0 ·(

4 23 1

)− 3 ·

(2 13 1

)+ 0 ·

(2 14 2

)=

= −3 · (2 · 1− 3 · 1) = 3

!

Vi har na den kunnskapen vi trenger om determinanter. I neste seksjonskal vi se hvordan vi kan bruke denne kunnskapen til a finne egenverdier ogegenvektorer.

Oppgaver til seksjon 4.9

1. Bruk definisjonen av determinant til a regne ut determinanten til matrisene:

a)

1 −2 −13 1 −21 0 1

b)

2 0 31 −1 20 1 2

c)

0 2 3

−1 2 02 −1 1

Page 168: Flervariabel analyse med lineær algebra

330 KAPITTEL 4. LINEÆR ALGEBRA I RN

2. Bruk radoperasjoner til a regne ut determinanten til matrisene:

a)

1 −3 02 −1 −21 −1 1

b)

2 1 −11 −1 12 1 2

c)

0 −1 1

−1 3 22 −2 1

3. Regn ut determinanten ved a ekspandere langs velvalgte søyler og rader:

a)

1 2 40 0 −13 7 2

b)

1 0 32 −3 14 0 2

c)

3 1 0 42 1 2 00 0 1 −21 2 1 2

4. Bruk MATLAB til a regne ut determinanten til matrisen:

a)

7 −3 3 1 −43 2 −1 4 33 0 4 1 34 1 3 −1 51 4 −2 2 0

b)

2 3 2 1 1−2 2 1 2 4

1 4 −4 3 −32 −1 2 1 −23 0 2 −2 4

5. Bevis radtilfellet av lemma 4.9.1.

6. Bevis lemma 4.9.2 for nedre triangulære matriser.

7. Vis at dersom A er en n× n-matrise og r er et tall, sa er det(rA) = rn det(A).

8. Vis at det(An) = det(A)n for alle hele tall n (pa høyre side er det det(A) somopphøyes i n-te).

9. Bruk teorem 4.9.9 til a vise at dersom radene til A er lineært avhengige, sa erdet(A) = 0. (Hint: Bruk radoperasjoner til a skaffe deg en rad som bare bestar avnuller). Vis at dette ogsa følger fra teorem 4.9.10 og korollar 4.9.16.

10. En n× n-matrise kalles ortogonal dersom U−1 = UT . Vis at det(U) er enten 1eller -1.

11. I denne oppgaven skal vi bruke følgende notasjon: Dersom A er en n×n-matriseog b ∈ Rn er en søylevektor, sa er Ai(b) matrisen vi far nar vi erstatter den i-tesøylen til A med b. Vi skal vise at dersom A er inverterbar, sa er løsningen

x =

x1

x2...

xn

til ligningen Ax = b gitt ved

xi =det(Ai(b))

det(A)

Dette kalles Cramers regel.

a) Vis at dersom I er n× n-identitetsmatrisen, sa er det(Ii(x)) = xi.

4.10. EGENVEKTORER OG EGENVERDIER 331

b) Vis at AIi(x) = Ai(b).

c) Bevis Cramers regel.

d) Bruk Cramers regel til a løse ligningssystemet

2x− 3y = 4x− 4y = −2

4.10 Egenvektorer og egenverdier

Dersom A er en n × n-matrise, kalles en vektor v #= 0 en egenvektor for Adersom det finnes et tall λ slik at Av = λv. Tallet λ kalles en egenverdi forA. Vi har vært borti egenvektorer og egenverdier tidligere, men siden vi ikkehar hatt noen metode for a finne dem, har det vært vanskelig a utnytte demskikkelig. Med det vi na har lært om determinanter, har vi de redskapene vitrenger.

Det er et par ting vi bør avklare før vi begynner. For det første legger vimerke til at dersom v er en egenvektor med egenverdi λ, sa er ogsa enhverparallell vektor av (der a er et tall forskjellig fra 0) en egenvektor medegenverdi λ siden

A(av) = aA(v) = a(λv) = λ(av)

Nar vi er pa jakt etter egenvektorer, er det nok a finne en av disse parallellevektorene, og vi velger da som regel en som har “pene” (f.eks. heltallige)komponenter.

Den andre tingen vi bør være klar over, er at selv om en matrise A er re-ell, kan det hende at den har egenverdier og egenvektorer som er komplekse(se eksempel 5 i seksjon 2.8). Skal man løse et praktisk problem, er det oftehelt nødvendig a studere disse komplekse egenvektorene og egenverdiene, ogdet medfører at vi er nødt til a bruke teorien fra de tidligere seksjonene pakomplekse tall og komplekse vektorer. I noen tilfeller gar vi da utover detvi strengt tatt har bevist, men det er ikke vanskelig a sjekke at de tidlige-re resultatene i dette kapitlet ogsa holder for komplekse tall og kompleksevektorer. Det eneste vi ma passe litt ekstra pa nar vi regner med kom-plekse vektorer, er skalarproduktet. Som du kanskje husker fra seksjon 1.3,inneholder skalarproduktet av to komplekse vektorer x = (x1, x2, . . . , xn),y = (y1, y2, . . . , yn) en komplekskonjugasjon — vi har

x · y = x1y1 + x2y2 + · · · + xnyn

Nar vi skal finne egenvektorer og egenverdier, lønner det seg som regel afinne egenverdiene først. Ifølge definisjonen er λ en egenverdi for A dersomdet finnes en ikke-null vektor v slik at

Av = λv

Page 169: Flervariabel analyse med lineær algebra

332 KAPITTEL 4. LINEÆR ALGEBRA I RN

Sagt pa en annen mate: λ er en egenverdi for A dersom ligningen Av = λvhar en ikke-null løsning v. Skriver vi høyresiden av denne ligningen somλInv og flytter leddet Av over pa den andre siden, far vi

(λIn −A)v = 0 (4.10.1)

Dette betyr at λ er en egenverdi for A hvis og bare hvis ligning (4.10.1) haren løsning v #= 0, dvs. hvis og bare hvis ligningen har mer enn en løsning(v = 0 er alltid en løsning). Ifølge teorem 4.9.10 skjer dette hvis og barehvis det(λIn −A) = 0. Vi har dermed vist:

Lemma 4.10.1 λ er en egenverdi for n × n-matrisen A hvis og bare hvisdet(λIn −A) = 0. !

Observer at dersom

A =

a11 a12 · · · a1n

a21 a22 · · · a2n...

... · · ·...

an1 an2 · · · ann

sa er

λIn −A =

λ− a11 −a12 . . . −a1n

−a21 λ− a22 . . . −a2n...

... . . ....

−an1 −an2 . . . λ− ann

La oss se pa et eksempel.

Eksempel 1: Vi skal finne egenverdiene til matrisen

A =(

4 −15 −2

)

Vi ser atdet(λI2 −A) =

∣∣∣∣λ− 4 1−5 λ + 2

∣∣∣∣ =

= (λ− 4)(λ + 2)− (−5) · 1 = λ2 − 2λ− 8 + 5 = λ2 − 2λ− 3

Egenverdiene er altsa løsningene til annengradsligningen

λ2 − 2λ− 3 = 0

Løser vi denne, far vi egenverdiene λ1 = 3, λ2 = −1.Nar vi har funnet egenverdiene, er det ingen sak a finne egenvektorene.

En egenvektor v1 med egenverdi λ1 = 3, er en løsning av ligningen

Av1 = 3v1

4.10. EGENVEKTORER OG EGENVERDIER 333

Setter vi inn v1 =(

xy

), far vi

4x− y = 3x

5x− 2y = 3y

som kan omformes til

x− y = 05x− 5y = 0

Vi kan selvfølgelig løse dette systemet ved Gauss-eliminasjon, men det eregentlig unødvendig — vi ser at ligningene har de samme løsningene, og atvi derfor kan nøye oss med a løse den første. Den har apenbart løsningenex = y. Dette betyr at vi kan velge y fritt og sa regne ut x. Alle vektorer vi farpa denne maten er parallelle, og vi plukker derfor bare ut en av dem. Velger

vi y = 1, far vi x = 1, og vi ser dermed at v1 =(

11

)er en egenvektor.

La oss ogsa finne en egenvektor v2 for den andre egenverdien λ2 = −1.Denne vektoren ma være en løsning av ligningen

Av1 = (−1)v1 = −v1

Setter vi inn v1 =(

xy

), far vi

4x− y = −x

5x− 2y = −y

som kan omformes til

5x− y = 05x− y = 0

Igjen ser vi at vi kan regne ut x nar vi har valgt y. Velger vi y = 5, far vi

x = 1, og dermed har vi v2 =(

15

). Vi har altsa to egenvektorer

v1 =(

11

)og v2 =

(15

)

Det er lett a se at disse er lineært uavhengige og dermed danner en basis forR2. ♣

I eksemplet ovenfor matte vi løse en annengradsligning for a finne egen-verdiene til en 2×2-matrise. Dette er typisk — skal vi finne egenverdiene tilen n×n-matrise, ma vi løse en n-tegradsligning. Grunnen er at nar vi regnerut det(λIn − A), far vi et n-tegradspolynom i λ. For a overbevise deg omdette behøver du bare a tenke pa hva som skjer nar du utvikler en matriseetter første rad (hvis du vil, kan du føre et induksjonsbevis).

Page 170: Flervariabel analyse med lineær algebra

334 KAPITTEL 4. LINEÆR ALGEBRA I RN

Definisjon 4.10.2 Dersom A er n× n-matrise, kalles n-tegradspolynomet

PA(λ) = det(λIn −A)

det karakteristiske polynomet1tilA.

Fra algebraens fundamentalteorem (se Kalkulus, teorem 3.5.1) vet vi atet n-tegradspolynom alltid har n røtter nar vi teller med multiplisitet ogtillater komplekse løsninger. Det vanligste er at alle røttene er forskjellige.Det neste resultatet viser at hvis det karakteristiske polynomet PA har nforskjellige røtter, sa har vi en basis av egenvektorer for A.

Setning 4.10.3 La A være en n × n-matrise, og anta at v1, v2, . . . , vk

er egenvektorer med forskjellige egenverdier. Da er v1, v2, . . . , vk lineærtuavhengige. Dersom A har n forskjellige egenverdier, finnes det altsa enbasis som bestar av egenvektorer for A.

Bevis: Anta (for motsigelse) at det finnes lineært avhengige egenvektorermed forskjellige egenverdier, og la v1, v2, . . . , vk være en slik mengde medfærrest mulige elementer. Vi ser at k er minst 2 siden en mengde som barebestar av ett ikke-null element umulig kan være lineært avhengig. Sidenvektorene er lineært avhengige, finnes det tall c1, c2, . . . , ck som ikke alle ernull, slik at

c1v1 + c2v2 + . . . + ckvk = 0 (4.10.2)

Faktisk ma alle c’ene være forskjellige fra null, for hvis ikke finnes det enmindre, lineært avhengig mengde av egenvektorer. Hvis vi ganger ligning(4.10.2) fra venstre med A, far vi

c1λ1v1 + c2λ2v2 + . . . + ckλkvk = 0 (4.10.3)

der λ1,λ2, . . . ,λk er egenverdiene. Ganger vi ligning (4.10.2) med −λ1 oglegger resultatet til (4.10.3), far vi

c2(λ2 − λ1)v2 + c3(λ3 − λ1)v3 + · · · + ck(λk − λ1)vk = 0

Siden alle c’ene er forskjellige fra null og egenverdiene er forskjellige, viserdette at v2, v3, . . . , vk er lineært avhengige, men det er umulig siden v1, v2,. . . , vk er en minimal, lineært avhengig mengde. Dette betyr at antagelsenom at det finnes lineært avhengige egenvektorer med forskjellige egenverdier,er gal, og dermed er den første delen av setningen bevist. Den andre delenfølger siden enhver lineært uavhengig mengde med n elementer i Rn er enbasis (se korollar 4.6.11). !

1De fleste bøker bruker definisjonen P (λ) = det(A− λIn) isteden. De to definisjoneneskiller seg med en faktor (−1)n, og er derfor sa godt som ekvivalente. Fordelen med vartvalg er at vi slipper en del unødvendige minuser nar vi skal finne egenverdier i praksis.

4.10. EGENVEKTORER OG EGENVERDIER 335

Multiple egenverdier

Vi har na sett at dersom alle egenverdiene til en matrise er forskjellige, safinnes det en basis av egenvektorer. Det er naturlig a tenke seg at dette ogsagjelder dersom noen av egenverdiene er sammenfallende — det naturligetipset er at dersom λ er en egenverdi med multiplisitet k, sa finnes det klineært uavhengige egenvektorer med egenverdi λ. Dette er imidlertid ikketilfellet, og dermed er det heller ikke slik at enhver matrise har en basis avegenvektorer. La oss se pa et eksempel.

Eksempel 2: Vi skal finne egenverdiene og egenvektorene til matrisen

A =(

2 −11 0

)

Det karakteristiske polynomet er

PA(λ) =(

λ− 2 1−1 λ

)= (λ− 2)λ− (−1) · 1 = λ2 − 2λ + 1

som bare har en rot λ = 1. Denne roten har multiplisitet 2 siden

PA(λ) = λ2 − 2λ + 1 = (λ− 1)2

En egenvektor v =(

xy

)ma tilfredsstille Av = v, dvs.

2x− y = x

x = y

Dette ligningssystemet er oppfylt hvis x = y, dvs. hvis v =(

xx

). Alle

disse vektorene er lineært avhengige, sa selv om λ har multiplisitet 2, finnesdet ikke to lineært uavhengige vektorer med egenverdi 1. Det finnes hellerikke noen basis bestaende av egenvektorer til A. ♣

Vi skal se pa et eksempel til. Dette eksemplet viser at vi ikke ma blifor pessimistiske; vi kan godt ha en basis av egenvektorer selv om ikke alleegenverdiene er forskjellige. Eksemplet demonstrerer ogsa noen av de reg-netekniske utfordringene vi far, nar vi skal finne egenverdiene til litt størresystemer.

Eksempel 3: Vi skal finne egenverdiene og egenvektorene til matrisen

A =

53

13 −1

3

0 1 0−2

3 −13

43

Page 171: Flervariabel analyse med lineær algebra

336 KAPITTEL 4. LINEÆR ALGEBRA I RN

Det karakteristiske polynomet er gitt ved:

PA(λ) =

∣∣∣∣∣∣∣

λ− 53 −1

313

0 λ− 1 023

13 λ− 4

3

∣∣∣∣∣∣∣

For a regne ut polynomet, ekspanderer vi langs andre rad og far

PA(λ) = (λ− 1)

∣∣∣∣∣λ− 5

313

23 λ− 4

3

∣∣∣∣∣ = (λ− 1)((

λ− 53)(

λ− 43)− 2

3· 13

)=

= (λ− 1)(λ2 − 3λ + 2

)

Annengradspolynomet λ2 − 3λ + 2 har røttene 2 og 1 (sjekk!), og dermedhar PA røttene 2 og 1 — den siste med multiplisitet 2. Egenverdiene til Aer dermed ogsa 2 og 1.

La oss først finne egenvektorene med egenverdi 1. En slik egenvektor

v =

xyz

ma tilfredsstille ligningen Av = v, dvs.

53x +

13y − 1

3z = x

y = y

−23x− 1

3y +

43z = z

Dette systemet kan ogsa skrives

23x +

13y − 1

3z = 0

0 = 0

−23x− 1

3y +

13z = 0

Det er mange mater a løse dette systemet pa, men siden det er viktig ikke amiste noen løsninger, kobler vi inn den “offisielle” metoden var. Den utvidedematrisen til ligningssystemet er

23

13 −1

3 00 0 0 0

−23 −1

313 0

4.10. EGENVEKTORER OG EGENVERDIER 337

Vi radreduserer denne matrisen ved a legge den første raden til den tredje,og deretter gange den første raden med 3

2 . Vi sitter da igjen med matrisen

1 1

2 −12 0

0 0 0 00 0 0 0

Vi ser at y og z er frie variable, mens x er en basisvariabel. Velger vi verdierfor y og z, far vi

x = −12y +

12z

En egenvektor ma derfor være pa formen

v =

xyz

=

−1

2y + 12z

yz

= y

−1

210

+ z

1201

Dette viser at

v1 =

−1

210

og v2 =

1201

genererer alle egenvektorer med egenverdi 1, og det er lett a sjekke at v1 ogv2 er lineært uavhengige.

Vi ser na pa den andre egenverdien 2. En egenvektor

v =

xyz

med denne egenverdien ma tilfredsstille ligningen Av = 2v, dvs.

53x +

13y − 1

3z = 2x

y = 2y

−23x− 1

3y +

43z = 2z

Dette systemet kan ogsa skrives

−13x +

13y − 1

3z = 0

−y = 0

−23x− 1

3y − 2

3z = 0

Page 172: Flervariabel analyse med lineær algebra

338 KAPITTEL 4. LINEÆR ALGEBRA I RN

Den utvidede matrisen til dette ligningssystemet er

−1

313 −1

3 00 −1 0 0

−23 −1

3 −23 0

Vi radreduserer denne matrisen:

−1

313 −1

3 00 −1 0 0

−23 −1

3 −23 0

III+(−2)I∼

−1

313 −1

3 00 −1 0 00 −1 0 0

III+(−1)II∼

−1

313 −1

3 00 −1 0 00 0 0 0

(−3)I

(−1)II∼

1 −1 1 00 1 0 00 0 0 0

Vi ser at z er en fri variabel, mens x og y er basisvariable. Velger vi en verdifor z, far vi

y = 0

ogx = y − z = −z

En egenvektor ma derfor være pa formen

v =

xyz

=

−z0z

= z

−1

01

Alle disse vektorene er parallelle, og vi velger

v3 =

−1

01

som var representant. Vi har dermed tre egenvektorer

v1 =

−1

210

,v2 =

1201

,v3 =

−1

01

Det er lett a sjekke at disse er lineært uavhengige og dermed danner en basisfor R3. ♣

Eksemplene ovenfor viser at det ikke er sa lett a vite hva som skjer medegenvektorene nar vi har sammenfallende egenverdier — i noen tilfeller vilvi ha en basis av egenvektorer, i andre tilfeller ikke. Vi kan ikke gjøre sa myeannet enn a undersøke hvert enkelt tilfelle. Det finnes mer avanserte verktøyman kan bruke, men de far vente til en annen anledning.

4.10. EGENVEKTORER OG EGENVERDIER 339

Komplekse egenverdier

Vi tar ogsa med et eksempel der egenverdiene er komplekse. Fremgangsmatener akkurat den samme som i det reelle tilfellet, men regningene kan bli littstyggere siden vi na far ligningssystemer med komplekse koeffisienter.

Eksempel 4: Vi skal finne egenverdiene og egenvektorene til matrisen

A =(

1 −22 1

)

Det karakteristiske polynomet er

PA(λ) =∣∣∣∣

λ− 1 2−2 λ− 1

∣∣∣∣ = λ2 − 2λ + 5

Setter vi dette uttrykket lik null og løser annengradsligningen, far vi

λ =−(−2) ±

√(−2)2 − 4 · 1 · 52

= 1 ± 2i

Egenverdiene er altsa λ1 = 1 + 2i og λ2 = 1− 2i.

Vi finner først en egenvektor v1 =(

xy

)med egenverdi λ1. En slik

vektor ma oppfylle ligningen(

1 −22 1

) (xy

)= (1 + 2i)

(xy

)

det vil si

x− 2y = (1 + 2i)x2x + y = (1 + 2i)y

Flytter vi leddene pa høyre side over pa den andre siden, og forkorter med2, far vi

−ix− y = 0x− iy = 0

Ganger vi den øverste ligningen med i, far vi den nederste ligningen, og deter derfor nok a finne en løsning til den ene av ligningene. Velger vi y lik 1 iden nederste ligningen, far vi x = i, og dermed har vi funnet egenvektoren

v1 =(

i1

)

Page 173: Flervariabel analyse med lineær algebra

340 KAPITTEL 4. LINEÆR ALGEBRA I RN

Vi kan finne en egenvektor v2 =(

xy

)med egenverdi λ2 pa akkurat

samme mate. En slik vektor ma oppfylle ligningen(

1 −22 1

) (xy

)= (1− 2i)

(xy

)

det vil si

x− 2y = (1− 2i)x2x + y = (1− 2i)y

Flytter vi leddene pa høyre side over pa den andre siden, og forkorter med2, far vi

ix− y = 0x + iy = 0

Ganger vi den første ligningen med −i, far vi den andre, sa det er nok a løseen av ligningene. Velger vi y = 1 i den nederste, far vi x = −i. Dermed harvi egenvektoren

v2 =(−i1

)

I eksemplet ovenfor ser vi at de to egenverdiene og de to egenvektoreneer komplekskonjugerte av hverandre. At egenverdiene er komplekskonjuger-te, er ikke noe mysterium — det følger av at de komplekse røttene til etreelt polynom alltid kommer i komplekskonjugerte par (se Kalkulus, lemma3.5.3). For a sjekke at det samme gjelder egenvektorene, trenger vi et literesonnement.

Setning 4.10.4 Anta at A er en reell n×n-matrise, og at v er en kompleksegenvektor med egenverdi λ. Da er v en egenvektor med egenverdi λ (her erv den vektoren vi far nar vi komplekskonjugerer alle komponentene til v).

Bevis: (I dette beviset bruker vi regnereglene for konjugasjon pa vektorerog matriser, og ikke bare pa tall. Du bør sjekke at dette er tillatt.) Siden Aer reell, har vi

Av = Av = Av

Pa den annen side erAv = λv = λv

Kombinerer vi disse to uttrykkene far vi

Av = λv

4.10. EGENVEKTORER OG EGENVERDIER 341

som viser at v er en egenvektor med egenverdi λ. !

Legg merke til at vi kan bruke denne setningen til a forenkle arbeidetmed a finne komplekse egenvektorer. I eksempel 4 kunne vi ha brukt den tila skrive opp v2 med en gang vi hadde funnet v1.

Egenverdier til symmetriske matriser

Vi ma innrømme at teorien var har sine ubehagelige sider — det er ikkealle matriser som har en basis av egenvektorer, og det kan godt tenkes ategenverdiene er komplekse selv om matrisen er reell. Dette ma vi bare levemed — det er na slik verden engang er. Det finnes imidlertid noen matrisersom oppfører seg slik vi kunne ønske oss, nemlig de symmetriske.

Definisjon 4.10.5 En n× n-matrise A er symmetrisk dersom A = AT .

Navnet symmetrisk kommer av at en symmetrisk matrise ikke endrer segnar vi speiler den om diagonalen. Disse matrisene er symmetriske:

A =(

1 22 3

), B =

4 2 32 0 53 5 7

, C =

−1 3 −2 13 −4 5 0

−2 5 −1 41 0 4 π

De symmetriske matrisene kan virke spesielle, men de dukker opp i for-bausende mange sammenhenger. I neste kapittel skal vi utnytte at matriserbestaende av de annenderiverte til en funksjon (sakalte Hesse-matriser) ersymmetriske.

Vi trenger en definisjon til før vi kan skrive opp hovedresultatet for sym-metriske matriser (har du lest seksjon 4.7 vil du ha sett bade denne definisjo-nen og setning 4.10.7 før): En basis v1,v2, . . . ,vn er ortonormal dersom allevektorene i basisen har lengde 1 og star ortogonalt (normalt) pa hverandre— med andre ord dersom

vi · vj ={

0 hvis i #= j1 hvis i = j

Teorem 4.10.6 (Spektralteoremet for symmetriske matriser) Anta atA er en symmetrisk n × n-matrise. Da er alle egenverdiene til A reelle, ogdet finnes en ortonormal basis for Rn som bestar av egenvektorer til A.

Vi utsetter beviset for dette teoremet til seksjon 4.12 — det er ikkespesielt vanskelig, men det krever en del forberedelser som vi ikke har gjortenna.

Ortonormale basiser har mange fordeler — blant annet er det raskt a fin-ne ut hvordan man kan skrive en vilkarlig vektor som en lineærkombinasjonav basisvektorene:

Page 174: Flervariabel analyse med lineær algebra

342 KAPITTEL 4. LINEÆR ALGEBRA I RN

Setning 4.10.7 Anta at v1, v2,. . . ,vn er en ortonormal basis for Rn. Forethvert element v ∈ Rn er da

v = c1v1 + c2v2 + · · · + · · · + cnvn

der ci = v · vi for i = 1, 2, . . . , n.

Bevis: Siden v1, v2,. . . ,vn er en basis, vet vi at v kan skrives som en lineær-kombinasjon

v = c1v1 + c2v2 + · · · + civi + · · · + cnvn

Tar vi skalarproduktet med vi pa begge sider, far vi

v · vi = c1v1 · vi + c2v2 · vi + · · · + civi · vi · · · + cnvn · vi = ci

der vi har brukt at

vj · vi ={

0 hvis i #= j1 hvis i = j

!

Diagonalisering av matriser

Dersom en matrise har en basis av egenvektorer, kan den diagonaliseres paen mate som ofte er nyttig.

Setning 4.10.8 Anta at A er en n×n-matrise med en basis v1,v2, . . . ,vn

av egenvektorer, og la λ1,λ2, . . . ,λn være de tilhørende egenverdiene. La T :Rn → Rn være lineæravbildningen som for alle i avbilder ei pa vi, og la Mvære matrisen til T. Da er M inverterbar, og

M−1AM = D

der D er diagonalmatrisen

D =

λ1 0 . . . 00 λ2 . . . 0...

......

...0 0 . . . λn

Bevis: Ifølge setning 4.6.13 finnes det virkelig en lineæravbildning T slik atT(ei) = vi for alle i. Dersom M er matrisen til T , er da Mei = vi for alle i.Ved setning 4.6.13 finnes det ogsa en lineæravbildning T slik at T(vi) = ei

for alle i. Hvis M er matrisen til denne lineæravbildningen, er Mvi = ei foralle i. Dermed er MMei = Mvi = ei. Dette betyr at MMei = Inei for allebasiselementer ei, og ifølge setning 4.6.12 er da MM = In. Dette betyr atM er inverterbar med M−1 = M

4.10. EGENVEKTORER OG EGENVERDIER 343

For a vise at D = M−1AM , observerer vi først at Dei = λiei. Ifølgesetning 4.6.13 er da nok a vise at M−1AMei = λiei for alle i. Men det erlett:

M−1AMei = M−1Avi = M−1λiei = λiM−1vi = λiei

Dermed er setningen bevist !

I praksis er det lett a finne matrisen M i setningen ovenfor — fra setning2.8.4 vet vi nemlig at den i-te søylen til M rett og slett er søylevektoren vi.Det er litt mer arbeid a finne M−1 siden vi da ma invertere matrisen M .Dersom matrisen A er symmetrisk, har vi ifølge spektralteoremet 4.10.6 enortonormal basis av egenvektorer. I dette tilfellet er det enkelt a finne M−1;det viser seg nemlig at M−1 er lik den transponerte matrisen MT .

Korollar 4.10.9 Anta at A er en symmetrisk n×n-matrise, la v1,v2, . . . ,vn

være en ortonormal basis av egenvektorer, og la λ1,λ2, . . . ,λn være de til-hørende egenverdiene. La T : Rn → Rn være lineæravbildningen som for allei avbilder ei pa vi, og la M være matrisen til T. Da er

MT AM = D

der D er diagonalmatrisen

D =

λ1 0 . . . 00 λ2 . . . 0...

......

...0 0 . . . λn

!

Bevis: Det holder a vise at MT = M−1, dvs. at MT M = In. Per definisjonav matrisemultiplikasjon er det ij-te elementet i MT M lik prikkproduktetav den i-te linjen i MT med den j-te søylen i M. Den i-te linjen i MT er likden i-te søylen i M som er lik vi, og den j-te søylen i M er lik vj . Altsa erdet ij-te elementet i MT M lik vi · vj som er 1 hvis i = j og 0 ellers (herbruker vi at basisen er ortonormal). Følgelig er MT M = In, og beviset erfullført. !

Setningen ovenfor gir oss en viktig forbindelse mellom egenverdier ogdeterminanter.

Korollar 4.10.10 Anta at A er en n×n-matrise med en basis v1,v2, . . . ,vn

av egenvektorer, og la λ1,λ2, . . . ,λn være de tilhørende egenverdiene. Da er

det(A) = λ1λ2 · . . . · λn

Determinanten er altsa lik produktet av egenverdiene.

Page 175: Flervariabel analyse med lineær algebra

344 KAPITTEL 4. LINEÆR ALGEBRA I RN

Bevis: La D være diagonalmatrisen i setningen ovenfor. Da er (ifølge lemma4.9.2)

det(D) = λ1λ2 · . . . · λn

Bruker vi isteden setning 4.9.14, far vi

det(D) = det(M−1AM) = det(M−1) det(A) det(M) = det(A)

der vi ogsa har brukt at ifølge korollar 4.9.15 er det(M−1) = 1det(M) . !

Egenverdier med MATLAB

Det er lett a finne egenverdier og egenvektorer med MATLAB. Det er flerekommandoer du kan bruke, men den nyttigste er som regel

>> [u,v]=eig(A)

Denne kommandoen definerer to matriser u og v. Søylene i matrisen u eregenvektorene til A, mens v er en diagonalmatrise der elementene pa diago-nalen er egenverdiene til A. Egenvektorene og egenverdiene kommer i sammerekkefølge slik at den første egenverdien tilhører den første egenvektoren osv.Her er et eksempel pa en kjøring:

>> B=[2 1 34 0 31 1 -2];

>> [u,v]=eig(B)

u =

-0.2864 -0.0000 0.3833-0.9143 0.9487 -0.8404-0.2864 0.3162 0.3833

v =

2.1926 0 00 1.0000 00 0 -3.1926

Vær oppmerksom pa at MATLAB alltid velger egenvektorer med lengde1. Dette er praktisk for noen formal, men fører ofte til at egenvektorene

4.10. EGENVEKTORER OG EGENVERDIER 345

blir mer uoversiktlige enn nødvendig. De fleste av oss ville f.eks. ha oppgitt

den andre egenvektoren ovenfor som

031

, men MATLAB velger altsa en

normalisert variant. Mer ubegripelig er MATLABs forkjærlighet for a velgenegative komponenter i egenvektorene; for de fleste formal ville det væremer naturlig a velge den første egenvektoren til a være

0.28640.91430.2864

istedenfor

−0.2864−0.9143−0.2864

Nar man regner videre med egenvektorer man har fatt av MATLAB, kandet derfor være lurt a se om man kan forenkle dem ved a velge en annenskalering eller et annet fortegn.

Det er en ting til man bør være klar over. MATLAB vil av og til opereremed en liten imaginærdel i en egenverdi/egenvektor som egentlig er reell.Det skyldes at MATLAB er et numerisk beregningsverktøy som regner medavrundede tall. Far du egenverdier/egenvektorer med en ørliten imaginærdel(eller en ørliten realdel), kan det være lurt a sjekke om dette er en avrun-dingsfeil før du gar videre.

Oppgaver til seksjon 4.10

1. Finn egenverdiene og egenvektorene til matrisen:

a)(

2 11 2

)b)

(1 41 1

)c)

(4 31 2

),

d)(

3 1−1 1

)e)

(1 13 1

)f)

(5 2

−1 3

)

2. Finn egenverdier og egenvektorene til matrisen:

a)

2 1 −34 2 30 0 1

b)

1 3 −12 0 1

−1 −1 2

(Hint : Tipp en rot i polynomet) c)

1 −1 22 −2 40 1 1

3. Bruk MATLAB til a finne egenvektorene og egenverdiene til matrisen :

a)

2 −1 0.53 −2 13 −1 2

b)

2 0.4 10

−2.4 7.3 0.054.2 1 −3.2

c)

3 −2 −2 4−5 2 −3 2−2 2 −8 3−4 1 6 4

4. Finn egenverdiene og egenvektorene til matrisen A og skriv vektoren x som enlineærkombinasjon av egenvektorer:

a) A =(

2 22 −1

),x =

(−1

5

)

b) A =(

4 11 4

),x =

(−2−6

)

Page 176: Flervariabel analyse med lineær algebra

346 KAPITTEL 4. LINEÆR ALGEBRA I RN

c) A =

− 12 − 4

332

0 −1 032 − 2

3 − 12

,x =

131

5. Bruk MATLAB til a finne egenverdien og egenvektorene til matrisen A. Brukogsa MATLAB til a skrive vektoren x som en lineærkombinasjon av egenvektorene:

a) A =

1 −2 40 5 4

2.5 −3 4

,x =

0.32.4

−3.4

.

b) A =

2.3 −0.3 1.2 31.2 3 2.4 −1.23.3 −1.2 0.5 7−2 3.1 −2.1 1.3

,x =

−1.32.4

0.044.1

6. La A =(

5 22 2

). Finn en diagonalmatrise D og en inverterbar matrise M slik

at D = MT DM .

7. Vis at A og AT har de samme egenverdiene. Har de ogsa de samme egenvekto-rene?

8. Anta at v er en egenvektor for bade A og B. Vis at v er en egenvektor for A+B.

9. Anta at v er en egenvektor for bade A og B. Vis at v er en egenvektor for AB.

10. To n × n-matriser A og B kalles similære dersom det finnes en inverterbarmatrise P slik at B = P−1AP . Vis at A og B da har de samme egenverdiene. Finnegenvektorene til B uttrykt ved hjelp av P og egenvektorene til A.

11. Anta at A er en inverterbare matrise og at v er en egenvektor for A med egen-verdi λ #= 0. Vis at v er en egenvektor for A−1 med egenverdi λ−1.

12. Vis at dersom alle søylene i en matrise har samme sum, sa er dette tallet enegenverdi for matrisen (Hint : Gjør noen radoperasjoner før du regner ut deter-minanten til λIn − A). Bruk dette til a finne egenverdiene og egenvektorene tilmatrisen

A =

−2 3 1

2 1 25 1 2

13. Vis at egenverdien til en 2× 2-matrise

A =(

a bc d

)

er

λ =a + d ±

√(a− d)2 + 4bc

2Bruk denne formelen til a forklare at egenverdiene til en symmetrisk (reell) 2× 2-matrise alltid er reelle.

4.11. EGENVEKTORER I PRAKSIS 347

14. En symmetrisk n × n-matrise A kalles positiv definit dersom (Ax) · x > 0 foralle x #= 0.

a) Vis at A er positiv definit hvis og bare hvis alle egenverdiene til A er strengtpositive.

b) Anta at A og B er to symmetriske matriser med strengt positive egenverdier.Vis at alle egenverdiene til A + B er strengt positive.

15. Anta at P (x) = anxn + an−1xn−1 + · · ·+ a1x + a0 er et polynom og at A er enkvadratisk matrise. Da er P (A) matrisen

P (A) = anAn + an−1An−1 + · · · + a1A + a0

a) Vis at dersom v er en egenvektor for A med egenverdi λ, sa er v en egenvektorfor P (A) med egenverdi P (λ).

b) Vi lar na PA være det karakteristiske polynomet til A. Vis at PA(A)v = 0for alle egenvektorer v til A.

c) Vis at dersom A har en basis av egenvektorer, sa er PA(A) = 0.

(Kommentar : Det viser seg at PA(A) = 0 ogsa nar A ikke har en basis av egenvek-torer. Dette kalles Cayley-Hamiltons teorem.)

4.11 Egenvektorer i praksis

I denne seksjonen skal vi se pa tre eksempler som illustrerer hvordan egen-vektorer og egenverdier kan brukes i praksis. Disse eksemplene er lange ogganske kompliserte, men de viser pa en realistisk mate hva vi ma gjøre for aanalysere problemer fra den virkelige verden. Det siste eksemplet viser ogsahvor nyttig det er a ha et verktøy som MATLAB nar matrisene blir storeog uttrykkene stygge.

Før vi begynner, minner vi om følgende viktige observasjon fra kapittel2:

Setning 4.11.1 Anta at v er en egenvektor for A med egenverdi λ. Da erv en egenvektor for An med egenverdi λn, dvs.

Anv = λnv

Bevis: Vi harA2v = A(Av) = A(λv) = λAv = λ2v

A3v = A(A2v) = A(λ2v) = λ2Av = λ3v

osv. Før gjerne et induksjonsbevis om du vil! !

Eksempel 1: Vi gar tilbake til handlevogneksemplet i seksjon 1.5: Et kjøpesenterhar tre stativ X, Y og Z hvor du kan hente og avlevere handlevogner. Av devognene som starter dagen i stativ X, vil 70% avslutte den pa samme sted,

Page 177: Flervariabel analyse med lineær algebra

348 KAPITTEL 4. LINEÆR ALGEBRA I RN

10% vil ha endt opp i Y , og 20% i Z. Av de vognene som startet dagen istativ Y , vil 30% avslutte dagen i stativ X, mens henholdsvis 50% og 20%vil havne i stativene Y og Z. De tilsvarende tallene for vogner som starter iZ, er at 40% ender dagen i X, 20% i Y og 40% i Z. Vi ordner disse tallenei en matrise A der første søyle gir fordelingen av de vognene som startet iX, andre søyle gir fordelingen av de vognene som startet i Y og tredje søylegir fordelingen av vognene som startet i Z:

A =

0.7 0.3 0.40.1 0.5 0.20.2 0.2 0.4

Vi ser at hvis vi starter dagen med x0 handlevogner i stativ X, y0 handle-vogner i stativ Y og z0 handlevogner i stativ Z, og lar

r0 =

x0

y0

z0

sa vil vektorenr1 = Ar0

gi oss fordelingen av handlevogner pa slutten av dagen. Hvis handlesenteretaldri rydder opp i handlevognene, men lar dem bli staende der kundenesetter dem, vil fordelingen etter n dager være gitt ved vektoren

rn = Anr0

Vi skal se hvordan vi kan bruke egenverdiene og egenvektorene til A til afinne et uttrykk for rn.

Vi regner først ut egenverdiene til A. Etter en del regning finner vi at

det(λI3 −A) =

∣∣∣∣∣∣

λ− 0.7 −0.3 −0.4−0.1 λ− 0.5 −0.2−0.2 −0.2 λ− 0.4

=

= λ3 − 1.6λ2 + 0.68λ− 0.08

For a finne egenverdiene ma vi altsa løse tredjegradsligningen

λ3 − 1.6λ2 + 0.68λ− 0.08 = 0

Dette kan høres vanskelig ut, men ved innsetting ser vi at λ = 1 er enløsning. Vi kan derfor polynomdividere med λ− 1 og fa

λ3 − 1.6xλ2 + 0.68λ− 0.08 = (λ− 1)(λ2 − 0.6λ + 0.08)

4.11. EGENVEKTORER I PRAKSIS 349

Løsningene til annengradsligningen λ2 − 0.6λ + 0.08 = 0 er

λ =−(−0.6) ±

√(−0.6)2 − 4 · 1 · 0.082 · 1 =

0.6 ± 0.22

=

0.4

0.2

Egenverdiene til A er dermed λ1 = 1, λ2 = 0.4 og λ3 = 0.2.Neste punkt pa programmet er a finne egenvektorene. Dersom v1 =

xyz

er en egenvektor med egenverdi 1, ma vi ha

0.7 0.3 0.40.1 0.5 0.20.2 0.2 0.4

xyz

=

xyz

Dette gir ligningssystemet

−0.3x + 0.3y + 0.4z = 00.1x− 0.5y + 0.2z = 00.2x + 0.2y − 0.6z = 0

Vi ganger ligningssystemet med 10 for a slippe desimaltall og skriver deretteropp den utvidede matrisen:

B =

−3 3 4 0

1 −5 2 02 2 −6 0

Radreduserer vi matrisen, far vi:

BI↔II∼

1 −5 2 0

−3 3 4 02 2 −6 0

II+3I

III+(−2)I∼

1 −5 2 00 −12 10 00 12 −10 0

III+II∼

1 −5 2 00 −12 10 00 0 0 0

− 112 II∼

1 −5 2 00 1 −5

6 00 0 0 0

Vi ser at z er en fri variabel. Gitt z, kan vi regne ut y = 56z, x = 5y − 2z =

5 · 56z − 2z = 13

6 z. Velger vi derfor z = 6, far vi y = 5 og x = 13. Dette giregenvektoren

v1 =

1356

Page 178: Flervariabel analyse med lineær algebra

350 KAPITTEL 4. LINEÆR ALGEBRA I RN

Vi kan finne egenvektorene knyttet til de andre egenverdiene pa tilsvarendemate. Vi far

v2 =

1

−10

og v3 =

11

−2

Siden egenverdiene er forskjellige, vet vi at v1, v2 og v3 danner en basis.Begynnelsestilstanden r0 kan derfor skrives som en lineærkombinasjon avegenvektorene

r0 = c1v1 + c2v2 + c3v3 (4.11.1)

Vi skal finne konstantene c1, c2, c3 senere, men la oss foreløpig arbeide videremed uttrykket ovenfor. Ganger vi med An pa begge sider, far vi

rn = Anr0 = c1Anv1 + c2A

nv2 + c3Anv3 =

= c1λn1v1 + c2λ

n2v2 + c3λ

n3v3 = c1v1 + c2 · (0.4)nv2 + c3 · (0.2)nv3

Tar vi grensen nar n → ∞, blir de to siste leddene borte, og vi sitter igjenmed

rn → c1v1 nar n →∞

Dette betyr at fordelingen av handlevogner nærmer seg en likevektstilstandnar n gar mot uendelig, og denne fordelingen er bestemt av egenvektoren tilden største egenverdien.

La oss til slutt se hvordan vi kan finne konstantene c1, c2, c3. Vi ma daspesifisere begynnelsestilstanden r0, og la oss anta at handlesenteret har 144handlevogner som alle blir plassert i stativ X i utgangspunktet. Det betyrat

r0 =

144

00

og at ligning (4.11.1) ovenfor kan skrives:

c1

1356

+ c2

1

−10

+ c3

11

−2

=

144

00

Dette er ekvivalent med ligningssystemet

13c1 + c2 + c3 = 1445c1 − c2 + c3 = 0

6c1 − 2c2 = 0

4.11. EGENVEKTORER I PRAKSIS 351

som har løsningene c1 = 6, c2 = 48, c3 = 18. Setter vi dette inn i uttrykketfor rn ovenfor, far vi

rn =

xn

yn

zn

= 6

1356

+ 48 · (0.4)n

1

−10

+ 18 · (0.2)n

11

−2

Likevektstilstanden i dette tilfellet er gitt ved 6

1356

=

783036

, dvs. 78

handlevogner i stativ X, 30 i stativ Y og 36 i stativ Z. Figuren nedenfor vi-ser hvordan fordelingen nærmer seg likevektstilstanden. Den øverste kurvenviser antall vogner i stativ X, den nest øverste antall vogner i stativ Z ogden nederste antall vogner i stativ Y . ♣

Bemerkning: Oppførselen i eksemplet ovenfor er typisk for systemer der vihar en konstant mengde (i eksemplet: antall handlevogner) som omfordelesmellom tilstander (i eksemplet: stativene X, Y , Z). I slike systemer er 1alltid en egenverdi, og den tilhørende egenvektoren beskriver en likevekts-tilstand for systemet.

I det neste eksemplet skal vi se pa et system av differensialligninger.

Eksempel 2: Dyreslagene I og II lever i det samme omradet. Dyreslag IIer avhengig av dyreslag I som føde for a kunne overleve i omradet. Storemengder av dyreslag II vil derfor bremse veksten til dyreslag I, mens storemengder av dyreslag I fremmer veksten til dyreslag II. Dersom x(t) og y(t) ermengden av hhv. dyreslag I og dyreslag II ved tiden t, antar vi at ligningene

Page 179: Flervariabel analyse med lineær algebra

352 KAPITTEL 4. LINEÆR ALGEBRA I RN

som styrer veksten til de to dyreslagene, er

x′(t) =15x(t)− 1

20y(t)

y′(t) =14x(t)− 1

10y(t)

Var oppgave er a løse ligningssystemet og finne uttrykk for x(t) og y(t).Siden ligningssystemet kobler de to ukjente funksjonene til hverandre, kanvi ikke bruke vare vanlige differensialligningsteknikker til a finne x(t) og y(t)hver for seg. Vi skal se hvordan vi kan bruke egenverdier og egenvektorer tila “dekoble” ligningssystemet slik at vi far to ligninger som kan løses hverfor seg.

Vi observerer først at dersom vi innfører vektorfunksjonen

r(t) =(

x(t)y(t)

),

kan ligningssystemet skrives

r′(t) = Ar(t)

der

A =

(15 − 1

2014 − 1

10

)

Vi finner først egenverdiene og egenvektorene til matrisen A. Det karakte-ristiske polynomet

PA(λ) =

∣∣∣∣∣λ− 1

5120

−14 λ + 1

10

∣∣∣∣∣ = λ2 − 110

λ− 3400

har røttene

λ =−(− 1

10) ±√

(− 110)2 − 4 · 1 · (− 3

400)

2 · 1 =110 ± 2

10

2=

320

− 120

Egenverdiene er altsa λ1 = 320 og λ2 = − 1

20 .

En egenvektor v1 =(

xy

)med egenverdi λ1 = 3

20 ma oppfylle ligningen

(15 − 1

2014 − 1

10

)(xy

)=

320

(xy

)

Multipliserer vi ut, far vi ligningene

15x− 1

20y =

320

x

14x− 1

10y =

320

y

4.11. EGENVEKTORER I PRAKSIS 353

Flytter vi over og rydder opp litt, ser vi at begge disse ligningene er ekviva-lente med

x− y = 0

Det betyr at vi kan velge y fritt, men at x da er gitt ved x = y. Velger viy=1, far vi x = 1, og den første egenvektoren var er dermed

v1 =(

11

)

Pa tilsvarende mate ma en egenvektor v2 =(

xy

)med egenverdi λ2 = − 1

20

oppfylle ligningen(

15 − 1

2014 − 1

10

)(xy

)= − 1

20

(xy

)

Multipliserer vi ut, far vi ligningene

15x− 1

20y = − 1

20x

14x− 1

10y = − 1

20y

Flytter vi over og rydder opp litt, ser vi at begge disse ligningene er ekviva-lente med

5x− y = 0

Det betyr at vi kan velge y fritt, men at x da er gitt ved 5x = y. Velger viy = 5, far vi x = 1, og den andre egenvektoren var er dermed

v2 =(

15

)

Vi gar na tilbake til differensialligningene vare. Siden v1, v2 er en basisfor R2, kan enhver vektor skrives som en lineærkombinasjon av v1 og v2.Det betyr at det for hver t finnes tall c1(t) og c2(t) slik at

r(t) = c1(t)v1 + c2(t)v2

Deriverer vi, far vir′(t) = c′1(t)v1 + c′2(t)v2

Sette vi dette inn i ligningen r′(t) = Ar(t), ser vi at

c′1(t)v1 + c′2(t)v2 = A(c1(t)v1 + c2(t)v2

)=

= c1(t)Av1 + c2(t)Av2 = c1(t)λ1v1 + c2(t)λ2v2

Page 180: Flervariabel analyse med lineær algebra

354 KAPITTEL 4. LINEÆR ALGEBRA I RN

Vi har altsac′1(t)v1 + c′2(t)v2 = c1(t)λ1v1 + c2(t)λ2v2

og siden v1, v2 er lineært uavhengige, betyr dette at

c′1(t) = λ1c1(t) og c′2(t) = λ2c2(t)

Legg merke til at vi na har “dekoblet” ligningssystemet og fatt to differen-sialligninger som kan løses hver for seg. Gjør vi det, far vi

c1(t) = C1eλ1t = C1e

320 t og c2(t) = C2e

λ2t = C2e− 1

20 t

der C1 og C2 er konstanter. Dermed har vi

r(t) = C1e320 tv1 + C2e

− 120 tv2

For a bestemme konstantene C1 og C2 trenger vi flere opplysninger omdyrestammene. La oss anta at det ved tiden t = 0 er 3 000 dyr av slag I og11 000 av slag II. Det betyr at

(3 000

11 000

)= r(0) = C1v1 + C2v2 = C1

(11

)+ C2

(15

)

Løser vi dette ligningssystemet, far vi C1 = 1 000 og C2 = 2 000. Dermedhar vi

r(t) = 1 000e320 tv1 + 2 000e−

120 tv2 = 1000e

320 t

(11

)+ 2 000e−

120 t

(15

)=

=

(1 000e

320 t + 2 000e−

120 t

1 000e320 t + 10 000e−

120 t

)

Antall dyr av slag I ved tiden t er dermed x(t) = 1 000e320 t + 2 000e−

120 t,

mens antall dyr av slag II er y(t) = 1 000e320 t + 10 000e−

120 t.

Til slutt legger vi nok en gang merke til hvordan vi i dette eksempletbrukte egenvektorer til a “dekoble” systemet — de opprinnelige funksjone-ne x(t) og y(t) er koblet sammen gjennom ligningssystemet, mens de nyefunksjonene c1 og c2 er “frakoblet” hverandre og oppfyller hver sin ligning.Slike “dekoblinger” star sentralt i mange anvendelser av egenvektorer. ♣

La oss til slutt se pa et litt mer komplisert eksempel der vi far god brukfor MATLAB til a holde styr pa egenverdier og egenvektorer. Eksempletminner en del om eksempel 1, men vi ser na pa et system som vokser, ogder mye av poenget er a finne hvor stor veksten er. Eksemplet viser ogsa hvasom skjer dersom vi har komplekse egenverdier.

4.11. EGENVEKTORER I PRAKSIS 355

Eksempel 3: Et dyreslag har en levealder pa fire ar. Det første aret erdyrene unger, det andre aret er de ungdommer, det tredje aret er de voksneog det fjerde aret er de eldre. Av ungene overlever 50% til aret etter, avungdommene overlever 80% til aret etter og av de voksne overlever 20% tilaret etter. En ungdom gir i gjennomsnitt opphav til 0.5 unger som blir fødtaret etter, en voksen gir i gjennomsnitt opphav til 2 unger som blir født aretetter, og et eldre dyr gir i gjennomsnitt opphav til 0.1 unge som blir fødtaret etter. Vi antar at vi starter med 200 dyr i hver aldersklasse, og ønskera finne ut hvordan stammen utvikler seg.

La xn, yn, zn og un være henholdsvis antall unger, ungdommer, voksneog eldre i ar n. Da er

xn+1 = 0.5yn + 2zn + 0.1un

yn+1 = 0.5xn

zn+1 = 0.8yn

un+1 = 0.2zn

I tillegg vet vi at x1 = y1 = z1 = u1 = 200.Det er flere mater a angripe dette problemet pa. La oss først se hva som

skjer nar vi bruker MATLAB til a regne ut utviklingen de 50 første arene.Vi lager m-filen

function [x,y,z,u]=dyrestamme(a,b,c,d,N)x(1)=a;y(1)=b;z(1)=c;u(1)=d;for n=1:N

x(n+1)=.5*y(n)+2*z(n)+.1*u(n);y(n+1)=.5*x(n);z(n+1)=.8*y(n);u(n+1)=.2*z(n);

end

Den neste kommandosekvensen far MATLAB til a plotte ut følgene i sammefigur:

>> [x,y,z,u]=dyrestamme(200,200,200,200,49);>> plot(x)>> hold on>> plot(y)>> plot(z)>> plot(u)

Resultatet er figuren nedenfor der den øverste kurven gir antall unger, dennest øverste antall ungdommer, den tredje øverste antall voksne og den ne-derste antall eldre.

Page 181: Flervariabel analyse med lineær algebra

356 KAPITTEL 4. LINEÆR ALGEBRA I RN

Disse kurvene er ikke sa lette a tolke. Det ser ut som de etter noeninnledende svingninger gar over i jevn vekst, og at fordelingen mellom deforskjellige aldersgruppene nærmer seg en likevekt. Men hvor kommer sving-ningene fra, hvor rask er veksten, og hvordan finner vi likevektsfordelingenmellom aldersgruppene?

.La oss kjøre programmet en gang til med startverdier x1 = 400, y1 = 300,

z1 = 100, u1 = 0. Resultatet ser du pa figuren nedenfor, og i hovedtrekkligner det forbløffende pa det vi fikk i stad; etter noen innledende svingningergar kurvene over i jevn vekst, og forholdet mellom aldersgruppene ligner padet vi fikk ovenfor.

Vi skal na se hvordan vi kan bruke egenverdier og egenvektorer til aforklare disse resultatene. Det første vi observerer, er at dersom vi innfører

4.11. EGENVEKTORER I PRAKSIS 357

vektorene

rn =

xn

yn

zn

un

sa kan ligningssystemet ovenfor skrives

rn+1 = Arn

der A er matrisen

A =

0 .5 2 .1.5 0 0 00 .8 0 00 0 .2 0

Bruker vi denne formelen gjentatte ganger, far vi

rn = An−1r1

Legg merke til at siden vi kaller begynnelsesbestanden r1 og ikke r0, maA oppphøyes i n − 1 og ikke n. Matematisk sett hadde det vært greiere abegynne med r0 slik vi gjorde i forrige eksempel, men MATLAB begynneralltid nummereringer pa 1, og vi har derfor valgt a holde oss til det siden viMATLAB bruker sapass mye i dette eksemplet.

La oss benytte MATLAB til a finne egenverdiene og egenvektorene tilA:

>> A=[0 .5 2 .1.5 0 0 00 .8 0 00 0 .2 0];

>> [u,v]=eig(A)

u =

Columns 1 through 3

-0.8472 0.7917 0.7917-0.4151 -0.2560 - 0.3675i -0.2560 + 0.3675i-0.3254 -0.1405 + 0.3802i -0.1405 - 0.3802i-0.0638 0.0887 - 0.0231i 0.0887 + 0.0231i

Column 4

-0.0000

Page 182: Flervariabel analyse med lineær algebra

358 KAPITTEL 4. LINEÆR ALGEBRA I RN

0.0006-0.05010.9987

v =Columns 1 through 3

1.0206 0 00 -0.5053 + 0.7253i 00 0 -0.5053 - 0.7253i0 0 0

Column 4

000

-0.0100

Vi har altsa egenverdiene λ1 = 1.0206, λ2 = −0.5053 + 0.7253i, λ3 =−0.5053 − 0.7253i, λ4 = −0.01 med tilhørende egenvektorer (vi bytter for-tegn pa den første av dem for a slippe minuser):

v1 =

0.84720.41510.32540.0638

, v2 =

0.7917−0.2560− 0.3675i−0.1405 + 0.3802i0.0887− 0.0231i

v3 =

0.7917−0.2560 + 0.3675i−0.1405− 0.3802i0.0887 + 0.0231i

, v4 =

00.0006−0.05010.9987

Vi ser at de komplekse egenverdiene og egenvektorene er konjugerte av hver-andre slik setning 4.10.4 sier. Vi ser ogsa at egenverdiene er ordnet i avta-gende rekkefølge: |λ1| > |λ2| = |λ3| > |λ4|.

Siden egenverdiene er forskjellige, vet vi at v1, v2, v3, v4 danner en basis.Vi kan derfor skrive starttilstanden

r1 =

200200200200

4.11. EGENVEKTORER I PRAKSIS 359

som en lineærkombinasjon

r1 =

200200200200

= c1v1 + c2v2 + c3v3 + c4v4

Vi skal bruke MATLAB til a finne koeffisientene c1, c2, c3, c4, men la oss førstse hva som skjer nar vi bruker An−1 pa ligningen ovenfor. Vi far

rn = An−1r1 = c1An−1v1 + c2A

n−1v2 + c3An−1v3 + c4A

n−1v4 =

c1λn−11 v1 + c2λ

n−12 v2 + c3λ

n−13 v3 + c4λ

n−14 v4

Vi setter den største egenverdien λn−11 utenfor en parentes

rn = λn−11

(c1v1 + c2

(λ2

λ1

)n−1

v2 + c3

(λ3

λ1

)n−1

v3 + c4

(λ4

λ1

)n−1

v4

)

Siden λ1 har størst tallverdi av egenverdiene, vil alle faktorene(

λ2λ1

)n−1,

(λ3λ1

)n−1,(

λ4λ1

)n−1ga mot null nar n gar mot uendelig. Det betyr at

limn→∞

(c2

(λ2

λ1

)n−1

v2 + c3

(λ3

λ1

)n−1

v3 + c4

(λ4

λ1

)n−1

v4

)= 0

Definerer vi

σ(n) = c2

(λ2

λ1

)n−1

v2 + c3

(λ3

λ1

)n−1

v3 + c4

(λ4

λ1

)n−1

v4 ,

kan vi derfor skrivern = λn−1

1

(c1v1 + σ(n)

)

der σ(n) → 0 nar n → ∞. Skriver vi ut komponentene og setter in λ1 =1.0206, far vi

xn

yn

zn

un

= 1.0206n−1

(c1

0.84720.41510.32540.0638

+ σ(n))

Dette betyr at nar n blir stor, er veksten bestemt av den største egen-verdien λ1 = 1.0206, og fordelingen mellom komponentene er bestemt avden tilhørende egenvektoren v1. Som du ser, minner disse resultatene omdet vi fikk i Eksempel 1, men vi har fatt med en vekstfaktor i tillegg.

Page 183: Flervariabel analyse med lineær algebra

360 KAPITTEL 4. LINEÆR ALGEBRA I RN

La oss na finne konstantene c1, c2, c3 og c4. Dersom vi velger den opp-rinnelige begynnelsestilstanden

r1 =

200200200200

far vi ligningen

200200200200

= c1

0.84720.41510.32540.0638

+ c2

0.7917−0.2560− 0.3675i−0.1405 + 0.3802i0.0887− 0.0231i

+

+c3

0.7917−0.2560 + 0.3675i−0.1405− 0.3802i0.0887 + 0.0231i

+ c4

00.0006−0.05010.9987

Innfører vi matrisen

D =

0.8472 0.7917 0.7917 00.4151 −0.2560− 0.3675i −0.2560 + 0.3675i 0.00060.3254 −0.1405 + 0.3802i −0.1405− 0.3802i −0.05010.0638 0.0887− 0.0231i 0.0887 + 0.0231i 0.9987

kan vi bruke MATLAB til a finne vektoren

c =

c1

c2

c3

c4

ved a taste

>> c=D\r1

Vi far c1 = 436.59, c2 = −107.29−49.34i, c3 = −107.29+49.34i, c4 = 193.72.Legg merke til at koeffisientene c2 og c3 til de komplekse egenverdiene erkonjugerte.

Vi har enna ikke forklart hvor svingningene i figuren kommer fra. Detviser seg at de kommer fra de komplekse egenverdiene. Skriver vi den kom-plekse egenverdien λ2 pa polarform λ2 = reiθ, ser vi at

λn−12 = rn−1ei(n−1)θ = rn−1

(cos((n− 1)θ) + i sin((n− 1)θ)

)

Cosinus- og sinus-leddene far uttrykket til a svinge, men i dette tilfellet vilsvingningene dø ut etter hvert fordi r < 1 og rn−1 → 0 nar n →∞. ♣

4.11. EGENVEKTORER I PRAKSIS 361

Oppgaver til seksjon 4.11

1. Finn to følger {xn}, {yn} slik at

xn+1 = xn + 3yn

yn+1 = 2xn + 2yn

nar x0 = 5, y0 = −5.

2. Finn funksjonene x(t), y(t) slik at

x′(t) = x(t) + 8y(t)y′(t) = 2x(t) + y(t)

og x(0) = 1, y(0) = 6.

3. (Eksamen i MAT1100, 13/, 2008)

a) Finn egenverdiene og egenvektorene til matrisen A =(

1.1 −0.20.1 0.8

)

b) To dyreslag bor i det samme omradet. Dersom det er xn og yn dyr av hvertslag ett ar, vil det aret etter være

xn+1 = 1.1xn − 0.2yn

yn+1 = 0.1xn + 0.8yn

dyr av hvert slag. Finn uttrykk for xn og yn dersom x0 = 3000, y0 = 1000.Hva skjer med bestandene nar n gar mot uendelig?

4. (Eksamen i MA 001, 31/5 1994) I barnehagen har Viktoria og Emil fatt hvert sittglass saft med nøyaktig like mye saft til hver. Viktoria er imidlertid ikke helt fornøydsiden saften til Emil inneholder dobbelt sa mye sukker som hennes. Glassene er ikkefullere enn at det gar an a helle litt fra det ene over i det andre, og smart som huner, far Viktoria med Emil pa følgende lek: Hun heller 1

9 av sin saft over i glassettil Emil, ber ham røre godt rundt og sa helle den samme mengden saft tilbake ihennes glass slik at de igjen har like mye saft.

Blandeprosedyren ovenfor gjentas flere ganger. La xn og yn være sukkermeng-den i glassene til henholdsvis Viktoria og Emil etter at prosedyren er utført nganger.

a) Vis at

xn+1 = 0.9xn + 0.1yn

yn+1 = 0.1xn + 0.9yn

b) La M være matrisen slik at(

xn+1

yn+1

)= M

(xn

yn

). Finn egenverdiene og

egenvektorene til M .

c) Skriv(

24

)som en lineærkombinasjon av egenvektorer for M , og finn

Mn

(24

).

Page 184: Flervariabel analyse med lineær algebra

362 KAPITTEL 4. LINEÆR ALGEBRA I RN

d) Hvor mange ganger ma blandeprosedyren utføres for at forholdet mellomsukkerinnholdet i Viktorias saft og Emils saft er minst 0.95?

5. (Eksamen i MA 001, 2/6 1997) I denne oppgaven er

M =

(12

59

59

12

)

a) Finn egenverdiene og egenvektorene til M .

I resten av oppgaven skal vi studere en modell for hvordan en ufarlig infeksjons-sykdom sprer seg i en befolkning. Vi deler befolkningen i to grupper — de som erimmune for sykdommen og de som er mottagelige for smitte. De fleste som nylighar hatt sykdommen vil være immune, men mange vil miste immuniteten etter somtiden gar.

I modellen ønsker vi a studere hvor mange som er immune, og hvor mange somer mottagelige for smitte etter 0, 10, 20, 30, . . . ar. Vi lar yn være antall immune etter10n ar og xn antall mottagelige ved samme tidspunkt. Vi har følgende observasjoner:

Av dem som er immune et ar, vil 49 fortsatt være immune 10 ar senere, 1

9 vilvære døde og resten vil være mottagelige for smitte.

Av dem som er mottagelige for smitte et ar, vil halvparten være immune 10 arsenere, 1

9 vil være døde og resten vil være mottagelige for smitte.I løpet av en 10-arsperiode vil befolkningen fa et tilskudd pga. fødsel og inn-

vandring. Dette tilskuddet er 16 av befolkningstallet ved begynnelsen av perioden,

og ved slutten av perioden vil 13 av de nye individene være immune og resten mot-

tagelige for smitte.

b) Vis at (xn+1

yn+1

)= M

(xn

yn

)

c) Anta at x0 = 8 millioner og at y0 = 2 milloner. Finn xn og yn.

d) Etter som tiden gar vil prosentdelen av immune nærme seg en grense. Hvaer denne grensen?

6. (Eksamen i MA 001, 3/6 1996) En oljemilliardær bestemmer seg for a satse paturisme. Hun kjøper 1 000 hytter pa fjellet. Hyttene leies ut for ett ar av gangen.Hytteeieren finner ut at 80% av hyttene som er leid ut ett ar, ogsa er leid ut aretetter, mens 70% av hyttene som er tomme ett ar, ogsa er tomme neste ar.

La xn være antall utleide og yn antall tomme hytter i ar n.

a) Finn en matrise M slik at(

xn+1

yn+1

)= M

(xn

yn

)

b) Ett ar er 550 hytter utleid. Hvor mange var utleid aret før?

c) Finn egenverdiene og egenvektorene til M .

Det første aret (ar 0) er halvparten av hyttene leid ut mens resten star tomme.

d) Finn xn og yn.

4.11. EGENVEKTORER I PRAKSIS 363

e) Det første aret er nettofortjenesten pr. utleid hytte 10 000 kroner, mens ut-giftene forbundet med en tom hytte er 4 000 kroner. Pa grunn av elde ogslitasje øker utgiftene for tomme hytter med 10% per ar, mens nettofortje-nesten for utleide hytter ligger stabilt pa 10 000 kroner i aret. La Pn værenettofortjeneste i ar n, dvs. inntekter minus utgifter. Finn Pn uttrykt ved nog begrunn at hytteeieren etter hvert taper penger.

7. (Eksamen i MA 001, 29/11 1996, litt tilpasset) Det var en gang en bestand avbiller som levde i en gammel verneverdig trebygning. Vi deler billebestanden inn itre aldersgrupper: nyfødte (0 uker gamle), voksne (1 uke gammel) og gamle (2 ukergamle). La xn, yn, zn være henholdsvis antall nyfødte, voksne og gamle biller vedtiden t = n, der tiden regnes i uker. Vi antar at alle billene som er nyfødte en uke,overlever til uken etter, men at bare halvparten av de voksne billene overlever tilneste uke, og at ingen gamle biller lever en uke til. En voksen bille gir i gjennomsnittopphav til 3 nye biller som blir født uken etter, mens en gammel bille i gjenomsnittgir opphav til 4 nye biller som blir født uken etter.

a) Finn en matrise M slik at

xn+1

yn+1

zn+1

= M

xn

yn

zn

b) Finn egenverdiene og egenvektoree til M .

c) Anta at det er 24 nyfødte, ingen voksne og 6 gamle biller i trebygningen vedt = 0. Hvor mange biller er det i hver aldersgruppe n uker senere?

8. (Eksamen i MA 001, 2/6 1993, litt tilpasset) I en by finnes det tre aviser, enskandaleavis A, en rimelig seriøs avis B og en svært seriøs avis C. I løpet av fem arskjer det følgende forandringer:

Avisene A og C far et antall nye kjøpere (som ikke har kjøpt noen avis tidligere)tilsvarende 10% av det antall kjøpere de hadde ved starten av perioden, mens avisC far en tilvekst av nye kjøpere pa 20%. 10% av leserne av avis A slutter med Aog gar over til B. 10% av leserne av B slutter med B og gar over til A og en annengruppe pa 10% gar over til C. 10% av kjøperne av C slutter med C og begynner akjøpe B. Ellers beholder alle kjøperne sin gamle avis.

La xn, yn, zn være salgstallene for henholdsvis avis A, B og C i aret 5n, forn = 1, 2, 3 . . ..

a) Finn en matrise M slik at

xn+1

yn+1

zn+1

= M

xn

yn

zn

b) Finn egenverdiene og egenvektorene til M .

c) Finn xn, yn, zn uttrykt ved x0, y0, z0 og n. Vis at forholdet mellom salgs-tallene nærmer seg grenser som er uavhengig av starttilstanden. Finn k1 =limn→∞

xnyn

og k2 = limn→∞yn

zn.

Page 185: Flervariabel analyse med lineær algebra

364 KAPITTEL 4. LINEÆR ALGEBRA I RN

9. To fiskeslag lever i samme innsjø. Fiskeslag II er avhengig av fiskeslag I for aopprettholde bestanden. Dersom x(t) er antall fisk av slag I ved tiden t, og y(t) erantall fisk av slag II ved tiden t, regner vi at

x′(t) = 0.02x(t)− 0.03y(t)

y′(t) = 0.01x(t)− 0.02y(t)

a) Vis at egenverdiene og egenvektorene til matrisen A =(

0.02 −0.030.01 −0.02

)er

λ1 = 0.01,λ2 = −0.01,v1 =(

31

),v2 =

(11

).

b) La r(t) =(

x(t)y(t)

)og skriv r(t) = c1(t)v1 + c2(t)v2. Vis at c1 og c2 tilfreds-

stiller differensialligningene

c′1(t) = 0.01c1(t)

c′2(t) = −0.01c2(t)

c) Anta at x(0) = 5 000 og y(0) = 1 000. Finn x(t) og y(t). Hvordan gar detmed forholdet x(t)

y(t) mellom antall fisk av slag I og antall fisk av slag II nar tblir stor?

d) Bruk MATLAB til a plotte x(t) og y(t) i samme koordinatsystem.

10. (Eksamen i MA 001, 3/12 1993) To arter, et rovdyr og et byttedyr, lever isamme omrade. La x(t) være antall rovdyr og y(t) antall byttedyr ved tiden t (tmales i ar). Anta at x(0) = 500, y(0) = 1000. Vi skal betrakte to enkle modeller forx(t) og y(t).

a) I den første modellen antar vi at x og y tilfredsstiller

x′(t) = x(t) + y(t)y′(t) = −x(t) + y(t)

Hva blir x(t) og y(t) i dette tilfellet (husk at ea+ib = ea(cos b + i sin b))?

b) I den andre modellen antar vi at x og y tilfredsstiller

x′(t) = −2x(t) + 4y(t)y′(t) = x(t)− 2y(t)

Hva blir x(t) og y(t) da?

c) Observasjonene vare tyder pa at det pa et visst tidspunkt ikke er flere bytte-dyr igjen. Hvilken modell passer med disse observasjonene? Hvor mangemaneder tar det ifølge modellen før dette skjer? I den andre modellen vilantall rovdyr og antall byttedyr etter hvert stabilisere seg seg pa visse verdi-er. Bestem disse verdiene.

4.11. EGENVEKTORER I PRAKSIS 365

11. En by har nettopp innført et system med “bysykler” der man kan lane ensykkel fra et sykkelstativ og levere den fra seg ved et annet (eller ved det sammeom man bare skal en tur i næromradet). Foreløpig har byen 4 stativer som vi kal-ler X, Y , Z, U . Myndighetene er interessert i a undersøke lanemønsteret for syklene,

Utgangspunkt Prosentfordeling neste manedi X i Y i Z i U ute av drift

X 40% 20% 20% 10% 10%Y 10% 40% 20% 20% 10%Z 10% 20% 25% 25% 20%U 30% 20% 20% 20% 10%

og har derfor en manedlig undersøkelse av hvor de forskjellige syklene befinner seg.Denne undersøkelsen viser at av de syklene som befant seg i stativ X en maned,befinner 40% seg i X maneden etter, 20% befinner seg i Y , 20% i Z og 10% i U ,mens 10% er ute av drift fordi de enten er forsvunnet eller inne til vedlikehold.Tilsvarende tall for syklene som opprinnelig var i Y , Z og U , fremgar av tabellenovenfor. I forbindelse med undersøkelsen far hvert stativ pafyll med nye/reparertesykler. Pafyllet tilsvarer 15% av antall sykler som star i stativet.

a) La xn, yn, zn, un være antall sykler i henholdsvis X, Y , Z, U rett etter den n-teundersøkelsen (og rett etter pafyllet av nye/reparerte sykler). Forklar at

xn+1 = 0.46xn + 0.115yn + 0.115zn + 0.345un

yn+1 = 0.23xn + 0.46yn + 0.23zn + 0.23un

zn+1 = 0.23xn + 0.23yn + 0.2875zn + 0.23un

un+1 = 0.115xn + 0.23yn + 0.2875zn + 0.23un

b) Skriv en m-fil som gitt x1, y1, z1, u1 returnerer xn, yn, zn, un for n fra 1 til 50.

c) Velg x1 = y1 = z1 = u1 = 100, og bruk MATLAB til a tegne følgene {xn}, {yn},{zn}, {un} i samme koordinatsystem.

d) Lag en ny MATLAB-figur der du plotter følgene { xn1.0071n−1 }, { yn

1.0071n−1 }, { zn1.0071n−1 },

{ un1.0071n−1 } i samme koordinatsystem.

e) Gjenta plottingen i c) og d), men bruk starttilstanden x1 = 200, y1 = 0, z1 = 0,u1 = 200. Ser du et mønster? Eksperimenter gjerne med andre startverdier.

f) La

wn =

xn

yn

zn

un

være fordelingen av sykler den n-te maneden. Forklar at wn+1 = Awn der A ermatrisen

Page 186: Flervariabel analyse med lineær algebra

366 KAPITTEL 4. LINEÆR ALGEBRA I RN

A =

0.46 0.115 0.115 0.3450.23 0.46 0.23 0.230.23 0.23 0.2875 0.230.115 0.23 0.2875 0.23

Forklar ogsa hvorfor wn = An−1w1.

g) Bruk MATLAB til a vise at matrisen A ovenfor har fire egenverdier λ1, λ2, λ3,λ4 med tilhørende egenvektorer v1, v2, v3, v4. Sørg for a ordne rekkefølgen slik atλ1 er egenverdien med størst tallverdi. (NB: MATLAB gir av og til egenvektorerder alle komponentene er negative. For a fa en egenvektor som er greiere a arbeidemed, kan du da bare fjerne alle minustegnene i denne vektoren.)

h) Vis at egenvektorene v1, v2, v3, v4 til A danner en basis for R4, dvs. at de erlineært uavhengige og utspenner hele R4 (bruk gjerne MATLAB).

i) Velg

w1 =

100100100100

og skriv denne vektoren som en lineærkombinasjon av v1, v2, v3, v4 (bruk gjerneMATLAB). Finn

limn→∞

An−1w1

λn−11

Sammenlign med resultatene i oppgave 1c) og d). Hva regner du med a fa dersomdu velger en annen starttilstand w1?

4.12 Spektralteoremet

I denne seksjonen skal vi bevise spektralteoremet for symmetriske matriser.Dette er et av de viktigste resultatene i lineær algebra og det er ogsa modellfor mer generelle resultater i andre deler av matematikken. Beviset er iseg selv ikke vanskeligere enn andre vi allerede har vært borti, men det erganske langt fordi vi enna ikke har gjort alle forberedelsene vi trenger. Væroppmerksom pa at beviset bygger pa seksjon 4.7, og har du ikke lest denseksjonen før, bør du gjøre det na.

La oss først minne om hva spektralteoremet sier.

Teorem 4.12.1 (Spektralteoremet for symmetriske matriser) Antaat A er en symmetrisk n × n-matrise. Da er alle egenverdiene til A reelle,og det finnes en ortonormal basis for Rn som bestar av egenvektorer til A.

Vi skal først vise at alle egenverdiene og egenvektorene til en symmetriskmatrise er reelle. Nøkkelen er dette enkle, men viktige resultatet:

4.12. SPEKTRALTEOREMET 367

Setning 4.12.2 Anta at A er en reell n × n-matrise og at x,y ∈ Cn er tokomplekse søylevektorer. Da er

(Ax) · y = x · (ATy)

Bevis: For alle søylevektorer u,v ∈ Cn er

u · v = uTv

der produktet pa venstresiden er et skalarprodukt mens produktet pa høyre-siden er et matriseprodukt (ser du ikke dette med det samme, sa skriv utbegge sidene av formelen og husk at komplekse skalarprodukter inneholderen komplekskonjugering i annen faktor). Bruker vi denne formelen samtregnereglene for transponering og matriseprodukter, far vi

(Ax) · y = (Ax)Ty = (xTAT )y = xT (ATy)

Siden A er reell, er AT = AT , og dermed far vi videre

xT (ATy) = xT (ATy) = x · (ATy)

!

Bemerkning: Argumentet ovenfor kan være litt vanskelig a lese fordi no-tasjonene for matriseprodukt og skalarprodukt er sa like. I mer avansertebøker er det derfor vanlig a bruke andre mater a angi skalarprodukt pa,f.eks. 〈x,y〉 istedenfor x · y. Med denne notasjonen kan resultatet ovenforskrives 〈Ax,y〉 = 〈x, ATy〉 og na blir det kanskje enklere a se hva setningensier — vi kan føre matrisen A over pa den andre siden av skalarproduktetforutsatt at vi transponerer den.

Vi tar med et viktig korollar av setningen ovenfor:

Korollar 4.12.3 En reell n× n-matrise er symmetrisk hvis og bare hvis

(Ax) · y = x · (Ay)

for alle x, y ∈ Rn.

Bevis: Dersom A er symmetrisk, er

(Ax) · y = x · (ATy) = x · (Ay)

ifølge setningen ovenfor.Dersom A ikke er symmetrisk, finnes det minst ett par av indekser (i, j)

slik at den (i, j)-te komponenten aij til A er forskjellig fra den (i, j)-te kom-ponenten aji til AT . Velger vi x = ei og y = ej , far vi

(Ax) · y = aji og x · (Ay) = aij

Page 187: Flervariabel analyse med lineær algebra

368 KAPITTEL 4. LINEÆR ALGEBRA I RN

Altsa er (Ax) · y #= x · (Ay). !

Vi kan na vise det første resultatet vi er pa jakt etter.

Setning 4.12.4 Dersom A er en symmetrisk (reell) n × n-matrise, sa eralle egenverdiene til A reelle. Til enhver reell egenverdi hører det en reellegenvektor.

Bevis: Anta at λ er en (muligens kompleks) egenverdi for A med en (muligenskompleks) egenvektor v. Da er

Av · v = (λv) · v = λ(v · v) = λ|v|2

Pa den annen side er (husk at vi ma bruke komplekse skalarprodukter sidenλ og v kan være komplekse)

Av · v = v · (Av) = v · (λv) = λ(v · v) = λ|v|2

(se punkt f) i setning 1.3.1 dersom du ikke skjønner hvor komplekskonjuge-ringen kommer fra). Dermed har vi λ|v|2 = λ|v|2, og forkorter vi med |v|2,far vi λ = λ som viser at λ er reell. Det gjenstar a vise at det finnes en reellegenvektor med λ. Dette kan gjøres pa flere mater — det enkleste er kanskjea observere at siden det(λIn−A) = 0, sa har ligningen (λIn−A)x = 0 ifølgeteorien var en ikke-null, reell løsning. !

Den neste setningen er det første spede skrittet pa veien mot eksistens-delen av spektralteoremet — den viser at en symmetrisk matrise i hvert fallhar en (reell) egenvektor.

Setning 4.12.5 Enhver symmetrisk matrise A har minst en (reell) egen-vektor.

Bevis: Ifølge algebraens fundamentalteorem (Kalkulus, teorem 3.5.1) har detkarakteristiske polynomet PA(λ) minst en rot. Det betyr at A har minst enegenverdi, og ifølge setningen ovenfor er denne egenverdien reell og har enreell egenvektor. !

Denne setningen er brekkstangen vi trenger for a komme igang medet induksjonsbevis for spektralteoremet. Beviset gar ved induksjon pa di-mensjonen til rommet som matrisen virker pa. Disse rommene er generelleunderrom av Rn, og for a fa induksjonsbeviset til a fungere, ma vi førstgeneralisere symmetribegrepet til underrom.

4.12. SPEKTRALTEOREMET 369

Symmetriske lineæravbildninger

Husk (fra seksjon 2.8) at en lineæravbildning fra Rn til Rm er en funksjonT : Rn → Rm slik at

(i) T(cx) = cT(x) for alle c ∈ R og alle x ∈ Rn

(ii) T(x + y) = T(x) + T(y) for alle x,y ∈ Rn

Til enhver slik lineæravbildning finnes det en matrise A slik at Ax = T(x)for alle x ∈ Rn (se setning 2.8.4), og vi har derfor stort sett arbeidet medmatriser istedenfor lineæravbildninger. I denne seksjonen trenger vi imidler-tid a arbeide med lineæravbildninger definert pa underrom av Rn, og da erdet tungvint a bruke matriser istedenfor lineæravbildninger.

Vi begynner med a generalisere begrepet lineæravbildning til underrom.

Definisjon 4.12.6 Anta at H er et underrom av Rn. En funksjon T : H →H kalles en lineæravbildning dersom

(i) T(cx) = cT(x) for alle c ∈ R og alle x ∈ H

(ii) T(x + y) = T(x) + T(y) for alle x,y ∈ H

Vi skal ofte arbeide med lineæravbildninger som i utgangspunktet erdefinert pa en større mengde enn H (gjerne pa hele Rn). Vi kan oppfattedisse som lineæravbildninger fra H til H dersom T(x) ∈ H for alle x ∈ H.I sa fall sier vi at T avbilder H inn i H.

Med korollar 4.12.3 som inspirasjon er det lett a definere symmetriskelineæravbildninger.

Definisjon 4.12.7 En lineæravbildning T : H → H kalles symmetrisk der-som

T(x) · y = x ·T(y) for alle x,y ∈ H

Det er ogsa lett a generalisere begrepene egenverdi og egenvektor tilunderrom:

Definisjon 4.12.8 En ikke-null vektor v ∈ H kalles en egenvektor forlineæravbildningen T : H → H dersom det finnes et tall λ ∈ R slik atT(v) = λv. Tallet λ kalles en egenverdi for T.

Bemerkning: Legg merke til at vi na bare tillater reelle egenverdier ogegenvektorer. Det er for a slippe a snakke om den komplekse versjonen avunderrommet H. Siden vi for øyeblikket kun er interessert i symmetriskelineæravbildninger (som bare har reelle egenvektorer og egenverdier), tapervi ikke noe pa a holde oss til det reelle tilfellet.

Page 188: Flervariabel analyse med lineær algebra

370 KAPITTEL 4. LINEÆR ALGEBRA I RN

Det neste resultatet generaliserer setning 4.12.5 til symmetriske lineær-avbildninger pa underrom. Beviset kan se ut som et skittent triks, men deter faktisk eksempel pa en generell teknikk (men hva er en matematisk tek-nikk annet enn et skittent triks som brukes mer enn en gang?) Synes dubeviset er mysteriøst, kan det være lurt a ta en kikk pa bemerkningen somfølger etter det (men bemerkningen forutsetter nok at du har prøvd a lesebeviset først!)

Setning 4.12.9 Anta at H #= {0} er et underrom av Rn. Da har enhversymmetrisk lineæravbildning T : H → H minst en egenvektor.

Bevis: Velg en ortonormal basis v1,v2, . . . ,vm for H. Vi kan skrive bildeneT(v1), T(v2), . . . , T(vm) som lineærkombinasjoner av basisvektorene:

T(v1) = c11v1 + c21v2 + · · · + cm1vm

T(v2) = c12v1 + c22v2 + · · · + cm2vm

......

......

T(vm) = c1mv1 + c2mv2 + · · · + cmmvm

Siden basisen er ortonormal, vet vi fra setning 4.10.7 at

cij = T(vj) · vi

Tilsvarende ercji = T(vi) · vj

Siden T er symmetrisk, er T(vj) · vi = vj ·T(vi) = T(vi) · vj . Det betyr atcji = cij , og følgelig er matrisen

C =

c11 c12 · · · c1m

c21 c22 · · · c2m...

... · · ·...

cm1 cm2 · · · cmm

symmetrisk. Vi vet fra setning 4.12.5 at C har minst en reell egenverdi λmed tilhørende (reell) egenvektor

x =

x1

x2...

xm

4.12. SPEKTRALTEOREMET 371

Dette betyr at Cx = λx, og skriver vi ut denne ligningen komponentvis, farvi

x1c11 + x2c12 + . . . + xmc1m = λx1

x1c21 + x2c22 + . . . + xmc2m = λx2

......

...x1cm1 + x2cm2 + . . . + xmcmm = λxm

Vi er na kommet til poenget som er a vise at v = x1v1 +x2v2 + · · ·+xmvm

er en egenvektor for T med egenverdi λ. Dette er bare et regnestykke (leggmerke til hvordan vi bruker ligningene ovenfor):

T(v) = x1T(v1) + x2T(v2) + · · · + xmT(vm)= x1(c11v1 + c21v2 + · · · + cm1vm)

+x2(c12v1 + c22v2 + · · · + cm2vm)...

......

...+xm(c1mv1 + c2mv2 + · · · + cmmvm)

= (x1c11 + x2c12 + . . . + xmc1m)v1

+(x1c21 + x2c22 + . . . + xmc2m)v2

......

......

+(x1cm1 + x2cm2 + . . . + xmcmm)vm

= λx1v1 + λx2v2 . . . + λxmvm = λv

Dette viser at v er en egenvektor med egenverdi λ, og dermed er bevisetfullført. !

Bemerkning: Ved første øyekast kan beviset ovenfor se ut som et umoti-vert regnestykke som pa mystisk vis ender opp med det svaret vi ønsker oss.Beviset har imidlertid en klar ide: Vi konstruerer en matrise C slik at dentilhørende lineæravbildningen (la oss kalle den T) oppfører seg pa akkuratsamme mate overfor basisen e1, e2, . . . , em i Rm som T oppfører seg over-for basisen v1,v2, . . . ,vm i H. Pa grunn av setning 4.12.5 vet vi at T haren egenvektor x. Vi konstruerer sa en vektor v som forholder seg pa akku-rat samme mate til basisen v1,v2, . . . ,vm som x forholder seg til basisene1, e2, . . . , em. Da er det ikke sa merkelig at v er en egenvektor for T medsamme egenverdi som x.

Vi er na kommet frem til de to siste resultatene vi trenger før vi kanga løs pa selve beviset for spektralteoremet. Det første skal hjelpe oss meddimensjonsregnskapet.

Page 189: Flervariabel analyse med lineær algebra

372 KAPITTEL 4. LINEÆR ALGEBRA I RN

Setning 4.12.10 Anta at H #= {0} er et underrom av Rn, og la a være enikke-null vektor i H. Da er

Ha⊥ = {x ∈ H | x · a = 0}

et underrom av Rn, og dim(Ha⊥) = dim(H)− 1. Dersom v1, v2, . . . , vk eren basis for Ha⊥, sa er v1, v2, . . . , vk, a en basis for H (dersom Ha⊥ = {0}betyr dette at a alene utgjør en basis for H).

Bevis: At Ha⊥ er et underrom, sjekkes pa akkurat samme mate som i ek-sempel 4.7.2. Vi overlater tilfellet der Ha⊥ = {0} til leserne, og antar at v1,v2, . . . , vk er en basis for Ha⊥ . Var jobb er a bevise at v1, v2, . . . , vk, a eren basis for H. Vi ma da sjekke at v1, v2, . . . , vk, a er lineært uavhengigeog utspenner hele H.

Vi begynner med uavhengigheten. Vi ma vise at dersom

c1v1 + c2v2 + · · · + ckvk + da = 0

sa er c1 = c2 = · · · ck = d = 0. Tar vi skalarproduktet med a pa begge siderav formelen ovenfor og bruker at a · vi = 0 (siden vi ∈ Ha⊥), far vi

d|a|2 = 0

Siden a #= 0, betyr dette at d = 0. Dermed star vi igjen med

c1v1 + c2v2 + · · · + ckvk = 0

og siden v1, v2, . . . , vk er lineært uavhengig, betyr dette at c1 = c2 =· · · ck = 0. Vi har altsa vist at v1, v2, . . . , vk, a er lineært uavhengige.

Det gjenstar a vise at v1, v2, . . . , vk, a utspenner hele H, dvs. at enhverb ∈ H kan skrives som en lineærkombinasjon av v1, v2, . . . , vk, a. Gitt enb ∈ H, lar vi p være projeksjonen av b ned pa a (se figur 1 og husk setning1.2.2).

!

"

111111112

++

++

+,

++

++

++

+,:

::

:+

p = ta

bab− p

Figur 1: Projeksjonen p av b ned pa a

Legg merke til at siden p = ta for et tall t, sa er b − p = b + (−t)amed i H. I tillegg star b−p per konstruksjon normalt pa a, og er følgelig et

4.12. SPEKTRALTEOREMET 373

element i Ha⊥ . Siden v1, v2, . . . , vk er en basis for Ha⊥ , finnes det dermedtall c1, c2, . . . , ck slik at

b− p = c1v1 + c2v2 + · · · + ckvk

Siden p er parallell med a, finnes det som allerede nevnt et tall t slik atp = ta. Dermed er

b = ta + c1v1 + c2v2 + · · · + ckvk

Dette viser at v1,v2, . . . ,vk,a utspenner hele H, og beviset er fullført. !

Det neste resultatet peker pa en viktig egenskap som skiller symmetriskelineæravbidninger fra generelle lineæravbildninger, og som er helt nødvendigfor a fa beviset for spektralteoremet til a fungere.

Setning 4.12.11 La H være et underrom av Rn og anta at T : H → H eren symmetrisk lineæravbildning. Anta videre at a er en egenvektor for T , ogla

Ha⊥ = {x ∈ H | x · a = 0}

være det ortogonale komplementet til a i H. Da avbilder T underrommetHa⊥ inn i seg selv, dvs. at dersom x ∈ Ha⊥, sa er ogsa T (x) ∈ Ha⊥.

Bevis: Anta at x ∈ Ha⊥ . Da er x · a = 0, og siden T er symmetrisk, har vi

T(x) · a = x ·T(a) = x · (λa) = λ(x · a) = 0

der λ er egenverdien til a. Dette viser at T (x) ∈ Ha⊥ . !

Bevis for spektralteoremet

Vi er na klare for a bevise spektralteoremet. For a fa induksjonsargumentetvart til a fungere, ma vi bevise et litt mer generelt resultat:

Teorem 4.12.12 (Spektralteoremet for underrom) Anta at H #= {0}er et underrom av Rn, og at T : H → H er en symmetrisk lineæravbildning.Da har H en ortonormal basis som bestar av egenvektorer for T.

Bemerkning: Siden H = Rn er et underrom av Rn og alle symmetrisken × n-matriser A definerer en symmetrisk lineæravbildning T ved T(x) =Ax, ser vi at teoremet ovenfor medfører den opprinnelige versjonen av spekt-ralteoremet i 4.12.1.

Bevis for teorem 4.12.12: Vi beviser teoremet ved induksjon pa dimensjonentil underrommet H. Anta først at H har dimensjon 1. Da har H en basis som

Page 190: Flervariabel analyse med lineær algebra

374 KAPITTEL 4. LINEÆR ALGEBRA I RN

bare bestar av en vektor v. Vi kan anta at |v| = 1 (hvis ikke bytter vi bareut v med v

|v|). Siden T(v) ∈ H, ma det finnes et tall c slik at T(v) = cv.Men da er v en egenvektor med egenverdi c, og basisen som bare bestar avv, er derfor en ortonormal basis av egenvektorer (ortogonaliteten er trivieltoppfylt siden v ikke har noen basiskompanjonger a sta ortogonalt pa).

Anta sa at teoremet gjelder for alle underrom med dimensjon m og at Hhar dimensjon m + 1. Ifølge setning 4.12.9 har en symmetrisk lineæravbild-ning T : H → H i hvert fall en egenvektor a som vi kan velge til a ha lengde1. Ifølge setning 4.12.11 avbilder T det ortogonale komplementet Ha⊥ inni seg selv. Setning 4.12.10 forteller oss at Ha⊥ har dimensjon m, og ifølgeinduksjonsantagelsen har dermed Ha⊥ en ortonormal basis v1,v2, . . . ,vm avegenvektorer for T. Ifølge setning 4.12.10 er da v1,v2, . . . ,vm,a en basis forH, og den bestar apenbart bare av egenvektorer. Siden a star ortogonalt paalle vektorer i Ha⊥ (og dermed spesielt pa v1,v2, . . . ,vm), er basisen orto-normal. !

Oppgaver til seksjon 4.12

1. En matrise kalles skjevtsymmetrisk dersom AT = −A. Vis at alle egenvediene tilen skjevtsymmetrisk matrise er imaginære (dvs. at de er komplekse tall pa formenz = ib).

2. En kvadratisk matrise U kalles ortogonal dersom U−1 = UT . Vis at dersom λer en (reell eller kompleks) egenverdi for U , sa er |λ| = 1. (Hint: Anta at v er enegenvektor med egenverdi λ, og regn ut Uv · Uv pa to forskjellige mater.)

3. Anta at A er en m× n-matrise.

a) Vis at B = AT A er en symmetrisk n× n-matrise.

b) Vis at alle egenverdieneλ1,λ2, . . . ,λn til B er ikke-negative.

c) Sett µi =√

λi og vis at det finnes en ortonormal basis v1,v2, . . . ,vn slik at

(Avi) · (Avj) ={

µ2i hvis i = j

0 ellers

Tallene µ1, µ2, . . . , µn kalles singulærverdiene til A.

Kapittel 5

Iterasjon og optimering

Forrige kapittel handlet om lineære ligningssystemer og hvordan de kan bru-kes til a løse problemer knyttet til matriser og vektorer. Selv om det ikkeer like lett a fa øye pa, handler dette kapitlet i stor grad om ikke-lineæreligningssystemer og hvordan de kan brukes til a løse problemer knyttet tilfølger og funksjoner (et ikke-lineært ligningssystem er rett og slett et lig-ningssystem som ikke er lineært). Vi skal blant annet se hvordan vi kanbruke slike ligningssystemer i optimering, dvs. i studiet av forskjellige typermaksimums- og minimumsproblemer.

Alle lineære ligningssystemer kan i prinsippet løses eksakt ved hjelp avGauss-eliminasjon. For ikke-lineære ligningssystemer er situasjonen en heltannen — for disse ligningssystemene er det som oftes umulig a finne eksak-te løsninger, og man ma derfor nøye seg med metoder som enten viser atløsninger eksisterer (uten a finne dem), eller som finner tilnærmede løsningerved hjelp av numeriske teknikker. Ofte gar disse to angrepsmatene hand ihand; det har som regel liten nytteverdi a vite at en løsning finnes uten aane hvordan den ser ut, og man kan kaste bort mye tid pa numerisk letingetter løsninger som ikke finnes. Dette kapitlet er derfor bade blant de mestpraktiske og de mest teoretiske i kompendiet — vi skal beskrive metoder ogteknikker som brukes for a løse praktiske problemer, men vi skal samtidigse pa teorien som forklarer nar og hvorfor disse metodene virker.

Numeriske løsningsmetoder er ofte basert pa iterasjon, dvs. at man star-ter med en tilnærmet løsning, og sa kjører den samme prosessen om og omigjen for a fa stadig bedre løsningskandidater. Newtons metode (se Kalku-lus seksjon 7.3) er et typisk eksempel pa en slik iterativ metode, og en avproblemstillingene vi skal se pa, er hvordan denne metoden kan generalise-res til en effektiv teknikk for a finne tilnærmede løsninger til ikke-lineæreligningssystemer.

Iterasjon er nært knyttet til følger; vi far en følge av tilnærmede løsningersom helst bør konvergere mot en virkelig løsning. For a forsta hvordan ite-rasjonsteknikker fungerer, trenger vi a forsta hva det vil si at en følge kon-

375

Page 191: Flervariabel analyse med lineær algebra

376 KAPITTEL 5. ITERASJON OG OPTIMERING

vergerer, og kapitlet starter derfor med et teoretisk studium av følger i Rm.Det viktigste begrepet vi skal se pa, er kompletthet — en omformulering ogvidereføring av kompletthetsprinsippet i Kalkulus. Kompletthet er en for-utsetning for alt vi gjør i dette kapitlet, og det kommer til a bli et endaviktigere verktøy nar du gar videre for a studere mer avansert matematikk— differensialligningsteori handler f.eks. i stor grad om a utnytte komplett-het av rom som bestar av funksjoner (og ikke av vektorer slik som vare romhittil har gjort).

Selv om dette kapitlet handler om ikke-lineære ligningssystemer, betyrikke det at vi kan glemme alt vi har lært om lineære systemer — vi kommertvert i mot til a fa bruk for det meste av det vi vet om vektorer, matriserog lineære ligningssystemer i løpet av kapitlet. Grunnen er at vi i mangesituasjoner skal tilnærme ikke-lineære ligningssystemer med lineære syste-mer som har omtrent samme oppførsel i det omradet vi er interessert i.Et typisk eksempel er Newtons metode der vi i hvert skritt i utregningenerstatter det opprinnelige, ikke-lineære ligningssystemet med et lineært sys-tem som er enklere a løse. Nøkkelen til sammenhengen mellom ikke-lineæreog lineære systemer er begrepet linearisering som vi studerte i seksjon 2.9(husk at lineariseringen til en funksjon F : Rn → Rm i punktet a er denaffinavbildningen som ligger tettest opptil F i omradet rundt a).

5.1 Litt topologi i Rm

Nar vi arbeider med funksjoner av en variabel, vil definisjonsomradet somregel være et intervall eller en enkel sammensetning av intervaller. For funk-sjoner av flere variable finnes det mange flere muligheter for hvordan defini-sjonsomradet kan være, og vi ma derfor være litt mer formelle i var omgangmed mengder. I denne seksjonen skal vi innføre apne og lukkede mengder.Disse mengdene spiller pa mange mater den samme rollen i flervariabelteorisom apne og lukkede intervaller spiller i teorien for funksjoner av en varia-bel. En liten bemerkning om notasjon før vi starter: I dette kapitlet vil vistort sett referere til det underliggende rommet som Rm og ikke Rn slik vivanligvis gjør i de andre kapitlene. Det er rett og slett fordi vi kommer tila arbeide mye med følger og ønsker a ha bokstaven n ledig for a referere tildet n-te leddet xn i en følge.

Vi begynner med a repetere litt fra kapittel 2. Dersom a er et punkt iRm, sa er (den apne) kulen om a ∈ Rm med radius r definert som

B(a, r) = {x ∈ Rm : |x− a| < r}

Den bestar altsa av de punktene i Rm som har avstand mindre enn r til a.I R3 er dette virkelig en (apen) kule i tradisjonell forstand, mens det i R2

er en (apen) sirkelskive og i R et apent intervall. Vi velger a bruke “kule”som et fellesord i alle dimensjoner selv om det til a begynne med kan virke

5.1. LITT TOPOLOGI I RM 377

litt uvant nar vi arbeider i planet eller pa tallinjen. De fleste illustrasjonenevare vil være i planet, og der vil kuler fremsta som sirkler. Noen ganger skalvi ogsa ha bruk for de lukkede kulene

B(a, r) = {x ∈ Rm : |x− a| ≤ r},

men det er de apne som vil spille hovedrollen til a begynne med.Figur 1 viser en mengde i planet (omradet innenfor kurven) og tre punk-

ter a, b og c.

3 33b

ac

Figur 1

De tre punktene ligger pa forskjellig mate i forhold til mengden — aligger klart pa innsiden av mengden, b ligger klart pa utsiden, mens c liggerpa grensen mellom mengden og omgivelsene. Vi kaller a et indre punkt, b etytre punkt og c et randpunkt for mengden. I høyere dimensjoner kan vi ikkestøtte oss pa figurer, og vi trenger derfor en mer formell definisjon av indrepunkter, ytre punkter og randpunkter:

Definisjon 5.1.1 La A være en delmengde av Rm.

(i) Et punkt a ∈ Rm kalles et indre punkt for A dersom det finnes en kuleB(a, r) om a som bare inneholder punkter som er med i A.

(ii) Et punkt b ∈ Rm kalles et ytre punkt for A dersom det finnes en kuleB(b, r) om b som ikke inneholder noen punkter som er med i A.

(iii) Et punkt c ∈ Rm kalles et randpunkt for A dersom enhver kule B(c, r)om c inneholder bade punkter som er med i A og punkter som ikke ermed i A.

Legg merke til at de tre delene av definisjonen uttømmer alle muligheter,sa et punkt i Rm ma enten være et indre punkt, et ytre punkt eller etrandpunkt for A. I figur 2 har vi illustrert definisjonen ved a legge “kuler”(dvs. sirkler) rundt punktene a, b og c.

3? 34567

3@ABC

b

ac

Figur 2

Et indre punkt hører alltid med til mengden A, mens et ytre punkt aldrihører med til mengden. For randpunkter er det ingen generell regel; de vil

Page 192: Flervariabel analyse med lineær algebra

378 KAPITTEL 5. ITERASJON OG OPTIMERING

noen ganger høre med til mengden og andre ganger ikke. Figur 3 viser dettefor tre mengder i planet. I punkt a) er randen tegnet med en hel strek —det markerer at alle punktene pa randen hører med til mengden A. En slikmengde kalles lukket. I punkt b) er randen stiplet — det markerer at ingen avpunktene pa randen hører med til mengden B. En slik mengde kalles apen.I punkt c) er noe av randen heltrukken og resten stiplet — det markererat noen av punktene pa randen hører med til mengden C, mens andre ikkegjør det. En slik mengde er hverken apen eller lukket (pa figuren har vi kaltden “halvapen”, men det er ingen offisiell betegnelse).

a)

Figur 3: Lukket, apen og “halvapen” mengde

A

b)

B

c)

C

La oss skrive opp definisjonen av apne og lukkede mengder litt mer for-melt:

Definisjon 5.1.2 En mengde A ⊂ Rm er lukket dersom den inneholder allesine randpunkter, og apen dersom den ikke inneholder noen randpunkter.

Apne og lukkede mengder spiller omtrent samme rolle i teorien for funk-sjoner av flere variable som apne og lukkede intervaller gjør i teorien forfunksjoner av en variabel. Det er imidlertid en viktig forskjell — apne oglukkede mengder kan ha mange forskjellige former, og det gjør at flervaria-belteorien har en del geometriske komplikasjoner som envariabelteorien ikkehar.

Eksempel 1: Vi skal undersøke om mengden

A ={

(x, y) ∈ R2 :x2

9+

y2

4≤ 1

}

er lukket. Mengden bestar av alle punkter som ligger pa eller innenfor enellipse (lag en skisse!) Randen bestar av alle punktene som ligger pa selveellipsen, og mengden er lukket siden alle disse randpunktene hører med tilA.

Følger i Rm

I resten av denne seksjonen skal vi se litt pa konvergens av følger i Rm. Detteer et begrep som kommer til a sta sentralt i de neste seksjonene.

En følge i Rm er en uendelig sekvens

x1,x2,x3, . . . ,xn, . . .

5.1. LITT TOPOLOGI I RM 379

av punkter xn ∈ Rm. Akkurat som for tallfølger bruker vi {xn} som enkortfattet skrivemate for disse følgene. Vi tillater at følgen starter med andreindekser enn 1, f.eks.

x3,x4,x5, . . . ,xn, . . .

ellerx−3,x−2,x−1, . . . ,xn, . . .

Dersom det er viktig a vite hvor følgen starter, kan vi markere det i denkortfattede skrivematen ved a skrive {xn}∞n=3 og {xn}∞n=−3 for de to følgeneovenfor.

< < < < < < < < !Rm

a

x1 x2 x3

Figur 4: En følge som konvergerer til a

/

0

1

2Intuitivt sier vi at en følge {xn} i Rm nærmer seg punktet a som grense-

verdi dersom vi kan fa avstanden mellom xn og a sa liten vi matte ønskeved a velge n tilstrekkelig stor. Vi kan formulere dette pa akkurat sammemate som i det en-dimensjonale tilfellet (sammenlign med definisjon 4.3.1 iKalkulus):

Definisjon 5.1.3 Følgen {xn} i Rm konvergerer mot punktet a ∈ Rm der-som det til enhver ε > 0 finnes en N ∈ N slik at |xn−a| < ε for alle n ≥ N .Vi skriver

limn→∞

xn = a

Vi har akkurat de samme regnereglene som for tallfølger:

Setning 5.1.4 Anta at {xn} og {yn} er to følger i Rm som konvergerermot henholdsvis x og y. Da har vi:

(i) Følgen {cxn} konvergerer for ethvert tall c, og limn→∞(cxn) = cx

(ii) Følgen {xn + yn} konvergerer, og limn→∞(xn + yn) = x + y

(iii) Følgen {xn − yn} konvergerer, og limn→∞(xn − yn) = x− y

(iv) Følgen {xn · yn} konvergerer, og limn→∞(xn · yn) = x · y (legg merketil at dette er en tallfølge og ikke en følge av vektorer).

Page 193: Flervariabel analyse med lineær algebra

380 KAPITTEL 5. ITERASJON OG OPTIMERING

Bevis: Bevisene er nesten identiske med de tilsvarende bevisene for tallfølger(se 4.3.3 i Kalkulus), den eneste forskjellen er at vi na ma bruke Schwarz’ulikhet (setning 1.2.3) og trekantulikheten for vektorer (setning 1.2.4) isted-enfor de tilsvarende ulikhetene for tall. For a illustrere bruken av disse ulik-hetene, tar vi med bevisene for (ii) og (iv).

(ii) Vi ma vise at gitt en ε > 0, kan vi alltid finne en N ∈ N slik at |(xn +yn)− (x+y)| < ε for alle n ≥ N . Det første vi gjør er a omgruppere leddeneslik at vi kan behandle {xn} og {yn} hver for seg:

|(xn + yn)− (x + y)| = |(xn − x) + (yn − y)| ≤ |xn − x| + |yn − y|

der vi i det siste skrittet har brukt trekantulikheten (setning 1.2.4). Sidenlimn→∞ xn = x, ma det finnes en N1 ∈ N slik at |xn−x| < ε

2 for alle n ≥ N1,og siden limn→∞ yn = y, ma det finnes en N2 ∈ N slik at |yn − y| < ε

2 foralle N ≥ N2. Velger vi N lik det største av tallene N1, N2, ser vi at narn ≥ N , er

|(xn + yn)− (x + y)| ≤ |xn − x| + |yn − y| <ε

2+

ε

2= ε

Dermed er (ii) bevist.

(iv) Vi ma vise at gitt en ε > 0, kan vi alltid finne en N ∈ N slik at|xn ·yn−x ·y| < ε for alle n ≥ N . Vi bruker først trikset med a legge til ogtrekke fra leddet x ·yn, og benytter deretter trekantulikheten (setning 1.2.4)og Schwarz’ ulikhet (setning 1.2.3):

|xn · yn − x · y| = |xn · yn − x · yn + x · yn − x · y| ≤≤ |xn · yn − x · yn| + |x · yn − x · y| ≤ |xn − x||yn| + |x||yn − y|

Vi skal na vise at vi kan fa hvert av de to leddene |xn−x||yn| og |x||yn−y|mindre enn ε

2 ved a velge n stor nok. Det siste leddet er enklest, og vi startermed det. Siden dette leddet opplagt er mindre enn ε

2 hvis |x| = 0, kan vikonsentrere oss om tilfellet |x| #= 0. Siden limn→∞ yn = y, ma det finnes enN1 ∈ N slik at |yn − y| < ε

2|x| for alle n ≥ N1. Dermed er |x||yn − y| <

|x| · ε2|x| = ε

2 nar N ≥ N1.Det første leddet |x − xn||yn| er litt verre. Vi observerer først at siden

limn→∞ yn = y, finnes det et tall N2 slik at |yn − y| ≤ 1 nar n ≥ N2.Dermed er

|yn| = |y + (yn − y)| ≤ |y| + |yn − y| ≤ |y| + 1

Siden limn→∞ xn = x, ma det finnes en N3 ∈ N slik at |xn − x| < ε2(|y|+1)

for alle n ≥ N3. Hvis n er større enn eller lik bade N2 og N3, er dermed

|xn − x||yn| <ε

2(|y| + 1)· (|y| + 1) =

ε

2

5.1. LITT TOPOLOGI I RM 381

Velger vi na N til a være det største av tallene N1, N2, N3, ser vi at forn ≥ N er

|xn · yn − x · y| ≤ |xn − x||yn| + |x||yn − y| <ε

2+

ε

2= ε

Dermed er (iv) bevist. !

Vi tok med bevisene ovenfor for a demonstrere hvordan trekantulikhetenog Schwarz’ ulikhet ofte brukes. Det viser seg at vi kan bevise disse resultate-ne vel sa enkelt ved a føre dem tilbake til tilsvarende resultater for tallfølger.Det neste resultatet vil gi oss det redskapet vi trenger. Litt notasjon før vibegynner: Dersom {xn} er en følge i Rm, skriver vi koordinatene til xn slik:

xn = (x(n)1 , x(n)

2 , . . . , x(n)m )

Vi skriver indeksen n oppe for ikke a blande den sammen med koordinatenetil xn, og vi putter den inn i en parentes for a gjøre det klart at den ikke eren eksponent.

Setning 5.1.5 Anta at {xn} er en følge i Rm med komponenter

xn = (x(n)1 , x(n)

2 , . . . , x(n)m )

og at x ∈ Rm har komponenter x = (x1, x2, . . . , xm). Da er

limn→∞

xn = x

hvis og bare hvis

limn→∞

x(n)i = xi for alle i = 1, 2, . . . m

Med andre ord: {xn} konvergerer mot x hvis og bare hvis hver komponent ixn konvergerer mot tilsvarende komponent i x.

Dersom du synes det er vanskelig a forsta hva setningen sier, er det lurta ta en kikk pa eksemplet nedenfor før du gar videre.

Bevis: Anta først at limn→∞ xn = x. Vi skal vise at limn→∞ x(n)i = xi. Det

betyr at gitt en ε > 0, ma vi vise at det alltid finnes en N ∈ N slik at|x(n)

i − xi| < ε for alle n ≥ N . Siden limn→∞ xn = x, finnes det en N ∈ Nslik at |xn − x| < ε nar n ≥ N . Siden

|x(n)i − xi| =

√(x(n)

i − xi)2 ≤

≤√

(x(n)1 − x1)2 + · · · + (x(n)

i − xi)2 + · · · + (x(n)m − xm)2 = |xn − x|

Page 194: Flervariabel analyse med lineær algebra

382 KAPITTEL 5. ITERASJON OG OPTIMERING

medfører dette at |x(n)i − xi| < ε for alle n ≥ N , og det er akkurat det vi

skulle vise.Anta sa at limn→∞ x(n)

i = xi for i = 1, 2, . . . ,m. Vi skal vise at atlimn→∞ xn = x. Det betyr at gitt en ε > 0, ma vi produsere en N ∈ N slikat |xn − x| < ε nar n ≥ N . Siden limn→∞ x(n)

i = xi, finnes det for hver i

en Ni ∈ N slik at |x(n)i − xi| < ε√

mnar n ≥ Ni. La N være den største av

N1, N2, . . . , Nm. For n ≥ N er da

|xn − x| =√

(x(n)1 − x1)2 + · · · + (x(n)

i − xi)2 + · · · + (x(n)m − xm)2 ≤

√(ε√m

)2

+ · · · +(

ε√m

)2

+ · · · +(

ε√m

)2

=

√m

ε2

m=√

ε2 = ε

!

Eksempel 2: Finn grenseverdien

limn→∞

n2

n2+1

n sin(

1n

)

(1 + 2

n

)n

Ifølge setningen ovenfor behøver vi bare a regne ut grensen til hver kompo-nent. Den første er enkel:

limn→∞

n2

n2 + 1L′H= lim

n→∞

2n

2n= 1

Den andre gar ogsa greit:

limn→∞

n sin(

1n

)= lim

n→∞

sin(

1n

)

1n

L′H= limn→∞

cos(

1n

) (− 1

n2

)(− 1

n2

) = limn→∞

cos(

1n

)= 1

Den tredje skriver vi først om:(

1 +2n

)n

= en log(1+ 2n)

og bruker deretter L’Hopitals regel pa eksponenten:

limn→∞

n log(

1 +2n

)= lim

n→∞

log(1 + 2

n

)

1n

L′H= limn→∞

1(1+ 2

n) ·(− 2

n2

)

− 1n2

= 2

Altsa erlim

n→∞

(1 +

2n

)n

= e2

5.1. LITT TOPOLOGI I RM 383

Kombinerer vi alt dette, far vi

limn→∞

n2

n2+1

n sin(

1n

)

(1 + 2

n

)n

=

1

1

e2

Det neste resultatet gir et nytt innblikk i hvorfor lukkede mengder kalles“lukkede”:

Setning 5.1.6 Anta at A ⊂ Rm er lukket, og at {xn} er en følge fra A somkonvergerer mot et punkt x. Da er x ∈ A.

Bevis: Anta for motsigelse at x /∈ A. Siden A er lukket, ma x da være etytre punkt (alle randpunktene hører jo med til A nar A er lukket). Det be-tyr at det finnes en kule B(x, r) om x som ikke inneholder noe punkt fraA. Spesielt kan ingen av leddene i følgen {xn} ligge i B(x, r). Det betyr at|xn − x| ≥ r for alle n, og følgelig kan ikke {xn} konvergere mot x. Dettegir oss den selvmotsigelsen vi er pa jakt etter. !

Det siste resultatet i denne seksjonen binder sammen konvergens og kon-tinuitet (se Kalkulus, setning 5.1.10 for den endimensjonale versjonen).

Setning 5.1.7 Anta at F : A → Rm er en funksjon av flere variable, og ata er et punkt i definisjonsomradet A til F. Da er F kontinuerlig i a hvis ogbare hvis F(xn) → F(a) for alle følger {xn} fra A slik at xn → a.

Bevis: Anta først at F er kontinuerlig i a. Gitt en følge {xn} av punkter iA slik at xn → a, ma vi vise at det for enhver ε > 0, finnes en N ∈ N slikat |F(xn)−F(a)| < ε for alle n ≥ N . Siden F er kontinuerlig i a, finnes deten δ > 0 slik at |F(y) − F(a)| < ε for alle y ∈ A slik at |y − a| < δ. Sidenxn → a, finnes det en N ∈ N slik at |xn − a| < δ nar n ≥ N . Men dettebetyr at nar n ≥ N , sa er |xn − a| < δ og følgelig |F(xn)− F(a)| < ε.

Anta sa at F ikke er kontinuerlig i a. Vi ma vise at det finnes i hvertfall en følge {xn} fra A slik at xn → a, men F(xn) #→ F(a). Siden F ikke erkontinuerlig i a, ma det finnes en ε > 0 slik at uansett hvor liten vi velgerδ > 0, sa eksisterer det en x ∈ A slik at |x− a| < δ, men |F(x)−F(a)| ≥ ε.Velger vi δ = 1

n , finner vi pa denne maten et punkt xn ∈ A slik at |xn−a| <1n , men |F(xn) − F(a)| ≥ ε. Følgen {xn} konvergerer mot a, men {F(xn)}kan ikke konvergere mot F(a) siden |F(xn)− F(a)| ≥ ε for alle n. !

Page 195: Flervariabel analyse med lineær algebra

384 KAPITTEL 5. ITERASJON OG OPTIMERING

Oppgaver til seksjon 5.1

1. Avgjør om mengden er apen eller lukket eller ingen av delene. Det holder meden figur og et uformelt argument.

a) {(x, y) ∈ R2 : |x| ≤ 1 og |y| ≤ 1} f) {(x, y) ∈ R2 : x + 2y = 1}b) {(x, y) ∈ R2 : |x| < 1 og |y| < 1} g) {(x, y) ∈ R2 : x og y er rasjonale}c) {(x, y) ∈ R2 : |x| ≤ 1 og |y| < 1} h) {(x, y, z) ∈ R3 : x2 + y2 + z2 < 1}d) {(x, y) ∈ R2 : |x| ≤ 1} i) {(x, y, z) ∈ R3 : x2 + y2 + z2 ≥ 1}e) {(x, y) ∈ R2 : x + 2y < 1}

2. Finn grensen til følgene {xn} nar:

a) xn = ( 2n2+1n2+3n , 3n

1−2n ).

b) xn = (n sin 1n , n(1− e2/n)).

c) xn = (√

n2 + 2n− n, cos 1n ,

(cos 1

n

)n2

)

3. Bruk setning 5.1.5 og grensesetningene for “vanlige” følger (dvs. følger med ver-dier i R) til a bevise setning 5.1.4.

4. Anta at a og b er to punkter i Rm, og at {xn} er en følge som konvergere motb. Vis at limn→∞ |xn−a| = |b−a|. (Hint: Vis først at ||xn−a|−|b−a|| ≤ |xn−b|).

5. Vis at den apne kulen B(a, r) er en apen mengde og at den lukkede kulen B(a, r)er en lukket mengde.

6. Vis at dersom c er et randpunkt for A ⊂ Rm, sa finnes det to følger {xn} og{yn} som konvergerer mot c slik at den ene følgen bare bestar av punkter som ermed i A, mens den andre følgen bare bestar av punkter som ikke er med i A.

7. I denne oppgaven skal vi se litt pa egenskapene til de apne mengdene.

a) Anta at A,B ⊂ Rm er apne mengder. Vis at A∪B og A∩B er apne mengder.(Husk at A ∪ B = {x ∈ Rm : x er med i minst en av mengdene A og B} ogA ∩B = {x ∈ Rm : x er med i begge mengdene A og B}.)

b) Hvis A ⊂ Rm, sa kalles mengden

Ac = {x ∈ Rm : x /∈ A}

komplementet til A. Vis at A og Ac har samme rand.

c) Vis at en mengde A ⊂ Rm er apen hvis og bare hvis komplementet Ac erlukket.

8. I denne oppgaven skal vi se litt pa egenskapene til de lukkede mengdene. Det erlurt a gjøre oppgaven ovenfor før du begynner pa denne.

a) Anta at A,B ∈ Rm er lukkede mengder. Vis at A ∪ B og A ∩ B er lukkedemengder.

5.2. KOMPLETTHET AV RM 385

b) Anta at A ⊂ Rm er lukket og at B ⊂ Rm er apen. Vis at

A \ B = {x ∈ A : x #∈ B}

er lukket.

c) Vis at A ⊂ Rm er lukket hvis og bare hvis A = A, der tillukningen A bestarav alle punkter som er med i enten A eller randen til A (dvs. A = A ∪ ∂Ader ∂A er randen til A).

9. (Eksamen MAT 1110 13/6, 2008)

a) Vis at dersom A er en m×m-matrise og {xn} er en følge i Rm som konvergerermot 0, sa konvergerer ogsa {Axn} mot 0.

b) Vis at dersom B er en inverterbar m×m-matrise og følgen {Bxn} konvergerermot 0, sa konvergerer ogsa {xn} mot 0.

c) Vis til slutt at dersom C er en ikke-inverterbar m×m-matrise, sa finnes detalltid en følge {xn} i Rm slik at {Cxn} konvergerer mot 0, mens {xn} ikkekonvergerer mot 0.

5.2 Kompletthet av Rm

I denne seksjonen skal vi se pa konvergens av følger fra en teoretisk syns-vinkel, men resultatene vi kommer frem til, har stor praktisk nytte — blantannet nar vi skal bruke datamaskiner til a finne numeriske løsninger pamatematiske problemer. Du vil fa se flere eksempler pa dette i de nesteseksjonene.

Vi starter med en følge av punkter i Rm

x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11, . . . ,xn, . . .

og tenker oss at vi plukker ut uendelig mange av punktene i følgen (mensannsynligvis ikke alle). Vi kan for eksempel begynne med a plukke ut deelementene som vi har satt en strek under her:

x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11, . . . ,xn, . . .

Pa denne maten far vi en ny følge som begynner

x3,x5,x6,x10, . . .

Denne nye følgen kalles en delfølge av den opprinnelige følgen.La oss se litt mer formelt pa dette. Dersom de leddene som vi plukker ut i

den opprinnelige følgen, har nummer n1, n2, n3, . . . , nk, . . ., vil den nye følgen(delfølgen) ha elementene xn1 , xn2 , xn3 , . . . , xnk , . . .. Kaller vi delfølgen {yk},har vi altsa {yk} = {xnk}. Vi kan na gi den presise definisjonen av endelfølge:

Page 196: Flervariabel analyse med lineær algebra

386 KAPITTEL 5. ITERASJON OG OPTIMERING

Definisjon 5.2.1 Anta at {xn} er en følge av punkter i Rm og at

n1 < n2 < n3 < n4 < . . . < nk < . . .

er en strengt voksende følge av naturlige tall. Da kalles følgen {yk} deryk = xnk en delfølge av {xn}.

Vi skal være interessert i samspillet mellom konvergens av følger og kon-vergens av delfølger. Det første resultatet er enkelt.

Setning 5.2.2 Anta at en følge {xn} i Rm konvergerer mot et punkt x. Dakonvergerer ogsa alle delfølger av {xn} mot x.

Bevis: Beviset overlates til leserne. !

Vi sier at en følge {xn} i Rm er begrenset dersom det finnes et tall K slikat |xn| ≤ K for alle n. Det neste resultatet er nøkkelen til resten av denneseksjonen.

Teorem 5.2.3 (Bolzano-Weierstrass’ teorem) Alle begrensede følger iRm har en konvergent delfølge.

Bevis: Beviset er enklest a oppfatte for følger i R2, men er lett a generaliseretil høyere dimensjoner nar man først har forstatt det. Vi skal derfor beviseresultatet for en følge {xn} i R2 og overlate resten til leserne.

Siden følgen er begrenset, vet vi at det finnes et tall K slik at |xn| < Kfor alle n. Det betyr spesielt at alle elementene i følgen ligger innenfor detstore kvadratet i figur 1.

!

"

−K K

−K

K

S1 S2

S3 S4

Figur 1: Kvadratene S1, S2, S3 og S4

Vi deler kvadratet opp i fire mindre kvadrater S1, S2, S3, S4 som vist pafiguren (disse kvadratene er lukkede og utgjør “hvert sitt hjørne” av det opp-rinnelige kvadratet). Siden følgen har uendelig mange ledd x1,x2,x3, . . ., maminst ett av kvadratene S1, S2, S3, S4 ogsa inneholde uendelig mange ledd.Kall dette kvadratet K1 (hvis flere av kvadratene S1, S2, S3, S4 inneholder

5.2. KOMPLETTHET AV RM 387

uendelig mange ledd, velger vi bare ett av dem). Vi deler na dette kvadra-tet K1 i fire nye kvadrater pa samme mate som før, og observerer at minsten av delene ma inneholde uendelig mange ledd fra følgen. Dette kvadra-tet kaller vi K2. Fortsetter vi pa denne maten, far vi en følge av kvadraterK1,K2,K3, . . . som ligger inni hverandre og som alle inneholder uendeligmange ledd fra følgen. Figur 2 viser hvordan en slik følge kan se ut.

Ideen er na a plukke en delfølge {xnk} av{xn} slik at xnk ∈ Kk for allek. Dette er mulig siden hvert kvadrat inneholder uendelig mange av leddenei den opprinnelige følgen, og det er intuitivt rimelig at en slik delfølge makonvergere siden leddene “er fanget i” mindre og mindre kvadrater. La ossse pa detaljene.

!

"

K1

K2

K3

$K4

#

Figur 2: Kvadratene K1, K2, K3 og K4. . .

For a konstruere delfølgen {xnk} lar vi først n1 være det minste talletslik at xn1 ∈ K1. Deretter velger vi n2 til a være det første tallet etter n1

slik at xn2 er med i K2 — et slikt element ma finnes siden K2 inneholderuendelig mange ledd fra følgen. Pa tilsvarende mate velger vi n3 til a væredet første tallet etter n2 slik at xn3 ∈ K3, osv. Vi har na funnet en delfølge{xnk} av {xn} slik at xnk ∈ Kk, og det gjenstar a vise at den konvergerer.

La (ak, bk) være koordinatene til det nedre, venstre hjørne til kvadratetKk. Det følger fra konstruksjonen at {ak} og {bk} er voksende (dvs. ikkeavtagende), begrensede følger. Ifølge teorem 4.3.9 i Kalkulus ma de da kon-vergere mot hver sin grenseverdi a og b, og følgelig vil punktene zk = (ak, bk)konvergere mot z = (a, b) (husk setning 5.1.5). Siden bade zk og xnk liggeri kvadratet Kk, og størrelsen av dette kvadratet gar mot null, ma da ogsafølgen {xnk} konvergere mot z. Dermed er teoremet bevist. !

Som du snart vil fa anledning til a se, er teoremet ovenfor et usedvanlignyttig redskap nar man arbeider med følger. Et enda nyttigere redskap erCauchy-følger.

Definisjon 5.2.4 En følge {xn} i Rm er en Cauchy-følge dersom det forenhver ε > 0, finnes en N ∈ N slik at |xn − xk| < ε for alle n, k ≥ N

Page 197: Flervariabel analyse med lineær algebra

388 KAPITTEL 5. ITERASJON OG OPTIMERING

En følge er altsa en Cauchy-følge dersom vi kan fa avstanden mellom to leddtil a bli vilkarlig liten ved a ga tilstrekkelig langt ut i følgen. Det er ikkevanskelig a se at alle konvergente følger er Cauchy-følger.

Lemma 5.2.5 Enhver konvergent følge i Rm er en Cauchy-følge

Bevis: Anta at xn konvergerer mot x. Gitt et tall ε > 0, vet vi da at detfinnes et tall N ∈ N slik at |xn − x| < ε

2 nar n ≥ N . Hvis bade n og k erstørre enn eller lik N , har vi dermed ved trekantulikheten

|xn − xk| = |(xn − x) + (x− xk)| ≤ |xn − x| + |x− xk| <ε

2+

ε

2= ε

Dermed har vi vist at xn er en Cauchy-følge. !

Det neste resultatet er mer overraskende — og atskillig mer nyttig.

Teorem 5.2.6 Alle Cauchy-følger i Rm konvergerer.

Bevis: Gangen i beviset er som følger: Først viser vi at enhver Cauchy-følgeer begrenset, deretter bruker vi teorem 5.2.3 til a plukke ut en konvergentdelfølge, og til slutt viser vi at Cauchy-følgen konvergerer mot det sammepunktet som delfølgen.

Anta at {xn} er en Cauchy-følge. For a vise at {xn} er begrenset, velgervi en ε > 0 (f.eks. ε = 1). Da finnes det en N slik at |xn − xk| < ε narn, k ≥ N . Spesielt ma |xn−xN | < ε for alle n ≥ N , og ved trekantulikhetenbetyr det at

|xn| = |xN + (xn − xN )| ≤ |xN | + |xn − xN | < |xN | + ε

nar n ≥ N . Dette betyr at følgen er begrenset av det største av tallene

|x1|, |x2|, |x3|, . . . , |xN−1|, |xN | + ε

Siden følgen {xn} er begrenset, har den ifølge teorem 5.2.3 en konvergentdelfølge {xnk} med en grenseverdi x. Vi skal vise at ogsa den opprinneligefølgen {xn} konvergerer mot x. Gitt en ε > 0, ma vi da vise at det finnes enN slik at |xn − x| < ε nar n ≥ N . Det er ikke sa vanskelig: Siden {xn} eren Cauchy-følge, finnes det en N slik at |xn − xk| < ε

2 nar n, k ≥ N . Sidendelfølgen {xnk} konvergerer mot x, finnes det et element xnK i denne følgenslik at nK ≥ N og |xnK − x| < ε

2 . Hvis n ≥ N , er dermed

|xn − x| = |(xn − xnK ) + (xnK − x)| ≤ |xn − xnK | + |xnK − x| <ε

2+

ε

2= ε

Dermed er teoremet bevist. !

Kombinerer vi teoremet ovenfor med det foregaende lemmaet, far videnne eksakte sammenhengen:

5.2. KOMPLETTHET AV RM 389

Korollar 5.2.7 En følge i Rm konvergerer hvis og bare hvis den er enCauchy-følge.

Bemerkning: Noen synes kanskje at resultatene ovenfor er sa opplagte atdet ikke er noen grunn til a bevise dem — det er da en selvfølge at Cauchy-følger og konvergente følger er det samme! Det er imidlertid lett a overbeviseseg om at dette ikke nødvendigvis er tilfellet. Anta at vi foretrakk a gjørevar matematikk i mengden Q av rasjonale tall istedenfor i mengden R avreelle tall. Følgen

x0 = 1, x2 = 1.4, x3 = 1.41, x4 = 1.4142, x5 = 1.41421, . . .

(bestaende av lengre og lengre desimaltallstilnærminger til√

2) er en Cauchy-følge i Q, men den konvergerer ikke i Q siden grensen er det irrasjonale tallet√

2.Det er mulig a definere konvergens og Cauchy-følger i andre mengder

(matematikere kaller dem gjerne metriske rom) enn Rm — det viser segat alt vi trenger, er et mal for avstanden mellom to punkter (en metrikk).Et slikt metrisk rom kalles komplett dersom alle Cauchy-følger konvergerer.Teoremet ovenfor forteller oss altsa at Rm er komplett, mens eksemplet ibegynnelsen av denne bemerkningen viser at Q ikke er komplett. Du harstøtt pa ordet komplett før i forbindelse med reelle tall — i seksjon 2.3 iKalkulus studerte vi kompletthetsprinsippet for R (det sier at alle begren-sede, ikke-tomme delmengder av R har en minste øvre skranke). Det viserseg a være en nær sammenheng mellom disse to formene for kompletthet,og vi kunne ha basert var diskusjon av R pa konvergens av Cauchy-følgeristedenfor eksistens av minste øvre skranker.

Selv om det kankje ikke er sa lett a se ved første øyekast, er teoremetovenfor et meget viktig redskap nar man skal studere konvergens av følger— det er ofte mye lettere a vise at en følge {xn} konvergerer ved a vise atden er en Cauchy-følge enn ved a bruke definisjonen av konvergens. Grunnener at for a bruke definisjonen, ma vi først finne grensepunktet x og sa viseat vi kan fa |xn − x| mindre enn ε ved a velge N stor nok. For a vise at{xn} er en Cauchy-følge, trenger vi ikke kjenne grensepunktet — alt vi skalsjekke, er at vi kan fa |xn−xk| mindre enn ε ved a velge n og k store nok. Viarbeider altsa med de gitte verdiene xn og xk og trenger ikke a vite noe omgrensepunktet pa forhand. Vi skal se slaende eksempler pa denne teknikkeni de neste tre seksjonene.

Oppgaver til seksjon 5.2

1. Bevis setning 5.2.2.

2. Bevis setning 5.2.3 for følger i et vilkarlig rom Rm.

Page 198: Flervariabel analyse med lineær algebra

390 KAPITTEL 5. ITERASJON OG OPTIMERING

3. Anta In er en følge av intervaller i R slik at In+1 ⊂ In og lengden til In gar motnull. Vis at det finnes nøyaktig ett tall som er med i alle intervallene In.

4. Anta at {xn} er en følge i Rm. Et punkt x i Rm kalles et opphopningspunkt for{xn} hvis enhver kule B(x, r) inneholder uendelig mange elementer i følgen.

a) Vis at x et et opphopningpunkt for {xn} hvis og bare hvis {xn} har endelfølge som konvergerer mot x

b) Anta at A er en lukket, begrenset delmengde av Rm. Vis at enhver følge i Ahar et opphopningspunkt i A.

c) Anta at A ⊂ Rm ikke er lukket. Vis at det finnes en følge i A som ikke haret opphopningspunkt i A.

d) Anta at A ⊂ Rm ikke er begrenset. Vis at det finnes en følge i A som ikkehar et opphopningspunkt i A.

5. Anta at a er et punkt i Rm og at B er en delmengde i Rm. Vi definerer avstandenfra a til B til a være

d(a, B) = inf{|a− b| : b ∈ B}

a) La B = {(x, y) ∈ R2 : x > 1}. Vis at d(0, B) = 1, men at det ikke finnes noepunkt b ∈ B slik at |0− b| = 1.

b) Vis at dersom a ∈ Rm og B er en lukket, begrenset delmengde av Rm, safinnes det et punkt b ∈ B slik at |a − b| = d(a, B). Vis ved et eksempel atdet godt kan være flere slike punkter b.

c) Vis at dersom a ∈ Rm og B er en lukket (men ikke nødvendigvis begrenset)delmengde av Rm, sa finnes det et punkt b ∈ B slik at |a− b| = d(a, B).

d) Mengden B kalles konveks dersom den har følgende egenskap: Dersom c ogd er to punkter i B, sa ligger ogsa hele linjestykket som forbinder c og d i B(se figur 5.5.1 hvis du føler behov for en illustrasjon). Vis at dersom B er enlukket, konveks delmengde av Rm, sa finnes det et entydig punkt b ∈ B slikat |a− b| = d(a, B).

5.3 Noen konsekvenser av kompletthet

I denne seksjonen skal vi se pa en del anvendelser av resultatene i forrigeseksjon. Seksjonen kan virke som en liten avstikker fra hovedtemaet i dettekapitlet, og det er mulig a hoppe over den og ga direkte løs pa seksjon 5.4.Man bør da være klar over at teorem 5.3.2 brukes for a bevise integrerbarhetav kontinuerlige funksjoner i seksjon 6.1 og at teorem 5.3.11 brukes i det (*-merkede) beviset for Kantorovichs teorem i seksjon 5.6.

Uniform kontinuitet

Vi skal først se pa et begrep som blir svært viktig nar vi skal studere inte-grasjon av funksjoner av flere variable i kapittel 6. I denne seksjonen skal vi

5.3. NOEN KONSEKVENSER AV KOMPLETTHET 391

bruke det til a studere derivasjon under integraltegnet og uavhengighetenav veien for linjeintegraler.

Vi begynner med en definisjon:

Definisjon 5.3.1 Anta at f : A → R er en funksjon av n variable. Vi sier atf er uniformt kontinuerlig pa en mengde B ⊂ A dersom det til enhver ε > 0finnes en δ > 0, slik at hvis u,v ∈ B og |u−v| < δ, sa er |f(u)− f(v)| < ε.

Ved første øyekast er det ikke lett a se forskjell pa denne definisjonenog definisjonen av vanlig kontinuitet. Nøkkelen ligger i ordet “uniform” somantyder at funksjonen skal være “like kontinuerlig” i alle punkter, dvs. atgitt en ε > 0, kan vi finne en δ > 0 som fungerer uansett hvilket punkt u ∈ Bvi befinner oss i. Med vanlig kontinuitet kan det tenkes at vi til samme εma bruke forskjellig δ avhengig av hvilket punkt u vi sjekker kontinuiteteni, og at det ikke er noen δ som fungerer i alle punkter. Et eksempel paen kontinuerlig, men ikke uniformt kontinuerlig funksjon av en variabel, erf(x) = x2 med B = R — denne funksjonen blir brattere og brattere dessstørre x blir i tallverdi, og vi trenger derfor mindre og mindre δ til a taklesamme ε.

Er du fortsatt forvirret over sammenhengen mellom uniform kontinui-tet og vanlig kontinuitet, er det ikke sikkert det neste resultatet hjelper —det sier at pa lukkede, begrensede mengder er det ikke noen forskjell pade to begrepene! Beviset bygger pa Bolzano-Weierstrass’ teorem fra forrigeseksjon.

Teorem 5.3.2 Anta at K er en lukket, begrenset delmengde av Rn. Enhverfunksjon f som er kontinuerlig pa K, er ogsa uniformt kontinuerlig pa K.

Bevis: Anta at f ikke er uniformt kontinuerlig pa K. Vi ma vise at da kanf heller ikke være (vanlig) kontinuerlig pa hele K. Siden f ikke er uniformtkontinuerlig, finnes det en ε > 0 slik at uansett hvor liten vi velger δ > 0, safinnes det punkter u,v ∈ K slik at |u−v| < δ, men |f(u)− f(v)| ≥ ε. Spe-sielt kan vi for hver n ∈ N, finne punkter un,vn ∈ K slik at |un − vn| < 1

n ,men |f(un)−f(vn)| ≥ ε. Siden K er lukket og begrenset, vet vi fra Bolzano-Weierstrass’ teorem at {un} har en delfølge {unk} som konvergerer mot etpunkt u ∈ K. Siden avstanden mellom unk og vnk gar mot null, ma ogsavnk ga mot u. Det er na lett a se at f ikke kan være kontinuerlig i u. Haddeden vært det, ville (ifølge setning 5.1.7) bade f(unk) og f(vnk) gatt motf(u), men det er umulig siden |f(unk) − f(vnk)| ≥ ε. Dette viser at vi harfunnet et punkt u ∈ K der f ikke er kontinuerlig, og beviset er fullført. !

Vi skal na se hvordan uniform kontinuitet kan brukes til a begrunne ennyttig teknikk som kalles “derivasjon under integraltegnet”. Sannsynligvisvil du før eller senere støte pa denne teknikken i andre fag, men siden vi

Page 199: Flervariabel analyse med lineær algebra

392 KAPITTEL 5. ITERASJON OG OPTIMERING

ikke har bruk for den andre steder i dette kompendiet, kan du godt hoppeover resten av seksjonen uten a ga glipp av noe i fortsettelsen.

Tenk deg at du har en funksjon av flere variable x = (x1, x2, . . . , xm)definert som et integral

F (x) =∫ b

aG(x, t) dt

og at du har behov for a derivere F med hensyn pa en av variablenex1, x2, . . . , xm. Under rimelige betingelser kan du da “derivere under in-tegraltegnet” og fa

∂F

∂xi(x) =

∫ b

a

∂G

∂xi(x, t) dt

Det er ikke sa vanskelig a se at denne formelen “burde være” riktig; brukervi definisjonen av partiellderivert, far vi

∂F

∂xi(x) = lim

h→0

F (x1, . . . , xi + h, . . . , xm)− F (x1, . . . , xi, . . . , xm)h

=

= limh→0

∫ b

a

G(x1, . . . , xi + h, . . . , xm, t)−G(x1, . . . , xi, . . . , xm, t)h

dt

Hvis vi tillater oss a flytte grenseverdien forbi integraltegnet, far vi

∂F

∂xi(x) = lim

h→0

∫ b

a

G(x1, . . . , xi + h, . . . , xm, t)−G(x1, . . . , xi, . . . , xm, t)h

dt =

∫ b

alimh→0

G(x1, . . . , xi + h, . . . , xm, t)−G(x1, . . . , xi, . . . , xm, t)h

dt =∫ b

a

∂G

∂xi(x, t) dt

som er resultatet vi ønsker oss. Det viser seg imidlertid at vi ikke uhemmetkan flytte grenseverdier forbi integraltegn — i noen tilfeller vil det faktisk gigalt svar! Vi skal na bruke uniform kontinuitet til a vise at svaret blir riktigi dette tilfellet.

Teorem 5.3.3 (Derivasjon under integraltegnet) Anta A ⊂ Rm er enapen mengde i Rm og at a, b er to reelle tall, a < b. Anta videre at G(x, t)er en funksjon av m + 1-variable som er kontinuerlig og har kontinuerligepartiellderiverte ∂G

∂xi(x, t) i alle punkter (x, t) der x ∈ A og a ≤ t ≤ b. Da har

funksjonen F (x) =∫ ba G(x, t) dt kontinuerlige partiellderiverte i alle punkter

x ∈ A og∂F

∂xi(x) =

∫ b

a

∂G

∂xi(x, t) dt

Bevis: Velg et punkt x = (x1, x2, . . . , xm) ∈ A. Siden A er apen, finnes deten lukket kule B(x, r) som ligger inni A. Da er mengden C = {(x, t) ∈

5.3. NOEN KONSEKVENSER AV KOMPLETTHET 393

Rm+1 |x ∈ B(x), a ≤ t ≤ b} lukket og begrenset, og funksjonen ∂G∂xi

er ifølgeteorem 5.3.2 uniformt kontinuerlig pa C.

For hver h < r finnes det ifølge middelverdisetningen (se seksjon 6.2 iKalkulus) et tall ch mellom xi og xi + h slik at

G(x1, . . . , xi + h, . . . , xm)−G(x1, . . . , xi, . . . , xm)h

=∂G

∂xi(x1, . . . , ch, . . . , xm)

Dette betyr at

F (x1, . . . , xi + h, . . . , xm)− F (x1, . . . , xi, . . . , xm)h

=

=∫ b

a

G(x1, . . . , xi + h, . . . , xm, t)−G(x1, . . . , xi, . . . , xm, t)h

dt

=∫ b

a

∂G

∂xi(x1, . . . , ch, . . . , xm) dt

Hvis vi legger til og trekker fra∫ ba

∂G∂xi

(x1, . . . , xi, . . . , xm) dt i det siste ut-trykket, far vi

F (x1, . . . , xi + h, . . . , xm)− F (x1, . . . , xi, . . . , xm)h

=

=∫ b

a

∂G

∂xi(x1, . . . , xi, . . . , xm, t) dt+

+∫ b

a

(∂G

∂xi(x1, . . . , ch, . . . , xm, t)− ∂G

∂xi(x1, . . . , xi, . . . , xm, t)

)dt

For a vise at ∂F∂xi

(x) =∫ ba

∂G∂xi

(x, t) dt er det dermed nok a vise at

limh→0

∫ b

a

(∂G

∂xi(x1, . . . , ch, . . . , xm, t)− ∂G

∂xi(x1, . . . , xi, . . . , xm, t)

)dt = 0

Vi bruker definisjonen av grenseverdi; gitt en ε > 0, ma vi finne en δ > 0slik at

∣∣∣∣∫ b

a

(∂G

∂xi(x1, . . . , ch, . . . , xm, t)− ∂G

∂xi(x1, . . . , xi, . . . , xm, t)

)dt

∣∣∣∣ < ε

nar h < δ. Siden ∂G∂xi

er uniformt kontinuerlig pa C, vet vi at det finnes enδ > 0 slik at hvis u,v ∈ C og |u−v| < δ, sa er |G(u)−G(v)| < ε

b−a . Spesieltbetyr dette at hvis h < δ, sa er

∣∣∣∣∂G

∂xi(x1, . . . , ch, . . . , xm, t)− ∂G

∂xi(x1, . . . , xi, . . . , xm, t)

∣∣∣∣ <ε

b− a

Page 200: Flervariabel analyse med lineær algebra

394 KAPITTEL 5. ITERASJON OG OPTIMERING

for alle t ∈ [a, b], og dermed er∣∣∣∣∫ b

a

(∂G

∂xi(x1, . . . , ch, . . . , xm, t)− ∂G

∂xi(x1, . . . , xi, . . . , xm, t)

)dt

∣∣∣∣ <

<

∫ b

a

ε

b− adt =

ε

b− a· (b− a) = ε

Det gjenstar a vise at ∂F∂xi

(x) er kontinuerlig. Siden∣∣∣∣∂F

∂xi(x)− ∂F

∂xi(y)

∣∣∣∣ =∣∣∣∣∫ b

a

(∂G

∂xi(x, t)− ∂G

∂xi(y, t)

)dt

∣∣∣∣

kan dette gjøres ved a bruke uniform kontinuitet pa akkurat samme matesom ovenfor. Detaljene overlates til leserne. !

For a vise en typisk anvendelse av derivasjon under integraltegnet, tarvi turen tilbake til seksjon 3.5. Der viste vi i setning 3.5.3 at dersom etvektorfelt F er konservativt i et omrade A, sa er ∂Fi

∂xj(x) = ∂Fj

∂xi(x) for alle

x ∈ A. Vi viste ogsa ved et eksempel at det er mulig a ha betingelsene∂Fi∂xj

(x) = ∂Fj

∂xi(x) oppfylt for alle x i et omrade A uten at F er konserva-

tivt i A. Problemet oppstar hvis omradet vi ser pa er gjennomhullet, og vinevnte at dersom omradet A er sakalt enkeltsammenhengende, sa medførerbetingelsene ∂Fi

∂xj(x) = ∂Fj

∂xi(x) for alle x ∈ A (og alle indekser i, j) at F er

konservativt i A. Dette resultatet er fortsatt litt for vanskelig for oss, menved hjelp av derivasjon under integraltegnet er det lett a vise at konklusjonenholder for en enklere klasse omrader, de som kalles stjerneformede.

Et omrade A ⊂ Rm er stjerneformet dersom det finnes et punkt a ∈ Aslik at for alle andre punkter x i A ligger hele linjestykket fra a til x i A. Leggmerke til at en kule er er et stjerneformet i henhold til denne definisjonen,sa et stjerneformet omrade behøve slett ikke a ligne sa mye pa en stjerne —poenget er heller at stjerner er typiske eksempler pa stjerneformede omrader.

3a

Figur 1: Et stjerneformet omrade

Setning 5.3.4 Anta at A ⊂ Rm er et apent og stjerneformet omrade, og atvektorfeltet F : A → Rm har kontinuerlige partiellderiverte slik at

∂Fi

∂xj(x) =

∂Fj

∂xi(x)

for alle x ∈ A og alle i, j = 1, 2, . . . ,m. Da er F konservativt i A.

5.3. NOEN KONSEKVENSER AV KOMPLETTHET 395

Bevis: For a slippe at notasjonen blir altfor uoversiktelig, antar vi at “sent-ret” a i A er origo (beviset for det generelle tilfellet gar pa akkurat sammemate). Linjestykket fra a = 0 er da gitt ved parametriseringen

r(t) = tx = (tx1, tx2, . . . , txm) t ∈ [0, 1]

som gir r′(t) = x. Vi definerer funksjonen φ : A → R ved

φ(x) =∫ 1

0F(r(t)) · r′(t) dt =

∫ 1

0F(tx) · x dt =

=∫ 1

0

m∑

j=1

Fj(tx1, . . . , txi, . . . , txm)xj dt

Malet er a vise at φ er en potensialfunksjon til F, dvs. at ∂φ∂xi

(x) = Fi(x).Deriverer vi under integraltegnet i uttrykket ovenfor, far vi

∂φ

∂xi(x) =

∫ 1

0

∂xi

(Fj(tx1, . . . , txi, . . . , txm)xj

)dt

=∫ 1

0

m∑

j=1

txj∂Fj

∂xi(tx1, . . . , txi, . . . , txm) + Fi(tx1, . . . , txi, . . . , xm)

dt

der vi har brukt bade kjerneregelen og produktregelen under integraltegnet.Benytter vi betingelsen ∂Fj

∂xi= ∂Fi

∂xj, far vi

∂φ

∂xi(x) =

∫ 1

0

m∑

j=1

txj∂Fi

∂xj(tx1, . . . , txi, . . . , txm) + Fi(tx1, . . . , txi, . . . , xm)

dt

Observer na at ved produkt- og kjerneregelen er

d

dt(tFi(tx1, . . . , txi, . . . , txm) = Fi(tx1, . . . , txi, . . . , xm)

+m∑

j=1

txj∂Fi

∂xj(tx1, . . . , txi, . . . , txm)

Ved analysens fundamentalteorem er dermed

∂φ

∂xi(x) =

∫ 1

0

d

dt(tFi(tx1, . . . , txi, . . . , txm) dt =

=[tFi(tx1, . . . , txi, . . . , txm)

]1

0

= Fi(x)

og beviset er ferdig. !

Beviset ovenfor er ganske typisk — mange funksjoner i matematikk ogandre fag er definert ved hjelp av bestemte integraler, og skal vi derivereslike funksjoner, ma vi vanligvis derivere under integraltegnet.

Page 201: Flervariabel analyse med lineær algebra

396 KAPITTEL 5. ITERASJON OG OPTIMERING

∗Operatornorm og inverterbarhet

I dette avsnittet skal vi bruke kompletthet til a utlede et nyttig kriterium forinverterbarhet av matriser. Vi skal fa bruk for dette kriteriet nar vi beviserKantorovitsjs teorem om konvergens av Newtons metode i seksjon 5.6. Detbeviset er imidlertid ment for de spesielt interesserte, sa du kan hoppe overdette avsnittet uten a miste noe i fortsettelsen.

Inspirasjonskilden til kriteriet er summeformelen for en geometrisk rekke

11− x

= 1 + x + x2 · · · + xn + · · · for |x| < 1

Vi skal vise en tilsvarende formel for m × m-matriser A, nemlig at hvis|A| < 1 (vi skal forklare hva dette betyr om et øyeblikk), sa er Im − Ainverterbar og

(Im −A)−1 = Im + A + A2 + . . . + An + . . .

En slik geometrisk rekke av matriser kalles ofte en Neumann-rekke etterden tyske matematikeren Carl Neumann (1832-1925). Formelen ovenfor ernyttig for a vise inverterbarhet av matriser som ikke avviker for mye fraidentitetsmatrisen.

La oss begynne med a forklare hva vi mener med |A|. I slutten av seksjon1.6 innførte vi normen ||A|| til en m×m-matrise

A =

a11 a12 · · · a1m

a21 a22 · · · a2m...

... · · ·...

am1 am2 · · · amm

ved

||A|| =√ ∑

1≤i,j≤m

a2ij

og beviste (setning 1.6.3) at

|Ax| ≤ ||A|||x| for alle x ∈ Rm

Deler vi med |x| i den siste ligningen, far vi

|Ax||x| ≤ ||A|| for alle x #= 0 (5.3.1)

Vi skal na innføre et annet mal pa størrelsen til en matrise som ofte er mereffektivt enn normen.

5.3. NOEN KONSEKVENSER AV KOMPLETTHET 397

Definisjon 5.3.5 Anta at A er en m×m-matrise. Operatornormen |A| tilA er definert ved

|A| = sup{|Ax||x| : x ∈ Rm,x #= 0

}

Legg merke til at ifølge formel (5.3.1) ovenfor er mengden i definisjonenbegrenset av ||A||, sa den minste øvre skranken |A| finnes. Fra formel (5.3.1)følger det ogsa at

|A| ≤ ||A||

Vi understreker igjen at normen ||A|| og operatornormen |A| er to forskjelligemater a male størrelsen til en matrise pa. Normen ||A|| er som regel lettesta beregne, mens operatornormen |A| ofte er lettere a bruke i teoretiske ar-gumenter. Pa grunn av ulikheten |A| ≤ ||A|| er det ofte mulig a erstatteoperatornormen med normen i beregningsproblemer og dermed fa enklereberegninger.

Det følger fra definisjonen av operatornorm at

|Ax| ≤ |A||x| for alle x ∈ Rm

Ved hjelp av denne ulikheten kan vi vise vare første resultater.

Lemma 5.3.6 For enhver kvadratisk matrise A er

|aij | ≤ |A|

for alle elementer aij i matrisen.

Bevis: Ganger vi A med enhetsvektoren ej , far vi

Aej =

a1j

a2j...amj

Tar vi normen pa begge sider og bruker formelen ovenfor, far vi (husk at|ej | = 1):

|A| = |A||ej | ≥ |Aej | =

∣∣∣∣∣∣∣∣∣

a1j

a2j...amj

∣∣∣∣∣∣∣∣∣

=√

a21j + a2

2j + · · · + a2mj ≥ |aij | !

Lemma 5.3.7 Hvis A,B er m×m-matriser, sa er

(i) |AB| ≤ |A||B|

Page 202: Flervariabel analyse med lineær algebra

398 KAPITTEL 5. ITERASJON OG OPTIMERING

(ii) |A + B| ≤ |A| + |B|

Bevis: (i) For enhver x #= 0 i Rm har vi

|(AB)x| = |A(Bx)| ≤ |A||Bx| ≤ |A||B||x|

der vi har brukt ulikheten |Cy| ≤ |C||y| to ganger, først med C = A ogy = Bx, og sa med C = B og y = x. Deler vi pa |x| i ulikheten ovenfor, farvi

|(AB)x||x| ≤ |A||B|

for alle x #= 0. Fra definisjonen av operatornorm far vi dermed at |AB| ≤|A||B|

(ii) For enhver x #= 0 i Rm har vi

|(A + B)x| = |Ax + Bx| ≤ |Ax| + |Bx| ≤ |A||x| + |B||x| = (|A| + |B|)|x|

Deler vi pa |x|, far vi|(A + B)x|

|x| ≤ |A| + |B|

for alle x #= 0. Fra definisjonen av operatornorm far vi dermed at |A + B| ≤|A| + |B|. !

Resultatet ovenfor gjelder selvfølgelig ogsa for flere matriser enn to; vihar

|A1A2 . . . An| ≤ |A1||A2| . . . |An|

og|A1 + A2 + · · · + An| ≤ |A1| + |A2| + · · · + |An|

Spesielt er|An| ≤ |A|n

som vi snart skal fa bruk for.Vi er na nesten ferdig med forberedelsene, alt som gjenstar er a definere

grenseverdien til en følge {An} av matriser. Det er lett; vi sier rett og slettat {An} konvergerer mot B dersom hvert element i An konvergerer mottilsvarende element i B.

Lemma 5.3.8 Dersom A er en m×m-matrise med |A| < 1, sa konvergererden geometriske rekken

Im + A + A2 + . . . + An + . . .

mot en matrise B i den forstand at B = limn→∞(Im + A + A2 + . . . + An).

5.3. NOEN KONSEKVENSER AV KOMPLETTHET 399

Bevis: La a(k)ij være det ij-te elementet til Ak (vi skriver k-en i a(k)

ij i parentesfor a understreke at det ikke er snakk om en potens). Vi ma vise at følgenav delsummer {sn}, der sn =

∑nk=0 a(k)

ij , konvergerer. Ifølge teorem 5.2.6 erdet nok a vise at denne følgen er en Cauchy-følge. Dersom N > n, har viifølge de to lemmaene ovenfor

|sN − sn| = |N∑

k=n+1

a(k)ij | ≤

N∑

k=n+1

|a(k)ij | ≤

N∑

k=n+1

|Ak| ≤N∑

k=n+1

|A|k =

=|A|n+1(1− |A|N−n)

1− |A| ≤ |A|n+1

1− |A|der vi har summert en geometrisk rekke (husk at |A| er et tall slik at det eren vanlig geometrisk rekke av tall vi summerer her). Siden |A| < 1, kan vi fauttrykket pa høyre side sa lite vi vil ved a velge n tilstrekkelig stor. Følgeliger {sn} en Cauchy-følge og ma konvergere. !

Bemerkning: Argumentet ovenfor er ganske typisk for hvordan man brukerCauchy-følger i praksis. I dette tifellet har vi ikke full kontroll over hvordanelementene sn =

∑nk=0 a(k)

ij i følgen ser ut (du kan prøve a regne dem ut, menuttrykkene blir utrolig kompliserte), men vi har en ulikhet som forteller ossnoe om størrelsen. Ved hjelp av denne ulikheten kan vi vise at følgen er enCauchy-følge, og dermed er konvergensen etablert til tross for at vi fortsattikke vet noe særlig hverken om leddene i følgen eller grenseverdien!

Vi kan na bevise hovedresultatet vart:

Teorem 5.3.9 Anta at A er en m×m-matrise og at |A| < 1. Da er Im−Ainverterbar og

(Im −A)−1 = Im + A + A2 + . . . + An + . . .

Bevis: La Bn = (Im + A + A2 + . . . + An) og B = limn→∞Bn = Im + A +A2 + . . . + An + . . .. Multipliserer vi ut og forkorter, ser vi at

(Im −A)Bn = (Im −A)((Im + A + A2 + . . . + An) = Im −An+1

Lar vi n ga mot uendelig i denne ligningen, far vi

(Im −A)B = limn→∞

(Im −A)Bn = limn→∞

(Im −An+1) = Im

der vi har brukt at siden |A| < 1, gar |A|n+1 mot null (tenk gjennom hvadu egentlig bruker i denne overgangen!). Ifølge teorem 4.5.3 er da Im − Ainverterbar med invers B. !

Vi tar med en reformulering av dette resultatet som ofte er mer naturliga bruke:

Page 203: Flervariabel analyse med lineær algebra

400 KAPITTEL 5. ITERASJON OG OPTIMERING

Korollar 5.3.10 Anta at C er en m×m-matrise slik at |Im − C| < 1. Daer C inverterbar og

C−1 = Im + (Im − C) + (Im − C)2 + . . . + (Im − C)n + . . .

Bevis: Sett A = Im − C og bruk teoremet ovenfor. !

Til slutt skal vi utvide resultatet vart slik at det ikke bare gjelder formatriser som ligger nær identitetsmatrisen, men for matriser som ligger næren hvilken som helst inverterbar matrise.

Teorem 5.3.11 (Banachs lemma) Anta at B er en inverterbar m ×m-matrise og at A er en annen m×m-matrise. Dersom

|B −A| < |B−1|−1

sa er ogsa A inverterbar og

|A−1| ≤ |B−1|1− |B−1||B −A|

Bevis: Siden B er inverterbar, kan vi skrive

A = B − (B −A) = B(Im −B−1(B −A)

)

Ifølge teorem 5.3.9 er matrisen Im −B−1(B −A) inverterbar dersom

|B−1(B −A)| < 1

Siden |B−1(B − A)| ≤ |B−1||B − A|, følger det at Im − B−1(B − A) erinverterbar dersom |B−1||B −A| < 1, dvs. dersom

|B −A| < |B−1|−1

(legg merke til at dette er betingelsen i teoremet). I sa fall er ogsa

A = B(Im −B−1(B −A)

)

inverterbar medA−1 =

(Im −B−1(B −A)

)−1B−1

(husk setning 1.7.4(ii)). Det gjenstar a estimere normen til A−1. Siden

|A−1| ≤ |(Im −B−1(B −A)

)−1 ||B−1|

og (ifølge teorem 5.3.9)

|(Im −B−1(B −A)

)−1 | = |∞∑

k=0

(B−1(B −A))k| ≤

5.3. NOEN KONSEKVENSER AV KOMPLETTHET 401

≤∞∑

k=0

(|B−1||(B −A)|)k ≤ 11− |B−1||B −A[

far vi

|A−1| ≤ |B−1|1− |B−1||B −A|

!

Oppgaver til seksjon 5.3

1. Vis at funksjonen f : R → R gitt ved f(x) = x2 er kontinuerlig, men ikkeuniformt kontinuerlig.

2. Vis at funksjonen f : (0, 1) → R gitt ved f(x) = 1x er kontinuerlig, men

ikke uniformt kontinuerlig.

3. Anta at A ⊂ Rm og at f er en funksjon f : A → R. Vis at dersom detfinnes en konstant K slik at |f(u) − f(v)| ≤ K|u − v| for alle u,v ∈ A, saer f uniformt kontinuerlig i A.

4. Anta at f : Rm → R er en kontinuerlig funksjon slik at lim|x|→∞ f(x) = 0.Vis at f er uniformt kontinuerlig pa Rm.

5. Fullfør beviset for at de partiellderiverte ∂F∂xi

i teorem 5.3.3 er kontinuer-lige.

6. La f(s) =∫ 10 esx2

dx. Vis at f ′(s) =∫ 10 x2esx2

dx.

7. Funksjonen f : R → R er definert ved f(t) =∫ 1

12

sin(tx)x dx. Vis at for t #= 0

er f ′(t) = sin t−sin( t2 )

t . Vis ogsa at f ′(0) = 12 .

8. Funksjonen h : R2 → R er kontinuerlig og har begrensede partiellderiver-te. Funksjonen f : R → R er gitt ved

f(x) =∫ g(x)

0h(x, t) dt

der g : R → R er en deriverbar funksjon. Vis at

f ′(x) =∫ g(x)

0

∂h(x, t)∂x

dt + h(x, g(x))g′(x)

9. Vis at for alle inverterbare m×m-matriser A er |A−1|−1 ≤ |A|.

Page 204: Flervariabel analyse med lineær algebra

402 KAPITTEL 5. ITERASJON OG OPTIMERING

10. Anta at A er en inverterbar m ×m-matrise og at {An} er en følge avm × m-matriser som konvergerer mot A. Vis at An er inverterbar for alletilstrekkelig store n og at {A−1

n } konvergerer mot A−1.

5.4 Iterasjon av funksjoner

Vi er na klare til a ta fatt pa det første hovedtemaet i dette kapitlet —iterasjon. Anta at vi har en funksjon F : Rm → Rm. Dersom vi velger etstartpunkt x0 ∈ Rm, kan vi bruke F til a skaffe oss en følge {xn} pa dennematen:

x1 = F(x0), x2 = F(x1), x3 = F(x2), . . . , xn+1 = F(xn), . . .

Hvert ledd i følgen fremkommer altsa ved at vi bruker F pa det foregaendeleddet. Vi sier at følgen {xn} oppstar ved iterasjon av F.

I denne seksjonen skal vi se først og fremst bli kjent med iterasjon somfenomen. Vi skal se pa en del praktiske situasjoner som kan beskrives vedhjelp av iterasjoner, og vi skal bruke MATLAB til a illustrere de forskjelligetypene oppførsel som finnes hos itererte systemer. I neste seksjon skal vi senærmere pa teorien bak den aller viktigste formen for oppførsel — konver-gens mot et fikspunkt. Før vi begynner, kan det være greit a observere atvi har vært borti iterasjoner tidligere: i seksjon 4.11 brukte vi egenvektorerog egenverdier til a studere iterasjon av lineære funksjoner. Det er langtverre a fa oversikt over oppførselen til de ikke-lineære iterasjonene vi na skalkonsentrere oss om.

Nar man tenker pa iterasjoner, er det ofte lurt a forestille seg at punktenei følgen representerer tilstander ved forskjellige tidspunkt; x0 er tilstandenved tiden 0, x1 er tilstanden ved tiden 1, osv. Funksjonen F blir da en me-kanisme som oppdaterer tilstanden fra et tidspunkt til det neste (i kapittel1 tenkte vi pa funksjoner gitt av matriser pa denne maten). La oss se pa etlite eksempel som kanskje gjør tankegangen lettere a forsta.

Eksempel 1: To dyreslag, et byttedyr og et rovdyr, lever i det sammeomradet. Dersom det ett ar er xn byttedyr og yn rovdyr i omradet, tenkerman seg at antall dyr aret etter er gitt ved

xn+1 = axn − bxnyn

yn+1 = cyn+1 + dxnyn

der a, b, c, d er positive tall. Legg merke til logikken; “kryssleddene” xnyn

representerer møter mellom byttedyr og rovdyr, og slike møter redusererveksten av byttedyr, men bidrar til vekst i rovdyrbestanden. Hvis vi innførerfunksjonen F : R2 → R2 ved

F(

xy

)=

(ax− bxycy + dxy

)

5.4. ITERASJON AV FUNKSJONER 403

og lar xn =(

xn

yn

), ser vi at systemet ovenfor kan skrives som xn+1 =

F(xn).Det er ikke lett a gjette hvordan et system av denne typen vil utvikle

seg i tiden, sa la oss bruke MATLAB som hjelpemiddel til a se pa et spe-sielt tilfelle. Vi velger a = 1.01, b = 3 · 10−5, c = 0.98, d = 10−5. Følgendem-fil regner ut utviklingen nar vi starter med m byttedyr og k rovdyr oggjennomfører N iterasjoner. Vær oppmerksom pa at det er en liten for-skyvning i nummereringen av leddene i følgen; i teoretisk arbeid far vi oftepenest uttrykk om vi begynner iterasjonen med punkt nummer 0 (altsa x0

som ovenfor), men i programmet nedenfor har vi tatt hensyn til MATLABsforkjærlighet for a la startpunktet være nummer 1 (og ikke nummer 0).

function [x,y]=byttedyr(m,k,N)x=[m]; %med disse linjene forteller viy=[k]; %MATLAB at iterasjonen starter i punktet (m,k)for n=1:N % starter løkken som utfører iterasjonene

x(n+1)=1.01*x(n)-3*10^(-5)*x(n)*y(n);y(n+1)=0.98*y(n)+10^(-5)*x(n)*y(n);

end %avslutter for-løkken

Dersom vi ønsker a se grafisk pa utviklingen nar vi starter med 1000 byttedyrog hundre rovdyr, kan vi gi kommandoene

>> [x,y]=byttedyr(1000,100,1000);>> plot(x)>> hold on>> plot(y,’r’)

Vi far dette resultatet:

Figur 1: Utviklingen av byttedyr (øverst) og rovdyr (nederst).

Page 205: Flervariabel analyse med lineær algebra

404 KAPITTEL 5. ITERASJON OG OPTIMERING

Vi ser at bestandene følger et bølgemønster med klare topper og bun-ner. Logikken er ikke sa vanskelig a forsta; til a begynne med er det relativtfa rovdyr, og byttedyrbestanden vokser. Dette fører til gode betingelser forrovdyrbestanden som ogsa begynner a vokse kraftig. Til slutt gjør rovdyrenesa kraftig innhogg at byttedyrbestanden begynner a avta. Etter hvert førerdette til darligere forhold for rovdyrene, og rovdyrbestanden begynner ogsaa avta. Dette gir etter hvert bedre forhold for byttedyrene som begynner ata seg opp igjen osv. ♣

Bemerkning: La oss smette inn en liten bemerkning om effektivitet iMATLAB-beregninger. Programmet ovenfor er kort, og det fungerer utmer-ket for de sma datamengdene vi har i dette eksemplet. Det er imidlertid liteeffektivt fordi MATLAB hele tiden ma endre dimensjonen pa vektorene xog y. Det viser seg at MATLAB arbeider mye mer effektivt dersom vi girdisse vektorene den “riktige” dimensjonen helt fra starten av. Det kan vigjøre ved a endre programmet til

function [x,y]=byttedyr(m,k,N)x=zeros(1,N);y=zeros(1,N);x(1)=m;y(1)=k;for n=1:N-1

x(n+1)=1.01*x(n)-3*10^(-5)*x(n)*y(n);y(n+1)=0.98*y(n)+10^(-5)*x(n)*y(n);

end

Kommandoen zeros(1,N) gir oss et N -tuppel (radvektor) med bare 0’er,og sørger derfor for at vektorene vare har den riktige dimensjonen helt frastarten av.

Bølgemønsteret ovenfor er bare ett av mange man kan støte pa nar manitererer en funksjon. For a bli litt kjent med de forskjellige mulighetene skalvi bruke MATLAB til a gjøre noen eksperimenter. Selv om vi i dette heftethovedsakelig er interessert i funksjoner av flere variable, skal vi gjennomføredisse eksperimentene for en funksjon f : R → R av en variabel for a faoversiktlige figurer.

Vi skal stort sett arbeide med funksjoner f : [0, 1] → [0, 1] gitt ved

f(x) = bx(1− x)

der b er en konstant mellom 0 og 4 (nar b ligger utenfor dette intervallet, vilikke f avbilde intervallet [0, 1] inn i [0, 1]). Funksjoner av denne typen serut som grafen pa figur 2 (større b-verdier gir høyere topp).

5.4. ITERASJON AV FUNKSJONER 405

Figur 2: En graf av typen f(x) = bx(1− x)

For a gjennomføre iterasjonen, lager vi et lite program iterasjon.m(uten a bry oss for mye om beregningseffektivitet):

function x=iterasjon(a,b,N)x=[a];for n=1:N

x(n+1)=b*x(n)*(1-x(n));end

Input-parametrene a, b og N angir henholdsvis startverdien, parameterenb i ligningen ovenfor og antall iterasjonen. Gir vi MATLAB kommandoen>>iterasjon(0.9,2.8,100) etterfulgt av >>plot(x), far vi figuren neden-for:

Figur 3: b = 2.8.

Vi ser at etter noen innledende fluktuasjoner, slar følgen seg til ro og nærmerseg en grenseverdi x ≈ 0.64. Dette punktet x er et likevektspunkt (ellerfikspunkt som matematikere liker a si) i den forstand at f(x) = x. La ossna endre b-verdien og prøve med b = 3.0. Vi far da utviklingen i figur 4. Idette tilfellet nærmer vi oss ogsa en slags grenseverdi, men dette er ikke etfast punkt, men en svingebevegelse mellom to faste punkter — vi nærmeross en “stabil bane med periode 2”.

Page 206: Flervariabel analyse med lineær algebra

406 KAPITTEL 5. ITERASJON OG OPTIMERING

Figur 4: b = 3.0.

Gar vi et skritt videre og velger b = 3.5, far vi utviklingen i figur 5. Dennegangen nærmer vi oss en “stabil bane med periode 4”, altsa en svingningmellom fire faste punkter.

Figur 5: b = 3.5.

Til slutt setter vi b = 3.95 og far denne figuren:

Figur 6: b = 3.95.

5.4. ITERASJON AV FUNKSJONER 407

Her er det tilsynelatende ingen orden i det hele tatt, bare usystematiskesvingninger opp og ned.

Eksemplene ovenfor viser noen av de fenomenene vi kan støte pa nar viitererer en funksjon. Vær oppmerksom pa at oppførselen ogsa kan avhengeav startverdien x0 (altsa parameteren a i programmet): I figur 6 har vi iterertfunksjonen g(x) = 2 arctanx med forskjellige startverdier. Vi ser at dersomvi har en positiv startverdi, konvergerer følgen mot et positivt fikspunkty ≈ 2.3311, men dersom vi starter i et negativt punkt, konvergerer denmot et negativt fikspunkt z ≈ −2.3311. Det finnes ogsa et tredje fikspunktu = 0, men det er frastøtende i den forstand at følgen bare konvergerermot det dersom x0 (og dermed alle xn) er lik 0. Pa tilsvarende mate kanlengden til en periodisk bane avhenge av startpunktet; ett startpunkt kanf.eks. lede til baner med periode 3, mens et annet startpunkt leder til banermed periode 14 (for samme b-verdi).

Figur 6: Iterasjon av g(x) = 2 arctanx for forskjellige startverdier.

Det viser seg at itererte følger kan ha enda mer komplisert oppførsel enndet vi har sett eksempler pa her, spesielt i høyeredimensjonale systemer dervi itererer en funksjon F : Rm → Rm for m > 1. Dette far vi komme tilbaketil en annen gang; hensikten med denne seksjonen er bare a gi deg en vissfølelse for de fenomenene som kan oppsta ved iterasjon.

Oppgaver til seksjon 5.4

1. En følge {xn, yn} i R2 er gitt ved x1 = y1 = 0 og

xn+1 = 0.6xn − 0.6yn + 0.2yn+1 = 0.6xn + 0.6yn + 1

Skriv et MATLAB-program som beregner elementer i følgen, og tegn dem inn i enfigur. Vis at funksjonen

F(x, y) =(

0.6x− 0.6y + 0, 20.6x + 0.6y + 1

)

Page 207: Flervariabel analyse med lineær algebra

408 KAPITTEL 5. ITERASJON OG OPTIMERING

har et fikspunkt.

2. To dyreslag lever i det samme omradet. Dersom det er hhv. xn og yn dyr avhvert slag i omradet ett ar, regner man at tallene aret etter er gitt ved

xn+1 = 0.9xn + 0.01yn − 10yn+1 = −1.01xn + yn + 300

Skriv et MATLAB-program som beregner hvordan bestanden utvikler seg, og plottresultatet nar x1 = 20, y1 = 2000. Finn et likevektspunkt for bestandene.

3. I denne oppgaven skal vi se pa befolkningsutviklingen i to land. Dersom innbyg-gertallet (malt i millioner) i de to landene er hhv. xn og yn ett tiar, regner man atde tilsvarende tallene ti ar etter er gitt ved

xn+1 = 1.1xn + 0.001yn − 0.5yn+1 = 0.95yn + 0.002xn + 0.2

Skriv et MATLAB-program som beregner hvordan innbyggertallene utvikler seg,og plott resultatet nar x1 = 50, y1 = 8.

4. To bensinstasjoner X og Y konkurrerer ved a tilpasse seg hverandres priser.Dersom prisene en uke er hhv. xn og yn, vil stasjon X uken etter sette sin pris til1.01 · xn+yn

2 , mens stasjon Y vil velge den prisen som er lavest av xn og 1.1yn. Laget MATLAB-program som viser hvordan prisene vil utvikle seg. Kjør programmetbade med x1 = 8, y1 = 12 og med x1 = 12, y1 = 8. Sammenlign prisutviklingene.

5. To insektstyper konkurrerer om det samme omradet. Anta at xn og yn er antallinsekter (malt i millioner) i omradet i ar n. Vi regner at bestanden i ar n + 1 da ergitt ved

xn+1 = 2.2xn(1− xn) + 0.01xnyn

yn+1 = 3.1yn(1− yv)− 0.02xnyn

Skriv et MATLAB-program som beregner hvordan bestandene utvikler seg, og plottresultatet nar x1 = 0.5, y1 = 0.5 og nar x1 = 0.1, y1 = 0.8. Eksperimenter ogsamed andre startverdier i intervallet (0, 1).

6. To firmaer konkurrerer i det samme markedet. Dersom prisene pa produktetderes (malt i tusen kroner) er hhv. p og q, regner firmaene med a selge hhv.

E1(p, q) = 1000e−pq−α(p+q)

ogE2(p, q) = 1000e−

qp−β(p+q)

eksemplarer, der α og β er konstanter.

a) Anta at prisen q ligger fast. Vis at firma 1 da far størst salgsinntekter ved aselge sitt produkt for p∗ = q

1+αq . Vis tilsvarende at hvis p ligger fast, sa farfirma 2 størst salgsinntekter ved a selge sitt produkt for q∗ = p

1+βp .

5.4. ITERASJON AV FUNKSJONER 409

b) Det første aret velger firmaene prisene p1 og q1. De bestemmer seg for atprisen aret etter skal være hhv. p2 = 1.1p∗1 = 1.1 q1

1+αq1og q2 = 1.1q∗1 =

1.1 p11+βp1

. Denne politikken holder de fast ved i arene som kommer. Skrivet MATLAB-program som beregner prisutviklingen for de to produktene.Parametrene α og β skal innga blant input-variablene.

c) Kjør programmet med α = β = 0.05. Bruk startverdiene (x1, y1) = (3, 4),(x1, y1) = (4, 3), (x1, y1) = (1, 1.3), (x1, y1) = (1.3, 1) og sammenlign resul-tatene.

d) Gjenta punkt c) med α = 0.05,β = 0.02.

7. La f : R → R være funksjonen f(x) = x2 + x− 2. Vis at x =√

2 er et fikspunktfor f . Skriv et MATLAB-program som utfører iterasjonen xn+1 = f(xn). Startprogrammet med x1 =

√2. Hva skjer (du bør nok utføre ca. 30 iterasjoner før du

ser noe)? Forklar!

8. Skriv et MATLAB-program for iterasjon av funksjoner f : [0,π] → R gitt vedf(x) = b sinx, der b er en konstant. Eksperimenter med forskjellige startverdier ogforskjellige b-verdier slik vi gjorde med funksjonen f(x) = bx(1− x) i teksten.

9. I denne oppgaven er A =

1.3 −0.2

0.1 1

.

a) Finn egenverdiene og egenvektorene til A.

b) Skriv vektorene(

20

)og

(43

)som lineærkombinasjoner av basisvektorene

du fant i a).

c) Funksjonen f : R → R er gitt ved f(x) = λx+k der λ og k er konstanter, λ #=1. Vis at nar vi itererer f med startpunkt x0, sa er xn = λn

(x0 − k

1−λ

)+ k

1−λ

d) Anta at r0 =(

20

)og at følgen {rn} fremkommer ved iterasjonen rn+1 =

Arn + b der b =(

43

). Finn rn.

10. I denne oppgaven skal vi se pa en grafisk metode for a studere iterasjon av enkontinuerlig funksjon f av en variabel. I figur 1 har vi tegnet opp funksjonsgrafenog linjen y = x i samme koordinatsystem.

!

"

++

++

++

++

++

+y = x

y = f(x)

Figur 1

Page 208: Flervariabel analyse med lineær algebra

410 KAPITTEL 5. ITERASJON OG OPTIMERING

a) Forklar at fikspunktene til f er det samme som skjæringspunktene mellomlinjen y = x og grafen til f .

!

"

++

++

++

++

++

+y = x"

!

$#

"!

x0 x1x2 x3

Figur 2

b) Figur 2 viser hvordan vi grafisk kan finne punktene x1 = f(x0), x2 = f(x1), x3 =f(x2) osv. Forklar hvordan og hvorfor metoden virker.

c) Figur 3 viser en bane med periode 2. Lag en tilsvarende figur som viser enbane med periode 3 (du kan godt bruke en annen funksjonsgraf y = f(x)).

!

"

++

++

++

++

++

+y = x

"!

$#

x0 x1

Figur 3

d) I resten av oppgaven skal vi se pa funksjoner f : [0, 1] → [0, 1] gitt vedf(x) = bx(1−x), der 0 ≤ b ≤ 4. Vis at dersom b > 1, sa har f to fikspunkter0 og 1− 1

b .

e) Velg b = 72 . Vis at banen som starter i x0 = 3

7 er periodisk med periode 2.

f) Bruk MATLAB eller en lommeregner til a tegne grafen til f◦2. Vis at grafenskjærer linjen y = x i punktene 0, 3

7 , 57 og 6

7 . Forklar.

g) (arbeidskrevende) Vis at dersom 3 < b ≤ 4, sa har funksjonen f(x) = bx(1−x) baner med periode to som starter i punktene b+1±

√(b−1)2−4

2b .

5.5 Konvergens mot et fikspunkt

I forrige seksjon sa vi pa noen av de typene oppførsel vi kan fa nar vi iterereren funksjon F. En av de enkleste og viktigste er at følgen konvergerer moten likevektstilstand x, det vil si en tilstand slik at F(x) = x (se figur 3 og

5.5. KONVERGENS MOT ET FIKSPUNKT 411

6 i forrige seksjon). Matematisk kaller vi en slik tilstand for et fikspunkt forF:

Definisjon 5.5.1 Anta at A er en delmengde av Rm og at F er en funksjonfra A til Rm. Vi sier at x ∈ A er et fikspunkt for F dersom F(x) = x.

Det er en del naturlige spørsmal knyttet til iterasjon og fikspunkter: Narhar en funksjon F et fikspunkt? Dersom F har et fikspunkt x, nar vil enfølge dannet ved iterasjon av F konvergere mot x? Dersom en funksjon harflere fikspunkter, hvilket av disse vil en iterert følge konvergere mot? Hvor-dan vil dette avhenge av hvilket punkt x0 vi startet iterasjonen i, altsa avbegynnelsestilstanden til systemet? Dette er vanskelige spørsmal som vi ikkekan gi utfyllende svar pa her, men vi skal i hvert fall bevise et resultat somer nyttig i mange sammenhenger. Dette resultatet gjelder for kontraksjonersom er en spesielt enkel type funksjoner a ha med a gjøre. I seksjon 5.7 skalvi se hvordan vi kan bruke fikspunktiterasjon til a fa et grep pa omvendtefunksjoner og implisitt gitte funksjoner.

Definisjon 5.5.2 Anta at A er en ikke-tom delmengde av Rm. En funksjonF : A → A kalles en kontraksjon av mengden A dersom det finnes et positivttall C < 1 slik at

|F(x)− F(y)| ≤ C|x− y|

for alle x,y ∈ A. Vi kaller C en kontraksjonsfaktor for F .

Siden C er mindre enn 1, ser vi at kontraksjoner reduserer avstanden mellompunkter — avstanden mellom F(x) og F(y) er mindre enn avstanden mellomx og y. Legg ogsa merke til at vi krever at alle verdiene til F skal ligge iA; funksjonen F skal altsa avbilde mengden A inn i A selv. Nar man skalvise at en funksjon F er en kontraksjon av en mengde A, er dette ofte detvanskeligste punktet a sjekke.

Vi trenger litt notasjon før vi gar videre. Dersom følgen {xn} oppstarnar vi itererer F med x0 som startpunkt, ser vi at

x1 = F(x0), x2 = F(x1) = F(F(x0)), x3 = F(x2) = F(F(F(x0))), . . .

Generelt er xn = F(F(. . . (F(x0)) . . .)) der vi har n F’er etter hverandre. Fora fa en mer oversiktelig notasjon, skriver vi xn = F◦n(x0); med andre ord erF◦n den funksjonen vi far nar vi setter F sammen med seg selv n ganger.

Lemma 5.5.3 Anta at F : A → A er en kontraksjon med kontraksjonsfak-tor C. For alle x,y ∈ A og alle n ∈ N er da

|F◦n(x)− F◦n(y)| ≤ Cn|x− y|

F◦n er altsa en kontraksjon med kontraksjonsfaktor Cn.

Page 209: Flervariabel analyse med lineær algebra

412 KAPITTEL 5. ITERASJON OG OPTIMERING

Bevis: For n = 1 er dette bare definisjonen av kontraksjon. For n = 2 harvi:

|F◦2(x)− F◦2(y)| = |F(F(x))− F(F(y))| ≤ C|F(x)− F(y)| ≤ C2|x− y|

Ved a fortsette pa sammen mate, far vi resultatet for alle n ∈ N (du kanføre et formelt induksjonsbevis hvis du vil). !

Legg spesielt merke til at dersom xk og xk+1 er to ledd som følger etterhverandre i følgen, sa er

|xk − xk+1| = |F◦k(x0)− F◦k(x1)| ≤ Ck|x0 − x1| (5.5.1)

Vi er na klare til a vise hovedresultatet i denne seksjonen. Det har navnetter den polske matematikeren Stefan Banach (1892-1945).

Teorem 5.5.4 (Banachs fikspunktsteorem) Anta at A er en ikke-tom,lukket delmengde av Rm og at F : A → A er en kontraksjon av A medkontraksjonsfaktor C. Da har F nøyaktig ett fikspunkt x i A. Uansett hvilketpunkt x0 i A vi starter iterasjonen i, vil følgen x0,x1,x2, . . . ,xn, . . . derxn = F◦n(x0) konvergere mot x, og for alle n ∈ N er

|xn − x| ≤ Cn

1− C|x0 − x1|

Bevis: La oss først vise at F kan ha høyst ett fikspunkt. Dersom bade x ogy er fikspunkter, har vi nemlig

|x− y| = |F(x)− F(y)| ≤ C|x− y|

Det betyr at |x − y| ≤ C|x − y|, og siden C < 1 er det bare mulig dersom|x− y| = 0, dvs. dersom x = y.

Neste skritt er a vise at følgen {xn} er en Cauchy-følge uansett hvilketpunkt x0 ∈ A vi begynner iterasjonen i. Dersom vi har to ledd i følgen xn

og xk med n < k, har vi

|xn−xk| = |(xn−xn+1)+(xn+1−xn+2)+. . .+(xk−2−xk−1)+(xk−1−xk)| ≤

≤ |xn − xn+1| + |xn+1 − xn+2| + . . . + |xk−2 − xk−1| + |xk−1 − xk| ≤

≤ Cn|x0 − x1| + Cn+1|x0 − x1| + . . . + Ck−2|x0 − x1| + Ck−1|x0 − x1| ≤

≤(Cn + Cn+1 + . . . + Ck−2 + Ck−1 + . . .

)|x0 − x1| =

Cn

1− C|x0 − x1|

der vi først har brukt trekantulikheten, sa ulikheten i formel (5.4.1) ovenforog til slutt summeformelen for en geometrisk rekke. Siden C < 1, kan vifa uttrykket Cn

1−C |x0 − x1| sa lite vi matte ønske oss ved a velge n tilstrek-kelig stor. Dette betyr at {xn} er en Cauchy-følge, og ifølge teorem 5.2.6

5.5. KONVERGENS MOT ET FIKSPUNKT 413

konvergerer den mot en grense x (siden A er lukket, ligger x i A — husksetning 5.1.6). Det er lett a vise at grensepunktet x er et fikspunkt for F;siden enhver kontraksjon er kontinuerlig, har vi nemlig ifølge setning 5.1.7:

x = limn→∞

xn+1 = limn→∞

F(xn) = F( limn→∞

xn) = F(x)

Siden vi allerede vet at F ikke kan ha mer enn ett fikspunkt, betyr dette atfølgen {xn} konvegerer mot det samme punktet x uansett hvilket startpunktx0 man bruker.

Det gjenstar a vise den siste formelen i teoremet. Ifølge utledningenovenfor, er

|xn − xk| ≤Cn

1− C|x0 − x1|

nar k > n. Lar vi k →∞, far vi

|xn − x| ≤ Cn

1− C|x0 − x1|

og beviset er fullført (tenk gjennom det siste resonnementet!) !

Legg merke til at beviset ovenfor illustrerer filosofien var fra seksjon 5.2 —det er mye lettere a vise at en følge konvergerer ved a sjekke at den er enCauchy-følge enn ved a konstruere grenseelementet!

Bemerkning: Situasjonen i teoremet ovenfor er den best tenkelige — funk-sjonen F har nøyaktig ett fikspunkt x, og itererer vi F, vil følgen konvergeremot x uansett hvilket punkt x0 vi starter i. Det er ett poeng til som erviktig, og det er at vi har kontroll pa hvor fort følgen {xn} konvergerer motx. I praksis er det nemlig sjelden vi kan finne et fikspunkt helt nøyaktig, altvi kan gjøre er a iterere funksjonen sa mange ganger at xn kommer sa nærfikspunktet som vi trenger. Ulikheten

|xn − x| ≤ Cn

1− C|x0 − x1|

gir oss kontroll over dette — ønsker vi at xn skal gi oss fikspunktet med ennøyaktighet bedre enn ε, ma vi velge n sa stor at

Cn

1− C|x0 − x1| < ε

Det betyr at med en gang vi har regnet ut x1, har vi den informasjonen vitrenger for a beregne konvergeringsraten.

Vi skal na se pa et eksempel som viser at vi ikke kan fjerne betingelsenom at F er en kontraksjon fra teoremet ovenfor.

Page 210: Flervariabel analyse med lineær algebra

414 KAPITTEL 5. ITERASJON OG OPTIMERING

Eksempel 1: La A = {x ∈ R2 : 1 ≤ |x| ≤ 2} være omradet mellom tosirkler i planet, og la F være avbildningen som dreier hele omradet A envinkel θ < 2π om origo. Da er |x − y| = |F(x) − F(y)| (siden alle punkterdreies samme vinkel), men det finnes ingen fikspunkter siden alle punkter errotert i forhold til utgangspunktet.

Legg merke til at dersom vi erstatter A med omradet A′ = {x ∈ R2 :|x| ≤ 2}, der “hullet” i midten er fjernet, sa har F et fikspunkt, nemlig 0.Dette fikspunktet kan vi imidlertid ikke na frem til ved iterasjon; enhveriterasjon av F sender punkter i sirkelbaner rundt origo. ♣

For a bruke Banachs fikspunktteorem trenger vi en metode til a vise atF er en kontraksjon. Vi skal arbeide oss frem mot et kriterium som ofte ernyttig, og minner først om en hjelpesetning vi allerede har bevist (se setning3.2.3):

Setning 5.5.5 (Middelverdisetning for funksjoner av flere variable)Anta at f : A → R er en funksjon av m variable, og at f er deriverbar i etomrade som inneholder linjestykket mellom punktene a,b ∈ Rm. Da finnesdet et punkt c pa linjestykket fra a til b slik at

f(b)− f(a) = ∇f(c) · (b− a)

Den neste setningen bringer oss enda et skritt nærmere resultatet vart:

Setning 5.5.6 Anta at F : A → Rm er en funksjon av m variable, og atF er deriverbar i et omrade som inneholder linjestykket mellom punktenea,b ∈ Rm. Da finnes det punkter c1, c2, . . . , cm pa linjestykket fra a til b,slik at

|F(b)− F(a)| ≤ |b− a|√∇F1(c1)2 + · · · +∇Fm(cm)2

der F1, F2, . . . , Fm er komponentene til F.

Bevis: Bruker vi forrige setning pa den i-te komponenten Fi, far vi et punktci pa linjestykket fra a til b slik at

Fi(b)− Fi(a) = ∇Fi(ci) · (b− a)

Ved Schwarz’ ulikhet er da

|Fi(b)− Fi(a)| ≤ |∇Fi(ci)||b− a|

Dermed er

|F(b)− F(a)| =√

(F1(b)− F1(a))2 + · · · + (Fm(b)− Fm(a))2 ≤

≤√|∇F1(c1)|2|b− a]2 + · · · + |∇Fm(cm)|2|b− a]2

5.5. KONVERGENS MOT ET FIKSPUNKT 415

= |b− a|√|∇F1(c1)|2 + · · · + |∇Fm(cm)|2

og setningen er bevist. !

Denne setningen forteller oss at dersom det finnes et tall C < 1 slik at√|∇F1(c1)|2 + · · · + |∇Fm(cm)|2 ≤ C

for alle punkter c1, c2, . . . , cm vi kan komme borti, sa er F en kontraksjon.For a formulere dette som en setning pa en grei mate, trenger vi begrepetkonveks mengde. En delmengde A av Rm kalles konveks dersom det er slik athver gang a og b er med i A, sa er hele linjestykket mellom a og b ogsa medi A. Intuitivt er en mengde konveks dersom randen “buler utover”. Figurennedenfor viser en konveks mengde A og en ikke-konveks mengde B. Leggmerke til at det er lett a finne to punkter i B slik at ikke hele linjestykketsom forbinder dem, ligger i B.

a)

Figur 1: Konveks mengde A og ikke-konveks mengde B

A

b)

B

Setning 5.5.7 Anta at A er en ikke-tom, lukket, konveks delmengde av Rm

og at F : A → A er en avbildning som er deriverbar i A. Anta at det finneset tall C < 1 slik at

√|∇F1(c1)|2 + · · · + |∇Fm(cm)|2 ≤ C

for alle punkter c1, c2, . . . , cm ∈ A. Da er F en kontraksjon og har et entydigfikspunkt. Vi kan iterere oss frem til fikspunktet ved a starte i et hvilket somhelst punkt x0 i A.

Bevis: Dette er bare a kombinere setning 5.5.6 med teorem 5.5.4. Legg mer-ke til at siden mengden A er konveks, vil ethvert punkt ci pa linjestykketmellom to punkter a,b ∈ A selv ligge i A. !

Bemerkning: C-verdien vi far fra setningen ovenfor er ofte langt unna denbeste (dvs. den minste) kontraksjonsfaktoren til F, og det kan godt hendeat F er en kontraksjon selv om

√|∇F1(c1)|2 + · · · + |∇Fm(cm)|2 > 1

La oss se pa et (ganske darlig!) eksempel:

Page 211: Flervariabel analyse med lineær algebra

416 KAPITTEL 5. ITERASJON OG OPTIMERING

Eksempel 2: Definer en avbildning F : R3 → R3 ved

F (x, y, z) =

x8 −

y2 + z

4 + 1x4 + z

4 + 2x2 + y

2 − 1

Her er Jacobi-matrisen

F(x, y, z) =

18 −1

214

14 0 1

412

12 0

Gradienten til F1 er den første linjen i matrisen, altsa

∇F1(x, y, z) =18

i− 12

j +14

k

Tilsvarende er gradientene til F2 og F3 gitt av de neste linjene i matrisen

∇F2(x, y, z) =14

i +14

k

og

∇F3(x, y, z) =12

i +12

j

Uansett hvilke punkter vi evaluerer gradientene i, har vi dermed

|∇F1|2 + |∇F2|2 + |∇F3|2 =

=(

18

)2

+(−1

2

)2

+(

14

)2

+(

14

)2

+ 02 +(

14

)2

+(

12

)2

+(

12

)2

+ 02 =

=6164

Dermed er

√|∇F1|2 + |∇F2|2 + |∇F3|2 =

√6164

=√

618

< 1

og F er altsa en kontraksjon og har et entydig fikspunkt.For a finne (en tilnærmet verdi for) fikspunktet, starter vi en itera-

sjon. Følgende MATLAB-program fikspunkt.m starter med punktet x0 =(a, b, c) og gjennomfører N iterasjoner. Vær oppmerksom pa den vanligeforskyvningen i nummereringen av punktene; i MATLAB-programmet larvi startpunktet være (x1, y1, z1). Husk ogsa at vi kan gjøre programmet mereffektivt ved a gi x, y og z riktig lengde fra starten av (se bemerkningenetter eksempel 1 i seksjon 5.4).

5.5. KONVERGENS MOT ET FIKSPUNKT 417

function [x,y,z]=fikspunkt(a,b,c,N)x=[a]; %med disse linjene forteller viy=[b]; %MATLAB at iterasjonen starter iz=[c]; %punktet (a,b,c)for n=1:N % starter for-løkken som utfører iterasjonene

x(n+1)=x(n)/8-y(n)/2+z(n)/4+1;y(n+1)=x(n)/4+z(n)/4+2;z(n+1)=x(n)/2+y(n)-1;

end %avslutter for-løkken

For a regne ut de første 10 verdiene med startpunkt x0 = (0, 0, 0), gir vina kommandoen

>> fikspunkt(0,0,0,9)

Output er:

x0 = x1 = x2 = x3 = x4 = x5 = x6 = x7 = x8 = x9 =0.0000 1.0000 -0.1250 0.3594 0.1074 0.2322 0.1696 0.2009 0.1853 0.1931

y0 = y1 = y2 = y3 = y4 = y5 = y6 = y7 = y8 = y9 =0.000 2.0000 2.0000 2.3438 2.3242 2.4077 2.4025 2.4234 2.4221 2.4273z0 = z1 = z2 = z3 = z4 = z5 = z6 = z7 = z8 = z9 =

0.0000 -1.0000 1.5000 0.9375 1.5234 1.3779 1.5238 1.4874 1.5238 1.5147

Vi ser at følgen xn ser ut til a stabilisere seg rundt (0.2, 2.4, 1.5), men at detfortsatt er ganske store fluktuasjoner. Vi gir derfor kommandoen

>> fikspunkt(0,0,0,19)

for ogsa a fa de neste ti verdiene. De er:

x10 = x11 = x12 = x13 = x14 = x15 = x16 = x17 = x18 = x19 =0.1892 0.1911 0.1902 0.1906 0.1904 0.1905 0.1905 0.1905 0.1905 0.1905y10 = y11 = y12 = y13 = y14 = y15 = y16 = y17 = y18 = y19 =2.4269 2.4282 2.4282 2.4285 2.4285 2.4286 2.4285 2.4286 2.4286 2.4286z10 = z11 = z12 = z13 = z14 = z15 = z16 = z17 = z18 = z19 =1.5238 1.5215 1.5238 1.5232 1.5238 1.5237 1.5238 1.5238 1.5238 1.5238

Na ser vi en tydelig konvergens mot et fikspunkt med (tilnærmet) verdi(0.1905, 2.4286, 1.5239).

Programmet fikspunkt.m er ganske primitivt; vi ma bestemme pa forhandhvor mange iterasjoner vi ønsker. I praksis bruker man ofte mer avanserteprogrammer (gjerne med en while-løkke) som avbryter iterasjonen nar manhar fatt en viss nøyaktighet.

Vi innledet med a si at dette er et ganske darlig eksempel. Grunnener at vi kunne ha funnet fikspunktet direkte ved a løse ligningssystemetF(x, y, z) = (x, y, z) ved regning. Dette er et lineært ligningssystem som erlett a løse med metodene i forrige kapittel. Metoden ovenfor har imidlertidogsa sine fordeler; vi har vist at fikspunktet er tiltrekkende (dvs. at iterasjo-ner av F alltid konvergerer). Det viser seg ogsa at nar man far store lineæreligningssystemer med tusenvis av ligninger og ukjente, sa er det ofte raskerea løse dem ved en eller annen form for iterasjon enn ved radoperasjoner. ♣

Page 212: Flervariabel analyse med lineær algebra

418 KAPITTEL 5. ITERASJON OG OPTIMERING

Et problem med teorien i denne seksjonen er at det ofte kan være vans-kelig a vise at den funksjonen F som vi arbeider med, virkelig er en kontrak-sjon. Ofte er ikke F en kontraksjon i hele Rm, men bare i mindre omraderi nærheten av fikspunktet, og det kan ofte være vanskelig a finne et sliktomrade A (for at det skal fungere, ma F avbilde A inn i A). I slike tilfellerkan det ofte være lurt a prøve seg med en fikspunktiterasjon uten a væresikker pa at F er en kontraksjon. I praktisk arbeid er ofte et fikspunkt funnetpa denne maten mer enn godt nok, og i teoretisk arbeid kan informasjon omhvor fikspunktet (sannsynligvis) ligger, gjøre det lettere a lokalisere omradetder F er en kontraksjon.

Det kan være greit a vite at det finnes mer generelle fikspunktteoremerenn Banachs. Brouwers fikspunktteorem sier for eksempel at dersom A eren ikke-tom, lukket, begrenset, konveks delmengde av Rm, sa vil enhverkontinuerlig funksjon F : A → A ha ett eller flere fikspunkt. Det er imidlertidingen garanti for at disse fikspunktene kan finnes ved iterasjon.

Oppgaver til seksjon 5.5

1. (Fra Oblig 2 i MAT1110, V-07) I denne oppgaven skal vi se pa iterasjon avfunksjonen F : R2 → R2 gitt ved

F(x, y) =(

12

sin(x + y),12

cos(x− y))

a) Lag et MATLAB-program for a beregne følger un+1 = F(un).

b) Kjør programmet ditt med startpunkt u1 = (x1, y1) = (1,−1) og et passendeantall iterasjoner. La MATLAB tegne følgen {un}.

c) Kjør programmet 6 ganger til. I hvert tilfelle lar du MATLAB velge et til-feldig startpunkt (x1, y1) med −2.5 ≤ x1, y1 ≤ 2.5 (kommandoen >> randproduserer et tilfeldig tall mellom 0 og 1). Tegn opp sekvensene i hvert sittsubplot, og sett aksene slik at resultatene er lette a sammenligne.

2. La F : Rn → Rn være en kontinuerlig funksjon. Vis at dersom det finnes en følge{un} der un+1 = F(un) som konvergerer mot u, sa er u et fikspunkt for F.

3. Vis at enhver kontinuerlig funksjon f : [0, 1] → [0, 1] har et fikspunkt.

4. Du star midt i et landskap og holder et kart over det samme omradet vannrettforan deg. Forklar at det finnes nøyaktig ett punkt pa kartet som ligger loddrettover det tilsvarende punktet i landskapet.

5. I denne oppgaven skal vi vise følgende generalisering av Banachs fikspunktteorem:

Teorem Anta at A er en ikke-tom, lukket delmengde av Rm, og at F : A → A erfunksjon slik at F◦k er en kontraksjon for en k ∈ N. Da har F nøyaktig ett fikspunktx i A.

Vi skal gjennomføre beviset i to skritt:

5.5. KONVERGENS MOT ET FIKSPUNKT 419

a) Vis at ethvert fikspunkt for F ogsa er et fikspunkt for F◦k. Forklar at dettemedfører at F kan ha høyst ett fikspunkt.

b) Ifølge Banachs fikspunktteorem har F◦k et fikspunkt x. Vis at F(x) ogsa eret fikspunkt for F◦k. Fullfør beviset for teoremet.

c) La F : R2 → R2 være gitt ved F(x, y) = (2y + 1, x3 + 1). Vis at F ikke er en

kontraksjon, men at F◦2 er det. Finn fikspunktet til F.

6. (Fra Oblig 1 i MAT1110, V-07) I denne oppgaven skal vi eksperimentere meden annen type “fikspunkter”. Disse “fikspunktene” er mengder som ikke forandrerseg nar vi anvender en sammensetning av funksjoner pa dem.

Vi starter med funksjonene T1 : R2 → R2, T2 : R2 → R2 og T3 : R2 → R2 gittved T1(x, y) =

(x2 , y

2

), T2(x, y) =

(x2 + 1

2 , y2

)og T3(x, y) =

(x2 + 1

4 , y2 +

√3

4

)

a) La S være den likesidede trekanten med hjørner i punktene (0, 0), (1, 0) og( 12 ,√

32 ). Beskriv bildene T1(S), T2(S) og T3(S) av S under henholdsvis T1,

T2 og T3 (husk at generelt er T(S) = {T(x, y) | (x, y) ∈ S}).

b) La S1 være det samlede bildet av S under T1, T2 og T3 (vi har altsa S1 =T1(S)∪T2(S)∪T3(S)). Beskriv bildet S2 av S1 under T1, T2 og T3 (vi haraltsa S2 = T1(S1) ∪ T2(S1) ∪ T3(S1)). Lag en skisse av S1 og S2. Hvordantror du S3 og S4 blir seende ut? Hvordan gar det nar du tegner inn Sn foralle n? Mengden A vi da far kalles Sierpinski-trekanten, og den er et slagsfikspunkt i den forstand at den ikke endrer seg nar vi bruker T1, T2 og T3

pa den (dvs. at A = T1(A) ∪T2(A) ∪T3(A)).

Vi skal na se pa følgende prosedyre: Start med et punkt (x1, y1) i planet. Velgtilfeldig en av funksjonen T1,T2,T3, og la (x2, y2) være det punktet vi far nar vibruker denne funksjonen pa (x1, y1). Velg pa ny en av funksjonen T1,T2,T3 pa entilfeldig mate, og la (x3, y3) være det punktet vi far nar vi bruker denne funksjonenpa (x2, y2). Fortsetter vi pa denne maten, far vi en følge av punkter {(xn, yn)} iplanet. Det viser seg at denne følgen alltid hoper seg opp pa den samme mengden.Vi skal undersøke dette fenomenet nærmere.

c) Forklar at følgende MATLAB-program er en implementering av prosedyrenovenfor.

function [x,y]=Sierpinski(a,b,N)x(1)=a;y(1)=b;for n=1:Nz=rand;if z<=1/3x(n+1)=x(n)/2;y(n+1)=y(n)/2;elseif z<=2/3x(n+1)=x(n)/2+1/2;y(n+1)=y(n)/2;elsex(n+1)=x(n)/2+1/4;y(n+1)=y(n)/2+sqrt(3)/4;

Page 213: Flervariabel analyse med lineær algebra

420 KAPITTEL 5. ITERASJON OG OPTIMERING

endendplot(x,y,’.’)

Du ma sannsynligvis bruke MATLABs hjelpefunksjon for a finne ut av noenav kommandoene.

d) Legg programmet ovenfor pa en m-fil og kjør det med forskjellige input-verdier a, b og N . Beskriv det du ser. Velg noen av kjøringene, og presenterdem i samme figur ved hjelp av kommandoen subplot. (Hint: Du bør velge Nopp til størrelsesorden 10 000 for a fa et godt bilde, men det er lærerikt ogsaa se pa mindre verdier av N . Det kan ogsa være lurt a bruke kommandoenaxis(’equal’) før du lagrer bildene.)

e) Undersøk ogsa hvordan programmet nedenfor fungerer (rett opp figurene medaxis(’equal’) ).

function [x,y]=blomst(r,d,s,N)x(1)=1;y(1)=0;for n=1:Nz=rand;if z<=0.95x(n+1)=r*(x(n)*cos(pi/d)-y(n)*sin(pi/d));y(n+1)=r*(x(n)*sin(pi/d)+y(n)*cos(pi/d));elseif z>.95x(n+1)=s*x(n)+1;y(n+1)=s*y(n);endendplot(x,y,’.’)

Kjør programmet først med r = 0.97, d = 7, s = 16 , N = 10 000, men

eksperimenter ogsa med andre verdier. Bruk de to funksjonene F1(x, y) =r(x cos π

d − y sin πd , x sin π

d + y cos πd ) og F2(x, y) = (sx + 1, sy) til a forklare

hvordan bildene fremkommer.(Hint: I en “typisk” kjøring vil man velge F1

mange ganger før F2 dukker opp første gang. Deretter kommer sannsynligvisen ny sekvens av F1’ere osv. Prøv a knytte dette bildet til de geometrisketolkningene av F1 og F2.)

5.6 Newtons metode i flere variable

I forrige kapittel sa vi hvordan vi kan løse lineære ligningssystemer med mligninger og m ukjente:

a11x1 + a12x2 + · · · + a1mxm = b1

a21x1 + a22x2 + · · · + a2mxm = b2

......

...am1x1 + am2x2 + · · · + ammxm = bm

5.6. NEWTONS METODE I FLERE VARIABLE 421

Lineære ligningssystemer er viktige i mange sammenhenger, men de flesteligningssystemene som dukker opp i praksis, er ikke av denne typen, meninneholder mer kompliserte funksjonsuttrykk. Vi kan f.eks. ha tre mer kom-pliserte ligninger slik som her:

3x2y + 2ez+z = 02z2 cos(xy2 + z) + ex = 0

x3(y2 + z) = 0

Slike ligningssystemer er som regel umulig a løse eksakt, og man ma der-for bruke datamaskin for a finne tilnærmede løsninger. Vi skal se hvordanNewtons metode, som du kjenner for funksjoner av en variabel (se Kalkulus,seksjon 7.3), kan utvides til ligningssystemer.

Vi observerer først at det a løse et ligningssystem med m ligninger og mukjente, er det samme som a finne nullpunktene til en funksjon F : Rm →Rm. Lar vi f.eks. F : R3 → R3 være funksjonen

F(x, y, z) =

3x2y + 2ez+z

2z2 cos(xy2 + z) + ex

x3(y2 + z)

ser vi at løsningene til ligningene ovenfor er de samme som nullpunktenetil funksjonen F. Vi er altsa interessert i a finne nullpunkter til funksjonerF : Rm → Rm.

La oss anta at vi vet eller mistenker at funksjonen har et nullpunkt inærheten av et punkt x0 ∈ Rm. Vi skal forsøke a finne en bedre tilnærmingtil nullpunktet enn x0. Husk at i nærheten av x0 er F godt tilnærmet av sinlinearisering i x0, altsa av den affine funksjonen

Tx0F(x) = F(x0) + F′(x0)(x− x0)

der F′(x0) er Jacobi-matrisen til F i punktet x0 (se seksjon 2.9). Istedenfora løse den kompliserte ligningen F(x) = 0, løser vi den enklere ligningenTx0F(x) = 0, dvs. ligningen

F(x0) + F′(x0)(x− x0) = 0

Dette er et lineært ligningssystem, og hvis Jacobi-matrisen F′(x0) er inver-terbar, har det løsningen

x = x0 − F′(x0)−1F(x0)

Som allerede papekt er dette en løsning av det forenklede ligningssystemetTx0F(x) = 0 og ikke av det opprinnelige ligningssystemet F(x) = 0 som viegentlig vil løse, men med litt flaks er x en bedre tilnærming til løsningen

Page 214: Flervariabel analyse med lineær algebra

422 KAPITTEL 5. ITERASJON OG OPTIMERING

enn den gjetningen x0 som vi startet med. Vi lar derfor x1 = x være varandre tilnærming til løsning.

Vi gjentar na prosedyren med x1 som input istedenfor x0 og far en nytilnærming

x2 = x1 − F′(x1)−1F(x1)

Deretter bruker vi x2 som input og far en ny tilnærming x3:

x3 = x2 − F′(x2)−1F(x2)

Slik fortsetter vi a følge mønsteret

xn+1 = xn − F′(xn)−1F(xn)

og haper a nærme oss en løsning av det opprinnelige ligningssystemet F(x) =0.

Definisjon 5.6.1 Anta at F : A → Rm er en deriverbar funksjon av mvariable. Newtons metode anvendt pa F med startpunkt x0 gir oss følgenx0,x1,x2, . . . ,xn, . . . der

xn+1 = xn − F′(xn)−1F(xn)

Legg merke til at Newtons metode ikke er noe annet enn fikspunkts-iterasjon av funksjonen

G(x) = x− F′(x)−1F(x)

Legg ogsa merke til at prosedyren forutsetter at Jacobi-matrisen F′(xn) erinverterbar for alle n.

La oss se pa et eksempel.

Eksempel 1: Vi skal bruke Newtons metode til a finne en løsning av lig-ningssystemet

x2y + 1 = 0ex + y = 0

Sagt pa en annen mate skal vi finne et nullpunkt for funksjonen

F(x, y) =(

x2y + 1ex + y

)

Denne funksjonen har Jacobi-determinant

F′(x, y) =(

2xy x2

ex 1

)

5.6. NEWTONS METODE I FLERE VARIABLE 423

Lar vi x0 =(

x0

y0

), x1 =

(x1

y1

), x2 =

(x2

y2

), . . . være en følge som

fremkommer nar vi bruker Newtons metode pa F, ser vi at iterasjonsformelen

xn+1 = xn − F′(xn)−1F(xn)

kan skrives(

xn+1

yn+1

)=

(xn

yn

)−

(2xnyn x2

n

exn 1

)−1 (x2

nyn + 1exn + yn

)

For a regne ut punktene i følgen skriver vi et lite MATLAB-program.Legg merke til at variablen u alltid inneholder det siste punktet xn =(

xn

yn

)vi har regnet ut, mens variablene x og y lagrer hele listen av x-

og y-koordinater. Legg ogsa merke til at vi bruker kommandoen A\v iste-denfor A−1v for a spare regnearbeid (dette er mer effektivt enn a tvingeMATLAB til a regne ut A−1).

function [x,y]=newtonfler(a,b,N)x=zeros(1,N); % sørger for at vektoren x har "riktig" lengdey=zeros(1,N); % sørger for at vektoren y har "riktig" lengdex(1)=a; %laster inn x-koordinaten til startpunktety(1)=b; %laster inn y-koordinaten til startpunktetu=[a;b]; %setter u lik startpunktetfor n=1:NA=[2*x(n)*y(n) x(n)^2;exp(x(n)) 1]; %setter A lik Jacobi-matrisenv=[x(n)^2*y(n)+1;exp(x(n))+y(n)]; %setter v lik funksjonsverdienu=u-A\v; %oppdaterer ux(n+1)=u(1); %finner x(n+1) som førstekoordinaten til uy(n+1)=u(2); %finner y(n+1) som annenkoordinaten til u

end

For a kjøre programmet med startpunkt (−0.7,−2.5), gir vi kommando-en

>> [x,y]=newtonfler(-.7,-2.5,20);

Vi kan fa ut x- og y-verdiene ved a skrive henholdsvis >> x og >> y.Tabellen nedenfor viser de første verdiene:

x0 = x1 = x2 = x3 = x4 = x5 = x6 = x7 = x8 = x9 = x10 =-0.7000 -0.9323 -2.7167 -2.4802 1.9425 1.0409 0.5810 0.7475 0.7056 0.7035 0.7035

y0 = y1 = y2 = y3 = y4 = y5 = y6 = y7 = y8 = y9 = y10 =-2.5000 -0.3812 0.3088 -0.0817 -0.4540 -0.6865 -1.5295 -2.0855 -2.0233 -2.0208 -2.0207

Følgen ser altsa ut til a konvergere mot et nullpunkt med koordinatertilnærmet lik (0.7035,−2.0207) (de neste tallene i utskriften bekrefter dette

Page 215: Flervariabel analyse med lineær algebra

424 KAPITTEL 5. ITERASJON OG OPTIMERING

inntrykket). For a fa bedre oversikt hvordan følgen oppfører seg, kan vi plotteden med kommandoen >> plot(x,y).

Figur 1: Konvergens av Newtons metode

Resultatet ser du i figur 1. Legg merke til at de siste skrittene er sa smaat du ikke kan se dem pa figuren. ♣

Programmet i eksemplet ovenfor er ganske primitivt siden det er skred-dersydd for akkurat den funksjonen vi skal studere. Skal man bruke Newtonsmetode i flere sammenhenger (eller som del av et større program), bør manlage en versjon der man kan laste inn de funksjonene man skal arbeide med.

Konvergens av Newtons metode

I eksemplet ovenfor konvergerte Newtons metode mot et nullpunkt, meni andre eksempler er dette slett ikke tilfellet — vi kan f.eks. fa en følgesom gar mot det uendelig fjerne. Selv i eksemplet ovenfor er vi ikke hundreprosent sikre pa at vi virkelig er i nærheten av et nullpunkt; det gar an alage eksempler der det ser ut som vi har konvergens mot et nullpunkt somi virkeligheten ikke finnes. Et tilleggsproblem far vi dersom funksjonen harmer enn ett nullpunkt, og vi ikke er sikre pa hvilket nullpunkt Newtonsmetode konvergerer mot — det kan godt være et helt annet enn det vi erinteressert i.

Ser du etter hva som star i Kalkulus (seksjon 7.3) eller i de fleste andrelærebøker om Newtons metode, vil du finne en setning av denne typen:

Setning 5.6.2 (Newtons metode i en variabel) Anta f : R → R haret nullpunkt i a. Dersom f ′(a) #= 0, og f ′′(x) eksisterer og er kontinuerlig ien omegn rundt a, sa finnes det en δ > 0 slik at hvis x0 ∈ (a− δ, a + δ), sakonvergerer følgen {xn} i Newtons metode mot a.

Setninger av denne typen (det finnes tilsvarende for funksjoner av fle-re variable) forteller deg at dersom du starter nær nok et nullpunkt, sa vilNewtons metode (sa sant betingelsene er oppfylt) konvergere mot dette null-punktet. Slike setninger er teoretisk beroligende, men de er til liten nytte nar

5.6. NEWTONS METODE I FLERE VARIABLE 425

man bruker Newtons metode i praksis — da kjenner man jo ikke nullpunk-tene, og kan umulig vite om man er “nær nok” eller ikke. Vi skal istedense pa et teorem som har praktisk nytte — det gir nemlig en mulighet tila sjekke konvergens med en gang vi starter beregningene. Teoremet kallesgjerne Kantorovitsj’ teorem etter den russiske matematikeren og økonomenLeonid Vitaljevitsj Kantorovitsj (1912-1986) som vant Nobels minnepris iøkonomi i 1975.

Røft sett sier Kantorovitsj’ teorem at Newtons metode konvergerer der-som det første skrittet x1 − x0 er “tilstrekkelig lite”, og at nullpunktet denkonvergerer mot da ligger innenfor en kule om x0 med radius 2|x1 − x0|.Problemet er at hva som er “tilstrekkelig lite” avhenger av den funksjonenF vi arbeider med, og det punktet x0 vi starter i. Dess raskere F′ variererog dess mindre F′(x0) er, dess strengere ma vi være med kravet til x1 − x0.

La oss aller først innføre et mal pa hvor fort F′ varierer. I seksjon 5.3definerte vi operatornormen |A| til en kvadratisk matrise A ved

|A| = sup{|Ax||x| : x ∈ Rm,x #= 0

}

og understreket at dette er et (av flere mulige) mal pa hvor stor en matriseer. Nar vi i Kantorovitsj’ teorem har forutsetningen

|F′(u)− F′(v)| ≤ M |u− v| for alle u,v ∈ U0

betyr dette at størrelsen til differensen mellom Jacobi-matrisen i punktetu og Jacobi-matrisen i punktet v er mindre enn M ganger størrelsen tildifferensen mellom u og v — med andre ord: Jacobi-matrisen endrer seg ikkeveldig mye raskere enn avstanden mellom punktene. Som vi snart skal se,vil to ganger deriverbare funksjoner oppfylle en slik betingelse, men kanskjemed en M som er ganske stor.

Før vi skriver opp Kantorovitsj’ teorem, minner vi om at ifølge Newtonsmetode er

x1 = x0 − F′(x0)−1F(x0),

og følgelig er[x1 − x0| = |F′(x0)−1F(x0)|

Teorem 5.6.3 (Kantorovitsj’ teorem) La F : U → Rm være en deriver-bar funksjon definert pa en apen, konveks delmengde U av Rm, og anta atdet finnes en konstant M slik at

|F′(x)− F′(y)| ≤ M |x− y| for alle x,y ∈ U

La x0 være et punkt i U , og anta at Jacobi-matrisen F′(x0) i x0 er inver-terbar med

|F′(x0)−1| ≤ K

Page 216: Flervariabel analyse med lineær algebra

426 KAPITTEL 5. ITERASJON OG OPTIMERING

Anta til slutt at den lukkede kulen B(x0,1

KM ) er inneholdt i definisjons-mengden U . Dersom

|x1 − x0| = |F′(x0)−1F(x0)| ≤1

2KM,

er F′(x) inverterbar for alle x i den apne kulen B(x0,1

KM ). Starter vi New-tons metode i x0, vil alle punktene xn ligge i B(x0,

1KM ), og de vil konvergere

mot et punkt x ∈ B(x0,1

KM ) der F(x) = 0.

Det er altsa tallet 12KM som avgjør hvor lite det første skrittet x1 − x0 ma

være for at vi skal være sikret konvergens. Du har kanskje stusset pa at vibruker ulikheten |F′(x0)−1| ≤ K til a beskrive K, og ikke bare setter K lik|F′(x0)−1|. Grunnen til dette er at |F′(x0)−1| er vanskelig a beregne eksakt,og at det derfor er greit a ha et kriterium som tillater oss a bruke et estimatK.

Vær for øvrig oppmerksom pa at følgen {xn} godt kan konvergere utenat betingelsene i Kantorovitsj’ teorem er oppfylt — i mange tilfeller vilbetingelsene først være oppfylt etter at vi har gjennomført noen iterasjoner.Selv om betingelsene ikke er oppfylt for x1−x0, bør du derfor teste x2−x1,x3 − x2 og noen ledd til før du gir opp.

Før vi gar videre, tar vi med to tilleggsresultater — ett om entydighetav nullpunktet og ett om konvergenshastighet. Begge er egentlig del av Kan-torovitsj’ resultat, men vi velger a presentere dem separat for ikke a fa etaltfor overlesset teorem. Vi kommer tilbake med bevisene etter at vi harbevist Kantorovitsj’ teorem.

Setning 5.6.4 Anta at betingelsene i Kantorovitsj’ teorem er oppfylt. Dahar F nøyaktig ett nullpunkt i den lukkede kulen B(x0,

1KM ), nemlig det vi

finner ved a starte Newtons metode i x0.

Setning 5.6.5 Anta at betingelsene i Kantorovitsj’ teorem er oppfylt, og lax være grensepunktet for følgen {xn} gitt av Newtons metode med startpunktx0. Anta at |x1 − x0| ≤ ε ≤ 1

2KM . Da er

|x− xn| ≤1

KM

((1−

√1− 2h)2n

2n

)

der h = KMε ≤ 12 .

Det siste resultatet ser litt mystisk ut før man har lest beviset for Kan-torovitsj’s teorem, men observer at nar h < 1

2 , sa er 1 −√

1− 2h < 1.Uttrykket (1 −

√1− 2h)2n gar derfor svært raskt mot 0 (man kaller ofte

fenomenet superkonvergens).

5.6. NEWTONS METODE I FLERE VARIABLE 427

Før vi gar løs pa bevisene for Kantorovitsj’ teorem og de to tilleggs-setningene ovenfor, er det et lite problem vi bør ta oss av — hvordan finnervi i praksis et tall M slik at |F′(u) − F′(v)| ≤ M |u − v| for alle u,v i enmengde U? Setningen nedenfor gir oss en nyttig metode, men vær klar overat den ofte gir en M -verdi som er mye større enn nødvendig. Legg merke tilat setningen (og beviset) er en litt mer komplisert variant av setning 5.5.6.

Setning 5.6.6 Anta at U er en apen, konveks delmengde av Rm og atF : U → Rm har kontinuerlige annenderiverte. Anta at det for alle trip-ler (i, j, k), 1 ≤ i, j, k ≤ m, finnes tall mi,j,k slik at

∣∣∣∣∂2Fi

∂xk∂xj(x)

∣∣∣∣ ≤ mi,j,k for alle x ∈ U

SettM = (

1≤i,j,k≤m

m2i,j,k)

12

Da er|F′(u)− F′(v)| ≤ M |u− v| for alle u,v ∈ U

Bevis: Det i, j-te elementet i matrisen F′(u) − F′(v) er ∂Fi∂xj

(u) − ∂Fi∂xj

(v).Ifølge middelverdisetningen for funksjoner av flere variable (se setning 3.2.3eller setning 5.5.5), finnes det et punkt ci,j pa linjestykket mellom u og vslik at

∂Fi

∂xj(u)− ∂Fi

∂xj(v) = ∇

(∂Fi

∂xj

)(ci,j) · (u− v)

Ifølge Schwartz’ ulikhet er dermed∣∣∣∣∂Fi

∂xj(u)− ∂Fi

∂xj(v)

∣∣∣∣ ≤∣∣∣∣∇

(∂Fi

∂xj

)(ci,j)

∣∣∣∣ |u− v|

Bruker vi at

∣∣∣∣∇(

∂Fi

∂xj

)(ci,j)

∣∣∣∣ =

√(∂2Fi

∂x1∂xj(ci,j)

)2

+ · · · +(

∂2Fi

∂xm∂xj(ci,j)

)2

√√√√m∑

k=1

m2i,j,k ,

far vi∣∣∣∣∂Fi

∂xj(u)− ∂Fi

∂xj(v)

∣∣∣∣ ≤

√√√√m∑

k=1

m2i,j,k |u− v|

Husk at normen ||A|| til en m ×m-matrise A med komponenter aij er gittved

||A|| =√ ∑

1≤i,j≤m

a2ij

Page 217: Flervariabel analyse med lineær algebra

428 KAPITTEL 5. ITERASJON OG OPTIMERING

Dermed er

||F′(u)− F′(v)|| =

√√√√m∑

i,j=1

(∂Fi

∂xj(u)− ∂Fi

∂xj(v)

)2

√√√√√∑

1≤i,j≤m

√√√√m∑

k=1

m2i,j,k |u− v|

2

=√ ∑

1≤i,j,k≤m

m2i,j,k|u− v| = M |u− v|

Siden operatornormen |F′(u)−F′(v)| er mindre enn normen ||F′(u)−F′(v)||(se seksjon 5.3), følger det at

|F′(u)− F′(v)| ≤ M |u− v|

!

∗Bevis for Kantorovitsj’ teorem

Vi skal na bevise Kantorovitsj’ teorem. Før vi begynner, gjør vi oppmerksompa at argumentet er bade langt og krevende sammenlignet med de flesteandre bevisene i dette kompendiet. Det gir imidlertid en flott illustrasjonav hvordan teknikkene vare kan brukes til a bevise avanserte matematiskeresultater. Før vi kommer til selve beviset for Kantorovitsj’ teorem, skal vibevise tre lemmaer. I tillegg skal vi gjøre viktig bruk av Banachs lemma(teorem 5.3.11), sa har du ikke lest det før, bør du gjøre det na.

Det første lemmaet vart vil hjelpe oss a utnytte betingelsen |F′(u) −F′(v)| ≤ M |u− v| i Kantorovitsj’ teorem.

Lemma 5.6.7 Anta at U er en apen, konveks delmengde av Rm, og at F :U → Rm er en deriverbar funksjon slik at

|F′(u)− F′(v)| ≤ M |u− v| for alle u,v ∈ U

Da er|F(y)− F(x)− F′(x)(y − x)| ≤ M

2|y − x|2

for alle x,y ∈ U .

Bevis: Siden U er konveks, ligger alle punkter pa linjestykket mellom x ogy i U (dette er definisjonen av konveksitet). Linjestykket er parametrisertved

r(t) = x + t(y − x) der t ∈ [0, 1],

og deriverer vi G(t) = F(r(t)), gir kjerneregelen

G′(t) = F′(r(t))(y − x)

5.6. NEWTONS METODE I FLERE VARIABLE 429

som vi kan skrive om til

G′(t) = F′(x)(y − x) +(F′(r(t))− F′(x)

)(y − x)

Integrerer vi pa begge sider, far vi

F(y)− F(x) = G(1)−G(0) =∫ 1

0G′(t) dt =

=∫ 1

0

(F′(x)(y − x) +

(F′(r(t))− F′(x)

)(y − x)

)dt =

= F′(x)(y − x) +∫ 1

0

(F′(r(t))− F′(x)

)(y − x) dt

der vi i det siste skrittet har brukt at F′(x)(y−x) er konstant. Dette betyrat

∣∣F(y)− F(x)− F′(x)(y − x)∣∣ =

∣∣∣∣∫ 1

0

(F′(r(t))− F′(x)

)(y − x) dt

∣∣∣∣ ≤

≤∫ 1

0

∣∣(F′(r(t))− F′(x)∣∣ |y − x|

)dt ≤ M

∫ 1

0|r(t)− x||y − x| dt

Bruker vi at r(t)− x = (x + t(y − x))− x = t(y − x), far vi

∣∣F(y)− F(x)− F′(x)(y − x)∣∣ ≤ M

∫ 1

0t|y − x|2 dt =

M

2|y − x|2 !

Vi skal bevise Kantorovitsj’ teorem ved a sammenligne følgen {xn} meden atskillig enklere tallfølge. Her er det grunnleggende sammenligningsprin-sippet:

Lemma 5.6.8 La {xn} være en følge av punkter i Rm. Anta at det finnesen voksende følge {tn} av punkter pa tallinjen som konvergerer mot et tallt, og som er slik at

|xn+1 − xn| ≤ tn+1 − tn

for alle n. Da konvergerer {xn} mot et punkt x ∈ Rm og

|x− xn| ≤ t− tn

for alle n.

Bevis: Vi begynner med a vise at {xn} er en Cauchy-følge. Hvis k > n, harvi

|xk − xn| = |(xk − xk−1) + (xk−1 − xk−2) + · · · + (xn+1 − xn)| ≤

≤ |xk − xk−1| + |xk−1 − xk−2| + · · · + |xn+1 − xn)| ≤

Page 218: Flervariabel analyse med lineær algebra

430 KAPITTEL 5. ITERASJON OG OPTIMERING

≤ (tk − tk−1) + (tk−1 − tk−2) + · · · + (tn+1 − tn) = tk − tn

Siden følgen {tn} konvergerer, er den en Cauchy-følge, og følgelig kan vi fatk−tn sa liten vi vil ved a velge n og k store nok. Men dermed kan vi ogsa fa|xk−xn| sa liten vi vil, og følgelig er {xn} en Cauchy-følge og ma konvergeremot et punkt x.

Fra ulikhetene ovenfor vet vi at |xk − xn| ≤ tk − tn. Holder vi n fast oglar k →∞, far vi |x− xn| ≤ t− tn. !

I lemmaet ovenfor sier vi at tallfølgen {tn} majoriserer den opprinne-lige følgen {xn}. I beviset for Kantorovitsj’ teorem skal vi majorisere denopprinnelige følgen {xn} ved hjelp av en tallfølge {tn} som fremkommer veda bruke Newtons metode pa en enkel annengradsfunksjon P (t) pa tallin-jen. Det siste lemmaet (som ser atskillig verre ut enn det er) vil gi oss denødvendige verktøyene for a gjennomføre denne majoriseringen.

Lemma 5.6.9 Anta at a, b og c er positive reelle tall, og la P : R → R væreannengradspolynomet

P (t) = at2 − bt + c

Anta at P har reelle røtter

t± =b ±

√b2 − 4ac

2a

og la t− være den minste roten t− = b−√

b2−4ac2a . Anta at {tn} er den følgen vi

far nar vi bruker Newtons metode pa P (t) med startverdi t0 = 0. Da er {tn}en voksende følge som konvergerer mot t−. Punktene i følgen tilfredstillerligningen

tn+1 − tn =a(tn − tn−1)2

b− 2atn(5.6.1)

Bevis: Siden a, b og c er positive og polynomet har reelle røtter, er det letta sjekke at grafen ma se ut som pa figur 2. Det er ogsa lett a se grafisk atfølgen vi far ved a starte Newtons metode i t0 = 0, ma være voksende ogkonvergere mot t− (se oppgave 5.6.8).

!

"

! !!(0, c)

(t−, 0)(t+, 0)

Figur 2: En parabel P (t) = at2 − bt + c

5.6. NEWTONS METODE I FLERE VARIABLE 431

Det gjenstar a vise ligning (5.6.1). Her trenger vi et litt fiffig regnestykke.Siden P ′(t) = 2at− b, er Newtons metode gitt ved

tn = tn−1 −P (tn–1)P ′(tn−1)

= tn−1 −at2n−1 − btn−1 + c

2atn−1 − b=

at2n−1 − c

2atn−1 − b

Ganger vi denne likheten tn = at2n−1−c2atn−1−b med 2atn−1 − b, far vi

2atntn−1 − btn = at2n−1 − c

som igjen gir−btn + c = −2atntn−1 + at2n−1 (5.6.2)

Etter Newtons metode er ogsa

tn+1 − tn = − P (tn)P ′(tn)

= −at2n − btn + c

2atn − b

Bruker vi (5.6.2) og annen kvadratsetning, kan dette skrives som

tn+1 − tn = −at2n − 2atntn−1 + at2n−1

2atn − b=

a(tn − tn−1)2

b− 2atn

!

Vi er na klare til a bevise Kantorovitsj’ teorem og dets to kompanjonger,setningene 5.6.4 og 5.6.5. I disse bevisene far vi bruk for to størrelser ε ogh. Den første av disse er bare et tall slik at

|x1 − x0| ≤ ε ≤ 12KM

Nar ε er valgt, setter vih = KMε

Legg merke til at siden ε ≤ 12KM , er h ≤ 1

2 . Det kan virke litt merkelig atvi ikke spesifiserer verdien til ε, men bare lar den være et fritt tall mellom|x1 − x0| og 1

2KM . Dette skyldes at det ikke alltid er den samme verdien avε som er mest effektiv a bruke, og at vi derfor vil ha mulighet til a bytteε-verdi etter behov.

For a gjøre det enklere a lese beviset, skrive vi opp Kantorovitsj’ teorempa nytt.

Teorem 5.6.10 (Kantorovitsj’ teorem) La F : U → Rm være en deri-verbar funksjon definert pa en apen, konveks delmengde U av Rm, og antaat det finnes en konstant M slik at

|F′(x)− F′(y)| ≤ M |x− y| for alle x,y ∈ U

Page 219: Flervariabel analyse med lineær algebra

432 KAPITTEL 5. ITERASJON OG OPTIMERING

La x0 være et punkt i U , og anta at Jacobi-matrisen F′(x0) i x0 er inver-terbar med

|F′(x0)−1| ≤ K

Anta til slutt at den lukkede kulen B(x0,1

KM ) er inneholdt i definisjons-mengden U . Dersom

|x1 − x0| = |F′(x0)−1F(x0)| ≤1

2KM,

er F′(x) inverterbar for alle x i den apne kulen B(x0,1

KM ). Starter vi New-tons metode i x0, vil alle punktene xn ligge i B(x0,

1KM ), og de vil konvergere

mot et punkt x ∈ B(x0,1

KM ) der F(x) = 0.

Bevis: Ifølge Banachs lemma (teorem 5.3.11) er F′(x) inverterbar dersom|F′(x) − F′(x0)| < |F′(x0)−1|−1. Siden |F′(x) − F′(x0)| ≤ M |x − x0| ogK−1 ≤ |F′(x0)−1|−1, er denne betingelsen oppfylt dersom M |x−x0| < K−1,dvs. nar |x−x0| < 1

KM . Altsa er F′(x) inverterbar nar x ∈ B(x0,1

KM ). FraBanachs lemma vet vi at da er

|F′(x)−1| ≤ |F′(x0)−1|1− |F′(x0)−1||F′(x)− F′(x0)|

≤ K

1−KM |x− x0|

Dersom xn ∈ B(x0,1

KM ) (dette vil følge fra argumenter senere i beviset),har vi dermed

|xn+1 − xn| = |− F′(xn)−1F(xn)| ≤ |F′(xn)−1||F(xn)| ≤ K|F(xn)|1−KM |xn − x0|

Bruker vi at F(xn−1) + F′(xn−1)(xn − xn−1) = 0 (dette er selve utgangs-punktet for Newtons metode), ser vi at

|F(xn)| = |F(xn)− F(xn−1)− F′(xn−1)(xn − xn−1)| ≤M

2|xn − xn−1|2

ifølge lemma 5.6.7. Setter vi dette inn i ulikheten ovenfor, far vi

|xn+1 − xn| ≤KM |xn − xn−1|2

2(1−KM |xn − x0|)

Denne ulikheten minner om likheten (5.6.1) i lemma 5.6.6, og det er denneobservasjonen som er utgangspunktet for vart majoriseringstriks.

La P (t) = KM2 t2 − t + ε der ε (som ovenfor) er et tall slik at |x1 − x0| ≤

ε ≤ 12KM . Løser vi annengradsligningen P (t) = 0, far vi

t =1 ±

√1− 4KM

2 ε

2KM2

=1 ±

√1− 2h

KM

5.6. NEWTONS METODE I FLERE VARIABLE 433

der h = KMε ≤ 12 . Dette betyr at betingelsene i lemma 5.6.6 er oppfylt, og

vi vet dermed at hvis vi bruker Newtons metode pa P (t) med startpunktt0 = 0, sa vil følgen {tn} vokse mot grenseverdien

t− =1−

√1− 2h

KM

Legg merke til at t− ≤ 1KM .

Fra lemma 5.6.6 vet vi ogsa at

tn+1 − tn =KM(tn − tn−1)2

2(1−KMtn)

Ved induksjon er det na lett a vise at |xn+1−xn| ≤ tn+1−tn. For n = 0 følgerdette av at t1− t0 = − P (0)

P ′(0) = − ε−1 = ε, mens |x1−x0| ≤ ε per definisjon av

ε. For a gjennomføre induksjonstrinnet antar vi at |xk+1 − xk| ≤ tk+1 − tkfor alle k < n. Da er |xn − x0| ≤ tn − t0 = tn, og vi har

|xn+1 − xn| ≤KM |xn − xn−1|2

2(1−KM |xn − x0|)≤ KM(tn − tn−1)2

2(1−KMtn)= tn+1 − tn

Dette viser at {tn} majoriserer {xn}. Legg merke til at siden |xn − x0| ≤tn < t− < 1

KM , er følgen {xn} hele tiden innenfor den kulen B(x0,1

KM ) dervi vet at F′(x) er inverterbar, og vi har derfor ingen problemer med a utføreNewton-iterasjonen uendelig mange ganger. Siden {tn} majoriserer {xn},konvergerer xn mot et punkt x ifølge lemma 5.6.5. Siden xn ∈ B(x0,

1KM ),

ma grensepunktet x ligge i den lukkede kulen B(x0,1

KM ) (som regel vil detligge i den apne kulen B(x0,

1KM )).

Det gjenstar a vise at F(x) = 0. Vi har allerede vist at |F(xn)| ≤M2 |xn − xn−1|2. Siden {xn} konvergerer, gar uttrykket pa høyre side motnull, og følgelig er limn→∞ |F(xn)| = 0. Siden F er kontinurlig, følger det atF(x) = 0. !

Bevis for setning 5.6.4: Fra Kantorovitsj’ teorem vet vi at F har minst ettnullpunkt x som er grensen for følgen {xn} generert av Newtons metodemed startpunkt x0. Vi skal vise at dersom y er et vilkarlig nullpunkt for Fi B(x0,

1KM ), sa vil |y − xn| → 0. Dette medfører apenbart at x = y, og

følgelig finnes det bare ett nullpunkt.I dette beviset gjelder det a ha ε sa stor som mulig. Vi setter derfor

ε = 12KM og far h = KMε = 1

2 . Fra lemma 5.6.6 vet vi at hvis

rn = F(y)− F(xn)− F′(xn)(y − xn)

sa er|rn| ≤

M

2|y − xn|2

Page 220: Flervariabel analyse med lineær algebra

434 KAPITTEL 5. ITERASJON OG OPTIMERING

Siden F(y) = 0, far vi ogsa fra ligningen ovenfor at

y − xn + F′(xn)−1F(xn) = −F′(xn)−1rn

Siden xn+1 = xn − F′(xn)−1F(xn), gir dette

y − xn+1 = −F′(xn)−1rn

Fra beviset for Kantorovitsj’ teorem vet vi at

|F′(xn)−1| ≤ K

1−KM |xn − x0|

og dermed er

|y − xn+1| ≤KM |y − xn|2

2(1−KM |xn − x0|)≤ KM |y − xn|2

2(1−KM |tn|)

der {tn} er den majoriserende tallfølgen fra beviset for Kantorovitsj’ teorem.Siden

tn+1 − tn =KM(tn − tn−1)2

2(1−KMtn)

er tanken na a vise ved induksjon at |y − xn| ≤ tn − tn−1 for alle n. Siden(tn − tn−1) → 0, vil da |y − xn|→ 0. Induksjonen er enkel hvis vi bare kanfa startbetingelsene til a stemme. Ved a bruke Newtons metode baklengs,ser vi at t−1 = −

√2ε

KM = − 1KM (husk at vi har valgt ε slik at KMε = 1

2).Dermed er t0 − t−1 = 1

KM . Siden y ∈ B(x0,1

KM ), er |y − x0| ≤ 1KM . Med

dette har vi |y− x0| ≤ t0 − t−1, og siden resten av induksjonen gar greit, ersetningen bevist !

Før vi beviser setning 5.6.5, skal vi se pa et spesialtilfelle vi far bruk forunderveis.

Lemma 5.6.11 La P (t) være polynomet KM2 t2 − t + ε i det tilfellet der

ε = 12KM og h = KMε = 1

2 , dvs. at

P (t) =KM

2t2 − t +

12KM

La {tn} være følgen vi far nar vi bruker Newtons metode pa P (t) med t0 = 0,og la t− være nullpunktet denne følgen konvergerer mot. Da er t−−tn = 2−n

KM .

Bevis: Siden

P (t) =KM

2t2 − t +

12KM

=KM

2

(t− 1

KM

)2

5.6. NEWTONS METODE I FLERE VARIABLE 435

er t− = 1KM . Vi har ogsa P ′(t) = KM

(t− 1

KM

), sa Newtons metode gir

tn+1 = tn −KM

2

(tn − 1

KM

)2

KM(tn − 1

KM

) =12tn +

12KM

En liten omforming leder til

1KM

− tn+1 =12

(1

KM− tn

)

som ved induksjon gir

1KM

− tn = 2−n(1

KM− t0) =

2−n

KM

der vi har brukt at t0 = 0. Siden t− = 1KM , følger setningen. !

Bevis for setning 5.6.5: La {tn} være tallfølgen som majoriserer {xn} ibeviset for Kantorovitsj’ teorem. Ifølge lemma 5.6.7 er |x − xn| ≤ t− − tn,sa det holder a vise at

t− − tn ≤1

KM

((1−

√1− 2h)2n

2n

)

Vi begynner med a utlede identiteten

(t− − tn+1) =KM(t− − tn)2

2(1−KMtn)

Bruker vi formelen for Newtons metode pa P (t) = KM2 t2 − t + ε, far vi

t− − tn+1 = t− − tn +KM

2 t2n − tn + ε

KMtn − 1=

KMt−tn − t− + KM2 t2n − tn + ε

KMtn − 1

Siden t− er en løsning av ligningen KM2 t2 − t + ε = 0, er

t− =KM

2t2− + ε

Setter vi dette inn for (den ene forekomsten av) t− i formelen ovenfor, far vi

t− − tn+1 =KMt−tn − t− + KM

2 t2n − tn + ε

KMtn − 1=

=KMt−tn − KM

2 t2− − ε + KM2 t2n − tn + ε

KMtn − 1=

KM(t− − tn)2

2(1−KMtn)

som er identiteten vi skulle vise.

Page 221: Flervariabel analyse med lineær algebra

436 KAPITTEL 5. ITERASJON OG OPTIMERING

Neste skritt er a kontrollere faktoren 1−KMtn i nevneren. Nar ε = 12KM

(som i lemmaet ovenfor), er tn = 1KM

(1− 1

2n

), og følgelig 1−KMtn = 2−n

i dette tilfellet. Vi skal snart vise at dette er den minste verdien 1−KMtnkan ha (vi har altsa 1−KMtn ≥ 2n), og dermed far vi

t− − tn+1 =KM(t− − tn)2

2(1−KMtn)≤ KM2n−1(t− tn)2

Det er lett a vise ved induksjon at dersom {rn} er en tallfølge slik at

rn+1 ≤ c2n−1r2n

for alle n ≥ 0, sa er rn ≤ (cr0)2n

c2n . Bruker vi dette pa tallfølgen rn = t− − tn

(og husker at r0 = t− − 0 = 1−√

1−2hKM ), far vi

t− − tn ≤

(KM 1−

√1−2h

KM

)2n

KM2n=

1KM

(1−

√1− 2h

)2n

2n

som er formelen vi skulle frem til.Det gjenstar a vise at vi virkelig har ulikheten 1 − KMtn ≥ 2−n for

alle valg av ε (og ikke bare for ε = 12KM ). Vi tenker oss derfor at vi bruker

Newtons metode med t0 = 0 for forskjellige valg av ε ∈ [0, 12KM ], og at vi lar

tn(ε) være det n-te punktet i iterasjonen. Ser vi grafisk pa hvordan Newtonsmetode fungerer, virker det naturlig at tn(ε) er voksende som funksjon avε. Kan vi bevise dette, er vi ferdig fordi vi da har 1 − KMtn(ε) ≥ 1 −KMtn( 1

2KM ) = 2−n.Siden t0(ε) = 0, t1(ε) = ε, ser vi at bade t0(ε), t1(ε) og t1(ε) − t0(ε) er

voksende i ε. Ifølge formel (5.6.1) i lemma 5.6.8 er

tn+1(ε)− tn(ε) =KM(tn(ε)− tn−1(ε))

2(1−KMtn(ε))

Vi ser at hvis bade tn(ε) og tn(ε)− tn−1(ε) er voksende i ε, sa forteller dennelikheten oss at tn+1(ε) − tn(ε) er voksende i ε, noe som igjen medfører attn+1(ε) er voksende. Ved induksjon ma da tn(ε) være voksende i ε for alle n,og setningen er bevist. !

Oppgaver til seksjon 5.6

1. La f : R → R være funksjonen f(x) = x3 − x.

a) Vis at f har tre nullpunkter.

b) Skriv et MATLAB-program for a finne nullpunktene til f ved hjelp av New-tons metode.

c) Kjør programmet ditt med startverdier 0.4, 0.5 og 0.6. Prøv a gjette hva somskjer før du kjører programmet.

5.6. NEWTONS METODE I FLERE VARIABLE 437

d) Prøv a forklare resultatene i c) geometrisk ved a studere hvordan Newtonsmetode virker.

2. Funksjonen F : R2 → R2 er gitt ved

F(x, y) =(

x2 − yx2 + y2 − 1

)

a) Skriv et MATLAB-program for a finne nullpunktene til F ved hjelp av New-tons metode.

b) F har to nullpunkter. Finn begge to ved a velge forskjellige startverdier.

c) Finn nullpunktene til F ved regning og sjekk at svarene stemmer med det dufant i b).

3. Funksjonen F : R2 → R2 er gitt ved

F(x, y) =

12 sin(x + y)

12 cos(x− y)

a) Beskriv de (uendelig mange) nullpunktene til F.

b) Skriv et MATLAB-program for a finne nullpunktene til F ved hjelp av New-tons metode.

c) Eksperimenter med forskjellige startverdier og se hvordan Newtons metodefinner frem til forskjellige nullpunkter.

4. Funksjonen F : R2 → R2 er gitt ved

F(x, y) =(

y2 − x− 3x2 − y + sin(x− y)− 2

)

Skriv et MATLAB-program for a finne nullpunktene til F ved hjelp av Newtonsmetode. Bruk programmet til a finne i hvert fall to (tilnærmede) nullpunkter.

5. Skriv et MATLAB-program for a løse ligningssystemet

ex+y = sin(x− y)y2 − x2 = 1

Finn en (tilnærmet) løsning av systemet.

6. Skriv et MATLAB-program for a løse ligningssystemet

x2 + y2 + z2 = 9x2 − y2 + 2z2 = 1

x + y + 10z = 1

Finn minst to (tilnærmede) løsninger av systemet.

Page 222: Flervariabel analyse med lineær algebra

438 KAPITTEL 5. ITERASJON OG OPTIMERING

7. I denne oppgaven skal vi se pa konvergensraten i setning 5.6.5. Bruk MATLABtil a regne ut noen ledd av følgen

zn =(1−

√1− 2h)2

n

2n

for h = 12 , h = 0.4 og h = 0.3. Sammenlign konvergenshastighetene.

8. (Denne oppgaven fyller inn detaljer i beviset for lemma 5.6.9, men den kangodt gjøres uavhengig av lemmaet.) Anta at a, b og c er positive reelle tall, og laP : R → R være annengradspolynomet

P (t) = at2 − bt + c

og forutsett at P har reelle røtter

t± =b ±

√b2 − 4ac

2a

Anta at {tn} er den følgen vi far nar vi starter Newtons metode for P med t0 = 0. Visat {tn} er en voksende følge og at tn er mindre enn den minste roten t− = b−

√b2−4ac2a

for alle n (bruk induksjon). Forklar at dette betyr at {tn} konvergerer mot en grense-verdi t∗. Vis at t∗ = t−.

9. La F være en funksjon fra Rm til Rm. Et fikspunkt for F er det samme som etnullpunkt for funksjonen

G(x) = F(x)− x

a) Vis at nar vi bruker Newtons metode pa G, sa far vi iterasjonen

xn+1 = (F′(xn)− In)−1(F′(xn)xn − F(xn))

b) La f : R → R være funksjonen gitt ved f(x) = x3 +3x+1. Vis at funksjonenhar nøyaktig ett fikspunkt og at det ligger mellom −1 og 0.

c) Prøv a finne fikspunktet ved fikspunktiterasjon. Velg − 12 som startpunkt.

d) Prøv a finne fikspunktet ved a bruke Newtons metode pa funksjonen g(x) =f(x)− x. Velg startpunkt − 1

2 .

10. I denne oppgaven skal vi se pa et enkelt eksempel pa hvordan Kantorovitsj’teorem kan brukes i praksis. Eksemplet er sa enkelt at det a bruke Kantorovitsj’teorem er a skyte spurver med kanoner, men hensikten er a illustrere bruken avteoremet i en situasjon der de regnetekniske komplikasjonene forsvinner.

Vi skal bruke Newtons metode til a finne et nullpunkt for funksjonen f(x) = x−cos x (ifølge skjæringssetningen ma det finnes et nullpunkt). Vi starter iterasjonenmed x0 = 0.

a) Vis at |f ′(x)| ≤ 2 for alle x. Forklar at vi dermed kan velge M = 2 i Kan-torovitsj’ teorem.

b) Vis at f ′(x0) = 1. Forklar at vi kan bruke K = 1 i Kantorovitsj’ teorem.

c) Sjekk at f ′(x0)−1f(x0) = −1, og forklar at betingelsen i Kantorovitsj’ teoremikke er oppfylt for startpunktet x0 = 0 og de verdiene vi har funnet for K ogM .

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 439

d) Bruk allikevel Newtons metode til a regne ut at x1 = 1.

e) Vi skal na bruke Kantorovitsj’ teorem med x1 som utgangspunkt. Forklar atvi na kan bruke M = 2, K = 0.6 og vis at |x2−x1| ≤ 0.25. Konkluder med atKantorovitsj’ teorem garanterer at iterasjonen konvergerer mot et nullpunktfor f .

5.7 Omvendte og implisitte funksjoner

Det første temaet vi skal ta opp i denne seksjonen, er omvendte (inverse)funksjoner. Fra teorien om funksjoner av en variabel husker du sikkert at hvisen funksjon f tar oss fra en x-verdi til en y-verdi, sa bringer den omvendtefunksjonen f−1 oss tilbake fra y-verdien til x-verdien — er y = f(x), sa eraltsa x = f−1(y). Du husker sikkert ogsa at for a fa teorien til a fungereordentlig, ma vi anta at funksjonen f er injektiv, dvs. at det til hver y finneshøyst en x slik at y = f(x). I noen tilfeller ma vi sørge for at funksjonenblir injektiv ved a redusere definisjonsomradet; dette var trikset vi bruktefor a fa definert de omvendte trigonometriske funksjonene arcsin, arccos ogarctan.

Teorien for omvendte funksjoner av en variabel er vanskelig nok, men denhar en stor fordel; siden kontinuerlige, injektive funksjoner pa et intervall erstrengt monotone, er det som regel lett a avgjøre om en funksjon er injektiveller ikke. Det er ogsa lett a se hvor mye vi ma innskrenke definisjonsomradetfor a gjøre en ikke-injektiv funksjon injektiv. I høyere dimensjoner er detflere geometriske muligheter, og det er slett ikke lett a fa oversikt over naren funksjon er injektiv. Heldigvis finnes det et teorem som sier at dersomJacobi-matrisen til F : Rm → Rm er inverterbar i punktet x, sa er F injektivnar vi innskrenker den til en (tilstrekkelig liten) omegn rundt x, og den haren invers funksjon G som er definert i en omegn rundt punktet y = F(x).Vi kan ogsa regne ut den deriverte til den omvendte funksjonen G dersomvi kjenner den deriverte til F; akkurat som i det endimensjonale tilfellet harvi

G′(y) = F′(x)−1

Alt dette kalles omvendt funksjonsteorem, og dette teoremet er vart førstemal i denne seksjonen.

La oss begynne med noen definisjoner. Nar vi arbeider med inverse funk-sjoner, er det viktigere enn ellers a holde styr pa definisjonsmengder og ver-dimengder. Vi lar DF betegne definisjonsmengden til F (dvs. de x som F(x)er definert for), og vi lar

VF = {F(x) : x ∈ DF}

være verdimengden til F.

Page 223: Flervariabel analyse med lineær algebra

440 KAPITTEL 5. ITERASJON OG OPTIMERING

Definisjon 5.7.1 Funksjonen F : DF → VF kalles injektiv dersom det tilhver y ∈ VF bare finnes en x ∈ DF slik at y = F(x). I sa fall er denomvendte funksjonen G : VF → DF definert ved

G(y) = x dersom F(x) = y

Den omvendte funksjonen G betegnes ofte med F−1.

Anta at vi har en funksjon F : U → Rm og at U0 er en delmengde avU . Med restriksjonen av F til U0 mener vi den funksjonen vi far nar viinnskrenker definisjonsomradet til F til a være U0 (men ellers ikke gjør noenendringer). Vi sier at U0 er en omegn om punktet x dersom x er et indrepunkt i U0, dvs. dersom U0 inneholder en apen kule med sentrum i x. Vikan na gi en presis formulering av resultatet vi er pa jakt etter:

Teorem 5.7.2 (Omvendt funksjonsteorem) Anta at U er en apen meng-de i Rm og at F : U → Rm har kontinuerlige partiellderiverte. Anta at x ∈ Uog at Jacobi-matrisen F′(x) er inverterbar. Da finnes det en omegn U0 ⊂ Uom x slik at F restriktert til U0 er injektiv. Verdimengden V til denne restrik-sjonen er en omegn om y = F(x), og den omvendte funksjonen G : V → U0

er deriverbar i y med Jacobi-matrise

G′(y) = F′(x)−1

Beviset for omvendt funksjonsteorem er ganske vanskelig, og vi skal ut-sette det til slutten av seksjonen. Det vanskeligste punktet er a vise at deti det hele tatt finnes en omvendt funksjon. Legg merke til at dette er detsamme som a vise at ligningen y = F(x) (med x som ukjent) har en løsningnar y er i nærheten av y. Vi skal bruke Banachs fikspunktteorem til a viseat dette alltid er tilfellet.

Et annet tidkrevende punkt i beviset er a vise at den omvendte funk-sjonen G er deriverbar i punktet y. Nar dette er vist, er det imidlertidikke vanskelig a finne ut hva den deriverte er. Siden F og G er omvendtefunksjoner, har vi nemlig

G(F(x)) = x

for alle x i nærheten av x. Deriverer vi venstresiden av dette uttrykket, farvi ved kjerneregelen

G′(F(x))F′(x)

mens den deriverte av høyresiden er identitetsmatrisen Im (hvorfor det?).Dermed er

G′(F(x))F′(x) = Im

og følgelig erG′(F(x)) = F′(x)−1

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 441

Setter vi inn x = x og bruker at F(x) = y, far vi formelen i teoremet.La oss se pa et eksempel.

Eksempel 1: Vi skal vise at funksjonen

F(x1, x2) =(

ex1 + x2

x2 cos x1

)

er injektiv nar den restrikteres til en passende omegn om (0, 0), og at dennerestriksjonen har en omvendt funksjon G definert i en omegn om (1, 0). Viskal ogsa finne de partiellderiverte til G i punktet (1, 0).

Vi observerer først at

F(0, 0) =(

e0 + 00 cos 0

)=

(10

)

Videre erF′(x1, x2) =

(ex1 1

−x2 sinx1 cos x1

)

som gir

F′(0, 0) =(

1 10 1

)

Siden det(F′(0, 0)) = 1, er F′(0, 0) inverterbar, og følgelig er F injektiv ien omegn om (0, 0) og har en omvendt funksjon G definert i en omegn omF(0, 0) = (1, 0). Siden

(1 10 1

)−1

=(

1 −10 1

)

erG′(1, 0) = F′(0, 0)−1 =

(1 −10 1

)

Det betyr at ∂G1∂y1

(1, 0) = 1, ∂G1∂y2

(1, 0) = −1, ∂G2∂y1

(1, 0) = 0 og ∂G2∂y2

(1, 0) = 1.♣

Omvendt funksjonsteorem brukes mye bade i teori og anvendelser. I an-vendelser har man ofte behov for a bytte om pa hva som er uavhengige ogavhengige størrelser — istedenfor a tenke pa etterspørselen som en funksjonav prisene, har man plutselig lyst til a tenke pa prisene som funksjon avetterspørselen. Omvendt funksjonsteorem (og særlig formelen med de deri-verte) gjør det enkelt a bytte synsvinkel pa denne maten. I teoretisk arbeid erdet ofte betingelsene som er viktige — vi trenger garantier for at de funksjo-nene vi skal arbeide med, virkelig finnes og har de egenskapene vi ønsker oss.

Bemerkning: At F : DF → VF har en omvendt funksjon betyr at lignings-sytemet y = F(x) har en entydig løsning x ∈ DF for alle y ∈ VF. Omvendt

Page 224: Flervariabel analyse med lineær algebra

442 KAPITTEL 5. ITERASJON OG OPTIMERING

funksjonsteorem kan derfor oppfattes som et result som forteller oss hvordanløsningen x av ligningssystemet y = F(x) avhenger av y. Det er derfor ikkesa rart at det beviset vi skal gi for omvendt funksjonsteorem (se slutten avseksjonen), bygger pa det vi vet om løsbarhet av ligningssystemer (nærmerebestemt pa Banachs fikspunktteorem 5.5.4).

Implisitt funksjonsteorem

Vi skal na se pa en viktig konsekvens av omvendt funksjonsteorem, nemligdet som kalles implisitt funksjonsteorem. Det kan være lurt a ta utgangs-punkt i et konkret eksempel. Vi vet at kuleflaten med radius 1 er beskrevetav ligningen

x2 + y2 + z2 = 1

Denne beskrivelsen av kuleflaten er nyttig for en del formal, men for andrehadde det vært mer effektivt a tenke pa kuleflaten som en funksjonsgraf.Dette er ikke mulig hvis vi vil ha med bade øvre og nedre halvkule, mendersom vi er fornøyd med (for eksempel) øvre halvkule, kan vi løse ligningenovenfor for z og fa

z =√

1− x2 − y2

Dette viser at i hvert fall lokalt (vi innskrenker oss til øvre halvkule) villigningen x2 + y2 + z2 = 1 definere z som en funksjon z = g(x, y) =√

1− x2 − y2 av x og y. Dette eksemplet kan vi generalisere. Anta at vihar en funksjon f(x1, x2, . . . , xm, y) av m+1-variable, og at vi er interesserti mengden av punkter (x1, x2, . . . , xm, y) som tilfredsstiller ligningen

f(x1, x2, . . . , xm, y) = 0

(det er lurt a tenke pa dette som en generalisert flate). Akkurat som ovenforkan vi tenke oss at vi løser denne ligningen for y og far et uttrykk

y = g(x1, x2, . . . , xm)

Da har vi beskrevet den generaliserte flaten var som grafen til en funksjong med m variable. Vi kaller en slik funksjon g en implisitt gitt (eller bareimplisitt) funksjon.

Det er flere grunner til at denne planen kanskje ikke lar seg gjennomføre.Dersom f er funksjonen

f(x1, x2, y) = x21 + x2

2 + y2 + 1

sa har for eksempel ikke ligningen f(x1, x2, y) = 0 løsninger i det hele tatt.Et annet problem er at ligningen kan ha flere løsninger. I halvkuleeksempletovenfor har vi to løsninger

z = ±√

1− x2 − y2

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 443

Disse er greie a skille mellom dersom vi vet at vi vil være pa enten øvreeller nedre halvkule, men det finnes andre eksempler der det er vanskeligerea skjøte ting sammen. Et tredje problem er at det kan være vanskelig aløse ligningen f(x1, x2, . . . , xm, y) = 0 for y selv i de tilfellene der det finnesen løsning. Det er i den siste situasjonen vi virkelig far bruk for teoremetnedenfor. Det forteller oss nar ligningen har en løsning, og gir oss viktiginformasjon om løsningsfunksjonen i de tilfellene der vi ikke greier a regneden ut.

Teorem 5.7.3 (Implisitt funksjonsteorem) Anta at U er en apen del-mengde av Rm+1 og la f : U → R være en funksjon med kontinuerligepartiellderiverte. Anta at (x, y) = (x1, x2, . . . , xm, y) er et punkt i U derf(x, y) = 0. Anta videre at ∂f

∂y (x, y) #= 0. Da finnes det en omegn U0 om x,og en deriverbar funksjon g : U0 → R slik at g(x) = y og

f(x, g(x)) = 0

for alle x ∈ U0. Den deriverte til g er gitt ved

∂g

∂xi(x) = −

∂f∂xi

(x, y)∂f∂y (x, y)

Bevis: La oss begynne med det som kanskje ser vanskeligst ut, men somfaktisk er lettest, nemlig formelen for ∂g

∂xi(x). Anta derfor at vi har greid a

vise at det finnes en deriverbar funksjon g slik at

f(x, g(x)) = 0

i en omegn om x. Partiellderiverer vi begge sider mhp. xi, far vi ifølgekjerneregelen

∂f

∂xi(x, g(x)) +

∂f

∂y(x, g(x))

∂g

∂xi(x) = 0

Setter vi inn x = x, y = g(x) og bruker at ∂f∂y (x, y) #= 0, far vi

∂g

∂xi(x) = −

∂f∂xi

(x, y)∂f∂y (x, y)

som er den formelen vi skulle vise.For a vise at funksjonen g virkelig finnes og er deriverbar, bruker vi et

triks — vi anvender omvendt funksjonsteorem pa funksjonen F : Rm+1 →Rm+1 gitt ved

F(x1, x2, . . . , xm, y) =

x1

x2...

xm

f(x1, x2, . . . , xm, y)

Page 225: Flervariabel analyse med lineær algebra

444 KAPITTEL 5. ITERASJON OG OPTIMERING

Denne funksjonen har Jacobi-matrise

F′(x1, x2, . . . , xm, y) =

1 0 . . . 0 00 1 . . . 0 0...

... . . ....

...0 0 . . . 1 0

∂f∂x1

(x, y) ∂f∂x2

(x, y) . . . ∂f∂xm

(x, y) ∂f∂y (x, y)

Regner vi ut determinanten til Jacobi-matrisen, far vi

det(F′(x1, x2, . . . , xm, y)) =∂f

∂y(x, y)

Setter vi inn (x, y), ser vi at

det(F′(x, y)) =∂f

∂y(x, y) #= 0

ifølge antagelsen i teoremet. Jacobi-matrisen F′(x, y) er dermed inverterbar,og vi kan bruke omvendt funksjonsteorem pa F: Restrikterer vi F til entilstrekkelig liten omegn om (x, y), har den en omvendt funksjon G definertpa en apen mengde V ⊂ Rm+1 som inneholder F(x, y) = (x, f(x, y)) =(x, 0). Pa grunn av den spesielle formen til F, er det lett a se at G ma haformen

G(x1, x2. . . . , xm, z) =

x1

x2...

xm

h(x1, x2, . . . xm, z)

der h er en deriverbar funksjon. Siden G er den omvendte funksjonen til F,har vi videre

F(x1, x2, . . . , xm, h(x1, x2, . . . , xm, z)) = F(G(x1, x2, . . . , xm, z)) =

x1

x2...

xm

z

Pa den annen side vet vi fra definisjonen av F at

F(x1, x2, . . . , xm, h(x1, x2, . . . , xm, z)) =

=

x1

x2...

xm

f(x1, x2, . . . , xm, h(x1, x2, . . . , xm, z))

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 445

Sammenligner vi disse to formlene, ser vi at

z = f(x1, x2, . . . , xm, h(x1, x2, . . . , xm, z))

Setter vi inn z = 0, har vi dermed

f(x1, x2, . . . , xm, h(x1, x2, . . . , xm, 0)) = 0

Vi lar na U0 = {(x1, x2, . . . , xm) | (x1, x2, . . . , xm, 0) ∈ V }, og definererg : U0 → R ved g(x1, x2, . . . , xm) = h(x1, x2, . . . , xm, 0). Det følger fra ut-ledningene ovenfor at g(x) = y, at f(x, g(x)) = 0 for alle x ∈ U0, og at g erderiverbar i y med

∂g

∂xi(x) = −

∂f∂xi

(x, y)∂f∂y (x, y)

Det gjenstar en liten detalj. Teoremet pastar at g er deriverbar i hele om-egnen U0, men vi har bare vist deriverbarhet i punktet x. Dette er lett afikse med et lite triks. Vi bruker argumentene ovenfor pa nytt, men erstatterpunktet (x, y) med et fritt valgt punkt (x, g(x)) der x ∈ U0 (det kan hendevi ma innsnevre U0 noe for a være sikre pa at ∂f

∂y (x, g(x)) #= 0). !

Eksempel 2: Laf(x, y) = ex+y + y − 1

Vi skal vise at det finnes en funksjon g(x) definert i en omegn om 0 slik atg(0) = 0 og f(x, g(x)) = 0. Vi skal ogsa regne ut g′(0).

Vi observerer først at f(0, 0) = e0+0 + 0 − 1 = 0. Videre er ∂f∂y (x, y) =

ex+y + 1, sa ∂f∂y (0, 0) = e0+0 + 1 = 2 #= 0. Dette betyr at det finnes en

(implisitt definert) funksjon g slik at g(0) = 0 og f(x, g(x)) = 0 i en omegnom 0. Den deriverte til g er gitt ved

g′(0) = −∂f∂x (0, 0)∂f∂y (0, 0)

= − e0+0

e0+0 + 1= −1

2

Ofte kan det være lønnsomt a bruke implisitt derivasjon ogsa i situasjo-ner der vi faktisk kan finne et uttrykk for den implisitt gitte funksjonen:

Eksempel 3: Vi skal finne stigningstallene i x- og y-retning i et punkt(x, y, z) pa kuleflaten

x2 + y2 + z2 = R2

Istedenfor a referere eksplisitt til teoremet ovenfor, skal vi bruke implisittderivasjon slik det som regel gjøres i praksis. Vi tenker pa z som en funksjon

Page 226: Flervariabel analyse med lineær algebra

446 KAPITTEL 5. ITERASJON OG OPTIMERING

av x og y og deriverer ligningen ved hjelp av kjerneregelen. Deriverer vi mhp.x, far vi

2x + 2z∂z

∂x= 0

og deriverer vi mhp. y, far vi

2y + 2z∂z

∂y= 0

Dette gir ∂z∂x = −x

z og ∂z∂y = −y

z (forutsatt at z #= 0). Du kan selv brukeimplisitt funksjonsteorem til a rettferdiggjøre disse regningene. ♣

Vi tar ogsa med et eksempel som viser hvordan implisitt derivasjon duk-ker opp i andre fag.

Eksempel 4: Nar man studerer gasser, er det tre naturlige variable; trykketp, temperaturen T og volumet V . I gassmodeller er de knyttet sammengjennom en ligning f(p, V, T ) = 0. Funksjonen f varierer fra en modell til enannen — i teorien for sakalte ideelle gasser er f.eks. f(p, v, T ) = pV −kT derk er en konstant. Siden variablene er knyttet sammen gjennom en ligning,tenker man ofte pa hver av disse størrelsene p, V og T som en funksjonav de to andre. Tenker vi f.eks. pa trykket som en funksjon av volumet ogtemperaturen, har vi en funksjon p(V, T ) som oppfyller ligningen

f(p(V, T ), V, T ) = 0

altsa en implisitt gitt funksjon. Vi kan finne uttrykk for de partiellderivertetil p ved a derivere implisitt. Deriverer vi først mhp. V, far vi

∂f

∂p

∂p

∂V+

∂f

∂V= 0,

mens derivasjon mhp. T gir

∂f

∂p

∂p

∂T+

∂f

∂T= 0,

Løser vi for de partiellderiverte til p, ser vi at

∂p

∂V= −

∂f∂V∂f∂p

og∂p

∂T= −

∂f∂T∂f∂p

Regninger av denne typen (gjerne litt mer innfløkt enn disse) spiller en sen-tral rolle i mange anvendelser. Som oftest argumenterer man uformelt sliksom her; man deriverer ved bruk av kjerneregelen uten a bry seg for mye omderiverbarhet og andre matematiske finurligheter. Ønsker man bedre mate-matiske begrunnelser, er implisitt funksjonsteorem det riktige redskapet. ♣

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 447

Det finnes ogsa en vektorvaluert versjon av implisitt funksjonsteorem.Her tenker vi oss at vi skal finne k variable y1, y2, . . . , yk uttrykt ved m andrevariable x1, x2, . . . , xm. Siden vi har k ukjente, trenger vi ogsa k ligninger, savi starter med en funksjon F : Rm+k → Rk og ønsker a løse ligningssystemet

F(x1, . . . , xm, y1, . . . , yk) = 0

for y1, . . . , yk (legg merke til at ligningssystemet har k ligninger og k ukjen-te). Sagt med andre ord ønsker vi a finne funksjoner g1(x1, . . . , xm), . . . ,gk(x1, . . . , xm) slik at

F(x1, . . . , xm, g1(x1, . . . , xm), . . . , gk(x1, . . . , xm)) = 0

Disse uttrykkene blir enklere om vi bruker vektornotasjon. Skriver vi x =(x1, . . . , xm), y = (y1, . . . , yk) og G(x) = (g1(x), . . . , gk(x)), kan formelenovenfor skrives

F(x,G(x)) = 0

Før vi presenterer den vektorvaluerte versjonen av implisitt funksjons-teorem, trenger vi litt notasjon. Anta at vi har en funksjon F : Rm+k → Rk

som ovenfor, og at vi har delt inn variablene i to grupper x = (x1, . . . , xm)og y = (y1, . . . , yk). Vi lar ∂F

∂x være den Jacobi-matrisen vi far nar vi baretenker pa F som en funksjon av x-variablene, dvs.

∂F∂x

=

∂F1∂x1

∂F1∂x2

. . . ∂F1∂xm

∂F2∂x1

∂F2∂x2

. . . ∂F2∂xm

...... . . .

...

∂Fk∂x1

∂Fk∂x2

. . . ∂Fk∂xm

Tilsvarende lar vi ∂F∂y være den Jacobi-matrisen vi far, nar vi bare tenker pa

F som en funksjon av y-variablene, dvs.

∂F∂y

=

∂F1∂y1

∂F1∂y2

. . . ∂F1∂yk

∂F2∂y1

∂F2∂y2

. . . ∂F2∂yk

...... . . .

...

∂Fk∂y1

∂Fk∂y2

. . . ∂Fk∂yk

Teorem 5.7.4 (Vektorvaluert versjon av implisitt funksjonsteorem)Anta at U er en apen delmengde av Rm+k og la F : U → Rk være en funk-sjon med kontinuerlige partiellderiverte. Anta at (x, y) er et punkt i U der

Page 227: Flervariabel analyse med lineær algebra

448 KAPITTEL 5. ITERASJON OG OPTIMERING

F(x, y) = 0. Anta videre at k× k-matrisen ∂F∂y (x, y) er inverterbar. Da fin-

nes det en omegn U0 om x, og en deriverbar funksjon G : U0 → Rk slik atg(x) = y og

F(x,G(x)) = 0

for alle x ∈ U0. Jacobi-matrisen til G er gitt ved

G′(x) = −(

∂F∂y

(x, y))−1 (

∂F∂x

(x, y))

Vi overlater beviset til leserne. Ideen er akkurat den samme som i detskalarvaluerte tilfellet, men det er litt flere partiellderiverte a holde styr pa.

Bemerkning: Som du sikkert har oppdaget allerede, kan vi oppfatte im-plisitt funksjonsteorem som et teorem om ligningssystemer — vi ønsker aløse ligningssystemet F(x1, . . . , xm, y1, . . . , yk) = 0 med hensyn pa variable-ne y1, . . . , yk, og teoremet gir oss informasjon om hvordan disse løsningeneavhenger av de øvrige variablene x1, . . . , xm.

∗Bevis for omvendt funksjonsteorem

Vi skal dele beviset opp i lemmaer, og det er ikke sa lett a se hvordan altpasser sammen før du har vært gjennom hele resonnementet. Det førstelemmaet er enkelt, men inneholder det grunnleggende eksistensresultatet(det som sikrer at en omvendt funksjon finnes). Utgangspunktet for lemmaeter en selvfølgelighet, nemlig at identitetsavbildningen I(x) = x avbilderkulen B(x, r) injektivt pa B(x, r). Lemmaet viser at en avbildning som ikkeavviker for mye fra I, har en lignende egenskap. Husk at

B(a, r) = {x ∈ Rm : |x− a| ≤ r}

betegner en lukket kule i Rm.

Lemma 5.7.5 (Perturbasjonslemma) La B(0, r) være en lukket kule iRm, og anta at funksjonen H : B(0, r) → Rm er slik at H(0) = 0 og

|H(u)−H(v)| ≤ 12|u− v| for alle u,v ∈ B(0, r)

Da er funksjonen L : B(0, r) → Rm definert ved L(x) = x + H(x) injektiv,og kulen B(0, r

2) er inneholdt i verdimengden til L.

Bevis: La oss først vise at L er injektiv. Vi antar at L(x) = L(y), og mavise at x = y. Per definisjon av L er

x + H(x) = y + H(y)

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 449

dvs.x− y = H(y)−H(x)

som gir|x− y| = |H(x)−H(y)|

Ifølge antagelsene er |H(x)−H(y)| ≤ 12 |x− y|, sa likheten ovenfor er bare

mulig hvis |x− y| = 0, dvs. hvis x = y.Det gjenstar a vise at B(0, r

2) er inneholdt i verdimengden til L. Vi mada vise at for alle y ∈ B(0, r

2), har ligningen L(x) = y en løsning i B(0, r).Denne ligningen kan skrives

x = y −H(x),

sa det er nok a vise at funksjonen K(x) = y − H(x) har et fikspunkt iB(0, r). Dette vil følge av Banachs fikspunktteorem dersom vi kan vise atK er en kontraksjon av B(0, r). La oss først vise at K avbilder B(0, r) inni B(0, r). Det følger av at

|K(x)| = |y −H(x)| ≤ |y| + |H(x)| ≤ r

2+

r

2= r

der vi har brukt at ifølge betingelsene pa H er

|H(x)| = |H(x)−H(0)| ≤ 12|x− 0| ≤ r

2

Til slutt sjekker vi kontraksjonsbetingelsen:

|K(u)−K(v)| = |H(u)−H(v)| ≤ 12|u− v|

Dermed har vi vist at K er en kontraksjon, og følgelig har den et entydigfikspunkt i B(0, r). !

I det neste lemmaet skal vi vise at omvendt funksjonsteorem gjelderfor funksjoner L slik at L(0) = 0 og L′(0) = Im. Dette kan høres veldigspesielt ut, men det viser seg at det generelle tilfellet følger ved et enkeltvariabelskifte.

Lemma 5.7.6 Anta U er et omrade i Rm som inneholder 0 og at L : U →Rm er en funksjon med kontinuerlige partiellderiverte slik at L(0) = 0 ogL′(0) = Im. Da finnes det en r > 0 slik at L er injektiv nar den restrik-teres til B(0, r) og har en omvendt funksjon M definert pa et omrade sominneholder B(0, r

2). Den omvendte funksjonen M er deriverbar i 0 og harJacobi-matrise M′(0) = Im.

Page 228: Flervariabel analyse med lineær algebra

450 KAPITTEL 5. ITERASJON OG OPTIMERING

Bevis: La H(x) = L(x)−x. Vi skal først vise at H tilfredsstiller betingelsenei lemmaet over. Observer først at siden L(0) = 0 og L′(0) = Im, sa erH(0) = 0 og alle de partiellderiverte ∂Hi

∂xj(0) er lik 0. Spesielt er ∇Hi(0) = 0

for alle i. Bruker vi middelverdisetningen for funksjoner av flere variable(setning 3.2.3 alias setning 5.5.5) pa Hi, far vi dermed

Hi(x)−Hi(y) = ∇Hi(ci) · (x− y) = (∇Hi(ci)−∇Hi(0)) · (x− y)

Siden de partiellderiverte til H er kontinuerlige, kan vi fa (∇Hi(ci)−∇Hi(0))sa liten vi matte ønske ved a velge x og y tilstrekkelig nær 0. Spesielt finnesdet en r > 0 slik at hvis |x|, |y| ≤ r, sa er |∇Hi(ci) − ∇Hi(0)| ≤ 1

2√

mfor

alle i. Bruker vi Schwarz’ ulikhet, ser vi at

|Hi(x)−Hi(y)| ≤ |∇Hi(ci)−∇Hi(0)| |x− y| ≤ 12√

m|x− y|

og

|H(x)−H(y)| =√

(H1(x)−H1(y))2 + . . . + (Hm(x)−Hm(y))2 ≤

m

(1

2√

m|x− y|

)2

=12|x− y|

Dermed har vi vist at H tilfredsstiller betingelsene i forrige lemma, ogsiden

L(x) = x + H(x),

vet vi fra lemmaet at L restriktert til B(0, r) er injektiv og at verdimengdeninneholder B(0, r

2). Dette betyr at L (restriktert til B(0, r)) har en omvendtfunksjon M som er definert pa et omrade som omfatter B(0, r

2).Det gjenstar a vise at M er deriverbar i 0 med Jacobi-matrise Im, men

før vi gar løs pa deriverbarheten, trenger vi et lite estimat. Ifølge trekant-ulikheten har vi

|x| = |L(x)−H(x)| ≤ |L(x)| + |H(x)| ≤ |L(x)| + 12|x|

som gir12|x| ≤ |L(x)|

nar vi flytter over.Vi er na klar til a vise at den omvendte funksjonen M til L er deriverbar

i 0 med Jacobi-matrise Im. Ifølge Setning 2.6.4 er det nok a vise at

lim|y|→0

M(y)−M(0)− Imy|y| = 0

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 451

Siden M(0) = 0 og Imy = y, er dette det samme som

lim|y|→0

M(y)− y|y| = 0

Siden vi er interessert i grensen nar |y|→ 0, kan vi nøye oss med a betraktey ∈ B(0, r

2). For hver slik y vet vi at det finnes en entydig bestemt x i B(0, r)slik at y = L(x) og x = M(y). Setter vi dette inn i uttrykket ovenfor, far vi

lim|y|→0

M(y)− y|y| = lim

|y|→0

x− L(x)|y| = − lim

|y|→0

L(x)− Imx|x| · |x||y|

Siden 12 |x| ≤| L(x)| = |y|, vil |x| ga mot null nar |y| gar mot null. Siden L

er deriverbar i 0 med Jacobi-matrise Im, er derfor

lim|y|→0

L(x)− Imx|x| = lim

|x|→0

L(x)− L(0)− Imx|x| = 0

Siden faktoren |x||y| = |x|

|L(x)| ≤|x|12 |x|

= 2 er begrenset, følger det at

lim|y|→0

M(y)− y|y| = − lim

|y|→0

L(x)− Imx|x| · |x||y| = 0

Dermed er lemmaet bevist. !

Vi kan na bevise omvendt funksjonsteorem. For at du skal slippe a blafor mye, skriver vi det opp pa nytt.

Teorem 5.7.7 (Omvendt funksjonsteorem) Anta at U er en apen meng-de i Rm og at F : U → Rm har kontinuerlige partiellderiverte. Anta at x ∈ Uog at Jacobi-matrisen F′(x) er inverterbar. Da finnes det en omegn U0 ⊂ Uom x slik at F restriktert til U0 er injektiv. Verdimengden V til denne restrik-sjonen er en omegn om y = F(x), og den omvendte funksjonen G : V → U0

er deriverbar i y med Jacobi-matrise

G′(y) = F′(x)−1

Bevis: Planen er a omdanne F til en funksjon L som tilfredsstiller betingel-sene i foregaende lemma. Denne funksjonen L har da en omvendt funksjonM som vi kan omdanne til en omvendt funksjon G for F. Nar vi har funnetG, er det lett a sjekke at den har de egenskapene som teoremet angir.

Vi begynner med a definere funksjonen L ved

L(x) = A (F(x + x)− y)

der A = F′(x)−1. Siden F er definert i en omegn rundt x, er L definert i enomegn rundt 0. Vi ser ogsa at

L(0) = A (F(x)− y) = 0

Page 229: Flervariabel analyse med lineær algebra

452 KAPITTEL 5. ITERASJON OG OPTIMERING

siden F(x) = y. Videre gir kjerneregelen

L′(x) = AF′(x + x),

sa

L′(0) = AF′(x) = Im

siden A = F′(x)−1.Dette betyr at L oppfyller betingelsene i lemmaet ovenfor, og at L re-

striktert til en kule B(0, r) har en invers funksjon M definert pa en mengdesom inneholder B(0, r

2). For a finne en invers funksjon til F observerer vi atdersom vi snur litt pa ligningen L(x) = A (F(x + x)− y), far vi

F(x) = A−1L(x− x) + y

for alle x ∈ B(x, r). Siden L er injektiv og A−1 er inverterbar, følger detat F er injektiv pa B(x, r). For a finne den omvendte funksjonen, løser viligningen

y = A−1L(x− x) + y

med hensyn pa y og far

x = x + M(A(y − y))

Dette betyr at F restriktert til x ∈ B(x, r) har en invers funksjon G definertved

G(y) = x + M(A(y − y))

Siden definisjonsmengden til M omfatter hele B(0, r2), vil definisjonsmeng-

den til G omfatte alle y slik at |A(y− y)| ≤ r2 . Siden |A(y− y)| ≤ |A||y− y|,

inkluderer dette B(y, r2|A|), og følgelig er G definert i en omegn om y.

Resten er lett. Siden M er deriverbar og G(y) = x + M(A(y − y)),forteller kjerneregelen oss at G er deriverbar med Jacobi-matrise

G′(y) = M′(A(y − y))A

Setter vi inn y = y og bruker at M′(0) = Im, far vi

G′(y) = ImA = F′(x)−1

siden A per definisjon er lik F′(x)−1. !

5.7. OMVENDTE OG IMPLISITTE FUNKSJONER 453

Oppgaver til seksjon 5.7

1. Vis at funksjonen F(x, y) =(

x2 + y + 1x− y − 2

)har en omvendt funksjon G defi-

nert i en omegn rundt (1,−2) slik at G(1,−2) = (0, 0). Finn den deriverte til G ipunktet (1,−2). Vis at F ogsa har en omvendt funksjon H definert i en omegn om(1,−2) slik at H(1,−2) = (−1,−1). Finn H′(1,−2).

2. Vis at funksjonen F(x, y) =(

ex+y2−1

x− y

)har en omvendt funksjon G de-

finert i en omegn rundt (1,−1) slik at G(1,−1) = (0, 1). Finn G′(1,−1). Visat F har en annen omvendt funksjon H definert i en omegn om (1,−1) slik atH(1,−1) = (−3,−2). Finn H′(1,−1)

3. Vis at gjennom ethvert punkt (x0, y0) pa kurven med ligning x3 +y3 +y = 1 gardet en funksjon y = f(x) som tilfredsstiller ligningen. Finn f ′(x0).

4. La f : R3 → R være funksjonen f(x, y, z) = xy2ez + z. Vis at det finnesen funksjon g(x, y) definert i en omegn om (−1, 2, 0) slik at g(−1, 2) = 0 ogf(x, y, g(x, y)) = −4. Finn ∂g

∂x (−1, 2) og ∂g∂y (−1, 2).

5. (Eksamen i MAT 1110 13/6, 2008)

a) Finn den inverse matrisen til

A =

1 0 12 1 11 0 −2

b) Finn Jacobi-matrisen til funksjonen F : R3 → R3 nar

F(x, y, z) =

x + z

x2 + 12y2 + z

x + z2

Vis at F har en omvendt funksjon G definert i en omegn rundt (0, 12 , 2) slik

at G(0, 12 , 2) = (1, 1,−1). Finn G′(0, 1

2 , 2).

6. Finn stigningstallet til tangenten til ellipsen x2

a2 + y2

b2 = 1 i punktet (x0, y0), y0 #= 0.

7. Finn stigningstallet til tangenten til hyperbelen x2

a2 − y2

b2 = 1 i punktet (x0, y0),y0 #= 0.

8. Finn stigningstallet til tangenten til parabelen y2 = 4ax i punktet (x0, y0),y0 #= 0.

9. Nar man løser differensialligninger, finner man ofte ut at løsningene tilfredsstilleren ligning av typen φ(x, y(x)) = C der C er en konstant. Vis at y′(x) = −

∂φ∂x (x,y(x))∂φ∂y (x,y(x))

forutsatt at de partiellderiverte eksisterer og ∂φ∂y (x, y(x)) #= 0.

Page 230: Flervariabel analyse med lineær algebra

454 KAPITTEL 5. ITERASJON OG OPTIMERING

10. En funksjon z(x, y) tilfredsstiller ligningen

x + y2 + z3 = 3xyz

Finn ∂z∂x og ∂z

∂y .

11. En funksjon z(x, y) tilfredsstiller ligningen

2x2 + 3y2 + z2 = e−z

Finn ∂z∂x og ∂z

∂y .

12. Vis at det finnes funksjoner u(x, y) og v(x, y) definert i et omrade rundt (2,−1)som tilfredsstiller ligningene

x2 − y2 − u2 + v2 = 0

2xy + y2 − 2u2 + 3v4 + 8 = 0

og u(2,−1) = 2, v(2,−1) = 1. Finn ∂u∂x (2,−1) og ∂v

∂x (2,−1).

13. I oppgaver om “koblede hastigheter” (Kalkulus, seksjon 7.2) møter vi dennesituasjon: Vi vet hvor fort en størrelse y endrer seg (dvs. vi kjenner y′(t)) og viønsker a regne ut hvor fort en annen størrelse x endrer seg (dvs. vi vil finne x′(t)).De to størrelsene er bundet sammen med en ligning φ(x(t), y(t)) = 0.

a) Vis at x′(t) = −∂φ∂y (x(t),y(t))∂φ∂x (x(t),y(t))

y′(t). Hvilke forutsetninger har du gjort i regne-stykket ditt?

b) I noen oppgaver kjenner vi to hastigheter y′(t) og z′(t), og har en ligningφ(x(t), y(t), z(t)) = 0. Finn et uttrykk for x′(t) i dette tilfellet.

14. Anta at φ(x, y, z) er en deriverbar funksjon og at det finnes deriverbare funk-sjoner X(y, z), Y (x, z) og Z(y, z) slik at

φ(X(y, z), y, z) = 0 φ(x, Y (x, z), z) = 0 og φ(x, y, Z(x, y)) = 0

Vis at vi har (under passende betingelser)

∂X

∂y· ∂Y

∂z· ∂Z

∂x= −1

Denne relasjonen skrives ofte med sma bokstaver:

∂x

∂y· ∂y

∂z· ∂z

∂x= −1

og er da til skrekk og advarsel for folk som liker a forkorte ∂x, ∂y og ∂z.

5.8 Ekstremalverdisetningen

I resten av kapitlet skal vi konsentrere oss om maksimums- og minimums-problemer for funksjoner av flere variable. Fra teorien for funksjoner av en

5.8. EKSTREMALVERDISETNINGEN 455

variabel husker vi ekstremalverdisetningen (se Kalkulus, seksjon 5.3) somsier at en kontinuerlig funksjon definert pa et lukket, begrenset intervall erbegrenset og har maksimums- og minimumspunkter. I denne seksjonen skalvi bevise et tilsvarende resultat for kontinuerlige funksjoner av flere variabledefinert pa lukkede, begrensede mengder. Vi begynner med noen definisjo-ner.

Definisjon 5.8.1 Anta f : A → R er en funksjon av m variable. Vi sier atf er begrenset dersom det finnes tall K, M slik at

K ≤ f(x) ≤ M for alle x ∈ A

Vi sier at c ∈ A er et (globalt) maksimumspunkt for f dersom

f(c) ≥ f(x) for alle x ∈ A

og vi sier at d ∈ A er et (globalt) minimumspunkt for f dersom

f(d) ≤ f(x) for alle x ∈ A

Dersom en funksjon har maksimums- og minimumspunkter, er den apen-bart begrenset, men det finnes mange eksempler pa funksjoner som er be-grenset, men ikke har maksimums- og/eller minimumspunkter. Det er hellerikke uvanlig at en funksjon er ubegrenset til tross for at den er definertpa en begrenset mengde. For kontinuerlige funksjoner definert pa lukkede,begrensede mengder er det imidlertid orden i sakene:

Setning 5.8.2 (Ekstremalverdisetningen) Anta at A er en lukket, be-grenset delmengde av Rm og at f : A → R er kontinuerlig. Da har f mini-mumspunkter og maksimumspunkter og er følgelig begrenset.

Bevis: Vi skal vise at f har et maksimumspunkt. Beviset for minimumspunkter helt likt og overlates til leserne. La

M = sup{f(x) : x ∈ A}

der vi er enig om a sette M = ∞ dersom f ikke er oppad begrenset. Velg enfølge {xn} i A slik at f(xn) → M nar n → ∞ (dette er mulig uansett omM er endelig eller uendelig). Siden A er lukket og begrenset, har {xn} enkonvergent delfølge {xnk} ifølge teorem 5.2.3 (Bolzano-Weierstrass’ teorem).Siden A er lukket, ligger grensepunktet c til denne delfølgen i A (setning5.1.6), og ifølge setning 5.1.7 er

limk→∞

f(xnk) = f(c)

Pa den annen side er limk→∞ f(xnk) = M (siden f(xn) → M nar n →∞).Dermed ma

f(c) = M

Page 231: Flervariabel analyse med lineær algebra

456 KAPITTEL 5. ITERASJON OG OPTIMERING

Dette viser at M er endelig (f kan ikke ha verdien ∞ i et punkt c) og at cer et maksimumspunkt for f . !

Bemerkning: Beviset ovenfor er det samme som du finner for det en-dimensjonale tilfellet i Kalkulus, men siden vi har gjort en del forarbeid(spesielt teorem 5.2.3), er det atskillig kortere.

Oppgaver til seksjon 5.8

1. Anta at A er en lukket, begrenset delmengde av Rm og at F : A → Rk er konti-nuerlig. Vis at det finnes et tall K slik at |F(x)| ≤ K for alle x ∈ A.

2. Anta at f : Rm → R er en positiv funksjon slik at lim|x|→∞ f(x) = 0. Vis at fhar et maksimumspunkt.

3. La A være en lukket og begrenset delmengde av Rm og anta at F : A → A er enkontinuerlig funksjon.

a) Vis at funksjonen f : A → R gitt ved f(x) = |x − F(x)| er kontinuerlig.Forklar at f har et minimumspunkt.

b) Anta at |F(x) − F(y)| < |x − y| for alle x,y ∈ A, x #= y. Vis at F har etentydig fikspunkt. Hint: Bruk minimumspunktet fra a).

c) Vis ved et eksempel at dersom vi dropper betingelsen om at A er lukket ogbegrenset, sa behøver ikke F ha et fikspunkt.

5.9 Maksimums- og minimumspunkter

Hvordan finner vi maksimums- og minimumsverdier for funksjoner av flerevariable? For funksjoner av en variabel vet vi at vi først ma finne de punkteneder den førstederiverte er null, og deretter undersøke hva slags punkter detteer ved enten a se pa fortegnskiftet til den førstederiverte eller pa fortegnettil den annenderiverte. I denne seksjonen skal vi se at det er en tilsvarendeteori for funksjoner av flere variable. Hovedideene er de samme som i detenvariable tilfellet, men siden geometrien er rikere, er det flere muligheter aholde styr pa i den flervariable teorien.

I forrige seksjon definerte vi (globale) maksimums- og minimumspunkterfor funksjoner av flere variable. Vi kan imidlertid ikke regne med a finne deglobale ekstremalpunktene direkte, men ma ga veien om lokale maksima ogminima. Før vi skriver opp definisjonen, minner vi om at snittet C ∩D avto mengder C og D bestar av de punktene som er med i bade C og D.

Definisjon 5.9.1 La f : A → R være en funksjon av m variable. Vi sier ata ∈ A er et lokalt maksimumspunkt for f dersom det finnes en kule B(a, r)med sentrum i a slik at f(a) ≥ f(y) for alle y ∈ B(a, r) ∩ A. Tilsvarendekalles a et lokalt minimumspunkt dersom det finnes en kule B(a, r) slik at

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 457

f(a) ≤ f(y) for alle y ∈ B(a, r) ∩ A. Vi bruker lokale ekstremalpunktersom et fellesnavn pa lokale maksimal- og minimalpunkter.

Lokale maksimumspunkter ser litt forskjellig ut ettersom de er indrepunkter eller randpunkter. Figur 1 viser noen av mulighetene. Et lokaltmaksimum i det indre kan f.eks. være en “fjelltopp” som den høyeste top-pen pa figuren, eller det kan være et punkt pa en “askam” som de andrelokale maksimumspunktene i det indre. I begge disse tilfellene er det lett aforestille seg at alle de partiellderiverte i punktet er 0. Dette behøver imid-lertid ikke være tilfellet for lokale maksimumspunkter pa randen. Grafen ifigur 1 har lokale maksimumspunkter i hjørnene av definisjonsomradet (defire “flippene” i kanten av figuren), men de partiellderiverte i disse punkteneer ikke 0 — punktene ligger i en “skraning” der funksjonen hadde fortsatt astige hvis den var blitt forlenget pa naturlig mate utover definisjonsomradetsitt.

Figur 1: Lokale ekstremalpunkter i det indre og pa randen

I denne seksjonen skal vi stort sett konsentrere oss om jakten pa lokaleekstremalpunkter i det indre av definisjonsomradet. I neste seksjon skal vise pa en teknikk som (blant annet) kan brukes til a finne mulige ekstre-malpunkter pa randen. La oss aller først bevise at det virkelig er slik at departiellderiverte er null i alle lokale ekstremalpunkter i det indre.

Setning 5.9.2 Anta at en funksjon f : A → R har et lokalt maksimum ellerminimum i et indre punkt a. Dersom f er deriverbar i a, ma ∇f(a) = 0,dvs. at ∂f

∂xi(a) = 0 for alle i.

Bevis: Vi fører resultatet tilbake til det tilsvarende resultatet for funksjonerav en variabel (Kalkulus, setning 6.2.1). Anta at f har et lokalt maksimumi a = (a1, a1, . . . , am) (beviset for et lokalt minimum er helt tilsvarende). Lag være funksjonen av en variabel definert ved

g(xi) = f(a1, a2, . . . , xi, . . . , am)

Page 232: Flervariabel analyse med lineær algebra

458 KAPITTEL 5. ITERASJON OG OPTIMERING

(g er altsa funksjonen vi far nar vi “fryser” alle variablene i f unntatt den i-te). Da ma g ha et lokalt maksimum for xi = ai, og følgelig er g′(ai) = 0. Perdefinisjon av partiellderiverte er ∂f

∂xi(a) = g′(ai), og dermed er ∂f

∂xi(a) = 0. !

Ved hjelp av setningen ovenfor kan vi innskrenke jakten pa mulige maksimums-og minimumspunkter betraktelig.

Eksempel 1: La oss forsøke a lokalisere eventuelle maksimums- og mini-mumspunkter for funksjonen

f(x, y) = 3xy − 3x + 9y

Vi deriverer:∂f

∂x= 3y − 3 og

∂f

∂y= 3x + 9

Ifølge setningen ovenfor bør vi se etter punkter hvor begge de partiellderi-verte er null. Dette gir ligningssystemet

3y − 3 = 0 og 3x + 9 = 0

som har løsningen x = −3, y = 1. Dette betyr at det eneste mulige maksi-mums- eller minimumspunktet til f er (−3, 1), og at den tilsvarende funk-sjonsverdien er f(−3, 1) = 9.

Neste spørsmal er om (−3, 1) virkelig er et lokalt maksimums- eller mini-mumspunkt. For a avgjøre dette skal vi bruke et triks som av og til er nyttig.Vi innfører nye variable x′ og y′ slik at punktet (−3, 1) blir det nye origo,det vil si at vi setter

x′ = x− (−3) = x + 3y′ = y − 1

Legg merke til at (x′, y′) → (0, 0) nar (x, y) → (−3, 1). Siden x = x′ − 3,y = y′ + 1, ser vi at

f(x, y) = 3xy − 3x + 9y = 3(x′ − 3)(y′ + 1)− 3(x′ − 3) + 9(y′ + 1)= 3x′y′ + 3x′ − 9y′ − 9− 3x′ + 9 + 9y′ + 9= 9 + 3x′y′

Vi ser at hvis x′ og y′ har samme fortegn, sa vil f(x, y) være større ennf(−3, 1) = 9. Har derimot x′ og y′ motsatt fortegn, vil f(x, y) være mindreenn 9. Altsa kan (−3, 1) hverken være et lokalt maksimum eller et lokaltminimum.

La oss til slutt bruke MATLAB til a fa et bedre inntrykk av funksjonen.Skriver vi

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 459

>> x=-5:0.1:1;>> y=-1:0.1:3;>> [x,y]=meshgrid(x,y);>> z=3.*x.*y-3*x+9*y;>> mesh(x,y,z)

svarer MATLAB med figur 2 (etter at vi har rotert litt pa aksene for a fa etoversiktlig bilde).

Figur 2: Et sadelpunkt

Legg merke til at grafen minner litt om en sal (pa en hest), og at “vartpunkt” (−3, 1) ligger pa det stedet der man naturlig sitter pa salen. Som visnart skal komme tilbake til, kalles slike punkter “sadelpunkter”. ♣

Eksemplet ovenfor peker pa det som skal være hovedproblemstillingeni resten av denne seksjonen: Hvis ∇f(a) = 0, hvordan avgjør vi da pa eneffektiv mate om a er et lokalt maksimum, minimum eller ingen av delene?Teknikken med a skifte variable er nyttig i en del enkle tilfeller, men vitrenger tyngre skyts for a kunne behandle mer kompliserte uttrykk.

La oss begynne med a innføre litt terminologi. Et punkt a der ∇f(a)=0vil vi kalle et stasjonært punkt for funksjonen f . Et stasjonært punkt somhverken er et lokalt maksimum eller et lokalt minimum, vil vi kalle et sadel-punkt (se figur 2 ovenfor). Som vi allerede har vært inne pa, er det ikkevanskelig a forsta hvor det siste navnet kommer fra – det punktet du sitterpa nar du rir pa en hest, er et typisk eksempel pa et sadelpunkt; det er etminimum nar du beveger deg i hestens lengderetning og et maksimum nadu beveger deg pa tvers av hesten.

Vi tar med et eksempel til pa hvordan man finner stasjonære punkter.

Eksempel 2: Finn de stasjonære punktene til

f(x, y) = x2 − y2 + 4xy − 7x + 3y

Page 233: Flervariabel analyse med lineær algebra

460 KAPITTEL 5. ITERASJON OG OPTIMERING

Vi deriverer:∂f

∂x= 2x + 4y − 7

∂f

∂y= −2y + 4x + 3

Dette gir ligningene

2x + 4y = 74x− 2y = −3

Løser vi dette ligningssystemet, far vi x = 110 , y = 17

10 . Det betyr at punktet( 110 , 17

10) er et stasjonært punkt for f .Kjører vi MATLAB pa samme mate som i forrige eksempel, far vi grafen

pa figur 3.

Figur 3: Grafen til f(x, y) = x2 − y2 + 4xy − 7x + 3y

Den viser at vi ogsa i dette tilfellet har et sadelpunkt. ♣

Bemerkning: Legg merke til at nar vi skal finne de stasjonære punktenetil en funksjon f av m variable x1, x2, . . . , xm, ma vi løse et ligningssystemmed m ukjente og m ligninger:

∂f

∂x1(x1, x2, . . . , xm) = 0

∂f

∂x2(x1, x2, . . . , xm) = 0

...... =

...∂f

∂xm(x1, x2, . . . , xm) = 0

Dette er et system av den typen som vi brukte Newtons metode til a løsei seksjon 5.6. Nar vi far et maks/min-problem i flere variable som gar utover det aller enkleste, ma vi regne med a bruke numeriske metoder for afinne løsningen. Newton’s metode er en mulighet, men som vi skal se senere(seksjon 5.11), finnes det ogsa mer direkte metoder.

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 461

Taylors formel

Nar vi arbeider med funksjoner av to variable slik som i eksemplene oven-for, kan vi ofte bruke MATLAB eller et lignende verktøy til a undersøkeom de stasjonære punktene vare er minimumspunkter, maksimumspunktereller sadelpunkter. Hvis funksjonsgrafen er svært flat i omradet rundt detstasjonære punktet, kan det imidlertid være vanskelig a avgjøre visuelt hvaslags punkt vi har med a gjøre. Arbeider vi med funksjoner av flere ennto variable, er det atskillig verre a bruke visuelle hjelpemidler. Vi trengerderfor en teori som kan hjelpe oss i klassifiseringen av stasjonære punkter.

For funksjoner av en variabel har vi et slikt hjelpemiddel, nemlig annen-deriverttesten. Den sier at hvis f er en funksjon av en variabel med f ′(a) = 0,sa er a er et lokalt minimum dersom f ′′(a) > 0 og at a er et lokalt maksimumdersom f ′′(a) < 0. Nar f ′′(a) = 0, gir testen ingen konklusjon. Vart mal era lage en tilsvarende test for funksjoner av flere variable. Dette arbeidet erganske komplisert fordi en funksjon av flere variable har sa mange forskjelli-ge annenderiverte, og de ma kombineres pa riktig mate for a fa en test somvirker. Heldigvis skal vi fa hjelp av det vi vet om lineær algebra og basiserav egenverdier.

Dersom f(x1, . . . , xm) er en to ganger deriverbar funksjon av m variable,kan vi skrive opp alle de annenordens partiellderiverte som en m×m matrise:

Hf(a) =

∂2f∂x2

1(a) ∂2f

∂x1∂x2(a) . . . . . . ∂2f

∂x1∂xm(a)

∂2f∂x2∂x1

(a) ∂2f∂x2

2(a) . . . . . . ∂2f

∂x2∂xm(a)

......

∂2f∂xm∂x1

(a) ∂2f∂xm∂x2

(a) . . . . . . ∂2f∂x2

m(a)

Vi kaller dette Hesse-matrisen til f i punktet a (ikke bland Hesse-matrisen,som er en matrise av annenderiverte til et skalarfelt, sammen med Jacobi-matrisen, som er en matrise av førstederiverte til en vektorvaluert funksjon!).Foreløpig er Hesse-matrisen bare en grei mate a skrive opp de annenordenspartiellderiverte pa, men vi skal snart se at den ogsa har matematisk betyd-ning.

Vi husker fra seksjon 2.5 at dersom de blandede partiellderiverte ∂2f∂xi∂xj

(a)

og ∂2f∂xj∂xi

(a) er kontinuerlige, sa er de like. Det betyr at Hesse-matrisenHf(a) er symmetrisk. Fra lineær algebra (spektralteoremet 4.10.6) vet vi atHf(a) da ma ha m reelle egenverdier λ1(a),λ2(a), . . . ,λm(a) (flere av demkan være like). Det viser seg at det er fortegnet til disse egenverdiene somavgjør om et stasjonært punkt er et lokalt maksimum, et lokalt minimumeller et sadelpunkt. Dersom alle egenverdiene er positive, sa er a et lokaltminimum, dersom alle er negative, sa er a et lokalt maksimum, og dersomdet finnes egenverdier med motsatte fortegn, sa er a et sadelpunkt.

Page 234: Flervariabel analyse med lineær algebra

462 KAPITTEL 5. ITERASJON OG OPTIMERING

For a forsta hva Hesse-matrisen har a gjøre med lokale maksimums- ogminimumspunkter, ma vi først studere Taylors formel for funksjoner av flerevariable.

Setning 5.9.3 (Taylors formel) La f være en funksjon av m variable.Anta at de annenordens partiellderiverte til f er kontinuerlige i en kuleB(a, r) om a. For enhver y ∈ Rm med |y| < r finnes det et tall c ∈ (0, 1)slik at

f(a + y) = f(a) +∇f(a) · y +12(Hf(a + cy)y) · y

I dette uttrykket er Hf(a + cy)y matriseproduktet av matrisen Hf(a + cy)og (søylevektoren) y, mens (Hf(a + cy)y) · y er skalarproduktet mellom tovektorer.

Bevis: Definer en funksjon g av en variabel ved

g(t) = f(a + ty).

Bruker vi kjerneregelen for funksjoner av flere variable, ser vi at

g′(t) =m∑

i=1

∂f

∂xi(a + ty)yi = ∇f(a + ty) · y

Bruker vi kjerneregelen pa nytt, far vi

g′′(t) =m∑

i=1

m∑

j=1

∂2f

∂xj∂xi(a + ty)yiyj

Dette uttrykket kan ogsa skrives pa matriseform

g′′(t) = (Hf(a + ty)y) · y

(skriv opp uttrykket til høyre pa koordinatform og skjekk at dette stemmer).Taylors formel for funksjoner av en variabel (se Kalkulus, seksjon 11.2)

forteller oss at det finnes et tall mellom 0 og 1 slik at

g(1) = g(0) + g′(0) +12g′′(c)

Setter vi inn uttrykkene ovenfor, far vi

f(a + y) = f(a) +∇f(a) · y +12(Hf(a + cy)y) · y

!

Taylors formel forteller oss at i et stasjonært punkt a er det fortegnet til(Hf(a + cy)y) · y som avgjør om f(a + y) er større enn eller mindre ennf(a) (husk at i et stasjonært punkt er ∇f(a) = 0). Det hadde vært fint omvi kunne ha byttet ut (Hf(a + cy)y) · y med (Hf(a)y) · y i dette utsagnet,siden vi har mye bedre kontroll over punktet a enn over a + cy. Den nesteversjonen av Taylors formel sier at vi kan gjøre dette byttet uten a mattebetale altfor mye.

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 463

Setning 5.9.4 (Taylors formel, versjon 2) La f være en funksjon av mvariable. Anta at de annenordens partiellderiverte til f er kontinuerlige i enomegn om a. Da finnes det en funksjon ε av m variable slik at

limy→0

ε(y) = 0

og

f(a + y) = f(a) +∇f(a) · y +12(Hf(a)y) · y + ε(y)|y|2

for alle tilstrekkelige sma y ∈ Rm.

Bemerkning: Setningen ovenfor forteller oss at hvis vi tilnærmer f(a + y)med f(a) + ∇f(a) · y + 1

2(Hf(a)y) · y, sa gjør vi (for sma y) en feil somer liten sammenlignet med |y|2. Siden 1

2(Hf(a)y) · y typisk er av sammestørrelse som |y|2, betyr dette at det nest siste leddet vil dominere overfeilleddet ε(y)|y|2.

Bevis for versjon 2 av Taylors formel : Tar vi utgangspunkt i den førsteversjonen av Taylors formel og legger til og trekker fra 1

2(Hf(a)y) · y pahøyresiden, far vi

f(a + y) = f(a) +∇f(a) · y +12(Hf(a)y) · y

+12[(Hf(a + cy)−Hf(a)) · y]y

Vi forenkler notasjonen ved a sette

A(y) =12(Hf(a + cy)−Hf(a))

Legg merke til at A(y) er en m × m-matrise der koeffisientene aij(y) garmot null nar y gar mot 0.

Uttrykket for f(a + y) kan na skrives

f(a + y) = f(a) +∇f(a) · y +12(Hf(a)y) · y + (A(y)y) · y

Sammenligner vi dette med formelen i setningen, ser vi at vi ma sette

ε(y) =(A(y)y) · y

|y|2 =(A(y)

y|y|

)· y|y|

Det gjenstar a vise at limy→0

ε(y) = 0, men det er lett:

limy→0

|ε(y)| = limy→0

∣∣∣m∑

i,j=1

aij(y)yi

|y| ·yj

|y|

∣∣∣ ≤

≤ limy→0

m∑

i,j=1

|aij(y)| = 0

Page 235: Flervariabel analyse med lineær algebra

464 KAPITTEL 5. ITERASJON OG OPTIMERING

hvor vi har brukt at |yi||y| ,

|yj ||y| ≤ 1 og at lim

y→0aij(y) = 0. !

For a utnytte Taylors formel trenger vi et enkelt resultat fra lineær al-gebra.

Lemma 5.9.5 La A være en symmetrisk m×m-matrise.

a) Anta at alle egenverdiene til A er positive: 0 < λ1 ≤ λ2 ≤ . . . ≤ λm.Da er

(Ay) · y ≥ λ1|y|2

for alle y ∈ Rm

b) Anta at alle egenverdiene til A er negative: 0 > λ1 ≥ λ2 ≥ . . . ≥ λm.Da er

(Ay) · y ≤ λ1|y|2

for alle y ∈ Rm

Bevis: a) La v1,v2 . . . ,vm være en ortonormal basis av egenvektorer for Aslik at vi har egenverdi λi. Observer først at hvis y = c1v1 + c2v2 + . . . +cmvm =

∑mi=1 civi, sa er

|y|2 = y · y = (m∑

i=1

civi) · (m∑

j=1

cjvj) =

=m∑

i,j=1

cicj(vi · vj) = c21 + c2

2 + . . . + c2m

der vi har brukt at vi · vj er 1 dersom i = j og 0 ellers. Videre er

Ay = A(c1v1 + c2v2 + . . . + cmvm) = c1λ1v1 + c2λ2v2 + . . . + cmλmvm

Ved en tilsvarende regning som ovenfor ser vi at

(Ay) · y = (c1λ1v1 + c2λ2v2 + . . . + cmλmvm) · (c1v1 + c2v2 + . . . + cmvm)= c2

1λ1 + c22λ2 + . . . + c2

mλm ≥ λ1(c21 + c2

2 + . . . + c2m) ≥ λ1|y|2

b) Bruk punkt a) pa matrisen (−A). !

Annenderiverttesten

Vi er na klare til a vise hovedresultatet i dette kapitlet.

Teorem 5.9.6 (Annenderiverttesten) La a være et stasjonært punkt foren funksjon f av m variable. Anta at de annenordens partiellderiverte til fer kontinuerlige i en omegn om a. Da gjelder:

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 465

a) Hvis alle egenverdiene til Hf(a) er (strengt) positive, sa er a et lokaltminimumspunkt.

b) Hvis alle egenverdiene til Hf(a) er (strengt) negative, sa er a et lokaltmaksimumspunkt.

c) Hvis Hf(a) har bade (strengt) positive og (strengt) negative egenver-dier, sa er a et sadelpunkt.

Dersom noen av egenverdiene til Hf(a) er null og de andre har sammefortegn, sa gir testen ingen konklusjon.

Bevis: a) La λ1 være den minste egenverdien til Hf(a). Ifølge versjon 2 avTaylors formel er da (husk at ∇f(a) = 0 siden a er et stasjonært punkt):

f(a + y)− f(a) = ∇f(a) · y + 12(Hf(a)y) · y + ε(y)|y|2

= 12(Hf(a)y) · y + ε(y)|y|2

≥ 12λ1|y|2 + ε(y)|y|2

der vi har brukt lemma 5.9.5 i den siste overgangen. Siden λ1 er positivog ε(y) → 0, vil ogsa 1

2λ1 + ε(y) være positiv nar y er tilstrekkelig liten.Dermed er

f(a + y)− f(a) ≥ (12λ1 + ε(y))|y|2 ≥ 0

som viser at f(a) er et lokalt minimum.

b) La λ1 være den største egenverdien til Hf(a). Da er

f(a + y)− f(a) = ∇f(a) · y + 12(Hf(a)y) · y + ε(y)|y|2

= 12(Hf(a)y) · y + ε(y(|y|2

≤ 12λ1|y|2 + ε(y)|y|2

Siden λ1 er negativ og ε(y) → 0, vil ogsa 12λ1 + ε(y) være negativ nar y er

tilstrekkelig liten. Dermed er

f(a + y)− f(a) ≤ (12λ1 + ε(y))|y|2 ≤ 0

som viser at f(a) er et lokalt maksimum.

c) For a vise at a ikke er et lokalt maksimum, lar vi y være en egenvektorfor Hf(a) med en positiv egenverdi λ. Da er

f(a + y)− f(a) = ∇f(a)y + 12(Hf(a)y) · y + ε(y)|y|2

= 12λ|y|2 + ε(y)|y|2

Page 236: Flervariabel analyse med lineær algebra

466 KAPITTEL 5. ITERASJON OG OPTIMERING

Har vi valgt y tilstrekkelig liten, vil 12λ+ ε(y) > 0, og følgelig er f(a+y) >

f(a). Dette viser at a ikke er et lokalt maksimum.For a vise at a heller ikke er et lokalt minimum, lar vi isteden y være en

egenvektor med en negativ egenverdi og gjennomfører det samme resonne-mentet. !

For funksjoner av to variable har annenderiverttesten ogsa en annen formsom er enklere a bruke i praksis.

Korollar 5.9.7 (Annenderiverttesten i to variable) La a være et sta-sjonært punkt for en funksjon f av to variable. Anta at de annenordenspartiellderiverte er kontinuerlige i en omegn om a. La

A =∂2f

∂x2(a), B =

∂2f

∂x∂y(a) =

∂2f

∂y∂x(a), C =

∂2f

∂y2(a)

og la D være determinanten til Hesse-matrisen: D =∣∣∣∣

A BB C

∣∣∣∣ = AC −B2.

Da gjelder

(i) Hvis D < 0, sa er a et sadelpunkt.

(ii) Hvis D > 0 og A > 0, sa er a et lokalt minimum.

(iii) Hvis D > 0 og A < 0, sa er a et lokalt maksimum.

Hvis D = 0, gir testen ingen konklusjon.

Bevis: La λ1 og λ2 være de to egenverdiene til Hesse-matrisen. Vi vet fralineær algebra (korollar 4.10.10) at determinanten er produktet av egenver-diene, sa D = λ1λ2.

(i) Hvis D < 0, ma λ1 og λ2 ha motsatt fortegn. Ifølge den generelleannenderiverttesten er a et sadelpunkt.

(ii) Hvis D > 0, har de to egenverdiene samme fortegn, og ifølge dengenerelle annenderiverttesten ma a enten være et lokalt maksimum ellerminimum. Siden A = ∂2f

∂x2 (a) > 0, har f et lokalt minimum i a nar vi ser paden som en funksjon av x alene. Men da ma det være et lokalt minimum fhar i a.

(iii) Helt analogt til (ii). !

La oss se hvordan annenderiverttesten virker pa noen eksempler. Vi tarførst for oss funksjonen fra eksempel 1 pa nytt.

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 467

Eksempel 3: Vi ser altsa pa funksjonen f(x, y) = 3xy − 3x + 9y som viallerede har vist har partiellderiverte

∂f

∂x= 3y − 3 og

∂f

∂y= 3x + 9

Vi vet ogsa at begge de partiellderiverte er null i punktet (−3, 1). For abruke annenderiverttesten regner vi ut

A =∂2f

∂x2= 0, B =

∂2f

∂x∂y= 3, C =

∂2f

∂y2= 0

som gir

D =∣∣∣∣

A BB C

∣∣∣∣ =∣∣∣∣

0 33 0

∣∣∣∣ = −9.

Ifølge annenderiverttesten er (−3, 1) et sadelpunkt. ♣

La oss se pa et litt mer komplisert eksempel:

Eksempel 4: Vi skal finne de stasjonære punktene til

f(x, y) = xyex−y2

og avgjøre om de er lokale maksimums-, minimums- eller sadelpunkter.Derivasjon gir

∂f

∂x= 1 · yex−y2

+ xyex−y2= y(1 + x)ex−y2

∂f

∂y= x · 1 · ex−y2

+ xyex−y2(−2y) = x(1− 2y2)ex−y2

.

Siden ex−y2 ikke kan være null, er det nok a løse ligningene

y(1 + x) = 0x(1− 2y2) = 0

for a finne de stasjonære punktene. Den første ligningen har to løsningerx = −1 og y = 0. Setter vi x = −1 inn i den andre ligningen, far viy = ± 1√

2= ±

√2

2 . Setter vi y = 0 inn i den andre ligningen, far vi x = 0. Vi

har altsa tre stasjonære punkter (−1,√

22 ), (−1,−

√2

2 ) og (0, 0).Neste skritt er a regne ut de annenderiverte:

∂2f

∂x2= y · 1 · ex−y2

+ y(1 + x)ex−y2= y(2 + x)ex−y2

∂2f

∂x∂y= 1 · (1 + x) · ex−y2

+ y(1 + x)ex−y2(−2y) = (1 + x)(1− 2y2)ex−y2

∂2f

∂y2= x(−4y)ex−y2

+ x(1− 2y2)ex−y2(−2y) = −2xy(3− 2y2)ex−y2

Vi ma undersøke de stasjonære punktene hver for seg.

Page 237: Flervariabel analyse med lineær algebra

468 KAPITTEL 5. ITERASJON OG OPTIMERING

Det stasjonære punktet (0, 0): Her er

A =∂2f

∂x2(0, 0) = 0(2 + 0)e0−02

= 0

B =∂2f

∂x∂y(0, 0) = (1 + 0)(1− 2 · 02)e0−02

= 1

C =∂2f

∂y2(0, 0) = −2 · 0 · 0(3− 2 · 02)e0−02

= 0.

Dette gir D =∣∣∣∣

0 11 0

∣∣∣∣ = 02 − 12 = −1. Altsa er (0, 0) et sadelpunkt.

Det stasjonære punktet (−1,√

22 ): Her er

A =∂2f

∂x2

(− 1,

√2

2

)=√

22

(2 + (−1))e−1−(√

22 )2 =

√2

2e−

32

B =∂2f

∂y∂x

(− 1,

√2

2

)= (1 + (−1))

(1− 2

(√22

)2)e−1−(

√2

2 )2 = 0

C =∂2f

∂y2

(− 1,

√2

2

)= −2(−1)

√2

2

(3− 2

(√22

)2)e−1−(

√2

2 )2 = 2√

2 e−32

Dette gir

D =

∣∣∣∣∣

√2

2 e−3/2 00 2

√2 e−3/2

∣∣∣∣∣ = 2e−3

Siden D > 0, A > 0, forteller annenderiverttesten oss at (−1,√

22 ) er et lokalt

minimum.

Det stasjonære punktet (−1,−√

22 ): Her er

A =∂2f

∂x2

(− 1,−

√2

2

)= −

√2

2(2 + (−1))e−1−(−

√2

2 )2 = −√

22

e−32

B =∂2f

∂y∂x

(− 1,−

√2

2

)= (1 + (−1))

(1− 2

(−√

22

)2)e−1−(−

√2

2 )2 = 0

C =∂2f

∂y2

(− 1,−

√2

2

)=−2(−1)

(−√

22

)(3−2

(−√

22

)2)e−1−(−

√2

2 )2 =−2√

2 e−32

Dette gir

D =

∣∣∣∣∣−√

22 e−3/2 0

0 −2√

2 e−3/2

∣∣∣∣∣ = 2e−3

Siden D > 0, A < 0, ma (−1,−√

22 ) være et lokalt maksimum. ♣

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 469

Uoppstilte problemer

Til slutt i denne seksjonen skal vi se pa noen eksempler pa uoppstilteminimums- og maksimumsproblemer.

Eksempel 5: Vi har en 1 meter lang staltrad som skal deles i maksimalttre biter. Hver bit skal sa bøyes sammen til et kvadrat. Hva er det størsteog minste samlede areal disse rektanglene kan ha?

Hvis vi sier at de to første bitene har lengde x og y, ma den tredje halengde 1-x-y. Det totale arealet er dermed (husk at vi ma dele lengdene pa4 for a fa sidekantene i kvadratene):

A(x, y) =(x

4

)2+

(y

4

)2+

(1− x− y

4

)2

=116

(x2 + y2 + (1− x− y)2

)

Det er fristende a sette igang a derivere med en gang, men la oss først sehvilke verdier x og y kan ha. Vi ma apenbart ha x ≥ 0, y ≥ 0 og x + y ≤ 1(legg merke til at vi godt kan ha x = 0, y = 0 eller x + y = 1 — det svarerbare til at vi deler opp staltraden i færre enn tre biter). Dette betyr at viønsker a maksimere og minimere funksjonen A pa omradet

T = {(x, y) : x ≥ 0, y ≥ 0, x + y ≤ 1}

Dette er trekanten med hjørner (0, 0), (1, 0) og (0, 1) som vist pa figur 4.

!

"

::

::

::

::

:(0, 1)

(1, 0)

T

Figur 4

Siden T er en lukket mengde, vet vi fra ekstremalverdisetningen at A haren maksimums- og en minimumsverdi.

Partiellderiverer vi A, far vi

∂A

∂x(x, y) =

116

(2x + 2(1− x− y)(−1)) =116

(4x + 2y − 2)

∂A

∂y(x, y) =

116

(2y + 2(1− x− y)(−1)) =116

(2x + 4y − 2)

Ligningssystemet 4x + 2y − 2 = 0, 2x + 4y − 2 = 0 er lett a løse og girx = y = 1

3 . Bruker vi annenderiverttesten (gjør det!), ser vi at (13 , 1

3) er etlokalt minimum.

Page 238: Flervariabel analyse med lineær algebra

470 KAPITTEL 5. ITERASJON OG OPTIMERING

Dette betyr at det eneste potensielle ekstremalpunktet vi har i det ind-re av T , er et lokalt minimum i (1

3 , 13). For a finne andre kandidater ma vi

se pa randen til T . Den faller naturlig i tre deler, og vi ser pa hver del for seg.

Linjestykket fra (0, 0) til (1, 0): Pa dette linjestykket er y = 0, og vi far

A(x, 0) =116

(x2 + (1− x)2) for 0 ≤ x ≤ 1

Drøfter vi dette uttrykket som en vanlig funksjon av en variabel, finner viet minimum for x = 1

2 og maksima for x = 0 og x = 1. Vi har dermed etmulig minimumspunkt i (1

2 , 0) og mulige maksimumspunkter i (0, 0) og (1, 0).

Linjestykket fra (0, 0) til (0, 1): Pa dette linjestykket er x = 0, og vi far

A(0, y) =116

(y2 + (1− y)2) for 0 ≤ y ≤ 1

Dette er samme uttrykk som ovenfor bare med x byttet ut med y. Vi far der-for et mulig minimumspunkt i (0, 1

2) og mulige maksimumspunkter i (0, 0)og (0, 1).

Linjestykket fra (1, 0) til (0, 1): Pa dette linjestykket er y = 1− x, og vi far

A(x, 1− x) =116

(x2 + (1− x)2) for 0 ≤ x ≤ 1

Dette er samme uttrykk som i det første punktet ovenfor, og vi finner etminimum for x = 1

2 og maksima for x = 0 og x = 1. Vi har dermed et muligminimumspunkt i (1

2 , 12) og mulige maksimumspunkter i (1, 0) og (0, 1).

La oss ta en liten oppsummering: Vi har potensielle minimumspunkter i(13 , 1

3), (12 , 0), (0, 1

2) og (12 , 1

2). Regner vi ut funksjonsverdiene, far vi A(13 , 1

3) =148 og A(1

2 , 0) = A(0, 12) = A(1

2 , 12) = 1

32 . Dette betyr at minimumspunkteter (1

3 , 13) og minimumsverdien 1

48 . Vi far altsa mimimalt areal nar vi deleropp staltraden i tre like store deler.

Pa tilsvarende mate har vi de potensielle maksimumspunktene (0, 0),(1, 0) og (0, 1). Regner vi ut funksjonsverdiene, far vi A(0, 0) = A(1, 0) =A(1, 1) = 1

16 . Maksimumsverdiene er altsa 116 oppnadd i hjørnene A(0, 0) =

A(1, 0) = A(1, 1). Geometrisk representerer disse hjørnene den samme løs-ningen — vi deler ikke opp staltraden i det hele tatt, men bøyer den sammentil ett stort kvadrat. ♣

Eksemplet ovenfor viser at vi ikke kan neglisjere punktene pa randen avdefinisjonsomradet — det kan hende at det er der det interessante foregar!Det neste eksemplet illustrerer (blant annet) de problemene vi kan støte pa

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 471

nar definisjonsomradet ikke er begrenset.

Eksempel 6: Vi skal lage en boks med volum V . Hvordan skal vi ordne ossfor at overflatearealet A skal bli minst mulig?

Kaller vi sidekantene x, y og z som vist pa figur 5, ser vi at arealet blir

A = 2xy + 2xz + 2yz

Siden volumet V = xyz er gitt, kan vi eliminere en av variablene

z =V

xy

Dette gir

A(x, y) = 2xy +2V

y+

2V

x

I dette uttrykket kan x og y være vilkarlige, positive tall.

eeeeee

ffffff

RRRRRRRR

[[[[[[[[` ` ` ` @@@@@@

z

x y

Figur 5

Vi deriverer A:

∂A

∂x= 2y − 2V

x2

∂A

∂y= 2x− 2V

y2

For a finne de stasjonære punktene, ma vi løse ligningen

y =V

x2og x =

V

y2.

Setter vi det første uttrykket inn i det andre, ser vi at

x =V

( Vx2 )2

=x4

V

som gir x = 3√

V . Dette gir y = Vx2 = V

( 3√V )2= 3√

V . Vi har altsa ett

stasjonært punkt ( 3√

V , 3√

V ).

Page 239: Flervariabel analyse med lineær algebra

472 KAPITTEL 5. ITERASJON OG OPTIMERING

La oss regne ut de annenderiverte:

∂2A

∂x2=

4V

x3;

∂2A

∂y∂x= 2 ;

∂2A

∂y2=

4V

y3

Dette gir

∂2A

∂x2( 3√

V ,3√

V ) = 4

∂2A

∂y∂x( 3√

V ,3√

V ) = 2

∂2A

∂y2( 3√

V ,3√

V ) = 4

og D =∣∣∣∣

4 22 4

∣∣∣∣ = 16 − 4 = 12. Følgelig er ( 3√

V , 3√

V ) et lokalt minimum.

Legg merke til at siden

z =V

xy=

V3√

V · 3√

V= 3√

V

svarer dette lokale minimumet til at vi lar kassen være en kube (alle siderlike lange) med overflateareal

A = 6 · V 2/3

La oss oppsummere vare resultater sa langt: Vi har vist at funksjonen Abare har ett stasjonært punkt, og det er et lokalt minimum for x = 3

√V og

y = 3√

V . Dersom det finnes et globalt minimum, ma dette være i punktet( 3√

V , 3√

V ). Mange vil nok sla seg til ro med at dette betyr at ( 3√

V , 3√

V )er et globalt minimum, men det finnes faktisk en annen mulighet – det kantenkes at A nærmer seg en lavere “minimalverdi” enn 6V 2/3 uten noen ganga na frem til den. Vi skal na vise at dette ikke kan skje og at A0 = 6V 2/3

faktisk er den minste verdien arealet kan ha.Vi tar utgangspunkt i at uttrykket for arealet

A(x, y) = 2xy +2V

y+

2V

x

bestar av tre positive ledd 2xy, 2Vy og 2V

x . Skal arealet være mindre ennA0, ma i hvert fall hvert av disse leddene være mindre enn A0. Begynner vibakfra, ser vi at skal 2V

x være mindre enn A0, ma

x >2V

A0= 1

3V 1/3,

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 473

dvs. punktet (x, y) ma ligge til høyre for den vertikale linjen x = 13V 1/3.

Tilsvarende ser vi at skal 2Vy være mindre enn A0, ma

y > 13V 1/3

dvs. punktet (x, y) ma ligge over for den horisontale linjen y = 13V 1/3. Til

slutt ser vi at skal 2xy være mindre enn A0, ma

xy ≤ A0

2= 3V 2/3

dvs. punktet (x, y) ma ligge under hyperbelen xy = 3V 2/3.Kombinerer vi disse kravene, ser vi at (x, y) ma ligge i det avgrensede

omradet pa figur 6 dersom det skal være noe hap om at A(x, y) < A0 =6V 2/3. Vi legger ogsa merke til at pa randen av det avgrensede omradet vilA(x, y) > A0 – her er nemlig ett av de tre leddene 2xy, 2V

y og 2Vx lik A0

mens de to andre er positive.

!

"

x

y

x = 13 V 1/3

y = 13 V 1/3

xy = 3V 2/3

++V

!

"

Figur 6

Inkluderer vi randen, er det avgrensede omradet lukket og begrenset.Ifølge ekstremalverdisetningen i forrige seksjon har A et (globalt) minimums-punkt i dette omradet. Dette minimumspunktet kan ikke ligge pa randensiden verdien pa randen hele tiden er større enn verdien A0 i det indrepunktet ( 3

√V , 3√

V ). Altsa ma minimumspunkt ligge i det indre, og ifølgesetning 5.9.2 ma det være et stasjonært punkt. Siden det eneste stasjonæ-re punktet er ( 3

√V , 3√

V ), ma dette være et globalt minimum for A pa detavgrensede omradet. Siden funksjonsverdien utenfor dette omradet alltid erstørre enn A( 3

√V , 3√

V ), ma ( 3√

V , 3√

V ) være det globale minimumet for Apa hele definisjonsomradet. ♣

Det siste resonnementet i eksemplet ovenfor er ganske komplisert, og ipraktiske oppgaver hender det ofte at man utelater argumenter av dennetypen. Isteden argumenterer man for at det ut i fra oppgavens praktisketolkning ma finnes et maksimum eller minimum. I eksemplet ovenfor virkerdet imidlertid ikke sa lett a gi et slikt argument.

Page 240: Flervariabel analyse med lineær algebra

474 KAPITTEL 5. ITERASJON OG OPTIMERING

Oppgaver til seksjon 5.9

1. Finn de stasjonære punktene til funksjonen:

a) f(x, y) = x2 + 2y2 − 4x + 4y d) f(x, y) = xey2+x

b) f(x, y) = x2 + y2 − xy e) f(x, y) = xy − 1x + 2

y

c) f(x, y) = x2 + 2xy − 2y2 + x + 7y

2. Finn de stasjonære punktene og avgjør om de er lokale maksimums-, minimums-eller sadelpunkter:

a) f(x, y) = x2 + y2 − 2x + 4yb) f(x, y) = x2y2 − 4xy + 6x− 6y

c) f(x, y) = ex2+3y2

d) f(x, y) = 11−x+y+x2+y2

e) f(x, y) = x + ln(x2 + y2)

3. Finn det stasjonære punktet til funksjonen

f(x, y) = 3x2 + 2xy + 2y2 − 2x + 6y

og avgjør om det er et lokalt maksimumspunkt, minimimumspunkt eller sadelpunkt

4. Finn de stasjonære punktene til funksjonen

f(x, y) = x3 + 5x2 + 3y2 − 6xy

og avgjør om de er lokale maksimumspunkter, minimimumspunkter eller sadelpunk-ter.

5. Finn de stasjonære punktene til funksjonen

f(x, y) = x3 + 3x2y + 3y2

og avgjør om de er lokale maksimumspunkter, minimimumspunkter eller sadelpunk-ter.

6. Finn de stasjonære punktene til funksjonen

f(x, y) = (x + y2)ex

og avgjør om de er lokale maksimumspunkter, minimimumspunkter eller sadelpunk-ter.

7. Finn de stasjonære punktene til funksjonen

f(x, y, z) = xyz − x2 − y2 − z2

og avgjør om de er lokale maksimumspunkter, minimimumspunkter eller sadelpunk-ter.

8. (Eksamen i MAT1110, 13/6, 2007)

a) Finn de stasjonære punktene til f(x, y) = 2x2y + 4xy − y2.

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 475

b) Avgjør om de stasjonære punktene er lokale maksimumspunkter, lokale mi-nimumspunkter eller sadelpunkter.

9. (Eksamen i MAT1110, 13/8, 2007)

a) Finn de stasjonære punktene til f(x, y) = (x2 + y2)ex.

b) Avgjør om de stasjonære punktene er lokale maksimumspunkter, lokale mi-nimumspunkter eller sadelpunkter.

10. La f(x, y) = (x2 − y2)e−x2+y2

2 .

a) Finn de stasjonære punktene til f og avgjør om de er lokale maksimums-punkter, lokale minimumspunkter eller sadelpunkter.

b) Finn maksimum og minimum til f pa omradet {(x, y) | |x| ≤ 1, |y| ≤ 3}. BrukMATLAB eller en lommeregner til a tegne grafen.

11. Du skal lage en boks med volum V . Boksen skal ha bunn og fire sideflater, meningen topp. Hvordan skal du lage boksen for at overflatearealet skal bli minst mulig?

12. Du skal lage en ramme av stalrør som skal brukes som reisverk til et telt.Rammen bestar av fire bein med lengde x festet til et rektangel med sider y og z,se figur under. Lengdene x, y og z males i meter.

ffffff[[[[[[[[` ` ` ` @@@@@@

x z y

Volumet V = xyz av teltet skal være 500 m3. Din oppgave er a lage teltet slik atden totale lengden L av stalrør som gar med blir minst mulig.

a) Begrunn at lengden L kan skrives som

L(x, y) = 4x + 2y +1000xy

og finn de partiellderiverte ∂L∂x og ∂L

∂y .

b) Bestem de dimensjonene av teltet som gjør totallengden av stalrør minstmulig.

13. Vi skal bygge en rettvinklet kasse uten lokk, se figur nedenfor. Kassen skal hasidelengder x og y og høyde z. Selve “skjelettet” til kassen skal lages av 12 tynnerør (markert med streker pa figuren). Den totale lengden rør vi skal benytte er 56meter.

eeeeee

ffffff

RRRRRRRR

[[[[[[[[` ` ` ` @@@@@@

[[[[[[[''''''z

x y

Page 241: Flervariabel analyse med lineær algebra

476 KAPITTEL 5. ITERASJON OG OPTIMERING

a) Begrunn at arealet A av kassens utside (de fire veggene pluss bunnen) somfunksjon av x og y kan skrives

A(x, y) = 28x + 28y − 2x2 − 2y2 − 3xy.

og finn de partiellderiverte av A. Bestem deretter eventuelle punkter (x, y)der begge de partiellderiverte er null, og avgjør om disse punktene er loka-le minimumspunkter for A, lokale maksimumspunkter for A eller ingen avdelene.

b) Finn maksimumsverdien for A(x, y) pa omradet i xy-planet gitt ved0 ≤ x ≤ 14, 0 ≤ y ≤ 14. Hvordan bør sidelengdene x og y velges for at arealetav kassens utside skal bli størst mulig? (Begrunn svaret.)

14. (Eksamen i MAT 1100, 9/12, 2005) Oslo kommune planlegger a bygge et akva-rium med volum 5000 m3. Kostnadene er gitt ved:

Fronten – en glassplate: 1000 kr. per m2.

Sidekantene – 3 stk. i stal: 300 kr. per m2

Bunnen – i sement: 500 kr. per m2

Anta glassplaten har lengde l og høyde h. Forklar hvorfor materialene koster

f(l, h) = 100(

13lh +30000

l+

25000h

)

Finn l og h som minimaliserer materialkostnadene.

15. Et baderom har takhøyde 3 m og et kvadratisk gulv som er 4 m2. I dette rommetskal vi plassere et badekar av lengde x, bredde y og høyde z (malt i meter) og medvolum xyz = 2

3 m3. Badekaret skal plasseres i det ene hjørnet av baderommet somvist pa tegningen.

eeeeee

ffffff

RRRRRRRR

[[[[[[[[` ` ` ` @@@@@@

@@@@@@DDDD

[[[[[[[

ffffff

z

x y

Figur 4

Ut i fra dimensjonene pa rommet og karet far vi: 0 < x ≤ 2, 0 < y ≤ 2, 0 < z ≤ 3(og derfor ogsa xy = 2

3z ≥ 29 (m)2). Vi skal flislegge de to veggene badekaret

5.9. MAKSIMUMS- OG MINIMUMSPUNKTER 477

berører, samt badegulvet, men vi flislegger bare de delene av veggene og gulvetsom badekaret ikke dekker. Vi bruker to forskjellige typer fliser til vegger og gulv.Prisen pa veggflisene er 90 kr/m2 og pa gulvflisene 60 kr/m2. La P (x, y) betegnetotalprisen pa flisene som funksjon av x og y angitt i kr.

a) Vis at vi far P (x, y) = 1320− 60x −

60y − 60xy, og beregn ∂P

∂x og ∂P∂y .

b) For a fa oversikt over utgiftene til flisleggingen ønsker vi a finne den verdienav (x, y) som gjør at P (x, y) blir størst mulig. Finn denne verdien av (x, y)og den tilsvarende verdien til P .

16. Det amerikanske postvesenet ekspederer bare pakker der summen av lengde,bredde og høyde er mindre enn 108 tommer. Hva er det største volumet en kasse-formet pakke kan ha?

17. En fabrikk produserer to modeller av en vare. Det koster 400 kr. a lage standard-modellen og 600 kr. a lage luksusmodellen. Undersøkelser viser at nar utsalgsprisenefor standardmodellen og luksusmodellen er hhv. x og y kroner, sa far fabrikken solgt5(y− x) eksemplarer av standardmodellen og 450000 + 500(x− 2y) eksemplarer avluksusmodellen. Hvordan skal prisene settes for a maksimere fortjenesten?

18. To bedrifter konkurrerer om a selge nesten identiske varer i samme marked. Enøkning i produksjonen hos den ene bedriften fører derfor til svikt i inntektene hosden andre. Hvis bedrift A produserer x enheter per maned, og bedrift B produserery enheter per maned, er de manedlige fortjenestene gitt ved

P = 12000x− x2

2− y2

4for bedrift A

Q = 12000y − y2

2− x2

6for bedrift B

a) Dersom bedriftene ikke samarbeider om a fastsette produksjon, er det natur-lig a anta at hver av bedriftene uavhengig av den andre fastsetter sin produk-sjon slik at egen fortjeneste blir sa stor som mulig. Dessuten antar hver avbedriftene at den andre gjør det samme. Forklar hvorfor produksjonsnivaet(x, y) er løsningen av ligningssystemet

∂P

∂x= 0 og

∂Q

∂y= 0

Finn fortjenestene til A og B i dette tilfellet.

b) Bedriftsledelsen i de to bedriftene tror at ved a samarbeide om produksjons-nivaet kan de øke den totale fortjenesten til bedriftene. Forklar at det opti-male produksjonsnivaet na er løsningen av ligningssystemet

∂P

∂x+

∂Q

∂x= 0 og

∂P

∂y+

∂Q

∂y= 0

Finn fortjenestene til A og B i dette tilfellet.

Page 242: Flervariabel analyse med lineær algebra

478 KAPITTEL 5. ITERASJON OG OPTIMERING

c) Anta at bedriftene i hemmelighet har samarbeidet om a fastsette produk-sjonsnivaet. Etter en stund oppdager bedrift B, som tidligere var mest lønnsom,at bedrift A na er blitt markedsleder. Bedrift B bestemmer seg derfor for abryte avtalen uten a si fra til A. Gitt at A fastholder sitt produksjonsniva frab), hvordan skal B velge sitt produksjonsniva for a fa størst mulig fortjeneste?Hva blir fortjenestene til A og B i dette tilfellet?

19. I denne oppgaven er f(x, y) = x4 + y4.

a) Vis at (0,0) er et stasjonært punkt der Hesse-determinanten D er lik null.Vis at (0,0) er et minimumspunkt for funksjonen.

b) Lag en funksjon g(x, y) der (0,0) er et maksimumspunkt, men hvor Hesse-determinanten i (0,0) er lik null.

c) Lag en funksjon h(x, y) slik at (0,0) er et sadelpunkt, men hvor Hesse-determinanten i (0,0) er lik null.

20. I denne oppgaven skal vi se pa noen viktige forskjeller mellom funksjoner avhenholdsvis en og flere variable.

a) La f : R → R være en deriverbar funksjon av en variabel og anta at det enestestasjonære punktet til f er et lokalt maksimum i a. Vis at da er a et globaltmaksimum for f .

b) Laf(x, y) = 1− x2 − (1 + x)3y2

Vis at (0,0) er det eneste stasjonære punktet til f .

c) Vis at (0,0) er et lokalt maksimum, men ikke et globalt maksimum for f .Bruk MATLAB til a tegne grafen til f , og tenk gjennom forskjellen pa en ogflere dimensjoner.

d) La g : R → R være en kontinuerlig funksjon av en variabel og anta at a og b erto lokale maksimumspunkter for f . Vis at det finnes et lokalt minimumspunktmellom a og b.

e) Lag(x, y) = 4x2ey − 2x4 − e4y

Vis at de stasjonære punktene til g er (−1, 0) og (1, 0).

f) Vis at begge de to stasjonære punktene til g er lokale maksimumspunkter.Bruk MATLAB til a tegne grafen til g, og tenk gjennom forskjellen pa en ogflere dimensjoner.

5.10 Lagranges multiplikatormetode

I forrige seksjon sa vi hvordan vi kan finne de lokale maksimums- og mini-mumspunktene til en funksjon f(x1, x2, . . . , xm) av flere variable nar x1, x2,. . . , xm far lov til a ha alle verdiene i definisjonsomradet til f . Vi skal na sehva som skjer nar vi har begrensninger (sakalte bibetingelser) pa variablene.

5.10. LAGRANGES MULTIPLIKATORMETODE 479

I de enkleste problemene av denne typen har vi to funksjoner f(x, y) ogg(x, y), og vi ønsker a finne den største og/eller minste verdien til f(x, y)blant de punktene som tilfredsstiller bibetingelsen g(x, y) = b, der b er engitt konstant. La oss begynne med et enkelt (men langt!) eksempel.

Eksempel 1: Vi skal finne maksimums- og minimumsverdien til funksjonenf(x, y) = xy pa sirkelen x2 + y2 = 1. Setter vi g(x, y) = x2 + y2, ser viat dette er en bibetingelse g(x, y) = 1 av typen vi beskrev ovenfor. Det erflere mater a løse dette problemet pa. Den mest naturlige er kanskje a løseligningen x2 + y2 = 1 for y og sette inn (substituere) resultatet i f . Da farvi to optimeringsproblemer med en variabel,

h(x) = x√

1− x2

for øvre halvsirkel, ogk(x) = −x

√1− x2

for nedre halvsirkel. Det er lett a finne maksimumspunktene til disse funk-sjonene ved vanlige metoder.

Selv om “substitusjonsmetoden” fungerer bra i dette eksemplet, har denen fundamental svakhet. Dersom bibetingelsen er mer komplisert enn x2 +y2 = 1, klarer vi ikke a løse ligningen for en av variablene, og hele forsøketvart bryter sammen. Vi ønsker derfor a finne en metode som ikke er basertpa at vi løser ligninger og substituerer.

I figur 1 har vi tegnet opp punktene som tilfredsstiller bibetingelsene(sirkelen) sammen med noen av nivakurvene til funksjonen f(x, y) = xy.Nivakurvene tilsvarer funksjonsverdiene fra -1.6 til 1.6 med trinn pa 0.2.Absoluttverdien til funksjonen vokser med x og y, sa det er de ytterstenivakurvene som svarer til høye positive og negative funksjonsverdier (leggmerke til at f har positive verdier i første og tredje kvadrant, og negativeverdier i annen og fjerde kvadrant).

Figur 1: Nivakurver og bibetingelseskurve

Page 243: Flervariabel analyse med lineær algebra

480 KAPITTEL 5. ITERASJON OG OPTIMERING

Vi ser at det er noen nivakurver som ikke skjærer bibetingelseskurveni det hele tatt — de tilsvarer verdier som funksjonen ikke kan ha sa lengevi innskrenker oss til punkter pa sirkelen. Nivakurver som skjærer sirkelen,tilsvarer verdier som funksjonen har pa sirkelen. De største og minste ver-diene far vi nar nivakurvene bare berører sirkelen og gar ut igjen. Figur 2viser denne situasjonen.

Figur 2: Optimale nivakurver

Nivakurvene i figur 2 tilsvarer verdiene 12 (i første og tredje kvadrant) og

−12 (i annen og fjerde kvadrant), sa maksimumsverdien til funksjonen pa

sirkelen er 12 og minimumsverdien er −1

2 .Legg merke til at nivakurvene i figur 2 tangerer bibetingelseskurven. Det

er lett a innse at dette er et fenomen som ikke bare gjelder i dette eksemplet,men som gjelder generelt nar man skal optimere en funksjon f(x, y) under enbibetingelse g(x, y) = b — dersom nivakurven krysser bibetingelseskurven,vil vi normalt ha større verdier pa den ene siden av skjæringspunktet ogmindre pa den andre (se figur 3).

3a

∇g(a) ∇f(a)

f(x) < c f(x) > c

g(x) = b (bibetingelse)

f(x) = c (nivakurve)

"

++

++,

Figur 3: a er ikke et ekstremalpunkt under bibetingelsen g(x) = b

Dette betyr at nar vi leter etter vare maksimums- og minimumspunkter,sa ma vi lete etter punkter der nivakurven tangerer bibetingelseskurven,eller – sagt med andre ord — der normalen til nivakurven er parallell mednormalen til bibetingelseskurven (se figur 4).

5.10. LAGRANGES MULTIPLIKATORMETODE 481

3a∇g(a)

∇f(a)

f(x) > c

f(x) < c

g(x) = b (bibetingelse)

f(x) = c (nivakurve)

"

$

Figur 4: a er et minimumspunkt under bibetingelsen g(x) = b

Disse normalene er lette a finne siden vi vet at gradienter alltid star normaltpa nivakurver (husk setning 3.7.2), og bibetingelseskurven er en nivakurvefor funksjonen g(x, y). Vi leter altsa etter punkter der de to gradientene∇f(x, y) og ∇g(x, y) er parallelle, dvs. punkter der det finnes et tall λ slikat ∇f(x, y) = λ∇g(x, y).

I eksemplet vart er

∇f(x, y) =(

yx

)og ∇g(x, y) =

(2x2y

)

og vi er pa jakt etter punkter der disse er parallelle, dvs. punkter der detfinnes et tall λ slik at (

yx

)= λ

(2x2y

)

Skriver vi ut denne ligningen komponentvis, far vi

y = 2λx

x = 2λy

Dette gir oss to ligninger med tre ukjente, x, y og λ. Den nye ukjente λ somhar sneket seg inn i regnestykket, kalles en Lagrangemultiplikator og har gittnavn til hele metoden. I tillegg til ligningene ovenfor har vi en tredje ligningsiden punktet vart ma tilfredsstille bibetingelsen:

x2 + y2 = 1

Dette ligningssystemet med tre ligninger og tre ukjente kan løses pa fleremater. La oss først observere at ingen av de ukjente x, y kan være 0, forhvis den ene er det, ma den andre ogsa være det, og da far vi ikke oppfyltligningen x2 + y2 = 1. Dette medfører at heller ikke λ kan være 0. Dermedkan vi dele den første av ligningene vare pa den andre, og fa

y

x=

x

y

Page 244: Flervariabel analyse med lineær algebra

482 KAPITTEL 5. ITERASJON OG OPTIMERING

som gir y2 = x2. Setter vi dette inn i den tredje ligningen, far vi 2x2 = 1som gir x = ±

√2

2 . Siden y2 = x2, far vi ogsa y = ±√

22 . Dermed har vi fire

punkter vi ma se videre pa: (√

22 ,

√2

2 ), (−√

22 ,

√2

2 ),(−√

22 ,−

√2

2 ) og (√

22 ,−

√2

2 ).Setter vi inn i funksjonen f(x, y) = xy, far vi

f((√

22

,

√2

2)) = f((−

√2

2,−√

22

)) =12

og

f((−√

22

,

√2

2)) = f((

√2

2,−√

22

)) = −12

Dette stemmer svært godt med vare grafiske undersøkelser ovenfor, og det erderfor rimelig a tro at vi har en maksimumsverdi 1

2 som oppnas i punktene(√

22 ,

√2

2 ) og (−√

22 ,−

√2

2 ) og en minimumsverdi −12 som oppnas i punktene

(−√

22 ,

√2

2 ) og (√

22 ,−

√2

2 ). ♣

La oss oppsummere eksemplet ovenfor i litt mer generelle vendinger.Vi har en funksjon f(x, y) som vi ønsker a maksimere eller minimere underbibetingelsen g(x, y) = b, der b er en konstant. Da ma vi lete etter punkter pabibetingelseskurven der ∇f(x, y) = λ∇g(x, y). Skriver vi ut denne ligningenkomponentvis, far vi to ligninger med to ukjente

∂f

∂x(x, y) = λ

∂g

∂x(x, y)

∂f

∂y(x, y) = λ

∂g

∂y(x, y)

I tillegg har vi bibetingelsen

g(x, y) = b

slik at vi far tre ligninger med tre ukjente. Løser vi dette ligningssystemet, vilvi (under svært generelle betingelser) ha funnet alle potensielle maksimums-og minimumspunkter for problemet vart.

Vi kan generalisere enda litt lenger. Anta at vi har en funksjon

f(x1, x2, . . . , xm)

av m variable og en bibetingelse

g(x1, x2, . . . , xm) = b

Setter vi opp den samme ligningen∇f(x1, x2, . . . , xm) = λ∇g(x1, x2, . . . , xm)som før og skriver den ut komponentvis, far vi m ligninger med m+1 ukjente

5.10. LAGRANGES MULTIPLIKATORMETODE 483

x1, x2, . . . ,xm, λ:

∂f

∂x1(x1, x2, . . . , xm) = λ

∂g

∂x1(x1, x2, . . . , xm)

∂f

∂x2(x1, x2, . . . , xm) = λ

∂g

∂x2(x1, x2, . . . , xm)

......

...∂f

∂xm(x1, x2, . . . , xm) = λ

∂g

∂xm(x1, x2, . . . , xm)

Legger vi til bibetingelsen

g(x1, x2, . . . , xm) = b

har vi m + 1 ligninger med m + 1 ukjente. Igjen viser det seg at dette lig-ningssystemet gir oss alle mulige maksimums- og minimumspunkter.

Bemerkning: Ser du i litteraturen, vil du finne at bibetingelsene formulereslitt forskjellig — i noen bøker finner du alltid formen g(x1, x2, . . . , xm) = 0,mens andre tillater g(x1, x2, . . . , xm) = b for en vilkarlig b ∈ R. Egent-lig er det ikke noen forskjell pa disse formene — har vi et krav av typeng(x1, x2, . . . , xm) = b, innfører vi bare en ny funksjon

g(x1, x2, . . . , xm) = g(x1, x2, . . . , xm)− b,

og dermed har vi en bibetingelse av typen

g(x1, x2, . . . , xm) = 0

Siden∇g = ∇g, blir betingelsene for maksimums-/minimumspunkt uforand-ret. Vi skal derfor formulere resultatene vare for tilfellet g(x1, x2, . . . , xm) =b, men i bevisene nøye oss med a se pa tilfellet g(x1, x2, . . . , xm) = 0 somofte er notasjonsmessig enklere.

Teorem 5.10.1 (Lagranges multiplikatormetode med en bibetin-gelse) Anta at U er en apen delmengde av Rm, og at f, g : U → R erto funksjoner med kontinuerlige partiellderiverte. La b være et reelt tall, oganta at x = (x1, x2, . . . , xm) er et lokalt maksimums- eller minimumspunktfor f pa mengden

A = {x ∈ U | g(x) = b}

Da er enten ∇g(x) = 0, eller det finnes en konstant λ ∈ R slik at

∇f(x) = λ∇g(x)

Page 245: Flervariabel analyse med lineær algebra

484 KAPITTEL 5. ITERASJON OG OPTIMERING

Legg merke til at det i teoremet er kommet inn en ekstra mulighet som viikke har hatt med tidligere, nemlig at ∇g(x) = 0. Dette er bare naturlig— dersom ∇g(x) = 0, bryter vart geometriske resonnement sammen, oghva som helst kan hende. Vi understreker ogsa at teoremet bare hjelpeross a finne potensielle maksimums- og minimumspunkter — et punkt somtilfredsstiller betingelsene, behøver ikke a være noen av delene, men kanvære et generalisert sadelpunkt.

Før vi beviser teoremet, tar vi med et eksempel pa bruken.

Eksempel 2: Vi skal finne minimumsverdien til funksjonen

f(x, y, z) = (x− 3)2 + y2 + z2

under bibetingelsen x2 + 4y2 − z = 0. Legg merke til at problemet haren geometrisk tolkning — vi ønsker a finne det punktet (x, y, z) pa flatenz = x2 + 4y2 som har kortest avstand til punktet (3, 0, 0).

Lar vi g(x, y, z) = x2 + 4y2 − z = 0, ser vi at

∇g(x, y, z) =

2x8y−1

Siden ∇g aldri er null, slipper vi a bry oss om tilfellet ∇g(x) = 0. Vi servidere at

∇f(x, y, z) =

2x− 6

2y2z

Skriver vi ligningen ∇f(x, y, z) = λ∇g(x, y, z) pa komponentform, far vi(etter a ha forkortet litt)

x− 3 = λx

y = 4λy

2z = −λ

I tillegg har vi bibetingelsen

x2 + 4y2 − z = 0

En av utfordringene ved Lagranges multiplikatormetode er a løse ligningenevi kommer frem til. De kan være av forskjellig type, og det er ikke lett a gigenerelle rad om hvordan det er lurt a ga frem. I dette tilfellet ser det uttil a være lurest a starte med ligning nummer to, y = 4λy. Her er det tomuligheter. Dersom y #= 0, ma λ = 1

4 . Dersom y = 0, kan derimot λ værehva som helst. Vi ser pa disse tilfellene hver for seg:

5.10. LAGRANGES MULTIPLIKATORMETODE 485

Tilfellet λ = 14 : Den øverste ligningen blir na til x−3 = 1

4x, som gir x = 4, ogden tredje ligningen gir z = −1

8 . Setter vi dette inn i den nederste ligningen,far vi

16 + 4y2 +18

= 0

som apenbart ikke har noen løsning. Tilfellet λ = 14 fører derfor ikke frem.

Tilfellet y = 0: Vi sitter na igjen med tre ligninger for x, z og λ, nemlig

x− 3 = λx

2z = −λ

x2 − z = 0

Eliminerer vi z fra de to siste, ser vi at λ = −2x2, og setter vi dette inn iden øverste ligningen, sitter vi igjen med x− 3 = −2x3, dvs.

2x3 + x− 3 = 0

Vi ser at x = 1 er en løsning av denne ligningen. For a undersøke om detfinnes flere løsninger, polynomdividerer vi 2x3 + x − 3 med x − 1, og far2x2 + 2x + 3 som ikke har reelle røtter. Dermed har vi bare en løsning forx, nemlig x = 1. Siden x2 − z = 0, følger det at z = 1, (det følger ogsa atλ = −2, men λ er vi egentlig ikke interessert i).

Vi har dermed sett at den eneste løsningen av ligningssystemet er x =1, y = 0, z = 1. Siden den geometriske tolkningen forteller oss at funksjonenma ha et minimumspunkt, er det dette vi har funnet. ♣

Vi er na klar til a bevise Lagranges multiplikatorteorem for en bibetin-gelse. Ideen i beviset er den samme som vi hadde i begynnelsen av eksempel1: vi løser ligningen g(x1, x2, . . . , xm) = b for en av de variable og substitu-erer inn i f . Pa denne maten far vi et “fritt ekstremalverdiproblem” (dvs. etekstremalverdiproblem uten bibetingelser). I praksis er dette en ubrukeligmetode fordi vi ikke greier a løse ligningen g(x1, x2, . . . , xm) = 0, men teore-tisk fungerer den fordi implisitt funksjonsteorem forteller oss at det finnesen løsning med de egenskapene vi trenger.

Bevis for teorem 5.10.1: Som papekt ovenfor er det nok a vise teoremet forb = 0. Vi skal vise at dersom x er et lokalt maksimums- eller minimumspunktog ∇g(x) #= 0, sa finnes det en konstant λ slik at ∇f(x) = λ∇g(x). Siden viantar at ∇g(x) #= 0, finnes det minst en variabel xi slik at ∂g

∂xi(x) #= 0. Ved

eventuelt a bytte om pa variablene, kan vi anta at dette er den siste varia-belen xm. Siden denne variabelen kommer til a spille en litt spesiell rolle ibeviset, bytter vi navn pa den og kaller den y istedenfor xm (dette er bare fora gjøre beviset lettere a lese). Vi har dermed funksjoner f(x1, . . . , xm−1, y)og g(x1. . . . , xm−1, y), der ∂g

∂y (x1, . . . , xm−1, y) #= 0.

Page 246: Flervariabel analyse med lineær algebra

486 KAPITTEL 5. ITERASJON OG OPTIMERING

Siden ∂g∂y (x1, . . . , xm−1, y) #= 0, finnes det ifølge implisitt funksjonsteorem

(teorem 5.7.3) en deriverbar funksjon φ definert i en omegn om (x1, . . . , xm−1)slik at φ(x1, . . . , xm−1) = y og

g(x1, . . . , xm−1,φ(x1, . . . , xm−1)) = 0

i denne omegnen. Dette betyr at funksjonen

h(x1, . . . , xm−1) = f((x1, . . . , xm−1,φ(x1, . . . , xm−1))

har et vanlig ekstremalpunkt (uten bibetingelser) i punktet (x1, . . . , xm−1).Dermed er alle de partiellderivete ∂h

∂xilik null i dette punktet. Bruker vi

kjerneregelen, er dermed

0 =∂h

∂xi(x1, . . . , xm−1) =

∂f

∂xi(x1, . . . , xm−1, y) +

+∂f

∂y(x1, . . . , xm−1, y)

∂φ

∂xi(x1, . . . , xm−1)

Implisitt funksjonsteorem gir oss at

∂φ

∂xi(x1, . . . , xm−1) = −

∂g∂xi

(x1, . . . , xm−1, y)∂g∂y (x1, . . . , xm−1, y)

Setter vi dette inn i den foregaende ligningen (husk at x = (x1, . . . , xm−1, y)),far vi etter litt omgruppering

∂f

∂xi(x) =

∂f∂y (x)∂g∂y (x)

∂g

∂xi(x)

Setter vi λ =∂f∂y (x)∂g∂y (x)

, har vi dermed

∂f

∂xi(x) = λ

∂g

∂xi(x)

for i = 1, . . . ,m−1. Det gjenstar a vise at formelen ogsa holder for den sistevariabelen, dvs. at ∂f

∂y (x) = λ∂g∂y (x). Dette er bare en triviell utregning:

λ∂g

∂y(x) =

∂f∂y (x)∂g∂y (x)

∂g

∂y(x) =

∂f

∂y(x)

Dermed har vi vist at ∇f(x) = λ∇g(x), og beviset er fullført. !

Lagranges multiplikatormetode har mange anvendelser. Vi skal kommetilbake til noen av disse senere i seksjonen, men for øyeblikket skal vi nøye

5.10. LAGRANGES MULTIPLIKATORMETODE 487

oss med a følge opp en problemstilling fra forrige seksjon. I den seksjonenviste vi hvordan man kan finne lokale maksimums- og minimumspunkter idet indre av et omrade ved a lete etter punkter der alle de partiellderiverte ernull. Dersom omradet vi er interessert i er lukket, er det ogsa mulig at noenav maksimums- eller minimumspunktene ligger pa randen (husk eksempel 5i seksjon 5.9). Disse kan vi finne ved hjelp av Lagranges multiplikatormeto-de. Vi illustrerer fremgangsmaten med et enkelt eksempel.

Eksempel 3: Vi skal finne maksimums- og minimumsverdien til funksjonen

f(x, y) = x2 − y3

pa omradetA = {(x, y) ∈ R2 | x2 + y2 ≤ 1}

Siden omradet er lukket og funksjonen er kontinuerlig, vet vi fra ekstremal-verdisetningen (5.8.2) at det finnes (globale) maksimums- og minimums-punkter. Hvis et slikt punkt ligger i det indre av omradet, vet vi at departiellderiverte ma være null i punktet. Siden

∂f

∂x= 2x og

∂f

∂y= −3y2,

ser vi at det eneste stasjonære punktet er (0, 0) og at f(0, 0) = 0. Detteer var første kandidat til tittelen som maksimums- og minimumspunkt. Deandre kandidatene ma ligge pa randen

{(x, y) ∈ R2 | x2 + y2 = 1},

sa vi bruker Lagranges multiplikatormetode med f(x, y) = x2−y3 og g(x, y) =x2 + y2. Vi har

∇f(x, y) =(

2x−3y2

)og ∇g(x, y) =

(2x2y

)

og skriver vi ligningen∇f(x, y) = λ∇g(x, y) pa komponentform, far vi (etterlitt forkorting) ligningssystemet

x = λx

−3y2 = 2λy

x2 + y2 = 1

Den første ligningen kan oppfylles pa to mater, enten er x = 0 eller sa erλ = 1. Vi ser pa tilfellene hver for seg. Hvis x = 0, følger det fra den sisteligningen at y = ±1. Dette betyr at (0,±1) er mulige ekstremalpunkter.Setter vi isteden λ = 1, far den andre ligningen i systemet formen−3y2 = 2y.Denne ligningen har to løsninger, y = 0 og y = −2

3 . Setter vi disse løsningene

Page 247: Flervariabel analyse med lineær algebra

488 KAPITTEL 5. ITERASJON OG OPTIMERING

inn i den tredje ligningen, ser vi at y = 0 gir x = ±1 og at y = −23 gir

x = ±√

53 .

Ialt har vi dermed sju kandidater: (0, 0), (0,±1), (±1, 0) og (±√

53 ,−2

3).For a finne maksimum og minimum, regner vi ut alle funksjonsverdiene:

f(0, 0) = 0, f(0,±1) = ∓1, f(±1, 0) = 1, f(±√

53

,−23) =

2227

Dette viser at maksimumsverdien 1 finner vi i punktene (0,−1), (±1, 0),mens minimumsverdien -1 finner vi i punktet (0, 1).

Figur 5: Grafisk fremstilling av flaten f(x, y) = x2 − y3

Figur 5 viser grafen. Du ser tydelig de tre maksimumspunktene og det eneminimumspunktet. Punktene (±

√5

3 ,−23) er lokale minimumspunkter nar du

gar fra topp til topp langs randen. Det indre punktet (0, 0) er et sadelpunkt(men du kan ikke vise det ved annenderivertesten siden determinanten D ernull). ♣

Bemerkning om Lagrangefunksjoner: Vi skal straks ga over til a studereLagranges metode for problemer med flere bibetingelser, men før vi gjør det,tar vi med en liten bemerkning om en annen mate a fremstille teorien ovenforpa. Selv om denne fremstillingen bare er en omforming av den vi hittil harbrukt, ser de to beskrivelsene sa forskjellige ut ved første øyekast at det kanvære lurt a kjenne forbindelsen mellom dem.

Den alternative fremstillingen er basert pa sakalte Lagrangefunksjoner.Dersom vi ønsker a optimere funksjonen f(x1, . . . , xm) under bibetingelseng(x1, . . . , xm) = b, definerer vi Lagrangefunksjonen L ved

L(x1, . . . , xm,λ) = f(x1, . . . , xm)− λ(g(x1, . . . , xm)− b

)

(legg merke til at λ na er blitt en variabel pa linje med x1, . . . , xm). La ossglemme det opprinnelige problemet et øyeblikk, og heller finne de stasjonære

5.10. LAGRANGES MULTIPLIKATORMETODE 489

punktene til L. Regner vi ut de partiellderiverte, ser vi at:

∂L

∂x1=

∂f

∂xi− λ

∂g

∂x1

......

...∂L

∂xm=

∂f

∂xm− λ

∂g

∂xm

∂L

∂λ= −g(x1, . . . , xm) + b

Setter vi disse uttrykkene lik 0, far vi akkurat de ligningene vi skal løsenar vi bruker Lagranges multiplikatormetode — a bruke denne metoden eraltsa det samme som a finne de stasjonære punktene til LagrangefunksjonenL. I en del bøker vil du derfor se at man løser optimeringsproblemer underbibetingelser ved a skrive opp en Lagrangefunksjon og sa finne de stasjonærepunktene til denne funksjonen.

Det er en ting til du bør være klar. Noen bøker bytter fortegn pa λ-leddeti Lagrangefunksjonen og skriver den som

L(x1, . . . , xm,λ) = f(x1, . . . , xm) + λ(g(x1, . . . , xm)− b

)

Dette spiller ingen rolle — maksimums- og minimumspunktene er de sammesom før, det er bare λ som far omvendt fortegn av det den ellers ville hafatt.

Lagranges multiplikatormetode med flere bibetingelser

Vi skal na se pa Lagranges multiplikatormetode nar vi ønsker a optimere enfunksjon

f(x1, x2, . . . , xm)

under flere bibetingelser

g1(x1, x2, . . . , xm) = b1

g2(x1, x2, . . . , xm) = b2

......

...gk(x1, x2, . . . , xm) = bk

Normalt ma vi ha k < m for a fa et fornuftig ekstremalproblem, og vi skalderfor anta at dette alltid er tilfellet.

For a fa en følelse for problemet ser vi først pa tilfellet der vi ønsker amaksimere en funksjon

f(x, y, z)

Page 248: Flervariabel analyse med lineær algebra

490 KAPITTEL 5. ITERASJON OG OPTIMERING

av tre variable under to bibetingelser

g1(x, y, z) = b1

g2(x, y, z) = b2

De to ligningene g1(x, y, z) = b1 og g2(x, y, z) = b2 vil normalt definere toflater i rommet som skjærer hverandre langs en kurve (se figur 6). Problemeter altsa a finne den største verdien til f langs denne kurven.

Figur 6: De to flatene g1(x) = b1 og g(x) = b2 skjærer hverandre i en kurve

g1(x) = b1

g2(x) = b2

Husk at gradienten til f peker i den retningen hvor f vokser raskest.Dersom ∇f ikke star normalt pa kurven, er det rimelig a tro at funksjonenlangs kurven stiger i den retningen hvor ∇f peker. Skal vi derfor ha mak-simum i et punkt, ma ∇f i dette punktet sta normalt pa kurven, dvs. denma ligge i normalplanet til kurven. Dette normalplanet et utspent av nor-malvektorene til flatene (prøv a forsta dette geometrisk!), og ∇f ma derforvære en lineærkombinasjon av normalvektorene ∇g1 og ∇g2 til de to flatene(se figur 7).

Figur 7: ∇f(a) som lineærkombinasjon av ∇g1(a) og ∇g2(a)

38888889

))))))*SSSSSSSg

∇g1(a)

∇g2(a)

∇f(a)

g1(x) = b1

g2(x) = b2

))))*8888889

Vi venter derfor a finne maksimalverdien i et punkt (x, y, z) der det finneskonstanter λ1 og λ2 slik at

∇f(x, y, z) = λ1∇g1(x, y, z) + λ2∇g2(x, y, z)

Følgende teorem forteller oss at denne geometriske intuisjonen er riktig.

Teorem 5.10.2 (Lagranges multiplikatormetode med flere bibeting-elser) Anta at U er en apen delmengde av Rm, og at f, g1, g2, . . . , gk : U → R

5.10. LAGRANGES MULTIPLIKATORMETODE 491

er funksjoner med kontinuerlige partiellderiverte. Dersom b1, b2, . . . , bk erreelle tall og x = (x1, x2, . . . , xm) er et lokalt maksimums- eller minimums-punkt for f pa mengden

A = {x ∈ U | g1(x) = b1, g2(x) = b2, . . . og gk(x) = bk}

sa er enten ∇g1(x),∇g2(x), . . . ,∇gk(x) lineært avhengige, eller det finneskonstanter λ1,λ2, . . . ,λk slik at

∇f(x) = λ1∇g1(x) + λ2∇g2(x) + · · · + λk∇gk(x)

Før vi ser pa beviset, skal vi ta en nærmere kikk pa hva teoremet sier.Legg merke til at vi na har et ligningssystem med m+k ukjente x1, x2,. . . ,xm,λ1, λ2 ,. . . , λk, men at vi ogsa har m + k ligninger: Skriver vi ut ligningen

∇f(x) = λ1∇g1(x) + λ2∇g2(x) + · · · + λk∇gk(x)

komponentvis, far vi m ligninger, og bibetingelsene

g1(x) = b1

g2(x) = b2

......

...gk(x) = bk

gir oss de k siste. La oss se pa et enkelt eksempel.

Eksempel 4: Vi skal minimere funksjonen f(x, y, z) = x2 + y2 + z2 underbibetingelsene

x + 2y − z = 2

−x + y + 2z = 1

(Dette er ekvivalent med a finne det punktet pa skjæringslinjen mellomplanene x + 2y − z = 2 og −x + y + 2z = 1 som ligger nærmest origo, sadet er klart at problemet har en løsning). Vi regner ut gradientene til f ogfunksjonene g1(x, y, z) = x + 2y − z, g2(x, y, z) = −x + y + 2z:

∇f(x, y, z) =

2x2y2z

, ∇g1(x, y, z) =

12

−1

, ∇g2(x, y, z) =

−1

12

Ifølge teoremet ovenfor leter vi etter punkter der

2x2y2z

= λ1

12

−1

+ λ2

−1

12

Page 249: Flervariabel analyse med lineær algebra

492 KAPITTEL 5. ITERASJON OG OPTIMERING

Skriver vi ut ligningen komponentvis, far vi

2x = λ1 − λ2

2y = 2λ1 + λ2

2z = −λ1 + 2λ2

og i tillegg har vi bibetingelsene

x + 2y − z = 2

−x + y + 2z = 1,

altsa fem ligninger med fem ukjente. Ligningssystemet er lineært og kanløses ved vare standardmetoder, men vi velger en snarvei. Fra de tre førsteligningene, far vi uttrykkene x = λ1

2 −λ22 , y = λ1 + λ2

2 , z = −λ12 + λ2, som

vi setter inn i de to siste ligningene. Resultatet er

3λ1 −λ2

2= 2

−λ1

2+ 3λ2 = 1

Løser vi dette ligningssystemet, far vi λ1 = 2635 og λ2 = 16

35 . Setter vi inn iuttrykkene for x, y og z, far vi x = 1

7 , y = 3435 , z = 3

35 . Siden det geometriskeminimaliseringsproblemet vart apenbart har en løsning, og x = 1

7 , y = 3435 ,

z = 335 er den eneste kandidaten, er problemet løst. ♣

Vi skal na se pa beviset for teorem 5.10.2 (Lagranges multiplikatorteoremfor flere bibetingelser). Ideen er akkurat den samme som for en bibetingelse,men utførelsen blir litt mer komplisert fordi matriser erstatter tall en delsteder i argumentet. Vi far blant annet bruk for rangteoremet for matriser(teorem 4.7.9) som sier at vi alltid kan finne like mange lineært uavhengigesøyler som lineært uavhengige rader i en matrise.

∗Bevis for teorem 5.10.2: Det er nok a vise at hvis gradientene ∇g1(x),∇g2(x), . . . , ∇gk(x) er lineært uavhengige, sa finnes det konstanter λ1,λ2,. . . , λk slik at

∇f(x) = λ1∇g1(x) + λ2∇g2(x) + · · · + λk∇gk(x)

Som i tilfellet med en bibetingelse er det ogsa her nok a se pa tilfellet deralle bi-ene er 0. Lar vi G : Rm → Rk være funksjonen

G(x) =

g1(x)g2(x)

...gk(x)

,

5.10. LAGRANGES MULTIPLIKATORMETODE 493

kan vi dermed sammenfatte alle bibetingelsene i formelen G(x) = 0. Deri-verer vi, ser vi at radene i Jacobi-matrisen G′(x) rett og slett er gradientene∇g1(x),∇g2(x), . . . ,∇gk(x). Siden disse gradientene er lineært uavhengige ipunktet x, vet vi fra rangteoremet 4.7.9 for matriser at Jacobi-matrisen G(x)har k lineært uavhengige søyler. Ved eventuelt a bytte om pa rekkefølgen tilvariablene kan vi anta at dette er de k siste søylene. Siden de m− k førstevariablene og de k siste kommer til a spille ulike roller i resten av beviset,bytter vi navn pa dem for a gjøre forskjellen tydeligere. Vi setter

z = (x1, x2, . . . , xn)

der n = m− k, ogy = (xn+1, xn+2, . . . , xm)

Den “partielle” Jacobi-matrisen ∂G∂y (x) bestar av de siste k søylene i den

“fulle” Jacobi-matrisen G′(x), og siden disse søylene er lineært uavhengige,er ∂G

∂y (x) inverterbar. Ifølge teorem 5.7.4 (den vektorvaluerte versjonen avimplisitt funksjonsteorem) finnes det da en deriverbar funksjon Φ definert ien omegn om z = (x1, x2, . . . , xn) slik at

G(z,Φ(z)) = 0

og Φ(z) = y = (xn+1, xn+2, . . . , xm). Vi vet ogsa at

Φ′(z) = −(

∂G∂y

(x))−1 ∂G

∂z(x) (5.10.1)

Fra konstruksjonen ovenfor og betingelsene i teoremet følger det at funksjo-nen

h(z) = f(z,Φ(z))

har et lokalt ekstremalpunkt i z, og følgelig er ∇h(z) = 0. Vi skal na brukekjerneregelen til a regne ut ∇h. Det er da viktig a huske pa at Jacobi-matrisen til et skalarfelt er det samme som gradienten forutsatt at gradi-enten oppfattes som en radvektor. Alle gradienter i dette beviset ma der-for oppfattes som radvektorer. Vi far ogsa bruk for at “kjernefunksjonen”

Ψ(z) =(

zΦ(z)

)har Jacobi-matrise

Ψ′(z) =

1 0 . . . 00 1 . . . 0...

... . . ....

0 0 . . . 1∂φ1∂z1

∂φ1∂z2

. . . ∂φ1∂zn

∂φ2∂z1

∂φ2∂z2

. . . ∂φ2∂zn

...... . . .

...∂φk∂z1

∂φk∂z2

. . . ∂φk∂zn

Page 250: Flervariabel analyse med lineær algebra

494 KAPITTEL 5. ITERASJON OG OPTIMERING

Legg merke til at den nedre delen av denne matrisen er Jacobi-matrisenΦ′(z). Ifølge kjerneregelen har vi

∇h(z) = ∇f(z,Φ(z))Ψ′(z)

Dersom vi lar

∇zf(z,y) =(

∂f

∂z1(z,y), . . . ,

∂f

∂zn(z,y)

)

være den gradienten vi far dersom vi bare tenker pa f som en funksjon avz-variablene, og

∇yf(z,y) =(

∂f

∂y1(z,y), . . . ,

∂f

∂zk(z,y)

)

være den gradienten vi far dersom vi bare tenker pa f som en funksjon avy-variablene, sa kan ligningen ovenfor skrives:

∇h(z) = ∇zf(z,Φ(z)) +∇yf(z,Φ(z))Φ′(z)

Siden ∇h(z) = 0, har vi dermed

0 = ∇zf(z,Φ(z)) +∇yf(z,Φ(z))Φ′(z)

Fra ligning (5.10.1) ovenfor vet vi at

Φ′(z) = −(

∂G∂y

(x))−1 ∂G

∂z(x)

og setter vi dette inn i ligningen ovenfor, far vi (husk at x = (z,Φ(z))):

0 = ∇zf(x)−∇yf(x)(

∂G∂y

(x))−1 ∂G

∂z(x)

Dette ser komplisert ut, men er egentlig ikke sa ille. Observer at ∇yf(x) eren 1×k-matrise og at ∂G

∂y (x)−1 er en k×k-matrise. Ganger vi sammen disse,far vi en 1 × k-matrise Λ = (λ1,λ2, . . . ,λk). Dermed kan ligningen ovenforskrives

∇zf(x) = Λ∂G∂z

(z)

Ganger vi ut høyresiden og bruker at radene i ∂G∂z (z) er gradientene ∇zgi(z),

far vi∇zf(x) = λ1∇zg1(x) + λ2∇zg2(x) + · · · + λk∇zgk(x)

Dette er nesten det vi skulle vise, det eneste problemet er at vi har debegrensede gradientene ∇zf , ∇zg1 . . . ,∇zgk og ikke de fulle gradientene∇f , ∇g1. . .∇gk. Det gjenstar derfor a vise at

∇yf(x) = λ1∇yg1(x) + λ2∇yg2(x) + · · · + λk∇ygk(x)

5.10. LAGRANGES MULTIPLIKATORMETODE 495

Dette er ekvivalent med a vise at

∇yf(x) = Λ∂G∂y

(x),

og siden Λ = ∇yf(x)(

∂G∂y (x)

)−1, er dette en enkel utregning:

Λ∂G∂y

(x) = ∇yf(x)(

∂G∂y

(x))−1 ∂G

∂y(x) = ∇yf(x) !

Bemerkning: Vi skal ikke komme nærmere inn pa det her, men nevner iforbifarten at det ogsa finnes annenderiverttester for ekstremalverdiproble-mer med bibetingelser.

Bemerkning om Lagrangefunksjoner: Ogsa nar vi skal optimere enfunksjon f(x1, . . . , xm) under flere bibetingelser g1(x1, . . . , xm) = b1, . . . ,gk(x1, . . . , xm) = bk er det mulig a formulere problemstillingen ved hjelp aven Lagrangefunksjon L. I dette tilfellet far L formen

L(x1, . . . , xm,λ1, . . . ,λk) = f(x1, . . . , xm)

−λ1(g1(x1, . . . , xm)− b1

)− . . .− λk

(gk(x1, . . . , xm)− bk

)

Regner vi ut de partiellderiverte til L, far vi:∂L

∂x1=

∂f

∂x1− λ1

∂g1

∂x1− . . .− λk

∂gk

∂x1

......

...∂L

∂xm=

∂f

∂xm− λ1

∂g1

∂xm− . . .− λk

∂gk

∂xm

∂L

∂λ1= −g1(x1, . . . , xm) + b1

......

...∂L

∂λk= −gk(x1, . . . , xm) + bk

Setter vi disse uttrykkene lik 0, far vi de ligningene vi ma løse nar vi brukerLagranges multiplikatormetode. Akkurat som for problemer med en bibe-tingelse kan vi altsa løse optimeringsproblemer med flere bibetingelser veda finne de stasjonære punktene til Lagrangefunksjonen.

Vær oppmerksom pa at noen bøker bytter fortegn pa λ-leddene i Lag-rangefunksjonen slik at den blir seende slik ut:

L(x1, . . . , xm,λ1, . . . ,λk) = f(x1, . . . , xm)

+λ1(g1(x1, . . . , xm

)− b1) + . . . + λk

(gk(x1, . . . , xm)− bk

)

Dette spiller ingen rolle — maksimums- og minimumspunktene er de sammesom før, det er bare λ-ene som far omvendt fortegn av det de ellers ville hafatt.

Page 251: Flervariabel analyse med lineær algebra

496 KAPITTEL 5. ITERASJON OG OPTIMERING

Økonomisk tolkning av Lagrangemultiplikatorer

Lagranges multiplikatormetode brukes mye i økonomiske fag. Det er ikke savanskelig a forsta hvorfor — i økonomi er man opptatt av maksimums- ogminimumsproblemer (man ønsker f.eks. a maksimere inntektene og minimereutgiftene), men samtidig har man naturlige bibetingelser — man kan f.eks.ha en begrenset sum a kjøpe ravarer for, eller man har et begrenset antallarbeidstimer a fordele pa ulike oppgaver.

I de eksemplene vi har sett pa hittil, har Lagrangemultiplikatorene spilten underordnet rolle; de har vært hjelpestørrelser vi har trengt for a løseproblemet vart, men de har ikke hatt noen selvstendig betydning. I en deløkonomiproblemer spiller imidlertid Lagrangemultiplikatorene en viktig rol-le.

La oss tenke oss av vi ønsker a maksimere en inntektsfunksjon f(x) un-der bibetingelsene g1(x) = b1, g(x) = b2, . . . , gk(x) = bk. Dersom vi endrerverdiene b1, b2, . . . , bk, ma vi selvfølgelig regne med at bade maksimalpunk-tet x og maksimalverdien y = f(x) endrer seg. Vi kan derfor tenke pa dissesom funksjoner av b = (b1, b2, . . . , bk), altsa x(b), y(b) = f(x(b)). Dersomλ1, λ2, . . . ,λk er Lagrangemultiplikatorene som tilhører maksimumspunktetx(b), ma vi regne med at disse ogsa vil variere med b, og vi antar for en-kelthets skyld at de er veldefinerte funksjoner av b, altsa λ1(b), λ2(b), . . . ,λk(b). Det er lurt a tenke pa b1, b2, . . . , bk som innsatsfaktorer i produksjo-nen — b1 er kanskje det totalet beløpet vi er villige til a kjøpe ravarer for,b2 er det totale antall arbeidstimer vi er villige til a bruke i produksjonen,b3 beløpet vi bruker pa a videreutvikle produktene osv.

Et naturlig spørsmal er hvordan en endring i innsatsfaktorene vil pavirkeinntektene — hvor mye vil vi f.eks. tjene pa a øke arbeidsinnsatsen med 10%?Disse endringene males av de partiellderiverte

∂y

∂bi(b) =

∂f(x(b))∂bi

Som vi snart skal se, er∂y

∂bi(b) = λi(b)

Dette betyr at dersom vi gir innsatsfaktoren bi en liten økning ∆bi, sa økerinntektene med λi(b)∆bi. Dersom kostnadene ved a øke bi en enhet er mindreenn λi(b), sa lønner det seg altsa a øke innsatsfaktoren bi, men dersomkostnadene er større enn λi(b), lønner det seg a redusere bi. Av denne grunnkalles λi(b) likevektsprisen til innsatsfaktor bi (den kalles ogsa skyggeprisenfor a understreke at den ikke nødvendigvis har noe med den virkelige prisena gjøre).

La oss na vise at∂y

∂bi(b) = λi(b)

5.10. LAGRANGES MULTIPLIKATORMETODE 497

Vi skal ikke gjennomføre et fullstendig matematisk resonnement, men viseat denne formelen følger dersom vi antar at de involverte funksjonene erderiverbare (det gar an a vise at dette er tilfellet under svært rimelige be-tingelser). La oss begynne med a se pa bibetingelsene. Siden de alltid eroppfylt, har vi

gj(x(b)) = bj

Deriverer vi dette uttrykket mhp. bi, far vi (husk kjerneregelen pa venstre-siden!):

m∑

n=1

∂gj

∂xn(x(b))

∂xn

∂bi(b) =

1 hvis i = j

0 ellers(5.10.2)

Deriverer vi inntektsfunksjonen mhp. bi, far vi tilsvarende

∂y

∂bi(b) =

∂bif(x(b)) =

m∑

n=1

∂f

∂xn(x(b))

∂xn

∂bi(b)

Ifølge Lagrangebetingelsene er

∂f

∂xn(x(b)) =

k∑

j=1

λj(b)∂gj

∂xn(x(b))

og setter vi dette inn i uttrykket ovenfor, far vi

∂y

∂bi(b) =

m∑

n=1

k∑

j=1

λj(b)∂gj

∂xn(x(b))

∂xn

∂bi(b) =

=k∑

j=1

λj(b)m∑

n=1

∂gj

∂xn(x(b))

∂xn

∂bi(b) = λi(b)

der vi i siste overgang har brukt formel (5.10.2).

Oppgaver til seksjon 5.10

1. Finn maksimums- og minimumspunktene (hvis de finnes) til funksjonen f underbibetingelsen(e).

a) f(x, y) = 4x− 3y nar x2 + y2 = 1.

b) f(x, y) = xy nar 9x2 + y2 = 18

c) f(x, y, z) = x2 + y2 + z2 nar 2x− 3y + 2z = 17

d) f(x, y, z) = x + y + z nar x2 + y2 = 1 og 2x + z = 1

e) f(x, y, z) = 2x + 3y nar 3x2 + 2y2 = 3

f) f(x, y, z) = x2 − 2x + 2y2 + z2 + z nar x + y + z = 1 og 2x− y − z = 5

Page 252: Flervariabel analyse med lineær algebra

498 KAPITTEL 5. ITERASJON OG OPTIMERING

2. Finn punktene pa flaten z2 − xy = 1 som ligger nærmest origo.

3. Finn punktene pa skjæringkurven mellom flatene x2+y2 = 1 og x2−xy+y2−z2 =1 som ligger nærmest origo.

4. Løs oppgave 11 i forrige seksjon ved hjelp av Lagranges multiplikatorer.

5. Løs oppgave 12 i forrige seksjon ved hjelp av Lagranges multiplikatorer.

6. Løs oppgave 13 i forrige seksjon ved hjelp av Lagranges multiplikatorer.

7. Løs oppgave 16 i forrige seksjon ved hjelp av Lagranges multiplikatorer.

8. La f(x, y) = ln(x2 + y2 + 1)− x2

2 + y2.

a) Finn de stasjonære punktene til f og avgjør om de er lokale maksimums-punkter, lokale minimumspunkter eller sadelpunkter.

b) Finn maksimum og minimum til f pa omradet {(x, y) |x2 + y2 ≤ 1}. (Hint:Det kan lønne seg a bytte til polarkoordinater.)

9. (Eksamen i MAT 1110, 13/6, 2008) Forklar at funksjonen f(x, y) = 2x + 4y harmaksimums- og minimumspunkter under bibetingelsen {(x, y) ∈ R2 |x2 + y2 = 4}.Finn disse maksimums- og minimumspunktene.

10. Kjeglesnittet K bestar av alle punkter (x, y) som oppfyller ligningen 9x2+4y2−18x + 16y = 11

a) Hva slags kjeglesnitt er K? Lag en tegning av K der alle viktige størrelserer tegnet inn (f.eks. sentrum, brennpunkter, halvakser, asymptoter etter hvasom er aktuelt).

b) Forklar at funksjonen f(x, y) = 2x+y har en største og minste verdi nar denbegrenses til mengden K. Finn disse maksimum- og minimumsverdiene.

11. En rektangulær boks med kanter parallelle med koordinataksene skal plasseresinni ellipsoiden x2

a2 + y2

b2 + z2

c2 = 1. Hva er det største volumet denne boksen kan ha?

12. Av en sylinderformet stokk med radius r skal det skjæres ut en bjelke medbredde 2x og høyde 2y. (Se figur). Bæreevnen til bjelken er proporsjonal med x ogmed kvadratet av y, dvs. den er gitt ved funksjonen

f(x, y) = kxy2

der k er en konstant.

02/1

< "

$

!#2x

2y

Finn de verdier av x og y som gir størst verdi for f(x, y).

5.10. LAGRANGES MULTIPLIKATORMETODE 499

13. En renne skal lages ved at en b cm bred metallplate brettes opp symmetrisk pabegge sider. Figuren viser et tverrsnit av rennen. Hvordan ma vi velge bredden xog vinkelen u for at tverrsnittet skal fa størst mulig areal?

!!

""

!#x

u

14. Herons formel sier at arealet til en trekant med sider x, y, z er

A =√

s(s− x)(s− y)(s− z)

der s = x+y+z2 er halve omkretsen. Bruk Lagranges multiplikatormetode til a vise

at blant alle trekanter med samme omkrets, er det den likesidede som har størstareal.

15. La S være ellipsoideflaten

x2

a2+

y2

b2+

z2

c2= 1

a) Finn ligningen for tangentplanet til S i punktet (x0, y0, z0).

b) Anta at x0, y0, z0 > 0. Finn volumet til pyramiden avgrenset av koordinat-planene og tangentplanet til S i (x0, y0, z0).

c) Finn det punktet (x,y,z) pa S med x, y, z ≥ 0 som gjør produktet xyz størstmulig.

d) Hva er det minste volumet pyramiden i b) kan ha?

16. I økonomi regner man ofte at profitten kan modelleres som en Cobb-Douglas-funksjon. Det betyr at profitten er gitt ved P (x, y) = Kxαyβ der K, α, β er positivekonstanter, og x og y star for det beløpet man investerer i forskjellige “innsatsfak-torer”, f.eks. kan x være investeringen i ravarer og y investeringen i arbeidskraft.Anta at den totale investeringen er gitt, dvs. at x + y = S, der S er en konstant.

a) Vis at profitten er størst nar x = αSα+β , y = βS

α+β . Hva er den maksimaleprofitten?

b) Generaliser resultatet ovenfor til flere innsatsfaktorer. Anta at

P (x1, x2, . . . , xn) = Kxα11 xα2

2 . . . xαnn

(der K, α1,α2, . . . ,αn er positive konstanter) og finn maksimumsverdien tilP under bibetingelsen x1 + x2 + . . . + xn = S.

17. Anta at en forbruker har valget mellom to varetyper. De to vareslagene kosterhhv. p og q kroner per enhet. I økonomiske modeller regner man ofte med at nyttenforbrukeren har av a kjøpe x enheter av den ene varetypen og y enheter av denandre, er gitt ved en nyttefunksjon av typen

U(x, y) = a lnx + b ln y

der a og b er positive konstanter. Dersom forbrukeren har S kroner til radighet,ønsker hun a maksimere nyttefunksjon under bibetingelsen px + qy = S. Vist at

Page 253: Flervariabel analyse med lineær algebra

500 KAPITTEL 5. ITERASJON OG OPTIMERING

hun far maksimalt utbytte ved a velge x = aSp(a+b) og y = bS

q(a+b) .

18. Et firma produserer to vareslag. Det har et samlet produksjonsbudsjett pa Skroner i aret og et utviklingsbudsjett pa T kroner i aret. Firmaet regner at hvisdet bruker x kroner pa produksjon av vareslag 1 og samtidig bruker y kroner pa avidereutvikle produktet, vil overskuddet fra vareslag 1 være

U(x, y) = Axαy1−α

der A og α er konstanter, 0 ≤ α < 1. Hvis firmaet pa samme mate bruker z kronerpa produksjon av vareslag 2 og samtidig bruker u kroner pa videreutvikling, regnerdet med at overskuddet fra vareslag 2 vil være

V (z, u) = Bzβu1−α

der B og β er konstanter, 0 ≤ β < 1.

a) Forklar hvorfor det er naturlig for firmaet a optimere størrelsen U(x, y) +V (z, u) under bibetingelsene x + z = S, y + u = T .

b) Vis at Lagranges multiplikatormetode leder til ligningene

αA(x

y)α−1 = λ

(1− α)A(x

y)α = µ

βB(z

u)β−1 = λ

(1− β)B(z

u)β = µ

x + z = S

y + u = T

c) Vis ved a kombinere de to første ligningene ovenfor at xy = α

1−αµλ . Vis ogsa

at zu = β

1−βµλ .

d) Vis ved a kombinere den første og tredje ligningen ovenfor at

αA(x

y)α−1 = βB(

z

u)β−1

Sett inn uttrykkene for xy og z

u fra c) og vis at dette leder til formelen

µ

λ=

[Bββ(1− β)1−β

Aαα(1− α)1−α

] 1α−β

e) For enkelthets skyld kaller vi uttrykket pa høyre side av uttrykket ovenforfor K. Vi har med andre ord µ

λ = K. Ifølge c) har vi dermed xy = α

1−αK ogzu = β

1−βµλ . Sett disse uttrykkene inn i de to siste ligningen i ligningssystemet

i b), og finn x, y, z og u.

5.10. LAGRANGES MULTIPLIKATORMETODE 501

19. I denne oppgaven skal vi se pa en anvendelse av Lagranges multiplikatormetodei statistisk fysikk. La oss begynne med en kort skisse av den fysiske problemstillin-gen (selv om det egentlig ikke er nødvendig a skjønne fysikken for a løse oppgaven):Vi har et system med N partikler (N er et svært stort tall) som kan fordele seg pan energinivaer E1, E2, . . . , En. Den totale energien til systemet er U , og sannsynlig-heten for a finne en tilfeldig partikkel pa energiniva Ei er pi. Malet er a finne denmest sannsynlige fordelingen av partiklene pa energinivaene. Denne fordelingen ergitt ved vektoren (x1, x2, . . . , xn) der xi er antall partikler pa niva Ei.

Etter noen innledende betraktninger (som er ren sannsynlighetsregning) kom-mer man frem til at man ønsker a finne maksimum til funksjonen

f(x1, x2, . . . , xn) = N −n∑

i=1

xi ln(

xi

pi

)

under bibetingelsenen∑

i=1

xi = N (det totale antall partikler er N)

n∑

i=1

xiEi = U (den totale enegien er U)

a) La g og h være funksjonene g(x1, x2, . . . , xn) =∑n

i=1 xi, h(x1, x2, . . . , xn) =∑ni=1 xiEi. Vis at

∂f

∂xi= − ln

(xi

pi

)+ 1,

∂g

∂xi= 1 og

∂h

∂xi= Ei

b) Vis at Lagranges multiplikatormetode gir ligningene

− ln(

xi

pi

)+ 1 = λ + µEi for i = 1, 2, . . . , n

i tillegg til bibetingelsene∑n

i=1 xi = N og∑n

i=1 xiEi = U .

c) Vis at xi = pie−λ−µEi+1.

d) Vi innfører na partisjonsfunksjonen Z =∑N

i=1 pie−µEi . Bruk den første bi-betingelsen til a vise at xi = N

Z pie−µEi . Dermed har vi kvittet oss med denførste multiplikatoren λ.

e) Vis at den gjenværende multiplikatoren µ er bestemt av ligningen U =NZ

∑ni=1 piEie−µEi .

Dette viser at µ er knyttet til den totale energien til systemet. Faktisk viser detseg at µ = 1

kT der T er temperaturen til systemet (malt i grader Kelvin) og k eren konstant (Boltzmanns konstant). Vi ender dermed opp med den fundamentalesammenhengen xi = N

Z pie−EikT som kalles Maxwell-Boltzmann-fordelingen.

20. (Eksamen i MAT 1110 15/8, 2008, noe utvidet) I denne oppgaven er

A =

a11 a12 . . . a1n

a12 a22 . . . a23...

... . . ....

a1n a2n . . . ann

Page 254: Flervariabel analyse med lineær algebra

502 KAPITTEL 5. ITERASJON OG OPTIMERING

en symmetrisk n × n-matrise, og f : R3 → R er funksjonen f(x) = (Ax) · x (der(Ax) · x betegner skalarproduktet mellom vektorene Ax og x).

a) Vis at dersom x er en egenvektor fot A med egenverdi λ, sa er f(x) = λ|x|2.

b) Vis at for alle vektorer x = (x1, x2, . . . , xn) er

f(x1, x2, . . . , xn) =n∑

i=1

aiix2i + 2

i (=j

aijxixj

der den siste summen er over alle par av ulike indekser 1 ≤ i, j ≤ n.

c) La S = {x ∈ Rn : |x| = 1} være det n-dimensjonale kuleskallet om ori-go med radius 1. Forklar at nar vi innskrenker f til S, sa har funksjonenmaksimums- og minimumspunkter. Bruk Lagranges multiplikatormetode tila vise at disse maksimums- og minimumspunktene er egenvektorer til A. Vistil slutt at maksimumsverdien til f pa S er den største egenverdien til A,mens minimumsverdien er den minste egenverdien til A.

5.11 Gradientmetoden

I de foregaende seksjonene har vi studert optimeringsproblemer for funksjo-ner av flere variable. Vi har sett at bade problemer med bibetingelser ogproblemer uten bibetingelser leder til ligningssystemer som skal løses. Disseligningssystemene blir fort sa kompliserte at de ikke kan løses for hand, ogman ma derfor bruke datamaskiner til a finne tilnærmede løsninger. Newtonsmetode er et utmerket redskap for numerisk løsning av ligningssystemer, ogdet er selvfølgelig utviklet metoder der man kobler optimeringsproblemerdirekte til Newtons metode. Men det finnes ogsa andre metoder der mangar direkte løse pa optimeringsproblemene uten a ga veien om stasjonærepunkter. I denne seksjonen skal vi se kort pa en slik metode — “gradient-metoden” eller “den bratteste nedstigningsmetoden” (“method of steepestdescent”).

Grunnideen i denne metoden er enkel. Vi vet at gradienten til en funksjonpeker i den retningen hvor funksjonen stiger raskest, og ønsker vi a finneet minimumspunktet for funksjonen (metoden presenteres gjerne som enmetode for a finne minimumspunkter), er det naturlig a ga i motsatt retningav gradienten. Etter a ha gatt i denne retningen et stykke, stopper vi opp,regner ut gradienten pa nytt, og fortsetter i motsatt retning av den nyegradienten osv. Denne metoden bringer oss stadig lenger ned, og med littflaks burde den lede oss til et (lokalt) minimumspunkt.

Et viktig spørsmal er hvor langt vi skal ga i en retning før vi stopper oppog regner ut en ny gradient. Gar vi for kort, blir metoden ineffektiv fordivi ma regne ut nye gradienter oftere enn nødvendig, og gar vi for langt,risikerer vi a passere minimumspunktet og ga langt ut pa den andre siden.Et naturlig valg er a fortsette i den retningen vi har begynt sa lenge det gar

5.11. GRADIENTMETODEN 503

nedover, og først beregne en ny gradient nar vi kommer til et sted der detbegynner a ga oppover.

La oss se hvordan dette ser ut matematisk. Anta at ønsker a finne et(lokalt) minimumspunkt for funksjonen f(x), og at vi har et startpunktx0 som vi tror ikke ligger altfor langt unna det minimumspunktet vi er pajakt etter. Gradienten ∇f(x0) gir oss den retningen hvor funksjonen vokserbrattest, og vi ønsker a ga i motsatt retning, altsa langs linjen

r(t) = x0 −∇f(x0)t

Setter vi dette uttrykket inn i f , far vi en funksjon g av en variabel

g(t) = f(r(t))

Vi ønsker a finne minimumspunktet til g, sa vi regner ut den deriverte vedhjelp av kjerneregelen

g′(t) = ∇f(r(t)) · r′(t) = ∇f(x0 −∇f(x0)t) ·∇f(x0)

Vi er pa jakt etter en t > 0 slik at g(t) = 0, dvs.

∇f(x0 −∇f(x0)t) ·∇f(x0) = 0

(finnes det flere slike t’er, velger vi den første). Selv om dette bare er enligning med en ukjent, er det slett ikke sikkert vi kan løse den for hand, ogda ma vi bruke f.eks. Newtons metode for a finne en tilnærmet verdi. Narvi har funnet en løsning t0, setter vi

x1 = x0 −∇f(x0)t0

og gjentar hele prosedyren med x1 som utgangspunkt. Pa denne maten farvi en følge {xn} som (forhapentligvis) konvergerer mot et lokalt minimum.

Det gar an a analysere gradientmetoden teoretisk (omtrent som vi tid-ligere har analysert Newtons metode) og komme frem til sikre kriterier forkonvergens og gode estimater for konvergenshastighet. Vi skal ikke gjøredette her, men nøye oss med et enkelt eksempel som viser metoden i praksis.

Eksempel 1: Vi skal bruke gradientmetoden pa funksjonen

f(x, y) = x2 + 4y2

Det er lett a se at f har ett eneste minimumspunkt, nemlig (0, 0), sa poengetmed eksemplet er ikke a finne minimumspunktet, men a studere hvordangradientmetoden virker.

Vi trenger apenbart gradienten til f , sa la oss regne den ut med en gang:

∇f(x, y) = (2x, 8y)

Page 255: Flervariabel analyse med lineær algebra

504 KAPITTEL 5. ITERASJON OG OPTIMERING

Anta at vi starter iterasjonen i et punkt x0 = (x0, y0). Ifølge teorien ovenfor,leter vi etter en t > 0 som løser ligningen

∇f(x0 −∇f(x0)t) ·∇f(x0)

Bruker vi at ∇f(x, y) = (2x, 8y) og x0 −∇f(x0)t = (x0 − 2x0t, y0 − 8y0t),far vi ligningen

(2(x0 − 2x0t), 8(y0 − 8y0t)) · (2x0, 8y0) = 0

Ganger vi ut og forkorter, gir dette ligningen

x20 − 2x0t + 16y2

0 − 128y20t = 0

som har løsningen

t0 =x2

0 + 16y20

2x20 + 128y2

0

Dermed far vi

x1 = x0 −∇f(x0)t0 = (x0, y0)− (2x0, 8y0)x2

0 + 16y20

2x20 + 128y2

0

dvs.

x1 = x0

(1− x2

0 + 16y20

x20 + 64y2

0

)=

48x0y20

x20 + 64y2

0

y1 = y0

(1− 4x2

0 + 64y20

x20 + 64y2

0

)= − 3x2

0y0

x20 + 64y2

0

Tilsvarende formler gjelder selvfølgelig senere i iterasjonen; vi har

xn+1 =48xny2

n

x2n + 64y2

n

yn+1 = − 3x2nyn

x2n + 64y2

n

La oss skrive et lite MATLAB-program for a se hvordan iterasjonen forløper:

function [x,y]=gradient(a,b,N)x=zeros(1,N);y=zeros(1,N);x(1)=a;y(1)=b;for n=1:Nx(n+1)=48*x(n)*y(n)^2/(x(n)^2+64*y(n)^2));y(n+1)=-3*x(n)^2*y(n)/(x(n)^2+64*y(n)^2));end

5.11. GRADIENTMETODEN 505

Gir vi na kommandoene

>> [x,y]=gradient(1.4,.3,10);>> plot(x,y)>> axis ’equal’

far vi figuren nedenfor som viser hvordan gradientmetoden gir en følge somnærmer seg nullpunktet (0, 0) nar vi starter i punktet (1.4, 0.3).

Figur 1: Gradientmetoden ♣

Legg merke til at i figuren ovenfor ser gradientmetoden ut til a “oversky-te” ved a ga litt for langt i hvert skritt. Dette er ganske vanlig og gjelder ikkebare eksemplet vi na har studert. Gradientmetoden har ogsa andre svakhe-ter, og det finnes derfor en rekke videreutviklinger av metoden, men disseskal vi ikke komme inn pa her.

Oppgave til seksjon 5.11

1. Skriv et MATLAB-program som bruker gradientmetoden til a finne minimums-punktet til f(x, y) = x2 +2xy+2y2 +x−y. Sjekk resultatet ved a finne minimums-punktet ved regning.

Page 256: Flervariabel analyse med lineær algebra

506 KAPITTEL 5. ITERASJON OG OPTIMERING

Kapittel 6

Multippel integrasjon

I dette kapitlet skal vi se pa integrasjon av funksjoner av flere variable. Slike multipleintegraler defineres pa samme mate som integraler av funksjoner av en variabel, ogde regnes ut ved at man beregner flere “vanlige” integraler etter hverandre. Dissedelene av teorien er derfor ikke spesielt vanskelige, men det er selvfølgelig en fordela være flink i tradisjonell integralregning.

Det som er vanskeligst med de nye integralene, er a stille dem opp. Istedenfora integrere over intervaller pa tallinjen, skal vi na integrerer over omrader i Rn, ogfor a stille opp integralene, ma vi beskrive disse omradene ved hjelp av formler.Ofte blir beskrivelsene enklere nar man bruker andre koordinatsystemer enn detvanlige (kartesiske), og vi kommer na virkelig til a fa bruk for de alternativenekoordinatsystemene vi innførte i seksjon 3.7: polarkoordinater, sylinderkoordinaterog kulekoordinater. I noen tilfeller strekker ingen av disse “standardsystemene” til,og da ma vi selv lage et passende koordinatsystem. A bytte koordinatsystem padenne maten svarer til a skifte variabel i et vanlig integral, men den flervariableteorien er mer geometrisk — vi bytter som regel (men ikke alltid) koordinatssystemfor a fa et enklere omrade a integrere over og ikke for a fa en enklere integrand.

Multiple integraler har viktige anvendelser. Mange av disse er naturlige gene-raliseringer av anvendelser du allerede kjenner for vanlige integraler — vi kan f.eks.bruke multiple integraler til a regne ut arealer, volumer og masser. I tillegg fin-nes det mange “nye” anvendelser i f.eks. statistikk og fysikk. Det viktigste i dettekapitlet er imidlertid ikke a lære om flest mulig slike anvendelser; det viktigste era lære hvordan man selv gar frem nar man skal bruke multiple integraler til løseproblemer i andre fag eller i andre deler av matematikken.

I praksis ma man ofte bruke numeriske metoder for a regne ut multiple inte-graler. Det krever mye regnekapasitet, og som regel er det verdt a bruke litt tidpa a skrive integralene pa enklest mulig form før man prøver seg pa en numeriskintegrasjon. I dette kapitlet skal vi nøye oss med a se litt pa hvordan MATLABhandterer multiple integraler (men det er nok til a gi deg erfaring med hvor tungeslike integralberegninger er!).

For at ikke geometrien skal bli for komplisert og notasjonen for uoversiktlig, skalvi hovedsakelig konsentrere oss om funksjoner av to og tre variable. Den generelleteorien for funksjoner av n-variable er imidlertid en gansk grei generalisering av dento- og tre-dimensjonale teorien, og du vil neppe fa store problemer om du skullestøte pa et fire- eller fem-dimensjonalt integral i andre kurs. For fullstendighetens

507

Page 257: Flervariabel analyse med lineær algebra

508 KAPITTEL 6. MULTIPPEL INTEGRASJON

skyld har vi likevel tatt med en kommentar om slike integraler helt til slutt i seksjon6.10.

6.1 Dobbeltintegraler over rektangler

Vi skal først se hvordan vi kan integrere en funksjon f(x, y) av to variable overet rektangel R i xy-planet. Slike dobbeltintegraler kan brukes til sa mangt, men iutgangspunktet er det lurt a tenke seg at f er en positiv funksjon, og at vi ønskera regne ut volumet under funksjonsgrafen og over rektangelet R (se figur 1).

"

'''''''''''(

))))))))))*

#########

$$$$$$$#########$$$$$$$R

z = f(x, y)%

%&

x

z

y

Figur 1: Volumet under grafen z = f(x, y)

La oss begynne med litt notasjon: Dersom R er rektangelet

R = {(x, y) ∈ R2 | a ≤ x ≤ b, c ≤ y ≤ d},

skriver vi ofteR = [a, b]× [c, d]

En partisjon Π av R bestar av en partisjon

a = x0 < x1 < x2 < . . . < xn−1 < xn = b

av [a, b], og en partisjon

c = y1 < y2 < . . . ym−1 < ym = d

av [c, d]. Vi tenker oss at denne partisjonen deler opp R i et rutenett som vist pafigur 2.

!

"

a x1 x2 xn−1b

c

y1

y2

ym−1

d

Figur 2: En partisjon av R

6.1. DOBBELTINTEGRALER OVER REKTANGLER 509

Vi larRij = [xi−1, xi]× [yj−1, yj ]

være den ij-te ruten i denne oppdelingen (dvs. den i-te ruten nar vi teller i x-retning, og den j-te nar vi teller i y-retning).

La oss na tenke oss at f : R → R er en begrenset funksjon (den kan godt hanegative verdier, men vi skriver som om den var positiv). For a fa en tilnærmingtil volumet under grafen til f , lar vi

mij = inf{f(x, y) | (x, y) ∈ Rij}

ogMij = sup{f(x, y) | (x, y) ∈ Rij}

være henholdsvis infimum og supremum til f over Rij . Lar vi

|Rij | = (xi − xi−1)(yj − yj−1)

være arealet til ruten Rij , ser vi at den nedre trappesummen

N(Π) =n∑

i=1

m∑

j=1

mij |Rij |

og den øvre trappesummen

Ø(Π) =n∑

i=1

m∑

j=1

Mij |Rij |

er henholdsvis en nedre og en øvre tilnærming til volumet under grafen til f (dersomdette finnes!). Dersom vi kan fa disse verdiene sa nær hverandre vi matte ønske veda lage partisjonen fin nok, er det naturlig a definere den felles grenseverdien til avære integralet av f over rektanglet R.

Definisjon 6.1.1 Anta at R = [a, b] × [c, d] er et rektangel i R2 og at f : R → Rer en begrenset funksjon. Da definerer vi øvreintegralet til f over R som

∫∫

Rf(x, y) dxdy = inf{Ø(Π) | Π er en partisjon av R}

og nedreintegralet til f over R som∫∫

R

f(x, y) dxdy = sup{N(Π) | Π er en partisjon av R}

Dersom∫∫

Rf(x, y) dxdy =∫∫

Rf(x, y) dxdy, sier vi at f er integrerbar over R, og

definerer (dobbelt)integralet til f over R til a være

∫∫

Rf(x, y) dxdy =

∫∫

Rf(x, y) dxdy =

∫∫

R

f(x, y) dxdy

Page 258: Flervariabel analyse med lineær algebra

510 KAPITTEL 6. MULTIPPEL INTEGRASJON

Bemerkning: Vi skal skrive to integraltegn∫∫

i dobbeltintegraler for a understrekeat vi integrerer med hensyn pa to variable, men siden denne skrivematen blir slitsometterhvert, er det mange videregaende bøker som bare bruker ett integraltegn. Pasamme mate skal vi veksle litt mellom betegnelsene “integral” og “dobbeltintegral”— vi bruker “dobbeltintegral” nar vi sammenligner dobbeltintegraler med andreintegraltyper, men nøyer oss ofte med “integral” ellers.

Legg merke til at definisjonene ovenfor er helt analoge til dem vi har for vanligeintegraler (se Kalkulus, seksjon 8.2). Ogsa en del fundamentale regneregler er somfør:

Setning 6.1.2 Anta R = [a, b] × [c, d] er et rektangel i R2. Anta at f, g : R → Rer integrerbare funksjoner og at k er en konstant. Da er

(i) kf integrerbar og∫∫

R kf(x, y) dxdy = k∫∫

R f(x, y) dxdy.

(ii) f+g integrerbar og∫∫

R

(f(x, y)+g(x, y)

)dxdy =

∫∫R f(x, y) dxdy+

∫∫R g(x, y) dxdy.

(iii) Hvis f(x, y) ≤ g(x, y) for alle (x, y) ∈ R, er∫∫

R f(x, y) dxdy ≤∫∫

R g(x, y) dxdy.

Bevis: Vi overlater beviset til leserne. Se oppgavene til seksjonen for hint. !

Vi har na definert dobbeltintegraler over rektangler og sett pa deres enklesteegenskaper. Vare neste oppgaver er

(i) a vise at alle kontinuerlige funksjoner er integrerbare

(ii) a finne metoder for a regne ut dobbeltintegraler

Vi begynner med den første oppgaven.

Integrasjon av kontinuerlige funksjoner

For a vise at kontinuerlige funksjoner er integrerbare, trenger vi et begrep og etresultat fra seksjon 5.3 (har du ikke lest denne seksjonen enna, er det sannsynlighetlike greit a ta teorem 6.1.5 nedenfor til etterretning og heller vende tilbake til seksjon5.3 ved en senere anledning). Vi begynner med a minne om definisjon 5.3.1

Definisjon 6.1.3 Anta at f : A → R er en funksjon av n variable. Vi sier at f eruniformt kontinuerlig pa en mengde B ⊂ A dersom det til enhver ε > 0 finnes enδ > 0, slik at hvis u,v ∈ B og |u− v| < δ, sa er |f(u)− f(v)| < ε.

Nøkkelresultatet er teorem 5.3.2 som vi skriver opp pa nytt her:

Teorem 6.1.4 Anta at K er en lukket, begrenset delmengde av Rn. Enhver funk-sjon f som er kontinuerlig pa K, er ogsa uniformt kontinuerlig pa K.

Vi har na det redskapet vi trenger for a vise at alle kontinuerlige funksjoner erintegrerbare.

Teorem 6.1.5 Anta at R = [a, b]× [c, d] er et rektangel i R2, og at f : R → R erkontinuerlig. Da er f integrerbar over R.

6.1. DOBBELTINTEGRALER OVER REKTANGLER 511

Bevis: Siden enhver øvre trappesum er større enn eller lik enhver nedre trappesum(se oppgave 3 hvis du ønsker hjelp til a vise dette), sa er det nok a vise at forenhver ε > 0, finnes det er partisjon Π slik at Ø(Π) − N(Π) ≤ ε. Fra setningenovenfor vet vi at f er uniformt kontinuerlig pa R, sa det finnes en δ > 0 slik at hvis|u − v| < δ, sa er |f(u) − f(v)| < ε

|R| , der |R| = (b − a)(d − c) er arealet til R.Velger vi partisjonen sa fin at avstanden mellom to punkter i samme delrektangelRij alltid er mindre enn δ, ma Mij −mij ≤ ε

|R| . Dermed er

Ø(Π)−N(Π) =n∑

i=1

m∑

j=1

(Mij −mij)|Rij | ≤ε

|R|

n∑

i=1

m∑

j=1

|Rij | = ε

der vi har brukt at∑n

i=1

∑mj=1 |Rij | = |R| siden summen av arealene til alle

smarektanglene er lik arealet til det store rektanglet. !

Ovenfor har vi definert dobbeltintegralet ved hjelp av øvre og nedre trappesum-mer. Som du sikkert husker fra teorien for vanlige integraler, lønner det seg ofte atenke pa slike integraler som grensen for Riemann-summer. Vi har et tilsvarendebegrep for dobbeltintegraler. Dersom vi har en partisjon Π gitt ved

a = x0 < x1 < . . . < xn−1 < xn = b

c = y0 < y1 < . . . < ym−1 < ym = d,

kan vi lage et utplukk U ved a velge en cij i hvert delrektangel Rij . Den tilhørendeRiemann-summen er

R(Π, U) =n∑

i=1

m∑

j=1

f(cij)|Rij |

Legg merke til at siden mij ≤ f(cij) ≤ Mij , sa er

N(Π) ≤ R(Π, U) ≤ Ø(Π)

Vi ønsker a vise at Riemann-summene nærmer seg integralet nar partisjonen Πblir finere og finere. Som et mal pa finheten, bruker vi maskevidden som er lik denlengste diagonalen i rektanglene Rij — med andre ord

|Π| = max{√

(xi − xi−1)2 + (yj − yj−1)2 : 1 ≤ i ≤ n, 1 ≤ j ≤ m

}

Setning 6.1.6 Anta at {Πn} er en følge av partisjoner av rektanglet R = [a, b] ×[c, d] slik at maskevidden |Πn| gar mot null, og la Un være et utplukk for Πn. Foralle kontinuerlige funksjoner f : R → R er da

∫∫

Rf(x, y) dxdy = lim

n→∞R(Πn, Un)

Bevis: Anta at ε > 0 er gitt. Siden f er uniformt kontinuerlig og maskeviddentil partisjonene gar mot null, finnes det en N ∈ N slik at hvis n ≥ N , sa er|f(z) − f(w)| < ε

|R| for alle z,w som hører til i samme delrektangel Rij . Pa sam-me mate som i forrige bevis medfører dette at Ø(Πn) − N(Πn) < ε. Siden bade∫∫

R f(x, y) dxdy og R(Πn, Un) ligger mellom Ø(Πn) og N(Πn), betyr dette at

|∫∫

Rf(x, y) dxdy −R(Πn, Un)| < ε

Page 259: Flervariabel analyse med lineær algebra

512 KAPITTEL 6. MULTIPPEL INTEGRASJON

for alle n ≥ N , og setningen er dermed bevist. !

Bemerkning: Setningen ovenfor gjelder faktisk for alle integrerbare funksjoner fog ikke bare for de kontinuerlige. For a bevise dette ma vi vise ulikheten Ø(Πn)−N(Πn) < ε uten a bruke uniform kontinuitet. Den følger fra et generelt resultatsom sier at dersom f er integrerbar, sa finnes det for enhver ε > 0 en δ > 0 slik athvis |Π| < δ, sa er Ø(Π)−N(Π) < ε. Det krever litt fingerferdighet a bevise dette,men har du lyst til a prøve deg, kan du bruke beviset for lemma 8.5.6 i Kalkulussom modell.

Itererte integraler

Vi har na definert integralet av en funksjon av to variable over et rektangel og vistat alle kontinuerlige funksjoner er integrerbare, men vi har foreløpig ingen effektivemetoder for a regne ut dobbeltintegraler. For a finne frem til slike metoder skal vita utgangspunkt i en annen ide for a regne ut volumet under en funksjonsgraf.

Som tidligere deler vi intervallet [a, b] i n deler ved punktene

a = x0 < x1 < x2 < . . . < xn = b.

For hver xi tar vi et tverrsnitt av legemet normalt pa x-aksen (se figur 3).

"

'''''''''''(

))))))))))))))))*

#########

$$$$$$$#########$$$$$$$

x

z

y

$$$xi

$$$$$$$

Ai

Figur 3: Tverrsnittet Ai

Arealet av dette tverrsnittet er

Ai =d∫

c

f(xi, y)dy.

Tar vi dette arealet Ai og ganger med lengden xi − xi−1 av det i-te intervallet, farvi et volum som er svært nær volumet til den delen av legemet som ligger mellomxi−1 og xi. Ved a summere ser vi at

n∑

i=1

d∫

c

f(xi, y)dy (xi − xi−1)

6.1. DOBBELTINTEGRALER OVER REKTANGLER 513

er en god tilnærming til volumet og at denne tilnærmingen bør bli bedre dess finerepartisjonen er. Vi bør altsa ha

V ≈n∑

i=1

d∫

c

f(xi, y)dy

(xi − xi−1)

Definerer vi en funksjon F ved

F (x) =d∫

c

f(x, y)dy

ser vi atn∑

i=1

d∫

c

f(xi, y)dy

∆x =n∑

i=1

F (xi)∆x

er en Riemann-sum for F . Følgelig vil

n∑

i=1

F (xi)∆x −→b∫

a

F (x)dx =b∫

a

d∫

c

f(x, y) dy

dx

nar oppdelingen blir finere. Kombinerer vi de formlene vi na har, ser vi at vi burdeha

V =b∫

a

d∫

c

f(x, y)dy

dx.

I dette uttrykket kallesb∫

a

d∫

c

f(x, y)dy

dx

et iterert integral og det har følgende tolkning: Først integrerer vi f(x, y) som enfunksjon av y mens vi later som x er en konstant. Deretter integrerer vi resultatetsom en funksjon av x (y har na forsvunnet fra uttrykket siden vi har satt inngrensene y = c og y = d).

I argumentet ovenfor kuttet vi opp volumet i skiver normalt pa x-aksen. Vedisteden a kutte opp volumet i skiver normalt pa y-aksen, kan vi pa akkurat sammemate komme frem til formelen

V =d∫

c

b∫

a

f(x, y)dx

dy

Sammenligner vi de tre uttrykkene vi na har for volumet V , ser vi at

∫∫

R

f(x, y) dxdy =b∫

a

d∫

c

f(x, y)dy

dx =d∫

c

b∫

a

f(x, y)dx

dy

Page 260: Flervariabel analyse med lineær algebra

514 KAPITTEL 6. MULTIPPEL INTEGRASJON

Fordelen ved de to siste uttrykkene er at de bare involverer ting vi kan, nemligvanlig integrasjon av funksjoner av en variabel. Vi har altsa redusert integrasjon ito variable til to gangers integrasjon i en variabel.

Før vi gjennomfører et fullverdig matematisk bevis for formlene ovenfor (argu-mentet vi hittil har gitt, inneholder litt for mye ønsketenking om hva forskjelligeuttrykk “bør” konvergere mot), skal vi se hvordan de brukes i praksis.

Eksempel 1: Beregn∫∫

R

x2y dxdy der R = [0, 1]× [1, 3]. Ifølge formelen ovenforer

I =∫∫

R

x2y dxdy =3∫

1

1∫

0

x2y dx

dy

Integrerer vi1∫

0x2y dx som om y var en konstant, far vi

1∫

0

x2y dx =[13x3y

]x=1

x=0

=13·13 · y − 1

3· 03 · y =

13y

Dermed er

I =3∫

1

13y dy =

[y2

6

]3

1

=32

6− 12

6=

86

=43

La oss for treningens skyld ogsa regne ut integralene i motsatt rekkefølge:

I =∫∫

R

x2y dxdy =1∫

0

3∫

1

x2y dy

dx

Integrerer vi3∫

1x2y dy som om x var en konstant, far vi

0∫

1

x2y dy =[12x2y2

]y=3

y=1

=12x2 · 32 − 1

2x2 · 12 = 4x2

Altsa er

I =1∫

0

4x2 dx =[43x3

]1

0

=43

La oss se pa et eksempel til.

Eksempel 2: Beregn I =∫∫

R

y3exy2dxdy der R = [0, 1]× [0, 2].

6.1. DOBBELTINTEGRALER OVER REKTANGLER 515

Vi far

I =2∫

0

1∫

0

y3exy2dx

dy =2∫

0

[yexy2

]x=1

x=0dy

=2∫

0

(yey2− y)dy =

[12ey2

− 12y2

]2

0

=

=12e4 − 1

2· 22 − 1

2e0 +

12· 02 =

12(e4 − 5)

Hvis du forsøker a regne ut dette integralet ved a integrere med hensyn pa y først,far du atskillig større problemer. Det er faktisk ikke uvanlig at den ene integra-sjonsrekkefølgen gir mye enklere regninger enn den andre, sa det kan lønne seg a seskikkelig pa integralet før man begynner. ♣

Vi skal na bevise at vi virkelig har lov til a regne ut dobbeltintegraler ved hjelpav iterert integrasjon. For a dekke fremtidige anvendelser er vi nødt til a formulereresultatet for funksjoner som ikke nødvendigvis er kontinuerlige. Dette gjør at selveteoremet blir litt langt og kronglete, men beviset er heldigvis ikke sa vanskelig.

Teorem 6.1.7 Anta at R = [a, b] × [c, d] er et rektangel i R2 og at f : R → R erintegrerbar. Dersom funksjonen

y 8→ f(x, y)

er integrerbar over [c, d] for alle x ∈ [a, b], sa er funksjonen F (x) =d∫c

f(x, y) dy

integrerbar over [a, b] og

∫∫

Rf(x, y) dxdy =

b∫

a

d∫

c

f(x, y) dy

dx

Tilsvarende gjelder om vi bytter om variablene: Dersom funksjonen

x 8→ f(x, y)

er integrerbar over [a, b] for alle y ∈ [c, d], sa er funksjonen G(y) =b∫

af(x, y) dx

integrerbar over [c, d] og

∫∫

Rf(x, y) dxdy =

d∫

c

b∫

a

f(x, y) dx

dy

Før vi beviser teoremet, formulerer vi et resultat for kontinuerlige funksjonersom er lettere a fa oversikt over (funksjonene som inngar er automatisk integrerba-re).

Page 261: Flervariabel analyse med lineær algebra

516 KAPITTEL 6. MULTIPPEL INTEGRASJON

Korollar 6.1.8 Anta at R = [a, b]× [c, d] er et rektangel i R2 og at f : R → R erkontinuerlig. Da er

∫∫

Rf(x, y) dxdy =

b∫

a

d∫

c

f(x, y) dy

dx =d∫

c

b∫

a

f(x, y) dx

dy

Bevis: Alle kontinuerlige funksjoner (bade i en og to variable) er integrerbare, ogbetingelsene i teoremet er derfor oppfylt. !

Bevis for teorem 6.1.7: Vi nøyer oss med a vise den første halvdelen av teoremet— den andre vises pa akkurat samme mate med x-er og y-er byttet om.

Vi starter med en partisjon Π av rektanglet R gitt ved

a = x0 < x1 < . . . < xn−1 < xn = b

c = y0 < y1 < . . . < ym−1 < ym = d

og lar P være partisjonen av intervallet [a, b] gitt ved

a = x0 < x1 < . . . < xn−1 < xn = b

(vi bruker altsa de samme x-delepunktene som i Π). Vi lar N(Π) og Ø(Π) værehenholdsvis nedre og øvre trappesum for f med hensyn pa Π, og vi lar n(P ) og ø(P )være henholdsvis nedre og øvre trappesum for funksjonen F (x) =

∫ dc f(x, y) dy med

hensyn pa P . Observer at dersom vi kan vise at

N(Π) ≤ n(P ) og ø(P ) ≤ Ø(Π),

sa vil det følge at F er integrerbar pa [a, b] og at∫ b

aF (x) dx =

∫∫

Rf(x, y) dxdy

(dette er fordi f er integrerbar over R, og vi derfor kan fa bade N(Π) og Ø(Π) sanær

∫∫R f(x, y) dxdy vi matte ønske).

La oss vise at ø(P ) ≤ Ø(Π) — den andre ulikheten N(Π) ≤ n(P ) bevises paakkurat samme mate og overlates til leserne. Per definisjon er

ø(P ) =n∑

i=1

Ni(xi − xi−1)

derNi = sup{F (x) | x ∈ [xi−1, xi]}

For alle x ∈ [xi, xi−1] er

F (x) =d∫

c

f(x, y) dy =m∑

j=1

yj∫

yj−1

f(x, y) dy ≤m∑

j=1

Mij(yj − yj−1)

der Mij som vanlig er supremum til f(x, y) over rektanglet Rij . Dermed er ogsa

Ni ≤m∑

j=1

Mij(yj − yj−1)

6.1. DOBBELTINTEGRALER OVER REKTANGLER 517

og vi far

ø(P ) =n∑

i=1

Ni(xi − xi−1) ≤n∑

i=1

m∑

j=1

Mij(xi − xi−1)(yj − yj−1) = Ø(Π)

og teoremet er bevist. !

Dobbeltintegraler i MATLAB

Det er lett a bruke MATLAB til a regne ut dobbeltintegraler over rektangler, menkommandonavnene kan virke litt mystiske første gang du ser dem. Den grunnleg-gende kommandoen er >> dblquad. Her star dbl for “double”, mens quad star for“quadrature”, et gammelt ord for integrasjon. I tillegg ma du fortelle MATLABhvilken funksjon du vil integrere, og da kan du f.eks. bruke funksjonstilordnings-kommandoen @. For a integrere funksjonen f(x, y) = x2y over rektanglet R =[0, 1]× [−1, 2], skriver vi

>> dblquad(@(x,y)x.^2.*y,0,1,-1,2)

og far svaret

ans =0.5000

Legg merke til syntaksen i kommandoen: Først skriver vi @(x,y)x.^2.*y for a defi-nere funksjonen, deretter kommer grensene i x-retning, 0 og 1, og til slutt grensenei y-retning, -1 og 2.

Skal du arbeide mye med et litt komplisert funksjonsuttrykk, kan det lønne sega lagre funksjonsuttrykket pa en m-fil og bare kalle pa filnavnet. Vil du gjøre dettemed funksjonene ovenfor, lager du en m-fil integrand.m med dette innholdet

function z=integrand(x,y);z=x.^2.*y;

og utfører beregningene ved a skrive

>> dblquad(@integrand,0,1,-1,2)

Oppgaver til seksjon 6.1

1. Regn ut dobbeltintegralene

a)∫∫

R

xy dxdy der R = [1, 2]× [2, 4]

b)∫∫

R

(x + sin y) dxdy der R = [0, 1]× [0,π]

c)∫∫

R

x2ey dxdy der R = [−1, 1]× [0, 1]

d)∫∫

R

x cos(xy) dxdy der R = [1, 2]× [π, 2π]

Page 262: Flervariabel analyse med lineær algebra

518 KAPITTEL 6. MULTIPPEL INTEGRASJON

e)∫∫

R

xyex2y dxdy der R = [0, 2]× [1, 2]

f)∫∫

R

ln(xy) dxdy der R = [1, e]× [1, e]

g)∫∫

R

11+x2y dxdy der R = [1,

√3]× [0, 1]

2. Bruk MATLAB til a regne ut integralene i oppgave 1.

3. Vis at enhver nedre trappesum til en funksjon f over et rektangel R er mindreenn eller lik enhver øvre trappesum, dvs. at hvis Π1 og Π2 er to partisjoner av R,sa er N(Π1) ≤ Ø(Π2). Hint: La Π være en tredje partisjon som inneholder alledelepunkter i bade Π1 og Π2, og vis at N(Π1) ≤ N(Π) ≤ Ø(Π) ≤ Ø(Π2)

4. Vis at f er integrerbar over R hvis og bare hvis det for hver ε > 0 finnes enpartisjon Π slik at Ø(Π)−N(Π) < ε. (Du kan fa bruk for forrige oppgave)

5. Bevis setning 6.1.2 (du kan fa bruk for de to foregaende oppgavene).

6. Vis at funksjonen f(x) = x2 ikke er uniformt kontinuerlig pa R.

7. Anta at f : R → R er en kontinuerlig funksjon pa et rektangel R = [a, b]× [c, d].Vis at det finnes et punkt (x, y) i R slik at

∫∫R f(x, y) dxdy

|R| = f(x, y)

der |R| er arealet til R. Dette kalles ofte middelverdisetningen for dobbeltintegraler.

6.2 Dobbeltintegraler over begrensede omrader

Hittil har vi bare definert dobbeltintegraler∫∫

R

f(x, y) dxdy nar R er et rektangel,

men i praksis ma vi ofte integrere over mer kompliserte omrader. Vi skal na sehvordan dette kan gjøres.

For a slippe a begynne helt pa nytt skal vi bruke et knep som knytter de nyeintegralene til dem vi allerede har definert. Anta at vi ønsker a integrere en funksjonf over et begrenset omrade A. Vi plukker først ut et rektangel R som er stort noktil a inneholde A. Deretter definerer vi funksjonen fA : R → R ved

fA(x, y) =

f(x, y) hvis (x, y) ∈ A

0 hvis (x, y) #∈ A

Vi sier at f er integrerbar over A hvis fA er integrerbar over R, og i sa fall definerervi ∫∫

A

f(x, y) dxdy =∫∫

R

fA(x, y) dxdy

Bemerkning: Strengt tatt burde vi vise at definisjonen ovenfor ikke avhenger avhvilket rektangel R vi bruker (sa lenge det inneholder A). Vi overlater dette til de

6.2. DOBBELTINTEGRALER OVER BEGRENSEDE OMRADER 519

ivrigste leserne.

Figur 1 viser et eksempel pa en funksjon fA. Denne funksjonen er “tvunget” tila være 0 utenfor en ellipse i planet.

Figur 1: En funksjon fA.

Vi skal foreløpig ikke ga nærmere inn pa de teoretiske aspektene ved dette inte-gralbegrepet, men nevner bare at siden vi na ogsa ma ta hensyn til hvor komplisertmengden A er, er denne teorien mer innviklet enn den vi sa pa ovenfor. La oss førstkonsentrere oss om de problemene som oftest dukker opp i praksis.

Anta at φ1,φ2 : [a, b] → R er to kontinuerlige funksjoner av en variabel slik atφ1(x) ≤ φ2(x). Vi far da definert et omrade A i planet ved

A = {(x, y) : a ≤ x ≤ b, φ1(x) ≤ y ≤ φ2(x)}

(se figur 2).

!

"

a b

A

y = φ1(x)

y = φ2(x)

>>L

??W

Figur 2: Omrade av type I

Vi skal si at et slikt omrade er av type I. Følgende resultat er intuitivt rimelig, ogvi skal foreløpig bruke det med bare “et halvt bevis”.

Setning 6.2.1 Anta at A er av type I, og at f : A → R er kontinuerlig. Da er f

Page 263: Flervariabel analyse med lineær algebra

520 KAPITTEL 6. MULTIPPEL INTEGRASJON

integrerbar over A og

∫∫

A

f(x, y) dxdy =b∫

a

φ2(x)∫

φ1(x)

f(x, y) dy

dx

Bevis: Vi putter A inn i rektanglet R = [a, b]× [c, d]. Det er lett a sjekke at funk-sjonen y 8→ fA(x, y) er integrerbar over [c, d], sa setningen ville ha fulgt fra teorem6.1.7 dersom vi bare visste at fA var integrerbar over R = [a, b] × [c, d]. Dette erlettere a vise nar vi har utviklet litt mer maskineri, sa vi utsetter denne delen avbeviset til seksjon 6.6. !

Eksempel 1: Regn ut∫∫

A

(x + y2) dxdy der

A = {(x, y) : 0 ≤ x ≤ 1 og x ≤ y ≤ ex}

Ifølge teoremet ovenfor er

∫∫

A

(x + y2) dxdy =1∫

0

ex∫

x

(x + y2) dy

dx

Vi regner ut det innerste integralet:

ex∫

x

(x + y2) dy =[xy +

y3

3

]y=ex

y=x

= xex +e3x

3− x2 − x3

3

Setter vi dette inn i uttrykket ovenfor, far vi

∫∫

A

(x + y2) dxdy =1∫

0

(xex +

e3x

3− x2 − x3

3

)dx

De tre siste integralene kan regnes ut direkte, men i det første ma vi bruke delvisintegrasjon. Vi setter u = x, v′ = ex og far u′ = 1, v = ex. Dette gir

1∫

0

xex dx = [x · ex]10 −1∫

0

1 · ex dx =[xex − ex

]1

0

=

= 1 · e1 − e1 − 0 · e0 + e0] = 1

Dermed er∫∫

A

xex dx =1∫

0

(xex +

e3x

3− x2 − x3

3

)dx =

= 1 +[e3x

9− x3

3− x4

3 · 4

]1

0

= 1 +e3

9− 1

3− 1

12− 1

9=

1736

+e3

9

6.2. DOBBELTINTEGRALER OVER BEGRENSEDE OMRADER 521

Vi skal na se pa en annen situasjon der x-aksen og y-aksen har byttet roller.Vi sier at en mengde A ⊂ R2 er av type II dersom det finnes tall c, d, der c < d, ogto kontinuerlige funksjoner ψ1,ψ2 : [c, d] → R, der ψ1(y) ≤ ψ2(y) for alle y ∈ [c, d],slik at

A = {(x, y) : c ≤ y ≤ d og ψ1(y) ≤ x ≤ ψ2(y)}

(se figur 3).

!

"

c

d

Ax = ψ1(y) x = ψ2(y)! #

Figur 3: Omrade av type II

Vi har følgende parallell til setning 6.2.1.

Setning 6.2.2 Anta at f : A → R er kontinuerlig, og at

A = {(x, y) : c ≤ y ≤ d og ψ1(y) ≤ x ≤ ψ2(y)}

er av type II. Da er f integrerbar over A og

∫∫

A

f(x, y) dxdy =d∫

c

ψ2(y)∫

ψ1(y)

f(x, y) dx

dy

Bevis: Identisk med beviset for 6.2.1 med x og y byttet om. !

Eksempel 2: Regn ut∫∫

A

xy2 dxdy der A er omradet avgrenset av x-aksen og

de to grafene y = x2 og y = 2− x for x ≥ 0. Figur 4 viser omradet A.

!

"

::

::

:2

y

xA

y = x2 y = 2− x! #

!(1, 1)

Figur 4: Omradet i eksempel 2

Dette omradet er av type II siden det ligger klemt mellom to funksjonsgrafer ogytterpunktene y = 0 og y = 1. For a finne funksjonsuttrykkene ψ1(y) og ψ2(y)

Page 264: Flervariabel analyse med lineær algebra

522 KAPITTEL 6. MULTIPPEL INTEGRASJON

ma vi løse ligningene y = x2 og y = 2 − x med hensyn pa x. Vi far ψ1(y) = √y ,

ψ2(y) = 2− y. Altsa er

∫∫

A

xy2 dxdy =1∫

0

[ ∫ 2−y

√y

xy2 dx

]dy =

=1∫

0

[12x2y2

]x=2−y

x=√

y

dy =

=1∫

0

(12(2− y)2y2 − 1

2(√

y )2y2

)dy =

=1∫

0

(y4

2− 5

2y3 + 2y2

)dy =

[y5

10− 5

8y4 +

23y3

]1

0

=[

110− 5

8+

23

]=

17120

Ved a bryte et komplisert omrade opp i enklere deler, kan vi integrere overomrader som er atskillig verre enn type I og type II. Figur 5a) viser et eksempel –omradet A er hverken av type I eller II, men deler vi det opp som vist i figur 5b),far vi tre deler som alle er av type I. Vi kan da regne ut

∫∫

A

f(x, y) dxdy ved hjelp

av formelen∫∫

A

f(x, y) dxdy =∫∫

A1

f(x, y) dxdy +∫∫

A2

f(x, y) dxdy +∫∫

A3

f(x, y)dxdy

og teknikkene ovenfor.

!

"

A

!

"

Figur 5: Oppdeling av integrasjonsomradet

A1

A2

A3:T

La oss avslutte denne seksjonen med et eksempel som viser behovet for a inte-grere over andre omrader enn rektangler. Eksemplet viser ogsa de lange og ganskekompliserte utregningene vi ofte far.

Eksempel 3: Vi skal regne ut volumet som ligger over xy-planet og under grafentil f(x, y) = 1−x2−4y2. Denne funksjonen er en paraboloide med snuten oppover,

6.2. DOBBELTINTEGRALER OVER BEGRENSEDE OMRADER 523

og den er positiv nar x2 + 4y2 ≤ 1. Legg merke til at x2 + 4y2 = 1 er en ellipsemed store halvakse a = 1 langs x-aksen og lille halvakse b = 1

2 langs y-aksen, og viønsker altsa a integrere over innsiden av denne ellipsen (se figur 6).

.Figur 6: Integrasjonsomradet.

Integrerer vi i y-retning først, ma vi integrere fra den nedre “halvellipsen” y =− 1

2

√1− x2 til den øvre y = 1

2

√1− x2, mens den ytre integrasjonen i x-retning gar

fra −1 til 1. Volumet V er altsa gitt av integralet

V =1∫

−1

12

√1−x2∫

− 12

√1−x2

(1− x2 − 4y2) dy

dx

Integrerer vi med hensyn pa y, far vi

V =1∫

−1

[(y − x2y − 4

3y3

]y= 12

√1−x2

y=− 12

√1−x2

dx =

=1∫

−1

[(12

√1− x2 − 1

2x2

√1− x2 − 4

3

(12

√1− x2

)3)−

−(−1

2

√1− x2 +

12x2

√1− x2 +

43

(12

√1− x2

)3)]

dx =

=1∫

−1

(√1− x2 − x2

√1− x2 − 1

3(1− x2)3/2

)dx =

=1∫

−1

((1− x2)

√1− x2 − 1

3(1− x2)3/2

)dx =

1∫

−1

23(1− x2)3/2 dx

For a løse dette integralet, setter vi u = arcsinx. Da er x = sinu, dx = cos u du ogde nye grensene er arcsin(−1) = −π

2 og arcsin(1) = π2 . Dermed har vi

V =1∫

−1

23(1− x2)3/2 dx =

23

π/2∫

−π/2

(1− sin2 u)3/2 cos u du =23

π/2∫

−π/2

cos4 u du

Page 265: Flervariabel analyse med lineær algebra

524 KAPITTEL 6. MULTIPPEL INTEGRASJON

Trigonometriske integraler av denne typen dukker ofte opp nar vi løser dobbelt-integraler, og det kan være lurt a ta en titt pa seksjon 9.4 i Kalkulus som (blantannet) gir en innføring i hvordan man løser slike integraler. I integralet ovenfor erdet lurt a bruke formelen for cosinus til den dobbelte vinkelen baklengs: Vi harcos 2u = 2 cos2 u − 1 som gir cos2 u = 1+cos 2u

2 . Setter vi dette inn i integraletovenfor, far vi

V =23

π/2∫

−π/2

cos4 u du =23

π/2∫

−π/2

(1 + cos 2u

2

)2

du =

=16

π/2∫

−π/2

(1 + 2 cos 2u + cos2 2u) du =

=16

[u + sin 2u

]π/2

−π/2

+16

π/2∫

−π/2

cos2 2u du =π

6+

16

π/2∫

−π/2

cos2 2u du

For a løse det siste integralet, bruker vi igjen formelen for cosinus til den dobbeltevinkelen baklengs, og far cos2 2u = 1+cos 4u

2 . Dermed er

V =π

6+

16

π/2∫

−π/2

cos2 2u du =π

6+

112

π/2∫

−π/2

(1 + cos 4u) du =

6+

112

[u− 1

4sin 4u

]π/2

−π/2

6+

π

12=

π

4

Regnestykket ovenfor er langt og komplisert, men problemene vi støter pa erganske typiske for dobbeltintegraler. Med litt trening lærer du a beherske dem.

Mer om dobbeltintegraler i MATLAB

MATLAB kan ogsa brukes til a regne ut dobbeltintegraler over mer generelleomrader. Teknikken vi bruker, ligger tett opptil definisjonen. Hovedtrikset er atMATLAB-kommandoer av typen >>(f(x,y)<=g(x,y)) (legg merke til de yttersteparentesene) definerer funksjonen

F (x, y) =

1 hvis f(x, y) ≤ g(x, y)

0 ellers

Skriver vi f.eks. >>(x.^2+y.^2<=1) (legg igjen merke til de ytterste parentesene!)har vi definert en funksjon

F (x, y) =

1 hvis x2 + y2 ≤ 1

0 hvis x2 + y2 > 1

6.2. DOBBELTINTEGRALER OVER BEGRENSEDE OMRADER 525

Skriver vi na >>(x.^3-y.^2).*(x.^2+y.^2<=1) har vi dermed definert funksjonen

G(x, y) =

x3 − y2 hvis x2 + y2 ≤ 1

0 hvis x2 + y2 > 1

Det er akkurat slike funksjoner vi trenger for a regne ut integraler over generelleomrader.

La oss bruke MATLAB til a regne ut integralet i eksempel 1 ovenfor, dvs.∫∫A(x + y2) dxdy der

A = {(x, y) : 0 ≤ x ≤ 1 og x ≤ y ≤ ex}

Vi ma først finne et rektangel R som omfatter mengden A. Siden den minste verdieny kan ha i omradet vart er 0 og den største er e1 = e < 3, kan vi f.eks. bruke R =[0, 1]× [0, 3]. For a fange opp betingelsen x ≤ y, innfører vi funksjonen (x<=y), ogfor a fange opp betingelsen y ≤ ex, innfører vi funksjonen (y<=exp(x)). Uttrykket

(x+y.^2).*(x<=y).*(y<=exp(x))

vil dermed fange opp den funksjonen vi er interessert i. For a utføre integrasjonene,skriver vi

>> dblquad(@(x,y)(x+y.^2).*(x<=y).*(y<=exp(x)),0,1,0,3)

ans =2.7040

La oss ogsa prøve oss pa integrasjon i eksempel 3. Her skal vi integrere f(x, y) =1 − x2 − 4y2 over omradet x2 + 4y2 ≤ 1. Vi vet at ellipsen har sentrum i origo oghalvakser a = 1, b = 1

2 , sa hele omradet ligger inni rektanglet R = [−1, 1]× [− 12 , 1

2 ].For a regne ut integralet, gir vi kommandoen

>> dblquad(@(x,y)(1-x.^2-4*y.^2).*(x.^2+4*y.^2<=1),-1,1,-0.5,0.5)

ans =0.7854

Oppgaver til seksjon 6.2

1. Regn ut dobbeltintegralene

a)∫∫

R

x2y dxdy der R = {(x, y) : 0 ≤ x ≤ 2 og 0 ≤ y ≤ x}

b)∫∫

R

(x + 2xy) dxdy der R = {(x, y) : 0 ≤ x ≤ 3 og x ≤ y ≤ 2x + 1}

c)∫∫

R

y dxdy der R = {(x, y) : 1 ≤ y ≤ 2 og y ≤ x ≤ y2}

d)∫∫

R

x cos y dxdy der R = {(x, y) : 0 ≤ y ≤ π2 og 0 ≤ x ≤ sin y}

Page 266: Flervariabel analyse med lineær algebra

526 KAPITTEL 6. MULTIPPEL INTEGRASJON

e)∫∫

R

ex2dxdy der R er omradet i første kvadrant avgrenset av

x-aksen og linjene x = 1 og y = x.

f)∫∫

R

x2y dxdy der R er omradet avgrenset av kurvene y = x2 og

y =√

x .

g)∫∫

R

x cos(x + y) dxdy der R er trekanten med hjørner

(0, 0), (π, 0), (π,π).

h)∫∫

R

1√1−y2

dxdy der R er omradet gitt ved 0 ≤ y ≤ sinx og

0 ≤ x ≤ π2 .

i)∫∫

R

x dxdy der R er omradet mellom kurvene y = lnx og

y = x−1e−1 .

2. Bruk MATLAB til a regne ut integralene i oppgave 1.

3. Noen integraler er enklere a regne ut hvis vi bytter integrasjonsrekkefølgen. Løsdisse integralene ved a utføre integrasjonene i motsatt rekkefølge. Hint: Lag enskisse over integrasjonsomradet før du prøver a bytte integrasjonsrekkefølgen.

a)∫ 10

[∫ 1y ex2

dx]dy

b)∫ π

20

[∫ π2

xsin y

y dy]dx

c)∫ 10

[∫ 1√x e

xy2 dy

]dx

4. Vis at verdien til∫∫

A f(x, y) dxdy ikke avhenger av hvilket rektangel R vi brukeri definisjonen.

5. Anta at R1 og R2 er to disjunkte mengder (dvs. at R1 ∩ R2 = ∅), og at f erintegrerbar over bade R1 og R2. Vis at

∫∫

R1∪R2

f(x, y) dxdy =∫∫

R1

f(x, y) dxdy +∫∫

R2

f(x, y) dxdy

Hint: Du kan bruke setning 6.1.2(ii).

6.3 Dobbeltintegraler i polarkoordinater

I en del dobbeltintegraler er det enklere a uttrykke integranden eller inte-grasjonsomradet (eller begge deler) ved hjelp av polarkoordinater, og da erdet som regel ogsa enklere a utføre integrasjonen i polarkoordinater. Nar viarbeider i polarkoordinater, er det naturlig a bruke en annen type partisjo-ner enn nar vi arbeider i vanlige (kartesiske) koordinater. Istedenfor a brukeet rutenett definert av konstante x- og y-verdier, er det naturlig a bruke ett

6.3. DOBBELTINTEGRALER I POLARKOORDINATER 527

med konstante r- og θ-verdier. Figur 1 viser et slikt rutenett der sirklenesvarer til faste r-verdier og stralene ut fra origo svarer til faste θ-verdier.

Figur 1. Partisjon i polarkoordinater

Før vi gar videre, lønner det seg a finne en formel for arealet til rutene i nettet.Vi minner først om at arealet til sirkelsektoren i figur 2a) er 1

2r2∆θ (forutsatt atvinkelen males i radianer). Husker du ikke dette, er formelen lett a utlede: Arealettil hele sirkelen er πr2, og den delen vi ser pa, utgjør ∆θ

2π av det hele, og har følgeligareal πr2 · ∆θ

2π = 12r2∆θ. Arealet til “ruten” i figur 2b) er differensen mellom to

sirkelsegmenter som begge har samme vinkel ∆θ, men der den største har radiusr2 og den minste radius r1. Arealet er dermed

A =12r22∆θ − 1

2r21∆θ =

12(r2 + r1)(r2 − r1)∆θ = r∗∆r∆θ

der r∗ = r2+r12 er den midlere radien og ∆r = r2−r1 er differensen mellom radiene.

a)

;;

;;

;;

;;

UU

UU

UU

UU

∆θ

;;

;;h

;;

;;<

r

b)

;;

;;

;;

;;

UU

UU

UU

UU

∆θ

;;

;;h

;;

;;<

r2UUUb

UUUX

r1

''

((

Figur 2: Et arealelement i polarkoordinater

Anta na at vi har et “rektangel” S i polarkoordinater, dvs. et omrade i planetavgrenset av sirkelbuene r = a, r = b og stralene θ = α, θ = β. En partisjon

a = r0 < r1 < . . . < rn−1 < rn = b

α = θ0 < θ1 < . . . < θm−1 < θm = β

av S gir opphav til en oppdeling som vist pa figur 3.

Page 267: Flervariabel analyse med lineær algebra

528 KAPITTEL 6. MULTIPPEL INTEGRASJON

Figur 3: Rutenett i polarkoordinater

Hvis Sij er den ij-te ruten i denne oppdelingen (den som inneholder punkter(r, θ) der ri−1 ≤ r ≤ ri og θj−1 ≤ θ ≤ θj), sa vet vi fra utregningen ovenfor atarealet til Sij er

|Sij | = r∗ij(ri − ri−1)(θj − θj−1)

der r∗ij = ri+ri−12 er den midlere radien. Det naturlige midtpunktet i Sij er punktet

med polarkoordinater (r∗ij , θ∗ij) der θij∗ = θj+θj−12 . Dette punktet har vanlige koor-

dinater (x∗ij , y∗ij) = (r∗ij cos θ∗ij , r∗ij sin θ∗ij), og har vi en (positiv) funksjon f definert

pa S, ser vi at volumet under funksjonsgrafen er tilnærmet gitt ved

V ≈n∑

i=1

m∑

j=1

f(x∗ij , y∗ij)|Sij | =

=n∑

i=1

m∑

j=1

f(r∗ij cos θ∗ij , r∗ij sin θij)r∗ij(ri − ri−1)(θj − θj−1)

Dette er en Riemann-sum for funksjonen f(r cos θ, r sin θ)r over rektangelet R =[a, b]× [α, β], og nar oppdelingen blir finere og finere, vil den nærme seg integralet

∫∫

Rf(r cos θ, r sin θ)r drdθ

(legg merke til faktoren r som har kommet inn i tillegg til funksjonen f !) Dermedburde

V =∫∫

Rf(r cos θ, r sin θ)r drdθ

Pa den annen side — dersom vi ikke hadde byttet til polarkoordinater, men holdtoss til x og y, ville volumet være gitt som

V =∫∫

Sf(x, y) dxdy

og vi har dermed∫∫

Sf(x, y) dxdy =

∫∫

Rf(r cos θ, r sin θ)r drdθ

der S er integrasjonsomradet beskrevet i vanlige koordinater, og R er integrasjons-omradet beskrevet i polarkoordinater.

Argumentet ovenfor er ikke et matematisk bevis siden det baserer seg pa “ikke-matematisk” intuisjon om hva volum er, men det kan være liten tvil om at konklu-sjonen er riktig. Vi formulerer den som en setning.

6.3. DOBBELTINTEGRALER I POLARKOORDINATER 529

Setning 6.3.1 Anta at S er et omrade i xy-planet som i polarkoordinater kanbeskrives ved ulikhetene a ≤ r ≤ b, α ≤ θ ≤ β. For enhver kontinuerlig funksjonf : S → R er da

∫∫

Sf(x, y) dxdy =

∫∫

Rf(r cos θ, r sin θ)r drdθ

der R = [a, b]× [α, β]. Med andre ord

∫∫

Sf(x, y) dxdy =

b∫

a

β∫

α

f(r cos θ, r sin θ)r dθ

dr =

=

β∫

α

b∫

a

f(r cos θ, r sin θ)r dr

Vi skal ikke gi et formelt bevis for denne setningen na siden den vil følge fra etmer generelt resultat om skifte av variabel som vi skal bevise i seksjon 6.7. Istedenser vi pa et eksempel.

Eksempel 1: Vi skal regne ut∫∫

S

ln(x2 + y2) dxdy der S er omradet i første

kvadrant avgrenset av x-aksen, linjen y = x og de to sirklene x2 +y2 = 4, x2 +y2 =16 (lag en figur). I polarkoordinater kan A beskrives ved

2 ≤ r ≤ 4 og 0 ≤ θ ≤ π

4Setningen ovenfor forteller oss at

∫∫

A

ln(x2 + y2) dxdy =4∫

2

π4∫

0

ln r2 · r dθ

dr =π

4

4∫

2

r ln r2 dr

Dette integralet kan vi løse ved delvis integrasjon. Vi setter u = ln r2, v′ = r og faru′ = 2

r , v = 12r2. Dermed er

4∫

2

r ln r2 dr =[12r2 ln r2

]4

2

−4∫

2

r dr = 8 · ln 16− 2 ln 4−[r2

2

]4

2

= 28 ln 2− 6

og vi far∫ ∫

S

ln(x2 + y2) dxdy =π

4

4∫

2

r ln r2 dr = 7π ln 2− 3π

2♣

Vi kan ogsa bruke polarkoordinater pa mer generelle omrader enn de vi harbeskrevet ovenfor. En type som ofte dukker opp, er den vi ser i figur 4 — her liggerθ mellom to faste grenser α og β, mens r er begrenset av to funksjoner φ1(θ) ogφ2(θ).

Page 268: Flervariabel analyse med lineær algebra

530 KAPITTEL 6. MULTIPPEL INTEGRASJON

!

"

))))))))

SSSSSSSSSS

S r = φ2(θ)#

r = φ1(θ)3B

β α x

y

Figur 4: Et omrade i polarkoordinater

Setning 6.3.2 La S være et omrade i xy-planet som i polarkoordinater kan be-skrives ved at α ≤ θ ≤ β og φ1(θ) ≤ r ≤ φ2(θ), der φ1,φ2 : [α, β] → R er tokontinuerlige, ikke-negative funksjoner slik at φ1(θ) ≤ φ2(θ) for alle θ ∈ [α, β]. Daer

∫∫

Sf(x, y) dxdy =

β∫

α

φ2(θ)∫

φ1(θ)

f(r cos θ, r sin θ)r dr

Ogsa dette resultatet vil følge fra det generelle resultatet om skifte av variable,sa vi tar ikke med beviset her. Isteden ser vi pa et eksempel.

Eksempel 2: Vi skal regne ut∫∫

Sy√

x2+y2dxdy der S er omradet i første kvadrant

avgrenset av parabelen y = x2 og linjene y =√

33 x og y = x (se figur 5). Vi ser at

integrasjonsomradet et avgrenset av verdiene θ = π6 og θ = π

4 (tilsvarende de tolinjene y =

√3

3 x og y = x). Holder vi θ fast og lar r variere, ser vi at vi kommerinn i integrasjonsomradet ved r = 0 og gar ut av det nar vi treffer parablen y = x2.I polarkoordinater blir denne ligningen til r sin θ = r2 cos2 θ, som gir r = sin θ

cos2 θ .Integrasjonsomradet er altsa gitt ved

π

6≤ θ ≤ π

4og 0 ≤ r ≤ sin θ

cos2 θ

!

"

++

++

++

++

++

iiiiiiS

x

y

Figur 5: Integrasjonsomradet i eksempel 2

6.3. DOBBELTINTEGRALER I POLARKOORDINATER 531

Integralet blir dermed (husk r-faktoren!)

I =∫∫

S

y√x2 + y2

dxdy =

π4∫

π6

sin θcos2 θ∫

0

r sin θ

rr dr

dθ =

π4∫

π6

sin θcos2 θ∫

0

r sin θ dr

Integrasjon med hensyn pa r gir

I =

π4∫

π6

[r2

2sin θ

]r= sin θcos2 θ

r=0

dθ =12

π4∫

π6

sin3 θ

cos4 θdθ

Skriver vi om det siste integralet slik:

I =12

π4∫

π6

sin3 θ

cos4 θdθ =

12

π4∫

π6

(1− cos2 θ) sin θ

cos4 θdθ,

ser vi at u = cos θ er en naturlig substitusjon. Den gir

I =12

√2

2∫

√3

2

(u2 − 1)u4

du

Resten er enkel integrasjon:

I =12

√2

2∫

√3

2

(u2 − 1)u4

du =12

√2

2∫

√3

2

(1u2− 1

u4

)du =

=12

[− 1

u+

13

1u3

]√22

√3

2

=12

(−√

2 +132√

2 +2√

33− 1

38√

39

)=

5√

327

−√

26

Vi tar ogsa med et eksempel der vi ma arbeide litt for a finne grensene.

Eksempel 3: Vi skal integrere funksjonen f(x, y) =√

x2 + y2 over omradet S gittved x2 − 2x + y2 ≤ 0. Vi har lyst til a skifte til polarkoordinater fordi integrandenda blir sa mye penere. Spørsmalet er hvordan omradet S kan beskrives i polarkoor-dinater. Vi ser først at dersom vi fullfører kvadratet, kan ulikheten x2−2x+y2 ≤ 0skrives (x− 1)2 + y2 ≤ 1 som er en sirkelskive med sentrum i (1, 0) og radius 1. Pafigur 6 har vi tegnet inn denne sirkelen og en vinkel θ. Vi er interessert i hvor langtvi kan ga i θ-retning og fortsatt holde oss innenfor omradet, dvs. vi er interessert ilengden pa linjestykket OB.

Page 269: Flervariabel analyse med lineær algebra

532 KAPITTEL 6. MULTIPPEL INTEGRASJON

!

"

02/1

<;;;

O A

B

θ

Figur 6: Integrasjonsomradet i eksempel 3

Vi ma bruke litt geometri. Trekk normalen fra A(1, 0) ned pa linjestykket OB.Den treffer OB i et punkt C som ligger midt mellom O og B (hvorfor?), og veddefinisjonen av cosinus er |OC| = |OA| cos θ = cos θ. Siden OB er dobbelt sa lang,har vi |OB| = 2 cos θ. Det betyr at starter vi i O og gar i en fast θ-retning, gar viinn i integrasjonsomradet S nar r = 0 og ut nar r = 2 cos θ. Legg ogsa merke til atde θ-verdiene som gir punkter i omradet S, ligger mellom −π

2 og π2 . Vi far dermed

dette integralet

I =∫∫

Sf(x, y) dxdy =

π2∫

−π2

2 cos θ∫

0

f(r sin θ, r cos θ)r dr

dθ =

=

π2∫

−π2

2 cos θ∫

0

r2 dr

der vi i siste skritt har brukt at√

x2 + y2 = r.Det gjenstar bare a regne ut integralet. Vi far først

I =

π2∫

−π2

2 cos θ∫

0

r2 dr

dθ =

π2∫

−π2

[r3

3

]r=2 cos θ

r=0

dθ =83

π2∫

−π2

cos3 θ dθ

Dette integralet løser vi ved a skrive cos3 θ = (1 − sin2 θ) cos θ og sa substituereu = sin θ, du = cos θ dθ. Dette gir

I =83

π2∫

−π2

(1− sin2 θ) cos θ dθ =83

1∫

−1

(1− u2) du =

=83

[u− u3

3

]1

−1

=83

[(1− 13

3

)−

((−1)− (−1)3

3

)]=

329

Trigonometriske integraler av den typen vi har sett i de to siste eksemplene, erganske vanlige nar vi vi bruker polarkoordinater til a løse dobbeltintegraler. Synes

6.3. DOBBELTINTEGRALER I POLARKOORDINATER 533

du slike integraler er vanskelige, finner du noen tips i seksjon 9.4 i Kalkulus. Sespesielt pa de eksemplene som omhandler integraler pa formene

∫sinn x dx,

∫cosn x dx og

∫sinn x cosm x dx

Oppgaver til seksjon 6.3

1. Løs integralet ved a bruke polarkoordinater:

a)∫∫

R

xy2 dxdy der R er omradet i første kvadrant som ligger

innenfor sirkelen x2 + y2 = 9

b)∫∫

R

(x2 + y2) dxdy der R er omradet i første kvadrant som ligger

innenfor sirkelen x2 + y2 = 25 og mellom linjeney = 0 og y = x.

c)∫∫

R

ex2+y2dxdy der R er omradet mellom sirklene om origo med

radier lik 1 og 4.

d)∫∫

R

xy dxdy der R er omradet i første kvadrant avgrenset av

x-aksen, linjen y = x og sirkelen x2 + y2 = 1

e)∫∫

R

(x2 − y2) dxdy der R er omradet i tredje kvadrant som ligger

mellom linjene y =√

3 x, y =√

33 x og innenfor sirkelen

x2 + y2 = 1.

f)∫∫

R

√2− x2 − y2 dxdy der R er den delen av sirkelen x2 + y2 ≤ 1

som ligger i første kvadrant.

g)∫∫

R

(x2 + y2

) 32 dxdy der R er sirkelen (x− 1)2 + y2 ≤ 1

2. Bruk MATLAB til a regne ut integralene i oppgave 1.

3. La R være sirkelskiven med sentrum i (0,1) og radius 1.

a) Vis at dersom f er en kontinuerlig funksjon definert pa hele R, sa er

∫∫

R

f(x, y) dxdy =π∫

0

2 sin θ∫

0

f(r cos θ, r sin θ)r dr

b) Regn ut∫∫

R

√x2 + y2 dxdy.

4. Vi har en positiv kontinuerlig funksjon r : [α, β] → R. Et omrade A bestar av depunktene i planet som har polarkoordinater (r, θ) slik at α ≤ θ ≤ β, 0 ≤ r ≤ r(θ).Vis at arealet til A er

|A| =12

∫ β

αr(θ)2 dθ

Page 270: Flervariabel analyse med lineær algebra

534 KAPITTEL 6. MULTIPPEL INTEGRASJON

Bruk denne formelen til a finne arealet til omradet avgrenset av kurven

r(θ) = sin(2θ) θ ∈ [0,π

2]

Lag en skisse av omradet.

6.4 Anvendelser av dobbeltintegraler

Vi har allerede papekt at dobbeltintegraler kan brukes til a regne ut volumer— dersom f er en positiv funksjon pa omradet A, er V =

∫∫A f(x, y) dxdy

volumet mellom funksjonsgrafen og omradet A. I denne seksjonen skal vi sepa noen andre anvendelser av dobbeltintegralet. Det er ikke sikkert at det erde anvendelsene vi har tatt med nedenfor, du kommer til a ha mest bruk for,sa det viktigste med dette avsnittet er ikke a pugge formlene utenat, men alære seg a stille opp dobbeltintegraler i praktiske situasjoner. Avsnittet girogsa flere eksempler pa hvordan man regner ut dobbeltintegraler.

Arealberegninger i planet

La oss begynne med arealer. Dersom funksjonen f er konstant lik 1, ervolumet under funksjongrafen lik arealet til det omradet vi integrerer over(volum er lik grunnflate ganger høyde). Arealet til et omrade A er derforgitt ved

areal(A) =∫∫

A1 dxdy

(forutsatt at integralet eksisterer, men dette er spørsmal vi skal se nærmerepa i seksjon 6.6). La oss se pa et eksempel.

Eksempel 1. En kurve er gitt i polarkoordinater ved r = sin θ2 , der 0 ≤ θ ≤

2π. Vi kan tegne kurven i MATLAB ved hjelp av kommandoene

>> t=linspace(0,2*pi,200);>> x=sin(.5*t).*cos(t);>> y=sin(.5*t).*sin(t);>> plot(x,y)>> axis’equal’

og resultatet blir som i figur 1. Var oppgave er a regne ut arealet til omradetS avgrenset av kurven.

6.4. ANVENDELSER AV DOBBELTINTEGRALER 535

.Figur 1: Kurven i eksempel 1.

Vi vet at arealet er gitt ved

areal(S) =∫∫

S1 dxdy =

∫∫

Rr drdθ

der R er omradet beskrevet i polarkoordinater. Dette gir

areal(S) =∫∫

Rr drdθ =

2π∫

0

sin θ2∫

0

r dr

dθ =12

2π∫

0

sin2 θ

2dθ

Formelen for cosinus til det dobbelte av en vinkel sier at cos 2u = 1−2 sin2 u,og bruker vi denne med v = θ

2 , ser vi at sin2 θ2 = 1−cos θ

2 . Dermed er

areal(S) =14

2π∫

0

(1− cos θ) dθ =14

[θ − sin θ

]2π

0

2♣

Massemiddelpunkt

Den neste anvendelsen vi skal se pa, er massemiddelpunkt. La oss førsttenke oss at vi har n partikler med masse m1,m2, . . . ,mn plassert i punkte-ne r1, r2, . . . , rn i planet. Massemiddelpunktet (eller massesenteret) til dissepartiklene er da definert til a være punktet

r =m1r1 + m2r2 + · · · + mnrn

m1 + m2 + · · · + mn=

∑ni=1 miri∑ni=1 mi

Skriver vi ut definisjonen komponentvis, ser vi at koordinatene til r er gittved

x =m1x1 + m2x2 + · · · + mnxn

m1 + m2 + · · · + mn=

∑ni=1 mixi∑ni=1 mi

og

y =m1y1 + m2y2 + · · · + mnyn

m1 + m2 + · · · + mn=

∑ni=1 miyi∑ni=1 mi

Page 271: Flervariabel analyse med lineær algebra

536 KAPITTEL 6. MULTIPPEL INTEGRASJON

der ri = (xi, yi). Massemiddelpunktet er viktig i fysikk og mekanikk. Deter et “balansepunkt” for systemet i følgende forstand: Dersom vi tenker ossat partiklene vare hviler pa en tynn glassplate som selv ikke veier noe, vildenne glassplaten balansere perfekt pa en blyantspiss plassert i massemid-delpunktet.

Vi ønsker na a generalisere begrepet massemiddelpunkt til sammenhen-gende legemer. Anta at vi har en tynn plate der massetettheten kan variere.La oss si at massetettheten i punktet r = (x, y) er f(r) = f(x, y). Dette be-tyr at dersom vi kutter ut en liten bit av platen med areal A rundt punktetr, vil massen til denne biten være tilnærmet lik f(r)|A|, der A er arealet tilA.

Anta na at vi kutter opp A i et kvadratisk rutenett pa den vanlige maten,og at Aij er den ij-te ruten. Plukker vi ut et punkt r∗ij = (x∗ij , y

∗ij) i Aij ,

vil systemet vart mekanisk oppføre seg omtrent som en partikkelsamling derpunkter med masse f(x∗ij , y

∗ij)|Aij | befinner seg i posisjon (x∗ij , y

∗ij). Dette

tilnærmede systemet har massemiddelpunkt med koordinater

x =∑n

i=1

∑mj=1 x∗ijf(x∗ij , y

∗ij)|Aij |∑n

i=1

∑mj=1 f(x∗ij , y

∗ij)|Aij |

y =∑n

i=1

∑mj=1 y∗ijf(x∗ij , y

∗ij)|Aij |∑n

i=1

∑mj=1 f(x∗ij , y

∗ij)|Aij |

Legg merke til at summene i disse uttrykkene er Riemann-summer for in-tegralene

∫∫A xf(x, y) dxdy,

∫∫A yf(x, y) dxdy og

∫∫A f(x, y) dxdy. Lar vi

oppdelingen bli finere og finere, konvergerer dermed uttrykkene ovenfor mot

x =∫∫

A xf(x, y) dxdy∫∫A f(x, y) dxdy

og

y =∫∫

A yf(x, y) dxdy∫∫A f(x, y) dxdy

Det er naturlig a definere r = (x, y) til a være massemiddelpunktet til platenvar.

Eksempel 2: Finn massemiddelpunktet til kvadratet A = [0, 1]× [0, 1] nartettheten er gitt ved f(x, y) = xy2.

La oss først regne ut nevneren i uttrykkene ovenfor, nemlig:

∫∫

Af(x, y) dxdy =

1∫

0

1∫

0

xy2 dx

dy =1∫

0

[12x2y2

]x=1

x=0

dy =

=1∫

0

12y2 dy =

[16y3

]1

0

=16

6.4. ANVENDELSER AV DOBBELTINTEGRALER 537

Neste trinn er a regne ut telleren i uttrykket for x:

∫∫

Axf(x, y) dxdy =

1∫

0

1∫

0

x2y2 dx

dy =1∫

0

[13x3y2

]x=1

x=0

dy =

=1∫

0

13y2 dy =

[19y3

]1

0

=19

Dette gir

x =∫∫

A xf(x, y) dxdy∫∫A f(x, y) dxdy

=1916

=23

Sa regner vi ut telleren i uttrykket for y:

∫∫

Ayf(x, y) dxdy =

1∫

0

1∫

0

xy3 dx

dy =1∫

0

[12x2y3

]x=1

x=0

dy =

=1∫

0

12y3 dy =

[18y4

]1

0

=18

Dermed er

y =∫∫

A yf(x, y) dxdy∫∫A f(x, y) dxdy

=1816

=34

Massemiddelpunktet er altsa r = (x, y) =(

23 , 3

4

). ♣

Et viktig spesialtilfelle av teorien ovenfor far vi nar tetthetsfunksjonenf er konstant lik 1. Da er

x =∫∫

A x dxdy∫∫A 1 dxdy

=∫∫

A x dxdy

Areal(A)

og

y =∫∫

A y dxdy∫∫A 1 dxdy

=∫∫

A y dxdy

Areal(A)

Punktet r = (x, y) kalles da sentroiden til omradet A.

Arealet til flater

I seksjon 3.9 studerte vi parametriserte flater, og vi begynner med en raskrepetisjon. En parametrisert flate bestar av et omrade A i R2 og en konti-nuerlig funksjon r : A → R3 som vi ofte skriver pa denne maten

r(u, v) = X(u, v) i + Y (u, v) j + Z(u, v)k, der (u, v) ∈ A

Page 272: Flervariabel analyse med lineær algebra

538 KAPITTEL 6. MULTIPPEL INTEGRASJON

Figur 2 viser hvordan en slik funksjon “løfter” omradet A opp pa en flate.Vi kaller r en parametrisering av flaten. Vi skal na se hvordan vi kan brukedobbeltintegraler over A til a beregne arealet til denne flaten.

"

u

v

!

(u, v)!A

"

''''''''''(

))))))*

!

x

y

z

r(u, v) = X(u, v) i + Y (u, v) j + Z(u, v)k(

Figur 2: Parametrisert flate

Som vanlig tar vi utgangspunkt i en oppdeling av A i et rutenett. Funk-sjonen r flytter dette rutenettet opp pa flaten (se figur 3).

"

u

v

!

(u, v)!A

"

''''''''''(

))))))*

!

x

y

z

r(u, v)(

Figur 3: Oppdeling av flate

Vi skal først prøve a beregne et tilnærmet areal for hver av de sma ruteneoppe pa flaten. Vi starter med den ij-te ruten Aij i oppdelingen av A. Denhar sitt nedre venstre hjørne i punktet (ui−1, vj−1), sitt nedre høyre hjørnei punktet (ui, vj−1) og sitt øvre venstre hjørne i punktet (ui−1, vj). Dis-se punktene avbildes opp pa punktene r(ui−1, vj−1), r(ui, vj−1), r(ui−1, vj)pa flaten. Dersom oppdelingen er fin nok, vil parallellogrammet utspent avvektorene r(ui, vj−1) − r(ui−1, vj−1) og r(ui−1, vj) − r(ui−1, vj−1) omtrentfalle sammen med bildet r(Aij) av Aij oppe pa flaten (parallellogrammet vilvære en slags flat “takstein” som dekker det lett krummede flateelementetr(Aij)).

Arealet til flateelementet r(Aij) er derfor tilnærmet lik arealet til paral-

6.4. ANVENDELSER AV DOBBELTINTEGRALER 539

lellogrammet, som er gitt ved lengden til kryssproduktet∣∣(r(ui, vj−1)− r(ui−1, vj−1)

(r(ui−1, vj)− r(ui−1, vj−1)

)∣∣

Bruker vi at

r(ui, vj−1)− r(ui−1, vj−1) ≈∂r∂u

(ui−1, vj−1)(ui − ui−1)

og

r(ui−1, vj)− r(ui−1, vj−1) ≈∂r∂v

(ui−1, vj−1)(vj − vj−1),

far vi derfor at arealet av flateelementet r(Aij) er tilnærmet lik∣∣∣∣∂r∂u

(ui−1, vj−1)×∂r∂v

(ui−1, vj−1)∣∣∣∣ (ui − ui−1)(vj − vj−1)

med bedre og bedre tilnærming dess finere oppdelingen er. Summerer vi, servi at arealet til hele flaten er tilnærmet gitt ved

n∑

i=1

m∑

j=1

∣∣∣∣∂r∂u

(ui−1, vj−1)×∂r∂v

(ui−1, vj−1)∣∣∣∣ (ui − ui−1)(vj − vj−1)

Dette er en Riemann-sum for funksjonen | ∂r∂u(u, v)× ∂r

∂v (u, v)|, og lar vi opp-delingen bli finere og finere, nærmer Riemann-summene seg integralet

∫∫

A

∣∣∣∣∂r∂u

(u, v)× ∂r∂v

(u, v)∣∣∣∣ dudv

Vi har dermed kommet frem til denne formelen for arealet til en parametri-sert flate:

Flateareal =∫∫

A

∣∣∣∣

(∂r∂u× ∂r

∂v

)(u, v)

∣∣∣∣ dudv

der vi har skrevet ( ∂r∂u ×

∂r∂v )(u, v) istedenfor ∂r

∂u(u, v) × ∂r∂v (u, v) for a spare

litt plass.

Bemerkning: Du ma være litt forsiktig nar du bruker denne formelen ogpasse pa at flaten ikke overlapper med seg selv. Er det overlapp, vil formelenregne arealet til den overlappende biten to ganger.

Eksempel 3: I seksjon 3.9 sa vi at en torus (smultring) har parametrise-ringen

r(u, v) = (R + r cos u) cos v i + (R + r cos u) sin v j + r sinuk ,

der u, v ∈ [0, 2π). La oss regne ut overflatearealet til denne torusen. Vi serførst at

∂r∂u

(u, v) = −r sinu cos v i− r sinu sin v j + r cos u k

Page 273: Flervariabel analyse med lineær algebra

540 KAPITTEL 6. MULTIPPEL INTEGRASJON

og∂r∂v

(u, v) = −(R + r cos u) sin v i + (R + r cos u) cos v j

Dermed blir(

∂r∂u× ∂r

∂v

)(u, v) = −r(R + r cos u)

(cos u cos v i + cos u sin v j + sinu k

)

og ∣∣∣∣

(∂r∂u× ∂r

∂v

)(u, v)

∣∣∣∣ = r(R + r cos u)

der vi har brukt formelen sin2 x+cos2 x = 1 en rekke ganger bade for x = uog x = v. Na er integrasjonen grei:

Arealet til torusen =∫∫

A

∣∣∣∣

(∂r∂u× ∂r

∂v

)(u, v)

∣∣∣∣ dudv =

=2π∫

0

2π∫

0

r(R + r cos u) dv

du = 2π

2π∫

0

r(R + r cos u) du = 4π2Rr ♣

Et viktig spesialtilfelle av teorien ovenfor er grafer z = f(x, y) til funk-sjoner av to variable. Som vi sa i seksjon 3.9, kan de oppfattes som para-metriserte flater pa formen

r(x, y) = x i + y j + f(x, y) k x, y ∈ A

Vi ser at∂r∂x

(x, y) = i +∂f

∂x(x, y) k

og∂r∂y

(x, y) = j +∂f

∂y(x, y) k

som gir (∂r∂x× ∂r

∂y

)(x, y) = −∂f

∂x(x, y) i− ∂f

∂y(x, y) j + k

og∣∣∣∣

(∂r∂x× ∂r

∂y

)(x, y)

∣∣∣∣ =

1 +(

∂f

∂x(x, y)

)2

+(

∂f

∂y(x, y)

)2

Arealet til funksjonsgrafen z = f(x, y) over omradet A er dermed

Areal =∫∫

A

1 +(

∂f

∂x(x, y)

)2

+(

∂f

∂y(x, y)

)2

dxdy

6.4. ANVENDELSER AV DOBBELTINTEGRALER 541

Eksempel 4: Vi skal regne ut arealet til den delen av paraboloiden f(x, y) =x2 + y2 som ligger over sirkelskiven A gitt ved x2 + y2 ≤ 1. Siden

∂f

∂x= 2x og

∂f

∂y= 2y,

far viAreal =

∫∫

A

√1 + 4x2 + 4y2 dxdy

Gar vi over til polarkoordinater, ser vi at

Areal =1∫

0

[∫ 2π

0r√

1 + 4r2 dθ

]dr = 2π

1∫

0

r√

1 + 4r2 dr

Vi innfører na en ny variabel u = 1 + 4r2, som gir du = 8r dr og

Areal =π

4

5∫

1

√u du =

π

4

[23u3/2

]5

1

6(5√

5− 1)

Flateintegraler av skalarfelt

Vi arbeider fortsatt med en parametrisert flate r(u, v), (u, v) ∈ A, som oven-for, men vi tenker oss at flaten er et fysisk objekt med varierende massetett-het — la oss si at massetettheten i punktet (x, y, z) pa flaten er f(x, y, z).Gjentar vi argumentene ovenfor, kommer vi raskt frem til at massen til heleflaten ma være gitt av

∫∫

Af(r(u, v))

∣∣∣∣

(∂r∂u× ∂r

∂v

)(u, v)

∣∣∣∣ dudv

Uttrykk av denne typen dukker opp sa ofte at det lønner seg a ha et egetnavn og en egen notasjon for dem:

Definisjon 6.4.1 Anta at T er flaten gitt ved parametriseringen r(u, v),(u, v) ∈ A. Anta at f er en kontinuerlig funksjon pa T . Da er flateintegralettil f over T definert ved

∫∫

Tf dS =

∫∫

Af(r(u, v))

∣∣∣∣

(∂r∂u× ∂r

∂v

)(u, v)

∣∣∣∣ dudv

(forutsatt at dobbeltintegralet er definert).

Page 274: Flervariabel analyse med lineær algebra

542 KAPITTEL 6. MULTIPPEL INTEGRASJON

Det er en del a holde styr pa nar man skal regne ut et flateintegral, savi tar med et eksempel som viser handgrepene.

Eksempel 5: Vi skal regne ut flateintegralet∫∫

T f dS der f(x, y, z) = xyz2

og der T er flaten gitt ved

r(u, v) = u cos v i + u sin v j + u2 k for u ∈ [0, 2], v ∈ [0, 2π]

(dette er en del av paraboloiden z = x2 + y2). Først regner vi ut

∂r∂u

= cos v i + sin v j + 2u k

og∂r∂v

= −u sin v i + u cos v j

Tar vi vektorproduktet, far vi

∂r∂u× ∂r

∂v= −2u2 cos v i− 2u2 sin v j + u k

og ∣∣∣∣∂r∂u× ∂r

∂v

∣∣∣∣ = u√

4u2 + 1

Vi ser ogsa at

f(r(u, v)) = f(u cos v, u sin v, u2) = (u cos v)(u sin v)(u2)2 = u6 sin v cos v

Na kan vi sette inn i integralet:∫∫

Tf dS =

∫∫

Af(r(u, v))

∣∣∣∣

(∂r∂u× ∂r

∂v

)(u, v)

∣∣∣∣ dudv =

=∫∫

[0,2]×[0,2π]

(u6 sin v cos v

)(u√

4u2 + 1)

dudv =

=2∫

0

[∫ 2π

0u7 sin v cos v

√4u2 + 1 dv

]du =

=2∫

0

u7√

4u2 + 1[∫ 2π

0sin v cos v dv

]du

(vi kan ta u-faktorene utenfor siden de regnes som konstanter nar vi inte-grerer med hensyn pa v). Siden

∫sin v cos v dv = 1

2 sin2 v +C (sett z = sin vhvis du ikke ser dette direkte), far vi

∫∫

Tf dS =

2∫

0

u7√

4u2 + 1[12

sin2 v

]2π

0

du = 0

6.4. ANVENDELSER AV DOBBELTINTEGRALER 543

Vi kan na utvide vare formler for massemiddelpunkt til masseforde-linger pa flater. Dersom f er massetettheten pa flaten T , er x-, y- og z-komponentene til massemiddelpunktet r = (x, y, z) gitt ved

x =∫∫

T xf(x, y, z) dS∫∫T f(x, y, z) dS

y =∫∫

T yf(x, y, z) dS∫∫T f(x, y, z) dS

z =∫∫

T zf(x, y, z) dS∫∫T f(x, y, z) dS

Vær oppmerksom pa at massemiddelpunktet som regel ligger utenfor flatenT .

Bemerkning: I kapittel 3 definerte vi kurveintegraler bade av skalarfelt(integraler av typen

∫C f ds) og av vektorfelt (integraler av typen

∫C F · dr).

Flateintegralene vi definerte ovenfor, korresponderer til den første typenlinjeintegraler. Det finnes ogsa flateintegraler som korresponderer til denandre typen linjeintegraler. De betegnes gjerne med

∫∫T F · n dS og brukes

mye i fysikk og mekanikk. Vi skal ikke komme nærmere inn pa dem her.

Oppgaver til seksjon 6.4

1. Beregn volumet til omradet E nar

a) E = {(x, y, z) : 0 ≤ x ≤ 2, 0 ≤ y ≤ 1, 0 ≤ z ≤ x + y2}

b) E = {(x, y, z) : 0 ≤ x ≤ 1, 0 ≤ y ≤ x, 0 ≤ z ≤ x2}

c) E = {(x, y, z) : − 1 ≤ x ≤ 1, 0 ≤ y ≤ 2,−xy ≤ z ≤ 3− xy}

d) E er omradet over xy-planet og under grafen z =√

32− 2x2 − 2y2

e) E er omradet som ligger under grafen z = x2 − y2 og oversirkelskiven x2 + y2 ≤ 1

f) E er omradet som ligger over xy-planet og under grafenz = 4− (x− 2)2 − (y + 1)2

2. En trekantet plate har hjørner i (0, 0), (1, 0) og (1, 1) og tetthet f(x, y) = x. Finnmassemiddelpunktet.

3. En plate dekker omradet R = {(x, y) | 0 ≤ x ≤ 1, x2 ≤ y ≤ 1} og har tetthetf(x, y) = xy. Finn massemiddelpunktet.

4. Regn ut overflatearealet til en kule med radius R.

Page 275: Flervariabel analyse med lineær algebra

544 KAPITTEL 6. MULTIPPEL INTEGRASJON

5. Finn arealet til flaten z = x2 − y2, x2 + y2 ≤ 4.

6. Finn arealet av den delen av kjegleflaten z2 = x2 + y2 som ligger mellom z = 0og z = 1.

7. Finn arealet av den delen av kuleflaten x2 + y2 + z2 = 1 som ligger over sirkelen(x− 1

2 )2 + y2 ≤ 14 .

8. Vis at arealet til en flate

r(r, θ) = r cos θ i + r sin θ j + f(r, θ)k der(r, θ) ∈ A

er (under passende betingelser) gitt ved

∫∫

A

1 +(

∂f

∂r

)2

+1r2

(∂f

∂θ

)2

r drdθ

9. Regn ut flatearealet∫∫

T x2 dS nar T er flaten gitt ved z = x2+y2 det x2+y2 ≤ 1.

10. Regn ut flateintegralet∫∫

T xyz2 dS der T er den delen av sylinderflaten x2 +y2 = 4 der x ≥ 0, y ≥ 0 og 0 ≤ z ≤ 1.

11. Regn ut flateintegralet∫∫

T z2 dS nar T er torusen

r(u, v) = (5 + 3 cos u) cos v i + (5 + 3 cos u) sin v j + 3 sinuk u, v ∈ [0, 2π]

Du kan fa bruk for noen av regningene i eksempel 3.

12. En sylinderflate T har parametriseringen

r(u, v) = u i + 5 cos v j + 5 sin v k, u ∈ [0, 2], v ∈ [0, 2π]

Tegn en skisse av flaten og regn ut flateintegralet∫∫

T x dS.

13. Forklar at en kule om origo med radius R har parametriseringen

r(θ, φ) = R cos θ sinφ i + R sin θ sinφ j + R cos φ k, θ ∈ [0, 2π],φ ∈ [0,π]

Regn ut∣∣∣ ∂r∂θ ×

∂r∂φ

∣∣∣. Regn ogsa ut flateintegralet∫∫

T xy dS nar T er den delen avkuleflaten som ligger i første oktant (dvs. omradet der x, y, z ≥ 0).

14. En avkortet kjegle T har parametriseringen

r(u, v) = u cos v i + u sin v j + uk u ∈ [1, 2], v ∈ [0, 2π]

Regn ut∣∣ ∂r∂u ×

∂r∂v

∣∣. Regn ogsa ut flateintegralet∫

T x2z dS.

15. Finn massemiddelpunktet til halvkulen x2 + y2 + z2 = 1, z ≥ 0, nar massetett-heten er 1.

16. (Prøveeksamen i MAT1110, 2004)

6.4. ANVENDELSER AV DOBBELTINTEGRALER 545

(a) La T være omradet som ligger inni bade sylinderen x2−2x+y2 = 0 og kulenx2 + y2 + z2 = 4. Finn volumet til T .

(b) Finn arealet av den delen av overflaten til T som ligger pa kuleflaten x2 +y2 + z2 = 4.

17. (Eksamen i MAT1110 13/8, 2004) La D være det begrensede omradet i R3

som ligger over xy-planet og inni bade paraboloiden z = 4− x2 − y2 og sylinderenx2 + y2 = 1.

a) Finn volumet til D.

b) Finn arealet av den delen av randflaten til D som ligger pa paraboloidenz = 4− x2 − y2.

18. (Eksamen i MAT1110 13/6, 2007)

a) Vis at volumet til omadet avgrenset av planet 2x + 4y − z = −4 og parabo-loiden z = x2 + y2 er gitt ved

V =∫∫

D

(2x + 4y − x2 − y2 + 4

)dxdy

der D er sirkelen med sentrum i (1, 2) og radius 3.

b) Regn ut V .

19. (Eksamen i MAT1110 14/6, 2006) R er omradet i R3 avgrenset av paraboloidenz = x2 + y2 og planet z = 2x + 6y − 6.

a) Forklar at volumet til R er

V =∫∫

A(2x + 6y − 6− x2 − y2) dxdy

der A = {(x, y) ∈ R2 | (x− 1)2 + (y − 3)2 ≤ 4}.

b) Regn ut V .

c) Vis at vektorfeltet

F(x, y, z) = y2z i + 2xyz j + xy2 k

er konservativt. Regn ut∮

C G · dr der

G(x, y, z) = (y2z + z) i + 2xyz j + xy2 k

og der C er skjæringskurven til flatene z = x2 + y2 og z = 2x + 6y − 6. Kurven erorientert mot klokken nar du ser den ovenfra.

Page 276: Flervariabel analyse med lineær algebra

546 KAPITTEL 6. MULTIPPEL INTEGRASJON

6.5 Greens teorem

I denne seksjonen skal vi se pa en interessant sammenheng mellom linjein-tegraler og dobbeltintegraler. Husk fra kapittel 3 at dersom

F(x, y) = P (x, y) i + Q(x, y) j

er et vektorfelt og C er en kurve i planet parametrisert ved

r(t) = x(t) i + y(t) j der t ∈ [a, b],

sa er linjeintegralet∫C F · dr definert ved

CF·dr =

b∫

a

F(r(t))·r′(t) dt =b∫

a

(P (x(t), y(t))x′(t)+Q(x(t), y(t))y′(t)

)dt

Inspirert av det siste uttrykket skriver man ofte∫

CF · dr =

CP dx + Q dy

der dx er en forkortelse for x′(t) dt og dy er en forkortelse for y′(t) dt.

!

"

R

!

#

"

$

C??W

x

y

Innsiden av C'''-

Utsiden av C+V

Figur 1: En enkel, lukket kurve C og omradet R den avgrenser

For a formulere Greens teorem trenger vi noen begreper. Husk at enparametrisert kurve r : [a, b] → R2 er lukket dersom den starter og ender isamme punkt, dvs. dersom r(a) = r(b). Vi sier at kurven er enkel dersomden ikke skjærer eller berører seg selv underveis, dvs. dersom r(s) #= r(t)for alle s, t ∈ [a, b), s #= t. En enkel, lukket kurve deler planet i to deler, enutside og en innside (se figur 1). Dette kan virke opplagt, men er forbausendevanskelig a bevise. Med omradet avgrenset av kurven skal vi mene samlingenav alle punkter som ligger enten pa eller pa innsiden av kurven. Vi kan naformulere teoremet:

Teorem 6.5.1 (Greens teorem) Anta at C er en enkel, lukket kurve meden stykkevis glatt parametrisering r, og la R være omradet avgrenset av C.

6.5. GREENS TEOREM 547

Dersom de partiellderiverte til P og Q er kontinuerlige i et apent omradesom inneholder R, sa er

CP dx + Q dy =

∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy

der C er orientert mot klokken

Bemerkning: Greens teorem er en to-dimensjonal versjon av analysensfundamentalteorem. Fundamentalteoremet sier at oppførselen til en funksjonf over det indre av et intervall [a, b], oppfanges av oppførselen til en annenfunksjon F pa randen til intervallet — vi har

F (b)− F (a) =b∫

a

f(x) dx

Tilsvarende sier Greens teorem at oppførselen til funksjonen ∂Q∂x −

∂P∂y over

det indre av omradet R, oppfanges av oppførselen til en annen funksjonF = P i + Q j over randen C til omradet.

Sa generelt som det er formulert ovenfor, er Greens teorem vanskelig abevise, og vi skal derfor nøye oss med a bevise noen spesialtilfeller som ertilstrekkelig for de fleste regnetekniske formal. Men før vi gjør det, skal vise pa noen eksempler.

Greens teorem kan brukes begge veier — bade til a omdanne linjeinte-graler til dobbeltintegraler og omvendt. Det enkleste er a omdanne linjein-tegraler til dobbeltintegraler.

Eksempel 1: Vi skal regne ut linjeintegralet∫C F · dr der C er omkretsen

til kvadratet R = [0, 1]× [2, 4] orientert mot klokken, og F er gitt ved

F(x, y) = (x +y3

3) i + (2x + y2) j

Vi ser at siden P (x, y) = x + y3

3 og Q(x, y) = 2x + y2, sa er

∂Q

∂x− ∂P

∂y= 2− y2

Dermed har vi∫

CF · dr =

CP dx + Q dy =

∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

=4∫

2

[∫ 1

0(2− y2) dx

]dy =

4∫

2

(2− y2)[∫ 1

01 dx

]dy =

4∫

2

(2− y2) dy =

Page 277: Flervariabel analyse med lineær algebra

548 KAPITTEL 6. MULTIPPEL INTEGRASJON

=[2y − y3

3

]4

2

= −443

Vi ser at vi har to fordeler av a bruke Greens teorem i eksemplet over— for det første er det enklere a dobbeltintegrere over et rektangel enn aparametrisere alle de fire kantene, og for det andre blir integranden enklerenar den deriveres.

La oss na se pa et eksempel der vi bruker Greens teorem i motsatt ret-ning — fra dobbeltintegral til linjeintegral.

Eksempel 2: Vi skal regne ut dobbeltintegralet∫∫

R xy dxdy der R eromradet omsluttet av kurven C gitt ved

r(t) = sin t i + sin t cos t j t ∈ [0,π]

Bruker vi MATLAB til a tegne opp kurven, far vi denne figuren

Figur 2: Omradet i eksempel 2

Siden det er kurven som er gitt, kan det være lurt a bruke Greens teoremtil a regne ut dobbeltintegralet. Vi trenger da et vektorfelt

F(x, y) = P (x, y) i + Q(x, y) j

der ∂Q∂x −

∂P∂y = xy. Det er mange valgmuligheter, men siden y-komponenten

er den “styggeste” delen av parametriseringen, kan det lønne seg a velge etvektorfelt der Q = 0. Dermed ma vi ha −∂P

∂y = xy, og P = −12xy2 er et

naturlig valg. Vi har dermed

I =∫∫

Rxy dxdy =

∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

=∫

CP dx + Q dy =

C−1

2xy2 dx + 0 dy

6.5. GREENS TEOREM 549

Fra parametriseringen ser vi at dx = cos t dt, sa vi far

I =∫

C−1

2xy2 dx = −1

2

∫ π

0sin t(sin t cos t)2 cos t dt =

= −12

∫ π

0sin3 t cos3 t dt = − 1

16

∫ π

0sin3 2t dt

der vi i siste overgang har brukt formelen sin 2t = 2 sin t cos t. Skriver visin3 2t = (1− cos2 2t) sin 2t og innfører en ny variabel u = cos 2t, far vi

I = − 116

∫ π

0(1− cos2 2t) sin 2t dt =

132

∫ 1

1(1− u2) du = 0

(hadde vi vært smarte, kunne vi pa et tidlig tidspunkt ha brukt symmetritil a se at integralet ma være 0, men knepene i utregningen av integralet erogsa greie a kjenne til). ♣

Av og til er det nyttig a bruke Greens teorem til a regne ut arealer.

Korollar 6.5.2 Anta at C er en enkel, lukket kurve med en stykkevis glattparametrisering r, og la være R omradet avgrenset av C. Da er arealet til Rgitt ved

Areal(R) =∫

Cx dy = −

Cy dx =

12

C−y dx + x dy

der kurveintegralene er orientert mot klokken.

Bevis: Disse formlene er direkte konsekvenser av Greens teorem. For a viseden første, bruker vi Greens teorem pa vektorfeltet F(x, y) = 0 i + x j. Daer

∂Q

∂x− ∂P

∂y= 1

og vi far ∫

Cx dy =

∫∫

R1 dxdy = Areal(R)

De to andre formlene utledes pa tilsvarende mate. !

Eksempel 3: La oss regne ut arealet til ellipsen

x2

a2+

y2

b2= 1

Denne ellipsen har parametriseringen

r(t) = a cos t i + b sin t j t ∈ [0, 2π]

Page 278: Flervariabel analyse med lineær algebra

550 KAPITTEL 6. MULTIPPEL INTEGRASJON

som gir dx = −a sin t dt og dy = b cos t dt. Setter vi dette inn i den siste avde tre formlene for arealet i korollar 6.5.2, far vi

Arealet av ellipse =12

C−y dx + x dy =

=12

∫ 2π

0

[− (b sin t)(−a sin t) dt + (a cos t)(b cos t) dt

]=

∫ 2π

0

ab

2= πab

Vi skal bevise Greens teorem for “enkle” omrader R, men før vi gjørdet, skal vi ta med oss en liten observasjon som gjør det mulig a utvideresultatet fra enkle til mer kompliserte omrader. Anta at figur 3a) viser etomrade R vi ønsker a bruke Greens teorem pa, men at vi er litt usikre pa omformelen gjelder for omrader av denne typen. Anta videre at vi kan dele Ropp i fire regioner R1, R2, R3 og R4 som vi vet Greens teorem kan brukes pa.Figur 3b) viser oppdelingen med piler som indikerer retningen de forskjelligerandkurvene gjennomløpes i.

a) b)

!

"

R

11111111I !

"#

Figur 3: Oppdeling i enklere omrader

!

"

! !"

$

#

$ >>L

#!

"#

$

#S

SS

SSj !

"

R4R1

R3R2

Bruker vi Greens teorem pa hvert av disse omradene, far vi∫∫

R1

(∂Q

∂x− ∂P

∂y

)dxdy =

C1

P dx + Q dy

∫∫

R2

(∂Q

∂x− ∂P

∂y

)dxdy =

C2

P dx + Q dy

∫∫

R3

(∂Q

∂x− ∂P

∂y

)dxdy =

C3

P dx + Q dy

∫∫

R4

(∂Q

∂x− ∂P

∂y

)dxdy =

C4

P dx + Q dy

6.5. GREENS TEOREM 551

Legger vi sammen disse ligningene, far vi∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

C1

(P dx + Q dy)+

+∫

C2

(P dx + Q dy) +∫

C3

(P dx + Q dy) +∫

C4

(P dx + Q dy)

siden vi apenbart kan legge sammen de fire dobbeltintegralene. Dersom vipa tilvarende mate kunne legge sammen de fire linjeintegralene, hadde vihatt Greens teorem for omradet R. Det er slett ikke opplagt at vi kan gjøredette — kurvene C1, C2, C3 og C4 inneholder jo deler som ikke er med i rand-kurven C til det opprinnelige omradet R (pa figuren er dette de loddretteog vannrette skillelinjene mellom omradene R1, R2. R3 og R4). Legg merketil at disse “ekstra” linjestykkene gjennomløpes to ganger, en i hver retning.Siden motsatt rettede linjeintegraler har samme tallverdi, men motsatte for-tegn (husk setning 3.4.4), vil disse bidragene kansellere hverandre, og vi starigjen med

C1

(P dx + Q dy) +∫

C2

(P dx + Q dy) +∫

C3

(P dx + Q dy)+

+∫

C4

(P dx + Q dy) =∫

CP dx + Q dy

Kombinerer vi ligningene vare, far vi∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

CP dx + Q dy

som er Greens teorem for omradet R.Det viser seg at det vi nettopp har vist, er et generelt fenomen — nar vi

deler et komplisert omrade opp i enklere bestanddeler, vil integralene overde “indre” kurvebitene alltid kansellere (dette forutsetter at omradet ikkehar hull; vi skal komme tilbake til dette nedenfor). For praktisk bruk avGreens teorem holder det for oss a bevise teoremet for enkle omrader ogoverlate til brukerne a vise at de kompliserte omradene de kommer borti,kan deles opp i enklere biter pa en sann mate at de “indre” linjeintegralenekansellerer.

Før vi begynner pa beviset, lønner det seg ogsa a observere at Greensteorem bestar av to deler — den ene sier at

CP dx = −

∫∫

R

∂P

∂ydxdy,

den andre at ∫

CQ dy =

∫∫

R

∂Q

∂xdxdy,

Page 279: Flervariabel analyse med lineær algebra

552 KAPITTEL 6. MULTIPPEL INTEGRASJON

Vi skal vise disse likhetene hver for seg og for litt forskjellig type omrade(at omradene er forskjellig, spiller ingen rolle sa lenge vi kan bruke sam-menslaingsteknikken ovenfor til a lappe sammen delene til mer generellehelheter).

Vi skal først vise∫C P dx = −

∫∫R

∂P∂y dxdy for omrader av type I. Husk

at et slikt omrade er pa formen

R = {(x, y) : a ≤ x ≤ b, φ1(x) ≤ y ≤ φ2(x)}

Figur 4 viser et omrade av type I med omløpsretningen fra Greens teorem.

!

"

a b

R

y = φ1(x)

y = φ2(x)

>>L

??W

$

"

)))*

#

Figur 4: Omrade av type I

Lemma 6.5.3 Anta at φ1,φ2 : [a, b] → R er to deriverbare funksjoner slikat φ1(x) < φ2(x) for alle x ∈ (a, b). La

R = {(x, y) : a ≤ x ≤ b, φ1(x) ≤ y ≤ φ2(x)}

og la C være randen til R orientert mot klokken. Anta at P er en funksjonav to variable med kontinuerlige partiellderiverte i R. Da er

CP dx = −

∫∫

R

∂P

∂ydxdy

Bevis: Vi begynner med a regne ut linjeintegralet. Randkurven C bestar avfire deler C1, C2, C3 og C4, der C1 er den nedre funksjonsgrafen, C2 er detloddrette linjestykket til høyre, C3 er den øvre funksjonsgrafen og C4 er detloddrette linjestykket til venstre. Vi har dermed

CP dx =

C1

P dx +∫

C2

P dx +∫

C3

P dx +∫

C4

P dx

Det andre og det fjerde av disse integralene (de to langs de loddrette linje-stykkene) er null fordi dx = x′(t) dt er null siden x(t) er konstant nar vibeveger oss loddrett.

For a regne ut∫C1

P dx parametriserer vi den nedre funksjonsgrafen ved

r1(t) = t i + φ1(t) j; t ∈ [a, b]

6.5. GREENS TEOREM 553

Da er dx = x′(t) dt = dt, og vi far

C1

P dx =∫ b

aP (t, φ1(t)) dt

For a regne ut∫C3

P dx ma vi parametrisere den øvre funksjonsgrafen. Dennaturlige parametriseringen er

r2(t) = t i + φ2(t) j; t ∈ [a, b],

men siden den parametriserer kurven i gal retning, ma vi passe pa a putteet minus foran integraltegnet. Dermed er

C3

P dx = −∫ b

aP (t, φ2(t)) dt

og vi far∫

CP dx =

∫ b

aP (t, φ1(t)) dt−

∫ b

aP (t, φ2(t)) dt

Til sammenligning regner vi na ut dobbeltintegralet∫∫

R∂P∂y dxdy. Ved

hjelp av analysens fundamentalteorem far vi

∫∫

R

∂P

∂ydxdy =

∫ b

a

[∫ φ2(x)

φ1(x)

∂P

∂y(x, y) dy

]dx =

=∫ b

a[P (x,φ2(x))− P (x,φ1(x))] dx

Sammenligner vi de resultatene vi na har, ser vi at

CP dx = −

∫∫

R

∂P

∂ydxdy

!

Vi skal na vise∫C Q dy =

∫∫R

∂Q∂x dxdy for omrader av type II. Vi minner

om at slike omrader er pa formen

R = {(x, y) : c ≤ y ≤ d, ψ1(y) ≤ x ≤ ψ2(y)}

Figur 5 viser et omrade av type II med omløpsretningen i Greens teoreminntegnet.

Page 280: Flervariabel analyse med lineær algebra

554 KAPITTEL 6. MULTIPPEL INTEGRASJON

!

"

c

d

Ax = ψ1(y) x = ψ2(y)! #

Figur 5: Omrade av type II

!

"

#

$

Lemma 6.5.4 Anta at ψ1,ψ2 : [c, d] → R er to deriverbare funksjoner slikat ψ1(y) < ψ2(y) for alle y ∈ (c, d). La

R = {(x, y) : c ≤ y ≤ d, ψ1(y) ≤ x ≤ ψ2(y)}

og la C være randen til R orientert mot klokken. Anta at Q er en funksjonav to variable med kontinuerlige partiellderiverte i R. Da er

CQ dy =

∫∫

R

∂Q

∂xdxdy

Bevis: Beviset er en kopi av det foregaende med rollene til x- og y-aksenbyttet om. Vi begynner med a regne ut linjeintegralet. Randkurven C bestarav fire deler C1, C2, C3 og C4, der C1 er den venstre funksjonsgrafen, C2 erdet nederste, vannrette linjestykket, C3 er den høyre funksjonsgrafen og C4

er det øverste, vannrette linjestykket. Vi har dermed∫

CQ dy =

C1

Q dy +∫

C2

Q dy +∫

C3

Q dy +∫

C4

Q dy

Det andre og det fjerde av disse integralene (de to langs de vannrette linje-stykkene) er null fordi dy = y′(t) dt er null siden y(t) er konstant nar vibeveger oss vannrett.

For a regne ut∫C1

Q dy parametriserer vi den venstre funksjonsgrafenved

r1(t) = ψ1(t) i + t j; t ∈ [c, d]

Siden denne parametriseringen gar i feil retning, ma vi kompensere ved asette et minus foran linjeintegralet. Siden dy = y′(t) dt = dt, far vi dermed

C1

Q dy = −∫ d

cQ(ψ1(t), t) dt

For a regne ut∫C3

Q dy parametriserer vi den høyre funksjonsgrafen ved

r2(t) = ψ2(t) i + t j; t ∈ [c, d],

6.5. GREENS TEOREM 555

og far ∫

C3

Q dy =∫ d

cQ(ψ2(t), t)) dt

Dermed har vi∫

CQ dy = −

∫ d

cQ(ψ1(t), t) dt +

∫ d

cQ(ψ2(t), t)) dt

Til slutt regner vi ut dobbeltintegralet∫∫

R∂Q∂x dxdy. Ved hjelp av ana-

lysens fundamentalteorem far vi∫∫

R

∂Q

∂xdxdy =

∫ d

c

[∫ φ2(y)

ψ1(y)

∂Q

∂x(x, y) dx

]dy =

=∫ d

c[Q(ψ2(y), y)−Q(ψ1(y), y)] dy

Sammenligner vi de resultatene vi na har, ser vi at∫

CQ dy =

∫∫

R

∂Q

∂xdxdy

!

Med de to lemmaene ovenfor til disposisjon kan selv den mest nidkjæremed god samvittighet bruke Greens teorem pa alle de sammenhengende,begrensede mengdene uten hull som dukker opp i praksis. Vi kan ogsa brukelemmaene pa omrader med hull, men da dukker det opp en ny effekt.

a) b)

!

"

4567R

Figur 6: Et omrade med hull

!

"

4567

! !"$

#

$ >>L

#!

"#

$

#S

SS

SSj!9

"

.*

C

R4R1

R3R2

Figur 6a) viser er omrade R med hull. I b) har vi delt opp omradet i firedelomrader R1, R1, R3, R4 som vi kan bruke Greens teorem pa. Dette giross

∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

C1

P dx + Q dy +∫

C2

P dx + Q dy+

Page 281: Flervariabel analyse med lineær algebra

556 KAPITTEL 6. MULTIPPEL INTEGRASJON

+∫

C3

P dx + Q dy +∫

C4

P dx + Q dy

der Ci er randen til Ri. Tar vi en kikk pa figur 6b) ser vi at alle “indre” bidragtil linjeintegralene kansellerer med fire unntak — linjeintegralene langs hulletforekommer bare en gang, og de er orientert i negativ omløpsretning (altsamed klokken). Vi sitter altsa igjen med

∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

CP dx + Q dy −

Ch

P dx + Q dy

der C er den “ytre” randen til R, og Ch er den indre randen (mot hullet),begge med positiv orientering. Vi far en tilsvarende formel for omrader medflere hull.

Det neste eksemplet viser at man ma være litt forsiktig nar man brukerGreens teorem.

Eksempel 4: Vi lar C være enhetssirkelen orientert mot klokken og setter

F(x, y) = P (x, y) i + Q(x, y) j = − y

x2 + y2i +

x

x2 + y2j

La oss først regne ut linjeintegralet∫C F · dr pa vanlig mate. Siden enhets-

sirkelen har parametriseringen

r(t) = cos t i + sin t j, t ∈ [0, 2π]

far vi∫

CF·dr =

∫ 2π

0

(− sin t

cos2 t + sin2 ti +

cos t

cos2 t + sin2 tj)·(− sin t i + cos t j) dt =

=∫ 2π

01 dt = 2π

La oss sa forsøke a bruke Greens teorem isteden. Vi observerer at

∂Q

∂x=

1 · (x2 + y2)− x · 2x

(x2 + y2)2=

y2 − x2

(x2 + y2)2

∂P

∂y= −1 · (x2 + y2)− y · 2y

(x2 + y2)2=

y2 − x2

(x2 + y2)2

Dermed er ∂Q∂x −

∂P∂y = 0, og ifølge Greens teorem burde vi vel fa

CF · dr =

CP dx + Q dy =

∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

∫∫

R0 dxdy = 0

selv om dette ikke stemmer med utregningene ovenfor?

6.5. GREENS TEOREM 557

Hva er galt? Ser vi nøyere etter, ser vi at F ikke er definert i origo, og atvi derfor strengt tatt ikke kan bruke Greens teorem. Vi kan imidlertid prøvea unnga problemet pa følgende mate. Vi lar Cr være en liten sirkel om origomed radius r, og bruker Greens teorem pa omradet mellom de to sirklene.Vi burde da fa

0 =∫∫

R

(∂Q

∂x− ∂P

∂y

)dxdy =

CP dx + Q dy −

Cr

P dx + Q dy (6.5.1)

Lar vi r ga mot null, far vi en kortere og kortere kurve a integrere over, ogvi ville tro at ∫

Cr

P dx + Q dy → 0 nar r → 0

I sa fall sitter vi nok en gang igjen med∫

CP dx + Q dy = 0

Men la oss se nærmere pa integralet∫Cr

P dx + Q dy. Dersom vi parametri-serer Cr med

s(t) = r cos t i + r sin t j, t ∈ [0, 2π]

far vi ∫

Cr

P dx + Q dy =

=∫ 2π

0

(− r sin t

r2 cos2 t + r2 sin2 ti +

r cos t

r2 cos2 t + r2 sin2 tj)·(−r sin t i+r cos t j) dt

=∫ 2π

01 dt = 2π

Na stemmer alt! Gar vi tilbake til ligning (6.5.1) ovenfor, ser vi at∫

CP dx + Q dy =

Cr

P dx + Q dy = 2π

akkurat som vi skulle ha.Dette eksemplet har en dobbelt moral (men ikke en dobbeltmoral!). Det

ene poenget er at vi ma være forsiktig nar vi bruker Greens teorem og sjekkeat funksjonene vi bruker, virkelig er definert i alle punkter vi integrerer over.Det andre er at det ikke er sikkert at integralet over stadig kortere kurver garmot null dersom integranden samtidig gar mot uendelig. Vær oppmerksompa at dette ikke er matematiske spissfindigheter — grunnleggende fysiskekrefter som gravitasjon og elektromagnetisme har en form som gjør at slikeproblemstillinger stadig dukker opp i praksis. ♣

Page 282: Flervariabel analyse med lineær algebra

558 KAPITTEL 6. MULTIPPEL INTEGRASJON

Greens teorem er et eksempel pa det som ofte kalles vektoranalyse. I tre(og høyere) dimensjoner finnes det enda viktigere eksempler pa slike teore-mer — Stokes’ teorem og Gauss’ teorem (ogsa kjent som divergensteoremet).Det første av disse binder sammen et integral over en flate med et integrallangs randkurven til flaten, mens det andre binder sammen et integral overet romlegeme med flateintegralet over randen til dette legemet. Vi ser attemaet hele tiden er det samme — et integral over et omrade sammenlignesmed et annet integral over randen til omradet.

Oppgaver til seksjon 6.5

1 Bruk Greens teorem til a regne ut linjeintegralene. I alle tilfeller er kurven Cpositivt orientert.

a)∫C(x2 + y) dx + x2y dy der C er omkretsen til kvadratet med hjørner i (0, 0),

(2, 0), (2, 2) og (0, 2).

b)∫C x2y3 dx + x3y2 dy der C er omkretsen til trekanten med hjørner i (0, 0),

(3, 0), (3, 1)

c)∫C(x2y + y) dx + (xy + x) dy der C er omkretsen til trapeset med hjørner i

(0, 0), (1, 0), (1, 2) og (0, 1)

d)∫C(x2y +xex) dx+(xy3 + esin y) dy der C er omkretsen til omradet avgrenset

av parabelen y = x2 og linjestykket med endepunkter (−1, 1) og (2, 4).

2. Kurven C er gitt ved

r(t) = t sin(t) i + (2πt− t2) j, t ∈ [0, 2π]

Skisser kurven (f.eks. ved a bruke MATLAB) og regn ut arealet til omradet denavgrenser.

3. Kurven C er gitt ved

r(t) = sin 2t i + t cos t j, t ∈ [0,π

2]

Skisser kurven (f.eks. ved a bruke MATLAB) og regn ut arealet til omradet avgren-set av kurven.

4. Regn ut arealet avgrenset av kurven

r(t) = a cos3 t i + b sin3 t j, t ∈ [0, 2π]

der a og b er to positive tall.

5. Regn ut∫∫

R x dxdy der R er omradet avgrenset av kurven

r(t) = (t− t2) i + (t− t3) j, t ∈ [0, 1]

6. Regn ut∫∫

R y dxdy der R er omradet avgrenset av kurven

r(t) = sin t i + t2 j, t ∈ [−π,π]

6.5. GREENS TEOREM 559

7. (Eksamen i MAT1110 13/6, 2005) La D være omradet i R2 som bestar avpunkter (x, y) som oppfyller ulikhetene x2 + y2 ≤ 1 og y ≥ 0. La C være randen tilD orientert mot urviseren. Finn verdien av kurveintegralet

C

(xy + ln(x2 + 1)

)dx +

(4x + ey2

+ 3 arctan y)

dy

8. (Eksamen i MAT1110 13/8, 2004) La D være det begrensede omradet i R2 somer avgrenset av parabelen y = 1−x2 og x-aksen. La C være den lukkede randkurventil D. Orienter C mot urviseren.

a) Regn ut kurveintegralet I =∫C −y dx+x2 dy ved direkte utregning av kurve-

integralet.

b) Regn ut I ved a beregne et dobbeltintegral∫∫

D f(x, y) dxdy av et passeligskalarfelt f(x, y).

9. (Prøveeksamen i MAT1110, 2004) La D være omradet i R2 bestemt av ulikhetenex ≥ 0, y ≥ 0 og x ≤ y ≤ 2− x2.

a) Sett opp et dobbeltintegral som har verdi lik arealet til D og regn ut verdienav dette dobbeltintegralet.

b) Beregn arealet av D ved a beregne linjeintegralet av et passelig vektorfeltlangs randen til D.

10. (Eksamen i MAT1110 14/6, 2004).

a) La D være omradet av punkter (x, y) i R2 som oppfyller ulikhetene: x2 +y2 ≤ 1, x ≥ 0, y ≥ 0 og 0 ≤ y ≤ x. Lag en skisse av omradet og beregndobbeltintegralet I =

∫∫D(x + y2) dxdy ved a innføre polarkoordinater.

b) Beregn I ved a regne ut direkte et kurveintegral∫C P dx+Q dy av et passelig

vektorfelt F = P i+Q j langs den stykkevis glatte kurven C som utgjør randentil D.

11. (Eksamen i MAT1110 13/6, 2007) R er rektanglet med hjørner i (1, 1), (3, 1),(3, 2), (1, 2), og C er omkretsen til R orientert mot klokken. Finn

∫C F · dr der

F(x, y) = (xy2 − y) i + (x2y + x) j

12. (Kontinuasjonseksamen i MAT1110, 2006)

a) En ellipse har ligningen

9x2 + 4y2 − 18x + 16y = 11

Finn sentrum og halvaksene til ellipsen, og lag en skisse av ellipsen i koordi-natsystemet.

b) Vis atr(t) = (1 + 2 cos t) i + (−2 + 3 sin t) j, t ∈ [0, 2π)

er en parametrisering av ellipsen i a). Regn ut∮C F · dr der

F(x, y) = y2 i + x j

og der C er ellipsen med positiv orientering.

Page 283: Flervariabel analyse med lineær algebra

560 KAPITTEL 6. MULTIPPEL INTEGRASJON

c) Regn ut ∫∫

R(1− 2y) dxdy

der R er omradet avgrenset av ellipsen.

13. Det er en nær sammenheng mellom Greens teorem og teorien for konservativevektorfelt i seksjon 3.5. Bruk Greens teorem til a vise at dersom F(x, y) = P (x, y) i+Q(x, y) j er et konservativt felt, sa er

∫C F · dr = 0 for alle enkle, lukkede, stykkevis

glatte kurver C.

6.6 Jordan-malbare mengder

I seksjon 6.4 sa vi hvordan vi kunne regne ut arealet til en mengde A vedhjelp av dobbeltintegraler:

Areal(A) =∫∫

A1 dxdy

Dette forutsetter selvfølgelig at integralet∫∫

A 1 dxdy er definert, og det erdet samme som at funksjonen

1A(x) =

1 hvis x ∈ A

0 hvis x /∈ A

er integrerbar. I denne seksjonen skal vi finne betingelser som sikrer at 1A

er integrerbar, og vi skal bruke disse betingelsene til a finne kriterier somgaranterer at generelle integraler av typen

∫∫A f(x, y) dxdy eksisterer. Dette

vil blant annet sette oss istand til a bevise at dobbeltintegraler av kontinu-erlige funksjoner over omrader av type I og type II virkelig eksisterer (huskseksjon 6.2).

Sammenlignet med de foregaende er denne seksjonen ganske teoretisk,og det er ikke sikkert at alle har lyst til a lese alle bevisene. Det er imidlertidviktig a fa med seg definisjonen av begrepene “Jordan-malbar” og “innholdnull” som vi skal fa bruk for i senere seksjoner.

Definisjon 6.6.1 Vi sier at en begrenset mengde A ⊂ R2 er Jordan-malbardersom 1A er integrerbar.

Bemerkning: Det finnes et sterkere begrep Lebesgue-malbar (sterkere i denforstand at flere mengder er Lebesgue-malbare enn Jordan-malbare) som duvil støte pa i videregaende kurs. Nar folk bare sier “malbar”, mener de somregel “Lebesgue-malbar”, og vi skal derfor dra med oss “Jordan”-forstavelseni dette heftet.

6.6. JORDAN-MALBARE MENGDER 561

Det viser seg at det eneste som kan hindre en mengde i a være Jordan-malbar, er at randen ikke er “liten” nok. Den neste definisjonen presisererhva “liten” betyr i denne sammenhengen.

Definisjon 6.6.2 En begrenset mengde B ⊂ R2 har innhold 0 dersom detfor hver ε > 0 finnes endelig mange rektangler

R1 = [a1, b1]× [c1, d1], R2 = [a2, b2]× [c2, d2], . . . , Rn = [an, bn]× [cn, dn]

slik atB ⊂ R1 ∪R2 ∪ . . . ∪Rn

og summen av arealene til R1, R2,. . . , Rn er mindre enn ε.

En begrenset mengde har altsa innhold null dersom den kan dekkes av en-delige familier av rektangler med vilkarlig lite samlet areal. Mengder medinnhold null er “sma” sett med to-dimensjonale øyne. Man vil f.eks. venteat en-dimensjonale objekter som en kontinuerlig funksjonsgraf har innholdnull (vi skal vise dette i beviset for setning 6.6.5).

Vi kan na formulere det første hovedresultatet vart:

Teorem 6.6.3 En begrenset mengde A ⊂ R2 er Jordan-malbar hvis og barehvis randen ∂A til A har innhold 0.

Vi trenger noen forberedelser før vi kan bevise teoremet.

Lemma 6.6.4 Anta at A ⊂ R2 er en begrenset mengde, og at R er etrektangel som inneholder A i sitt indre. Anta at Π er en partisjon som delerR inn i delrektangler Rij = [ai−1, ai]× [bj−1, bj ].

(i) Dersom a ∈ ∂A, sa er a med i et delrektangel Rij som bade inneholderpunkter som er med i A, og punkter som ikke er det.

(ii) Dersom et delrektangel Rij bade inneholder punkter som er med i A,og punkter som ikke er det, sa inneholder Rij et randpunkt a ∈ ∂A.

Bevis: (i) Siden a ligger i R, ma det høre til minst ett delrektangel Rij (sidennaborektangler har felles rand, kan a godt høre til flere rektangler). Dersoma ligger i det indre av Rij , ma Rij apenbart inneholde bade punkter som ermed i A og punkter som ikke er det (husk at a ∈ ∂A). Dersom a ligger paranden til Rij (enten pa en kant eller i et hjørne), kan det hende at Rij entenbare inneholder punkter som er med i A eller bare punkter som ikke er med iA, men da er det lett a overbevise seg om at ett av de andre smarektanglenesom a hører til, ma inneholde bade punkter som er med i A, og punkter somikke er det (lag en tegning).

(ii) Vi ma vise at dersom Rij bade inneholder punkter som er med i A,og punkter som ikke er det, sa ma Rij inneholde et punkt fra ∂A. Vi skal

Page 284: Flervariabel analyse med lineær algebra

562 KAPITTEL 6. MULTIPPEL INTEGRASJON

bruke samme teknikk som i beviset for Bolzano-Weierstrass’ teorem 5.2.3.Vi deler først Rij opp i fire mindre, lukkede rektangler, og observerer atminst ett av dem (kall det K1) ma inneholde bade punkter som er fra A, ogpunkter som ikke er det (tenk gjennom dette — det er ikke helt opplagt).Deler vi pa samme mate K1 inn i fire mindre rektangler, ma minst ett avdem bade inneholde punkter som er med i A, og punkter som ikke er det. Veda fortsette pa denne maten far vi en følge {Kn} av stadig mindre rektanglersom alle inneholder bade punkter som er med i A, og punkter som ikke ermed i A (se figur 1).

K1

K2

K3

$K4

#

Figur 1: Rektanglene Kn

Lar vi an være nedre, venstre hjørne i Kn, vil følgen {an} konvergeremot et punkt a i Rij . Siden hver Kn bade inneholder punkter som er med iA, og punkter som ikke er det, finnes det punkter av begge typer vilkarlignær a, og a ma derfor ligge pa randen ∂A til A. !

Før vi gar løs pa beviset for teorem 6.6.3 gjør vi en liten observasjon til.Dersom Π er en partisjon av rektanglet R, og A er en delmengde av R, vilhvert delrektangel Rij høre til en av følgende tre kategorier:

(i) Kategori 1: Alle punktene i Rij er med i A

(ii) Kategori 2: Ingen av punktene i Rij er med i A

(iii) Kategori 3: Noen (men ikke alle) punktene i Rij er med i A

Bevis for setning 6.6.3: Anta først at A er Jordan-malbar. Vi ma vise atranden ∂A til A har innhold 0.

La R være et rektangel som inneholder A i sitt indre. At A er Jordan-malbar, betyr at funksjonen 1A er integrerbar over R. Gitt ε > 0, finnesdet da en partisjon Π av R slik at Ø(Π)−N(Π) < ε, der Ø(Π) og N(Π) erøvre og nedre trappesum til funksjonen 1A. Dersom delrektanglet Rij er avkategori 1 eller 2, er supremum Mij og infimum mij over rektanglet Rij like(henholdsvis 1 for den første kategorien og 0 for den andre), mens for den

6.6. JORDAN-MALBARE MENGDER 563

tredje kategorien er Mij = 1 og mij = 0. Dette betyr at

ε > Ø(Π)−N(Π) =∑

Rij av tredje kategori|Rij |

der |Rij | er arealet til rektanglet Rij . Fra lemmaet ovenfor vet vi at ethvertrandpunkt a er med i et rektangel Rij av kategori 3, og dermed utgjørrektanglene av kategori 3 en overdekning av randen ∂A. Dermed har vifunnet en overdekning av ∂A med totalt areal mindre enn ε, og følgelig har∂A innhold 0.

Anta sa at randen ∂A til A har innhold 0. Gitt en ε > 0, ma vi finne enpartisjon Π slik at Ø(Π)−N(Π) < ε. Dette vil medføre at 1A er integrerbar,og dermed bevise teoremet.

Siden ∂A har innhold 0, finnes det en samling rektangler

S1 = [a1, b1]× [c1, d1], S2 = [a2, b2]× [c2, d2], . . . , Sn = [an, bn]× [cn, dn]

som dekker ∂A, og har samlet areal mindre enn ε. Lag en partisjon Π av Rved a bruke punktene a1, a2, . . . , an og b1, b2, . . . , bn som delepunkter langsx-aksen og c1, c2, . . . , cn og d1, d2, . . . , dn som delepunkter langs y-aksen. Ob-server at hvert av smarektanglene Rij til denne partisjonen ligger inni et avde opprinnelige rektanglene S1, S2, . . . , Sn (lag en figur!). De av rektangleneRij som inneholder punkter fra ∂A ma derfor ha samlet areal mindre enn ε.

Akkurat som ovenfor vil rektanglene Rij være av tre forskjellige katego-rier, og som ovenfor har vi

Ø(Π)−N(Π) =∑

Rij av tredje kategori|Rij |

Fra lemmaet vet vi at ethvert rektangel av kategori 3 inneholder et punktfra ∂A, og dermed har vi

Ø(Π)−N(Π) =∑

Rij av tredje kategori|Rij | ≤ ε

Beviset er fullført. !

Vi kan na vise at ethvert omrade av type I eller II (se seksjon 6.2) erJordan-malbart.

Setning 6.6.5 Ethvert omrade av type I eller II er Jordan-malbart.

Bevis: Vi nøyer oss med a bevise setningen for et omrade A av type I. Ifølgeteoremet ovenfor er det nok a vise at randen til A har innhold 0. Siden randentil A bestar av fire deler (to funksjonsgrafer og to loddrette linjestykker), er

Page 285: Flervariabel analyse med lineær algebra

564 KAPITTEL 6. MULTIPPEL INTEGRASJON

det nok a vise at hver av disse delene har innhold 0 (sjekk dette!). Vi tar foross funksjonsgrafene og overlater linjestykkene til leserne.

Anta altsa at φ : [a, b] → R er en kontinuerlig funksjon. Vi ma vise atfunksjonsgrafen

G = {(x,φ(x)) | x ∈ [a, b]}

har innhold null. Figur 2 viser ideen i beviset som bestar i a overdekke grafenmed rektanglene som skiller en øvre trappesum fra en nedre.

)

*

x

y

Figur 2: Overdekning av en graf

Her er detaljene: Siden alle kontinuerlige funksjoner er integrerbare, fin-nes det for enhver ε > 0 en partisjon Π av intervallet [a, b] slik at Ø(Π) −N(Π) < ε. Ser vi pa den tilsvarende overdekningen i figur 2, ser vi at dettotale arealet til de overdekkende rektanglene er

n∑

i=1

(Mi −mi)(ti − ti−1) < Ø(Π)−N(Π) ≤ ε

Dermed har vi funnet en overdekning av grafen G med totalt areal mind-re enn ε, og følgelig har grafen innhold 0. !

Vi kan na bevise et kriterium for integrerbarhet av kontinuerlige funk-sjoner.

Teorem 6.6.6 Anta at A ⊂ R2 er en lukket, begrenset, Jordan-malbarmengde. Da er enhver kontinuerlig funksjon f : A → R integrerbar overA (dvs. at integralet

∫∫A f(x, y) dxdy eksisterer). Spesielt er alle kontinuer-

lige funksjoner integrerbare over omrader av type I og II.

Bevis: La R være et rektangel som inneholder A. Vi ma vise at funksjonen

fA(x, y) =

f(x, y) hvis (x, y) ∈ A

0 ellers

er integrerbar over R. Det er nok a vise at f er begrenset og at det for hverε > 0, finnes en partisjon Π av R slik at Ø(Π)−N(Π) < ε.

6.6. JORDAN-MALBARE MENGDER 565

Ifølge ekstremalverdisetningen 5.7.2 er f begrenset, og det finnes derforet tall M slik at |f(x)| ≤ M for alle x ∈ A. Dette betyr at dersom Rij er etdelrektangel i en partisjon av R, sa er alltid Mij −mij ≤ 2M .

Fra setning 6.6.3 vet vi at det finnes en partisjon Π slik at hvis ø(Π) ogn(Π) er henholdsvis øvre og nedre trappesum til funksjonen 1A med hensynpa Π, sa er ø(Π) − n(Π) < ε

4M . Ifølge setning 6.1.4 er f : A → R uniformtkontinuerlig, og det finnes derfor en δ > 0 slik at hvis a og b er to punkter iA med |a− b| < δ, sa er |f(a)− f(b)| < ε

2|R| , der |R| som vanlig er arealettil R. Ved a legge inn enda flere delepunkter hvis nødvendig, kan vi forfineΠ til en partisjon Π slik at alle punkter som hører til samme delrektangelRij , har innbyrdes avstand mindre enn δ. Vi har

Ø(Π)−N(Π) =∑

alle rektangler Rij

(Mij −mij)|Rij | =

=∑

rektangler avkategori 1

(Mij −mij)|Rij | +∑

rektangler avkategori 2

(Mij −mij)|Rij | +

+∑

rektangler avkategori 3

(Mij −mij)|Rij |

I det siste uttrykket er∑

rektangler avkategori 1

(Mij −mij)|Rij | ≤∑

rektangler avkategori 1

ε

2|R| |Rij | <ε

2

pa grunn av den uniforme kontinuiteten. Videre er∑

rektangler avkategori 2

(Mij −mij)|Rij | = 0

siden Mij = mij = 0 i dette tilfellet. Endelig er∑

rektangler avkategori 3

(Mij −mij)|Rij | ≤ 2M∑

rektangler avkategori 3

|Rij | ≤

≤ 2M(ø(Π)− n(Π)

)≤ ε

2(husk at ø(Π) og n(Π) er øvre og nedre trappesum til funksjonen 1A, og atvi har laget partisjonen slik at ø(Π)− n(Π) < ε

4M ). Alt i alt er da

Ø(Π)−N(Π) <ε

2+ 0 +

ε

2= ε

Page 286: Flervariabel analyse med lineær algebra

566 KAPITTEL 6. MULTIPPEL INTEGRASJON

som viser at f er integrerbar. Utsagnene om integraler over omrader av typeI og II følger na fra setning 6.6.5. !

Bemerkning: Hvis man arbeider litt hardere, kan man beskrive nøyaktighvilke funksjoner f som er integrerbare over et rektangel R — det viserseg at f er integrerbar hvis og bare hvis mengden av punkter der f erdiskontinuerlig, har mal null (dette er en mer generell betingelse enn a hainnhold null). Resultatet ovenfor holder imidlertid for vare behov i dettekapitlet — spesielt er det tilstrekkelig for beviset av formelen for skifte avvariabel.

Oppgaver til seksjon 6.6

1. Vis at dersom A1, A2, . . . , Am er delmengder av Rn med innhold null, sa harogsa A1 ∪A2 ∪ . . . ∪Am innhold null.

2. I denne oppgaven er A og B to delmengder av R2.

a) Vis at ∂(A ∪B) ⊂ ∂A ∪ ∂B og ∂(A ∩B) ⊂ ∂A ∩ ∂B.

b) Vis at dersom A og B er Jordan-malbare, sa er ogsa A∪B og A∩B Jordan-malbare (du kan fa bruk for resultatet i den forrige oppgaven).

3. Anta at r : [a, b] → R er kontinuerlig funksjon. Vis at mengden av alle punktermed polarkoordinater (θ, r(θ)) der θ ∈ [a, b] har innhold 0.

6.7 Skifte av variable i dobbeltintegral

Husk hvordan vi skifter variabel i et vanlig integral∫ ba f(x) dx: Dersom

vi ønsker a innføre en ny variabel u = g(x), regner vi ut x = h(u) ogdx = h′(u) du, og setter inn (husk a bytte integrasjonsgrenser):

∫ b

af(x) dx =

∫ g(b)

g(a)f(h(u))h′(u) du

Vi ser at vi far to nye ingredienser i integralet etter variabelskiftet — et nyttintervall [g(a), g(b)] a integrere over og en ny faktor h′(u) i integranden. Idenne seksjonen skal vi se at akkurat det samme skjer for dobbeltintegraler— vi kan skifte variabel i disse integralene ogsa, men da far vi et nytt omradea integrere over og en ny faktor i integranden.

I vanlige integraler skifter vi variabel for a fa en enklere integrand. Idobbeltintegraler skifter vi vel sa ofte variable for a fa et enklere omradea integrere over. Vi skal ta denne situasjonen som utgangspunkt for vardiskusjon. Vi tenker oss at vi skal regne ut integralet til en funksjon f overomradet A til høyre pa figur 1, altsa integralet

∫∫A f(x, y) dxdy. Omradet

A er ganske uregelmessig, og vi ma bryte dobbeltintegralet opp i flere biter

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 567

for a fa regnet det ut pa vanlig mate. La oss na tenke oss at det finnes enfunksjon T : R2 → R2 som avbilder et atskillig penere omrade D pa A slikfigur 1 viser. Kanskje vi kan gjøre om dobbeltintegralet

∫∫A f(x, y) dxdy til

et dobbeltintegral over det enklere omradet D? Kanskje dette integralet harnoe a gjøre med funksjonen g(u, v) = f(T(u, v))? (Funksjonen g er altsadefinert slik at verdien til g i punktet (u, v) ∈ D er lik verdien til f i det“tilsvarende” punktet (x, y) = T(u, v) i A.)

!

"

!

"

A

D

(u, v)(x, y) = T(u, v)a

v

u

y

x

!!T

Figur 1: T avbilder D pa A

For a undersøke dette spørsmalet nærmere tenker vi oss at vi har deltopp D i et rutenett, og at vi har brukt T til a flytte dette rutenettet borttil A slik figur 2 viser.

!

"

!

"

A

D

(uij , vij)?

??

?Wa

v

u

y

x

!! (xij , yij)= T(uij , vij)

#

T

Figur 2: T flytter rutenettet fra D til A

Vi plukker ut et punkt (uij , vij) i den ij-te ruten Dij i oppdelingen avD, og lar (xij , yij) = T(uij , vij) være det tilsvarende punktet i ij-te rutenAij i oppdelingen av A. Er oppdelingen fin nok, burde

ij

f(xij , yij)|Aij |

(der |Aij | er arealet til Aij) være en god tilnærming til dobbeltintegralet

Page 287: Flervariabel analyse med lineær algebra

568 KAPITTEL 6. MULTIPPEL INTEGRASJON

∫∫A f(x, y) dxdy. Tilsvarende burde

ij

g(uij , vij)|Dij |

være en god tilnærming til dobbeltintegralet∫∫

D g(x, y) dudv.Hva er sammenhengen mellom disse to uttrykkene? Per definisjon av

g er g(uij , vij) = f(xij , yij), sa funksjonsverdiene i de to summene er desamme, men hva med arealene |Aij | og |Dij |? I seksjon 3.8 observerte vi attallverdien til Jacobi-determinanten

detT′(u, v) =

∣∣∣∣∣∣

∂T1∂u (u, v) ∂T1

∂v (u, v)

∂T2∂u (u, v) ∂T2

∂v (u, v)

∣∣∣∣∣∣

er en forstørrelsesfaktor for avbildningen T, og derfor er

|Aij | ≈ |detT′(uij , vij)| |Dij |

Vi burde derfor ha∑

ij

f(xij , yij)|Aij | ≈∑

ij

g(uij , vij) |detT′(uij , vij)| |Dij |

med bedre og bedre tilnærming dess finere oppdelingen er. Summene i detteuttrykket er begge en slags Riemann-summer som burde nærme seg hvertsitt integral, og dermed sitter vi igjen med

∫∫

Af(x, y) dxdy =

∫∫

Dg(u, v) |detT′(u, v)| dudv =

=∫∫

Df(T(u, v)) |detT′(u, v)| dudv

der vi i siste overgang har brukt at g(u, v) = f(T(u, v)).Argumentet ovenfor er langt fra et matematisk bevis, men det er sa pass

overbevisende at resultatet burde være riktig under passende forutsetninger.Vi skal na formulere et presist resultat som vi skal bevise mot slutten avseksjonen. Det er slett ikke det mest generelle resultatet man kan bevise,men det holder for vare anvendelser og er mulig a bevise med de redskapenevi har til disposisjon. Husk at en funksjon T er injektiv dersom a #= bmedfører T(a) #= T(b).

Teorem 6.7.1 (Skifte av variable i dobbeltintegral) La U være enapen, begrenset mengde i R2 og anta at T : U → R2 er en injektiv funksjonmed kontinuerlige partiellderiverte slik at detT′ #= 0 pa hele U . Hvis D ⊂ Uer en lukket, Jordan-malbar mengde, og f : T(D) → R er en kontinuerligfunksjon, sa er

∫∫

Af(x, y) dxdy =

∫∫

Df(T(u, v))|detT′(u, v)| dudv

der A = T(D).

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 569

Før vi ser pa noen eksempler, skal vi innføre litt hendig notasjon. Dersomvi kaller komponentene til T(u, v) for x(u, v) og y(u, v) slik at

T(u, v) = (x(u, v), y(u, v)),

blir Jacobi-determinanten

detT′(u, v) =

∣∣∣∣∣∣

∂x∂u(u, v) ∂x

∂v (u, v)

∂y∂u(u, v) ∂y

∂v (u, v)

∣∣∣∣∣∣

Det er vanlig a bruke notasjonen

∂(x, y)∂(u, v)

=

∣∣∣∣∣∣

∂x∂u(u, v) ∂x

∂v (u, v)

∂y∂u(u, v) ∂y

∂v (u, v)

∣∣∣∣∣∣

Formelen for skifte av variabel blir da∫∫

Af(x, y) dxdy =

∫∫

Df(x(u, v), y(u, v))

∣∣∣∣∂(x, y)∂(u, v)

∣∣∣∣ dudv

Det er instruktivt a sammenligne denne formelen med den formelen for skifteav variabel i vanlige integraler som vi startet denne seksjonen med, altsa

∫ b

af(x) dx =

∫ g(b)

g(a)f(h(u))h′(u) du

(likheten blir enda mer slaende om vi skriver h′(u) = dxdu).

Eksempel 1: Beregn integralet∫∫

A

xy dxdy der A bestar er omradet av-

grenset av linjene y = −x, y = −x + 4, y = x + 2, y = x + 3. Figur 3 viseromradet A.

!

"

::

::

::

::

::

::

::

::

++

++

++

++

++

++

++

++

++

++

x

y

y = −x

y = −x + 4

y = x + 3

A

y = x + 2

Figur 3: Omradet A

Legg merke til at A bestar av de punktene (x, y) som oppfyller ulikhetene

2 ≤ y − x ≤ 3 og 0 ≤ y + x ≤ 4

Page 288: Flervariabel analyse med lineær algebra

570 KAPITTEL 6. MULTIPPEL INTEGRASJON

Ideen er a innføre nye variable u = y − x, v = y + x slik at rendene tilomradet blir parallelle med koordinataksene. Løser vi disse ligningene medhensyn pa y og x, far vi

x =−u + v

2, y =

u + v

2

Avbildningene vare blir dermed x(u, v) = −u+v2 og y(u, v) = u+v

2 . Lar vi Dvære rektanglet

D = {(u, v) : 2 ≤ u ≤ 3 og 0 ≤ v ≤ 4}

ser vi at T (D) = A. Dermed har vi∫∫

A

xy dxdy =∫∫

D

(−u + v

2

) (u + v

2

) ∣∣∣∣∂(x, y)∂(u, v)

∣∣∣∣ du dv

Vi regner ut Jacobi-determinanten:

∂(x, y)∂(u, v

=

∣∣∣∣∣

∂x∂u

∂x∂v

∂y∂u

∂y∂v

∣∣∣∣∣ =

∣∣∣∣∣−1

212

12

12

∣∣∣∣∣ = −14− 1

4= −1

2

Dette gir oss

∫∫

A

xy dxdy =3∫

2

4∫

0

(−u + v

2

) (u + v

2

)· 12dv

du

=18

3∫

2

4∫

0

(v2 − u2)dv

du =18

3∫

2

[v3

3− u2v

]v=4

v=0

du

=18

3∫

2

(643− 4u2

)du =

18

[643

u− 43u3

]3

2

=18

[643

· 3− 43· 33 − 64

3· 2 +

43· 23

]= −1

2♣

Før vi gar løs pa det neste eksemplet, viser vi frem et triks som av og tiler nyttig. Siden funksjonen

(x, y) = T(u, v)

er injektiv, har den en omvendt funksjon T−1 som vi kan finne (i hvert falli prinsippet!) ved a løse ligningen ovenfor for x og y:

(u, v) = T−1(x, y)

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 571

Jacobi-determinanten til denne funksjonen er

det((T−1)′(x, y)

)=

∂(u, v)∂(x, y)

=

∣∣∣∣∣∣

∂u∂x

∂u∂y

∂v∂x

∂v∂y

∣∣∣∣∣∣

Fra omvendt funksjonsteorem 5.6.2 vet vi at Jacobi-matrisen til T−1 erden inverse til Jacobi-matrisen til T. Det samme ma gjelde for Jacobi-determinantene (siden det(A−1) = (det A)−1 ifølge korollar 4.9.15), og der-med har vi

∂(x, y)∂(u, v)

=

∣∣∣∣∣∣

∂x∂u

∂x∂v

∂y∂u

∂y∂v

∣∣∣∣∣∣=

∣∣∣∣∣∣

∂u∂x

∂u∂y

∂v∂x

∂v∂y

∣∣∣∣∣∣

−1

=(

∂(u, v)∂(x, y)

)−1

Formelen for skifte av variable kan derfor ogsa skrives:

∫∫

Af(x, y) dxdy =

∫∫

Df(x(u, v), y(u, v))

∣∣∣∣∂(u, v)∂(x, y)

∣∣∣∣−1

dudv

I noen tilfeller er denne formen enklere a bruke enn den opprinnelige slikdet neste eksemplet illustrerer.

Eksempel 2: Vi skal regne ut integralet∫∫

Axy dxdy der A er omradet i

første kvadrant avgrenset av kurvene y = 1x , y = 3

x og linjene y = x2 , y = 2x.

Figur 4 viser omradet.

!

"

333333333

??????????

x

y

A

y = 2x

y = x2

y = 3x

y = 1x

Figur 4: Omradet A

For treningens skyld skal vi regne ut integralet pa to mater; først skal vibruke “standardmetoden”, og sa skal vi bruke metoden vi nettopp presen-terte med a regne ut ∂(u,v)

∂(x,y) istedenfor ∂(x,y)∂(u,v) . I begge tilfeller skal vi bruke

det samme variabelskiftet, sa la oss finne det først. Omformer vi litt paligningene som beskriver omradet A, far vi betingelsene

1 ≤ xy ≤ 3 og12≤ y

x≤ 2

Page 289: Flervariabel analyse med lineær algebra

572 KAPITTEL 6. MULTIPPEL INTEGRASJON

Vi innfører derfor nye variable

u = xy og v =y

x

og ser at betingelsene ovenfor na blir til 1 ≤ u ≤ 3, 12 ≤ v ≤ 2. Det nye

integrasjonsomradet vi skal integrere u og v over, er derfor rektanglet

D = [1, 3]× [12, 2]

Metode 1: For a komme videre, løser vi ligningene u = xy og v = yx for x og

y. Fra den andre ligningen far vi y = vx, og setter vi dette inn i den første,ser vi at u = x(vx) som gir x =

√uv (husk at vi er i første kvadrant og

derfor bare er interessert i positive x-verdier). Setter vi dette inn i ligningeny = vx, far vi y =

√uv. Vi har altsa

x =√

u

vog y =

√uv

Vi kan na regne ut Jacobi-determinanten

∂(x, y)∂(u, v)

=

∣∣∣∣∣∣

∂x∂u

∂x∂v

∂y∂u

∂y∂v

∣∣∣∣∣∣=

∣∣∣∣∣∣∣

12√

uv−

√u

2√

v3

√v

2√

u

√u

2√

v

∣∣∣∣∣∣∣=

14v

+14v

=12v

Dermed er vi klare til a skrive opp det nye integralet:∫∫

A

x

ydxdy =

∫∫

D

√uv√

uv

12v

dudv =∫∫

D

12v2

dudv

Resten er enkelt:∫∫

D

12v2

dudv =∫ 3

1

[∫ 2

12

12v2

du

]dv =

∫ 3

1

32· 12v2

dv =

=∫ 3

1

34v2

dv =[− 3

4v

]3

1

= −14

+34

=12

Metode 2: Nar vi bruker denne metoden, skal regne ut Jacobi-determinanten∂(u,v)∂(x,y) , sa vi kan derivere med en gang uten a løse for x og y først:

∂(u, v)∂(x, y)

=

∣∣∣∣∣∣

∂u∂x

∂u∂y

∂v∂x

∂v∂y

∣∣∣∣∣∣=

∣∣∣∣∣y x

− yx2

1x

∣∣∣∣∣ =y

x+

y

x=

2y

x= 2v

Dette gir∣∣∣∂(u,v)∂(x,y)

∣∣∣−1

= 12v . Observerer vi at x

y = 1v , kan vi na sette rett inn i

integralet:∫∫

A

x

ydxdy =

∫∫

D

1v

12v

dudv =∫∫

D

12v2

dudv

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 573

Resten av regningen er som ovenfor.Vi ser at i dette eksemplet gir metode 2 kortere og enklere utregninger

enn metode 1. Det er flere grunner til dette. For det første er det letterea derivere u og v med hensyn pa x og y enn omvendt, og for det andre erdet enkelt a uttrykke integranden og Jacobi-determinanten ∂(u,v)

∂(x,y) ved hjelpav u og v uten først a matte finne x og y uttrykt ved u og v. Er ikke dissebetingelsene oppfylt, er det ofte vel sa raskt a løse integralet ved hjelp avmetode 1. ♣

Du har kanskje lurt pa sammenhengen mellom integrasjon i polarkoor-dinater, som vi behandlet i seksjon 6.3, og teorien ovenfor. Den er sværttett — vi kan tenke pa integrasjon i polarkoordinater som resultatet av etvariabelskifte der vi innfører nye variable r og θ slik at

x = r cos θ og y = r sin θ

Dette gir oss Jacobi-determinanten

∂(x, y)∂(r, θ)

=∣∣∣∣

cos θ −r sin θsin θ r cos θ

∣∣∣∣ = r cos2 θ + r sin2 θ = r

Den ekstra faktoren r i polarintegrasjon er altsa Jacobi-determinanten tilvariabelskiftet. Formelen for skifte av variable i dobbeltintegraler blir na tilden vanlige formelen for integrasjon i polarkoordinater:

∫∫

Af(x, y) dxdy =

∫∫

Df(r cos θ, r sin θ)r drdθ

der D er omradet A beskrevet i polarkoordinater.

Bemerkning: Ser du nøye etter, vil du se at vi egentlig bare har lov tila bruke teorem 6.7.1 pa polarkoordinater dersom origo ikke er med i inte-grasjonsomradet — betingelsen om at detT′ #= 0 er nemlig ikke oppfylt iorigo. Det er imidlertid ingen problemer med a bruke polarkoordinater paomrader som inneholder 0. Vil man begrunne dette, kan man først fjerne enliten sirkelskive B(0, ε) fra integrasjonsomradet og sa se pa grenseverdiennar ε gar mot 0.

Vi tar med et eksempel der det er naturlig a bruke polarkoordinater.

Eksempel 3: Vi skal finne volumet til en kule med radius a. Ligningenfor en kuleflate med radius a og sentrum i origo er

x2 + y2 + z2 = a2

Løser vi for z, far viz = ±

√a2 − x2 − y2 .

Page 290: Flervariabel analyse med lineær algebra

574 KAPITTEL 6. MULTIPPEL INTEGRASJON

Halve volumet ligger dermed under funksjonsgrafen f(x, y) =√

a2 − x2 − y2

og over sirkelenS{(x, y) ∈ R2 : x2 + y2 ≤ a2}

Dermed erV = 2

∫∫

S

√a2 − x2 − y2 dxdy .

Skifter vi til polarkoordinater, far vi

V = 2a∫

0

2π∫

0

√a2 − r2 r dθ

dr

(husk Jacobi-determinanten er r). Dette gir

V = 4π

a∫

0

√a2 − r2 r dr

For a løse dette integralet innfører vi en ny variabel u = a2 − r2. Da erdu = −2r dr, og vi far

∫ √a2 − r2 r dr = −1

2

∫ √u du = −1

3u3/2 + c =

13(a2 − r2)3/2 + c

Dermed er

V = 4π

[−1

3(a2 − r2)3/2

]a

0

=43πa3

♣Bruk av polarkoordinater er sa vanlig at du fritt kan bruke formelen ∂(x,y)

∂(r,θ) =r uten a matte begrunne den. Vær forøvrig oppmerksom pa at det ofte kanvære lurt a bruke polarkoordinater med et annet sentrum enn origo. Ønskerdu f.eks. a integrere over en sirkel med sentrum i (a, b), er det som regel lurta innføre polarkoordinater med dette punktet som sentrum. Det betyr at dusetter

x = a + r cos θ og y = b + r sin θ

Ogsa i dette tilfellet blir Jacobi-determinanten ∂(x,y)∂(r,θ) = r.

∗Bevis for skifte av variabel i dobbeltintegraler

Vi skal na bevise teorem 6.7.1. Beviset er langt og vanskelig, og vi skalstykke det opp i flere etapper. Først ser vi pa hvordan affinavbildningertransformerer arealer. (Dersom du synes det er noe kjent ved dette, skyldesdet nok at lemmaet nedenfor bare er en presisering av setning 2.9.3.)

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 575

Lemma 6.7.2 Anta at D ⊂ R2 er en begrenset, Jordan-malbar mengde medareal |D|. Dersom F(x) = Bx + b er en affinavbildning fra R2 til R2 medmatrise B, sa er bildet

A = F(D) = {F(x) | x ∈ D}

Jordan-malbart med areal |A| = |det(B)| |D|. Tallverdien til determinantener altsa forstørrelsesfaktoren til affinavbildningen.

Bevis: Fra seksjon 2.9 vet vi at formelen gjelder nar D er et rektangel (strengttatt viste vi den bare nar D er et kvadrat, men beviset for rektangler erakkurat det samme). For a vise at den gjelder for en generell, begrenset,Jordan-malbar mengde D, ma vi tilnærme D ved hjelp av rektangler. Herer detaljene:

Siden D er Jordan-malbar, er funksjonen 1D integrerbar, og vi kan forenhver ε > 0 finne en partisjon Π av et rektangel R som innholder D slik at

Ø(Π)− |D| <ε

2|detB|og

|D|−N(Π) <ε

2|det B|der Ø(Π) er den øvre trappesummen til funksjonen 1D, og N(Π) er dennedre trappesummen. Siden

Ø(Π) =∑

rektanglene Rij

slik at Rij∩D ,=∅

|Rij |

ogN(Π) =

rektanglene Rijslik at Rij⊂D

|Rij |,

vil det samlede bildet av de første rektanglene (de som inngar i summen tilØ(Π)) under F gi en overdekning av F(D) med samlet areal |det(B)|Ø(Π) <|det B||D| + ε

2 , mens det samlede bildet av rektanglene i den andre sum-men, vil gi en mengde som ligger inni F(D) med areal |det(B)|N(Π) >|det B||D| − ε

2 . Bildet F(D) ligger dermed klemt mellom to mengder derden største har areal mindre enn |det B||D| + ε

2 , og den minste har arealstørre enn |det B||D| − ε

2 . Det følger at A = F(D) er Jordan-malbar medareal |A| = |det B||D|. !

Bemerkning: Er man virkelig kritisk, vil man si at vi har jukset litt i be-viset ovenfor — vi har nemlig brukt to arealbegreper om hverandre uten asjekke at de faktisk er sammenfallende. Det ene arealbegrepet er det ufor-melle som vi har med oss fra skolen, og som forteller oss hvordan vi kan

Page 291: Flervariabel analyse med lineær algebra

576 KAPITTEL 6. MULTIPPEL INTEGRASJON

regne ut arealet til trekanter og parallellogrammer og lignende, mens detandre arealbegrepet er det vi har innført i dette kapitlet, og som bygger padobbeltintegraler. Det er ikke vanskelig a vise at de to begrepene stemmeroverens, men det tar litt tid, og vi overlater utfordringen til leserne!

Før vi for alvor gar løs pa beviset for teoremet, trenger vi noen tekniskehjelpemidler. Den neste setningen er et generelt resultat om lukkede mengdersom ogsa er nyttig i mange andre sammenhenger.

Setning 6.7.3 Anta at B og C er to disjunkte (dvs. at B ∩C = ∅), lukkedemengder i Rn, og at minst en av dem er begrenset. Da finnes det en δ > 0slik at |b− c| ≥ δ for alle b ∈ B og c ∈ C.

Bevis: La oss si at det er B som er begrenset. Dersom resultatet ikke hol-der, kan vi for hver n ∈ N finne et par av elementer bn ∈ B og cn ∈ Cslik at |bn − cn| < 1

n . Siden B er lukket og begrenset, har {bn} en delfølge{bnk} som konvergerer mot et punkt b ∈ B. Siden |bnk − cnk | → 0, vilogsa cnk → b. Siden C er lukket, ma da b ∈ C, og det er umulig sidenB ∩ C = ∅. !

I argumentene nedenfor er det ofte lurt a male størrelsen til en vektorpa en litt annen mate enn vanlig. Dersom x = (x1, x2) er en vektor i R2, larvi ||x|| = max{|x1|, |x2|}. Et kvadrat med sentrum i x og sider ε er na gittved

K(x, ε) = {y ∈ R2 | ||y − x|| <ε

2}

Siden vi maler vektorer pa en litt uvanlig mate, er det naturlig ogsa a malestørrelsen til matriser pa en annen mate enn vanlig. Dersom A er matrisen(

a11 a12

a21 a22

), lar vi

||A|| = max{|a11| + |a12|, |a21| + |a22|}

(OBS: Selv om vi bruker den samme notasjonen, er dette ikke den sammematrise-normen som vi brukte i setning 1.6.3). Her er et enkelt lemma omsammenhengen mellom disse normene:

Lemma 6.7.4 For alle x ∈ R2 og alle 2× 2-matriser A har vi

||Ax|| ≤ ||A||||x||

Bevis: Siden

Ax =

(a11x1 + a12x2

a21x1 + a22x2

),

er||Ax|| = max{|a11x1 + a12x2|, |a21x1 + a22x2|}

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 577

Videre er

|a11x1+a12x2| ≤ |a11||x1|+|a12||x2| ≤ (|a11|+|a12|) max{|x1|, |x2|} ≤ ||A||||x||

og

|a21x1+a22x2| ≤ |a21||x1|+|a22||x2| ≤ (|a21|+|a22|) max{|x1|, |x2|} ≤ ||A||||x||,

og følgelig er ||Ax|| ≤ ||A||||x|| !

Grunnen til at vi innfører de nye normene, er at de egner seg utmerkettil a beskrive hva som skjer med kvadrater nar de transformeres ved hjelp aven funksjon. Figur 5 viser problemstillingen — vi er interessert i størrelsentil det minste kvadratet K ′ (med sider parallelle med aksene) vi kan puttebildet av det opprinnelige kvadratet K inn i.

!

"

!K

!

"

!P

S

S(K)

K ′

Figur 5: Avbildning av kvadrater

Setning 6.7.5 La K ⊂ R2 være et kvadrat med areal |K| og sentrum c.Anta at S : K → R2 er en deriverbar avbildning slik at ||S′(x, y)|| ≤ C foralle punkter (x, y) i det indre av K. Da er S(K) inneholdt i et kvadrat medsentrum i S(c) og areal C2|K|

Bevis: La c = (x0, y0) og la (x, y) være et annet punkt i K. Ved middel-verdisetningen for funksjoner av flere variable (se setning 3.2.3) finnes detet punkt d i det indre av K slik at

|S1(x, y)− S1(x0, y0)| = |∇S1(d) · (x− x0, y − y0)|

Hvis s er halvparten av sidekanten i det opprinnelige integralet, er |x−x0| ≤s og |y − y0| ≤ s. Dermed er

|S1(x, y)− S1(x0, y0)| =(∣∣∣∣

∂S1

∂x(d)

∣∣∣∣ +∣∣∣∣∂S1

∂y(d)

∣∣∣∣

)s ≤ Cs

Tilsvarende resonnement for S2 gir |S2(x, y)−S2(x0, y0)| ≤ Cs, og resultatetfølger. !

Page 292: Flervariabel analyse med lineær algebra

578 KAPITTEL 6. MULTIPPEL INTEGRASJON

Vi er na ferdige med de første forberedelsene. De neste to resultatene giross viktig informasjon om malbarhet. Husk at tillukningen N til en mengdeN ⊂ R2 bestar av N pluss randen til N — med andre ord N = N ∪ ∂N .

Setning 6.7.6 La U være en apen, begrenset mengde i R2 og anta at N eren mengde med innhold 0 slik at tillukningen til N er inneholdt i U . DersomS : U → R2 er en funksjon med kontinuerlige partiellderiverte, sa har S(N)innhold null.

Bevis: Siden U er apen, er mengden

U c = {a ∈ R2 |a /∈ U}

(den kalles komplementet til U) lukket. Ifølge setning 6.7.3 finnes det dermeden δ > 0 slik at avstanden fra ethvert punkt i N til det nærmeste punktet iU c er minst δ. La K være tillukningen til mengden

{x ∈ R2 : det finnes a ∈ N slik at |x− a| ≤ δ/2}

Da er K en lukket og begrenset delmengde av U , og ifølge ekstremalverdi-setningen finnes et tall M slik at tallverdien til de partiellderiverte til S ermindre enn M

2 pa mengden K. Dermed er ||S′(x)|| ≤ M for alle x ∈ K.Gitt en ε > 0, kan vi finne en overdekning av N med samlet areal mindre

enn εM2 slik at alle rektanglene i overdekningen ligger inni K. Vi kan anta at

alle rektanglene i denne overdekningen er kvadrater. (For a se dette velgerdu først en overdekning som bestar av rektangler, sa utvider du hvert rek-tangel ørlite slik at alle hjørner har rasjonale koordinater, men det samledearealet fortsatt er mindre enn ε

M2 , og sa observerer du at alle rektanglermed rasjonale hjørner kan deles opp i et endelig antall kvadrater — det sistehar noe med fellesnevnere a gjøre!). Ser vi pa bildene av alle kvadratenei overdekningen, forteller forrige setning oss at hvert av dem ligger inni etnytt kvadrat med areal maksimalt M2 ganger arealet til det opprinneligekvadratet. De nye kvadratene overdekker dermed S(N) og har et samletareal mindre enn M2 ε2

M2 = ε. Følgelig har S(N) innhold 0, og setningen erbevist. !

Det neste resultatet viser at injektive funksjoner med ikke-null Jacobi-determinant bevarer malbarhet.

Setning 6.7.7 La U være en apen, begrenset mengde i R2, og anta at D eren Jordan-malbar mengde med tillukning inneholdt i U . Anta at S : U → R2

er en injektiv funksjon med kontinuerlige partiellderiverte slik at detS′(x) #=0 for alle x ∈ U . Da er S(D) Jordan-malbar.

Bevis: Ifølge teorem 6.6.3 er en mengde Jordan-malbar hvis og bare hvisranden har innhold 0. Dette betyr at randen N til D har innhold 0, og

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 579

ifølge forrige setning har dermed S(N) innhold 0. Dersom vi kan vise at∂S(D) ⊂ S(N), sa ma S(D) være malbar og teoremet følger (de to mengdene∂S(D) og S(N)er faktisk like, men det har vi ikke bruk for).

Anta y ∈ ∂S(D). Siden detS #= 0 pa U , forteller omvendt funksjons-teorem 5.6.2 oss at S har en kontinuerlig omvendt funksjon S−1 : S(U) → Usom er definert i en omegn om y. Siden y ∈ ∂S(D), kan vi na finne to følgerfra S(U) som konvergerer mot x — den ene, {yn}, bestar av punkter somligger i S(D), den andre, {zn}, bestar av punkter som ikke er med i S(D).Siden S−1 er kontinuerlig, vil S−1(yn) og S−1(zn) begge konvergere motx = S−1(y). Den første av disse følgene bestar av punkter som er med i D,den andre av punkter som ikke er med i D. Følgelig er x ∈ N = ∂D. Sideny = S(x), er dermed y ∈ S(N), og setningen er bevist. !

Vi kan na for alvor tenke pa a bevise teoremet. Hovedideen i beviset erat hvis K er et lite kvadrat med sentrum a, sa vil bildet T(K) ha arealtilnærmet lik |detT′(a)||K|. For a gjennomføre beviset trenger vi a vitehvor god tilnærmelsen er. Dette skal vi gjøre pa følgende indirekte mate. Vibruker først den inverse lineæravbildningen B = T′(a)−1 til a avbilde T(K)tilbake til utgangspunktet — dvs. vi ser pa mengden BT(K). Siden B ogT nesten er inverser til hverandre i det omradet vi ser pa, er BT(K) og Ksvært like, og vi skal bruke setning 6.7.6 til a vise at BT(K) kan passes inn iet kvadrat K ′ som bare har litt større areal enn K. Dermed er T′(a)(K ′) enmengde som inneholder T(K), og som har et areal som bare er ørlite grannstørre enn |detT′(a)||K|. Det neste lemmaet oppsummerer de regnetekniskedelene av dette resonnementet:

Lemma 6.7.8 La U være en apen mengde i R2 og anta at T : U → R2

er en injektiv funksjon med kontinuerlige partiellderiverte slik at detT′ #= 0pa hele U . Dersom K er et lukket kvadrat inni U , og B : R2 → R2 er eninverterbar matrise, sa er

|T(K)| ≤ |det B|−1

(supu∈K

||BT′(u)||)2

|K|

Bevis: La S være den sammensatte funksjonen S(u) = BT(u). Da er S′(u) =BT′(u) og

C = supu∈K

||S′(u)|| = supu∈K

||BT′(u)||

eksisterer siden K er lukket og begrenset, og de partiellderiverte til T erkontinuerlige. Ifølge setning 6.7.5 er S(K) inneholdt i et kvadrat med arealmindre enn C2|K| og ma derfor selv ha areal mindre enn C2|K| (vi vet fraforrige setning at S(K) er Jordan-malbar og dermed har et areal). SidenT(K) = B−1(S(K)), følger det fra lemma 6.7.2 at

|T(K)| = |det B−1||S(K)| ≤ |detB|−1C2|K|

Page 293: Flervariabel analyse med lineær algebra

580 KAPITTEL 6. MULTIPPEL INTEGRASJON

og dermed er lemmaet bevist. !

Vi trenger ogsa et lemma som viser at vi kan fa konstanten

C = supu∈K

||BT′(u)||

ovenfor sa nær 1 vi matte ønske dersom K er et tilstrekkelig lite kvadrat,og B er T′(a)−1 der a er sentrum i K:

Lemma 6.7.9 La U være en apen mengde i R2 og anta at T : U → R2 eren injektiv funksjon med kontinuerlige partiellderiverte slik at detT′ #= 0 pahele U . Anta at R er en lukket, begrenset delmengde av U . For enhver ε > 0finnes det da en δ > 0 slik at

∣∣ ||T′(v)−1T′(u)||− 1∣∣ < ε

og ∣∣ |detT′(v)|−1|detT′(u)|− 1∣∣ < ε

for alle u,v ∈ R slik at |u− v| ≤ δ.

Bevis: Siden T′ er kontinuerlig pa R, er (T′)−1 det ogsa , og det følger atfunksjonene

f(u,v) = ||T′(v)−1T′(u)||

ogg(u,v) = |detT′(v)|−1|detT′(u)|

er kontinuerlige funksjoner pa mengden

R×R = {(u,v) ∈ R4 |u,v ∈ R}

Siden R × R er lukket og begrenset, er f og g uniformt kontinuerlige ifølgesetning 6.1.4 (alias 5.3.2). Gitt ε > 0, finnes det derfor en δ > 0 slik at

|f(u,v)− f(u′,v′)| < ε og |g(u,v)− g(u′,v′)| < ε

nar |(u,v)− (u′,v′)| < δ. Velger vi u′ = v′ = u, følger lemmaet. !

Vi har na kommet til selve kjernen i argumentet vart:

Lemma 6.7.10 La U være en apen, begrenset mengde i R2 og anta at T :U → R2 er en injektiv funksjon med kontinuerlige partiellderiverte slik atdetT′ #= 0 pa hele U . Hvis D ⊂ U er en lukket, Jordan-malbar mengde, saer

|T(D)| ≤∫∫

D|detT′(u, v)| dudv

(de to uttrykkene er faktisk like, men vi nøyer oss med ulikheten foreløpig).

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 581

Bevis: Velg et kvadrat R som inneholder tillukningen til D. For ethvert talln, lar vi Π(n) være den partisjonen av R som vi far ved a dele sidene tilR inn i 2n like store deler. Velg N0 sa stor at de delkvadratene Rij i Π(N0)

som overlapper med D, ligger inni U (dette er mulig ifølge setning 6.7.3).La Kn være unionen av alle (de lukkede) delkvadratene i Πn som overlappermed D. Da er Kn en lukket, begrenset mengde, og dersom n ≥ N0, sa liggerKn inni KN0 . Observer at siden D er Jordan-malbar, er limn→∞ |Kn| = |D|(tenk gjennom dette — det er ikke helt opplagt!).

Gitt en ε > 0, velger vi n sa stor at |Kn| ≤ |D|+ ε. Ved eventuelt a velgen enda større, kan vi ifølge forrige lemma anta at hvis u og v ligger i sammedelkvadrat i Kn, sa er

∣∣ ||T′(v)−1T′(u)||− 1∣∣ < ε

og ∣∣ |detT′(v)|−1|detT′(u)|− 1∣∣ < ε

Anta at S1, S2, . . . , Sm er delkvadratene som utgjør Kn og la ai være sentrumi Si. Bruker vi lemma 6.7.8 med B = T(ai)−1, far vi

|T(Si)| ≤ |detT′(ai)|(1 + ε)2|Si|

Summerer vi opp, har vi

|T(D)| ≤m∑

i=1

|T(Si)| ≤ (1 + ε)2m∑

i=1

|detT′(ai)||Si|

Fra lemma 6.7.9 ser vi ogsa at for alle u ∈ Si, er

|detT′(u)| ≥ (1− ε)|detT′(ai)|

Dermed er

|detT′(ai)||Si| =∫∫

Si

|detT′(ai)| dudv ≤ 11− ε

∫∫

Si

|detT′(u, v)| dudv

og kombinerer vi dette med resultatet ovenfor, far vi

|T(D)| ≤ (1 + ε)2

1− ε

∫∫

Kn

|detT′(u, v)| dudv

(husk at Kn = S1 ∪S2 ∪ . . .∪Sm). Dersom C er supremum til |detT′(u, v)|pa KN0 (dette er en kontinuerlig funksjon over en lukket, begrenset mengde,sa et supremum finnes), er

∫∫

Kn

|detT′(u, v)| dudv ≤∫∫

D|detT′(u, v)| dudv + Cε

Page 294: Flervariabel analyse med lineær algebra

582 KAPITTEL 6. MULTIPPEL INTEGRASJON

(husk at vi har valgt n sa stor at |Kn| ≤ |D| + ε). Totalt har vi dermed

|T(D)| ≤ (1 + ε)2

1− ε

∫∫

D|detT′(u, v)| dudv +

Cε(1 + ε)2

1− ε

Siden ε > 0 er vilkarlig, kan vi fa uttrykket pa høyre side av ulikheten sanær

∫∫D |detT′(u, v)| dudv vi matte ønske ved a velge ε liten nok. Det betyr

at|T(D)| ≤

∫∫

D|detT′(u, v)| dudv

og beviset er fullført. !

Vi er na gjennom det verste, og resten av beviset for teoremet bestarbare i a fa bitene pa plass. Først utvider vi lemmaet ovenfor fra mengder tilpositive funksjoner.

Lemma 6.7.11 La U være en apen, begrenset mengde i R2 og anta at T :U → R2 er en injektiv funksjon med kontinuerlige partiellderiverte slik atdetT′ #= 0 pa hele U . Hvis D ⊂ U er en lukket, Jordan-malbar mengde, ogf : T (D) → R er en ikke-negativ, kontinuerlig funksjon, sa er

∫∫

T(D)f(x, y) dxdy ≤

∫∫

Df(T(u, v))|detT′(u, v)| dudv

Bevis: Fra teorem 6.6.3, teorem 6.6.6 og setning 6.7.6 vet vi at de to funk-sjonene er integrerbare over henholdsvis T(D) og D. La Π være en partisjonav et rektangel som inneholder T (D), og la

N(Π) =∑

ij

mij |Rij |

være den nedre trappesummen til fT (D). Legg merke til at det bare er dekvadratene som ligger inni D som bidrar til summen. Lar vi

Sij = T−1(Rij),

vet vi fra forrige lemma at |Rij | ≤∫∫

Sij|detT′(u, v)| dudv. Dermed er

N(Π) ≤∑

Rij⊂D

mij

∫∫

Sij

|detT′(u, v)| dudv ≤

≤∫∫

SSij

f(T(u, v))|detT′(u, v)| dudv ≤∫∫

Df(T(u, v))|detT′(u, v)| dudv

Siden vi kan fa N(Π) sa nær∫∫

T(D) f(x, y) dxdy vi matte ønske, sa er∫∫

T(D)f(x, y) dxdy ≤

∫∫

Df(T(u, v))|detT′(u, v)| dudv

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 583

og lemmaet er bevist. !

Foreløpig har vi bare bevist teoremet vart for positive funksjoner og medulikhet istedenfor likhet. Det kan se ut som vi fortsatt har en lang vei a ga,men det viser seg at vi bare er et triks fra malet. La oss skrive opp teoremetpa nytt før vi beviser det:

Teorem 6.7.12 (Skifte av variable i dobbeltintegral) La U være enapen, begrenset mengde i R2 og anta at T : U → R2 er en injektiv funksjonmed kontinuerlige partiellderiverte slik at detT′ #= 0 pa hele U . Hvis D ⊂ Uer en lukket, Jordan-malbar mengde, og f : T(D) → R er en kontinuerligfunksjon, sa er

∫∫

T(D)f(x, y) dxdy =

∫∫

Df(T(u, v))|detT′(u, v)| dudv

Bevis: Anta først at f er ikke-negativ. Fra lemmaet ovenfor vet vi at∫∫

T(D)f(x, y) dxdy ≤

∫∫

Df(T(u, v))|detT′(u, v)| dudv

For a fa den omvendte ulikheten bruker vi trikset vart. La E = T(D),g(u, v) = f(T(u, v))|detT′(u, v)| og S = T−1. Da er forutsetningene i lem-maet ovenfor oppfylt nar vi erstatter D, f og T med henholdsvis E, g og S(sjekk dette!). Følgelig er

∫∫

S(E)g(u, v) dudv ≤

∫∫

Eg(S(x, y))|detS′(x, y)| dxdy

Setter vi inn de opprinnelige uttrykkene og bruker at

detT′(S(x, y)) detS′(x, y) = 1

(husk omvendt funksjonsteorem) og S(E) = D, omdannes ulikheten ovenfortil ∫∫

Df(T(u, v))|detT′(u, v)| dudv ≤

∫∫

T(D)f(x, y) dxdy

som er den omvendte ulikheten av den vi har fra før. Dermed er teoremetbevist for ikke-negative funksjoner. For a utvide til generelle funksjoner ob-serverer vi først at dersom f er en funksjon som oppfyller betingelsene iteoremet, sa er f begrenset. Velger vi en tilstrekkelig stor, positiv konstantC er da f(x, y) + C en ikke-negativ funksjon, og dermed er∫∫

D

(f(T(u, v)) + C

)|detT′(u, v)| dudv =

∫∫

T(D)

(f(x, y) + C

)dxdy

Page 295: Flervariabel analyse med lineær algebra

584 KAPITTEL 6. MULTIPPEL INTEGRASJON

Etter det vi allerede har vist (C er en positiv funksjon!), er∫∫

DC|detT′(u, v)| dudv =

∫∫

T(D)C dxdy

og trekker vi dette fra ligningen ovenfor, far vi∫∫

T(D)f(x, y) dxdy =

∫∫

Df(T(u, v))|detT′(u, v)| dudv

og teoremet er omsider bevist! !

Oppgaver til seksjon 6.7

1. Løs dobbeltintegralene ved a bruke den angitte substitusjonen.

a)∫∫

A x2 dxdy der A er omradet avgrenset av linjene y = x, y = x+1, y = −x,y = −x + 2. Sett u = y − x, v = y + x

b)∫∫

A x dxdy der A er parallellogrammet med hjørner (0, 0), (3, 0), (1, 1), (4, 1).Sett u = x− y, v = y.

c)∫∫

A xy dxdy der A er omradet begrenset av linjene y = x2 , y = x

2 + 2, y = 2xog y = 2x− 2. Sett u = y − x

2 , v = y − 2x.

2. Bruk MATLAB til a regne ut integralene i oppgave 1 uten a skifte variabel.

3. Løs dobbeltintegralet ved a bruke den angitte substitusjonen:

a)∫∫

R

xy dxdy der R er omradet avgrenset av linjene x + 2y = −1,

x + 2y = 3, x = y + 1, x = y + 4. Bruk substitusjonenu = x + 2y, v = x− y

b)∫∫

R

(x2 − y2)ex+y dxdy der R er kvadratet med hjørner (0,0),

(−1, 1), (1, 1), (0, 2). Sett u = x + y, v = x− y.

c)∫∫

R

(y2 − yx) dxdy der R er omradet avgrenset av linjene y = x,

y = 2x og kurvene y = 2x , y = 1

x . Sett u = yx, v = yx .

4. Bruk MATLAB til a regne ut integralene i oppgave 3 uten a skifte variabel.

5. Regn ut dobbeltintegralene.

a)∫∫

Aex−y

x+y dxdy der A er omradet avgrenset av linjene y = x, y = x + 5,y = −x + 2 og y = −x + 4.

b)∫∫

A xy dxdy der A er omradet avgrenset av linjene y = x, y = 2x og kurveney = 1

x , y = 3x .

c)∫∫

A y dxdy der A er omradet avgrenset av linjene y = x2 , y = 2x og kurvene

y = 1x2 , y = 2

x2 .

6.7. SKIFTE AV VARIABLE I DOBBELTINTEGRAL 585

d)∫∫

A(3x− 2y) dxdy der A er parallellogrammet utspent av vektorene (2, 1) og(1, 3).

e)∫∫

A x dxdy der A er omradet avgrenset av parablene y = x2, y = x2 + 4,y = (x− 1)2, y = (x− 1)2 + 4.

6. Bruk MATLAB til a regne ut integralene i oppgave 5 uten a skifte variabel.

7. La A være parallellogrammet utspent av to vektorer(

ab

)og

(cd

)som ikke

er parallelle, og la M være matrisen M =(

a cb d

)

a) Vis at avbildningen(

xy

)= T

(uv

)= M

(uv

)avbilder enhetskvadra-

tet K utspent av e1 og e2 pa A.

b) Vis at for alle kontinuerlige funksjoner f er∫∫

Af(x, y) dxdy = detM

∫ 1

0

∫ 1

0f(au + cv, bu + dv) dudv

c) Regn ut∫∫

A e2x−3y dxdy der A er parallellogrammet utspent av(

2−1

)og

(13

).

8. (Eksamen i MAT1110 13/6, 2005)

a) Gitt koordinatskiftet x = u cos v og y = 2u sin v. Beskriv linjen y = 2x ikoordinatene u og v. La R være omradet i første kvadrant av xy-planet somer begrenset av x-aksen, linjen y = 2x og ellipsen x2 + y2

4 = 1. Finn arealetav R.

b) Finn arealet av flaten z = x2 + y2

2 , (x, y) ∈ R (der R er omradet beskrevet ipunkt a)).

9. (Eksamen i MAT1110 16/8, 2007) R er omradet i planet avgrenset av linjeney = x, y = 2x, y = −x + 1, y = −x + 3. Lag en skisse av R og regn ut dobbeltinte-gralet

∫∫R

x+yx2 dxdy.

10. I denne oppgaven skal vi se nærmere pa en pastand fremsatt i beviset for setning6.7.6. Anta at Π er en partisjon av rektanglet R = [a, b]× [c, d]:

a = x0 < x1 < . . . < xn−1 < xn = b

c = y0 < y1 < . . . < ym−1 < ym = d

der alle x’ene og y’ene er rasjonale tall. Vis at det finnes en partisjon Π som inne-holder alle delepunktene xi og yj i Π, men der alle delrektanglene Rij er kvadraterav samme størrelse. (Hint: Del opp [a, b] og [c, d] i delintervaller med lengde 1

N derN er fellesnevneren til alle brøkene x0, x1, . . . , xn, y0, y1 . . . , ym.)

Page 296: Flervariabel analyse med lineær algebra

586 KAPITTEL 6. MULTIPPEL INTEGRASJON

6.8 Uegentlige integraler i planet

Hittil har vi alltid integrert over begrensede omrader i planet, men i mangeanvendelser er det viktig a kunne integrere over ubegrensede omrader, og viskal na se hvordan dette kan gjøres. Vi skal først definere slike integraler forikke-negative funksjoner, og sa utvide til mer generelle funksjoner senere.Litt notasjon før vi begynner: I denne seksjonen er

Kn = {(x, y) ∈ R2 | |x|, |y| ≤ n}

det lukkede kvadratet med sentrum i origo og sidekant 2n.

Definisjon 6.8.1 La A være en delmengde av R2 slik at A∩Kn er Jordan-malbar for alle n ∈ N. Hvis f : A → R er en positiv, kontinuerlig funksjon,definerer vi

∫∫

Af(x, y) dxdy = lim

n→∞

∫∫

A∩Kn

f(x, y) dxdy

dersom denne grenseverdien eksisterer. I sa fall sier vi at det uegentlige in-tegralet

∫∫A f(x, y) dxdy konvergerer, i motsatt fall sier vi at det divergerer.

La oss se pa et eksempel:

Eksempel 1: Vi skal integrere f(x, y) = y2

1+x2 over omradet

A = R× [0, 2] = {(x, y) ∈ R2 | 0 ≤ y ≤ 2}

A er altsa en uendelig lang stripe med bredde 2. Legg merke til at nar n ≥ 2,sa er A ∩Kn = [−n, n]× [0, 2], og vi far

∫∫

Af(x, y) dxdy = lim

n→∞

∫ n

−n

[∫ 2

0f(x, y) dy

]dx

Setter vi inn funksjonsuttrykket og regner litt, ser vi at

∫ n

−n

[∫ 2

0

y2

1 + x2dy

]dx =

∫ n

−n

[y3

3

1 + x2

]y=2

y=0

dx =83

∫ n

−n

11 + x2

dx =

=83

[arctanx

]n

−n

=83(arctann− arctan(−n)) −→ 8π

3

der vi i siste overgang bruker at limn→∞ arctann = π2 og limn→∞ arctan(−n) =

−π2 . Dermed har vi vist at

∫∫

R×[0,2]

y2

1 + x2dxdy =

3♣

6.8. UEGENTLIGE INTEGRALER I PLANET 587

I definisjonen ovenfor brukte vi kvadratene Kn til a definere dobbeltin-tegraler over uendelige omrader. Ofte er det mer behagelig a bruke omraderav en annen type, for eksempel sirklene B(0, n)

Setning 6.8.2 Anta at A er en delmengde av R2 slik at A ∩ B(0, n) erJordan-malbar for alle n. Hvis f : A → R er en kontinuerlig, ikke-negativfunksjon, sa er

Af(x, y) dxdy = lim

n→∞

∫∫

A∩B(0,n)f(x, y) dxdy

(hvis integralet til venstre divergerer, er grenseverdien til høyre lik ∞)

Bevis: Siden rette linjer og sirkelbuer har innhold null, vil mengdene A∩Kn

være Jordan-malbare hvis og bare hvis mengdene A∩B(0, n) er det, sa deter ingen problemer med malbarheten. Siden

Kn/√

2 ⊂ B(0, n) ⊂ Kn

(lag en tegning!) og f er ikke-negativ, har vi∫∫

A∩Kn/√

2

f(x, y) dxdy ≤∫∫

A∩B(0,n)f(x, y) dxdy ≤

∫∫

A∩Kn

f(x, y) dxdy

Dersom integralet konvergerer, gar bade det venstre og det høyre uttrykketmot

∫∫A f(x, y) dxdy, og dermed ma uttrykket i midten ogsa gjøre det. Der-

som integralet divergerer, gar uttrykkene til venstre og høyre mot ∞, og dama uttrykket i midten ogsa gjøre det. !

Det neste eksemplet viser en overraskende bruk av dobbeltintegraler.Husk at vi hittil ikke er vært istand til a regne ut integralet

∫∞−∞ e−

x2

2 dx(som via normalfordelingen spiller en sentral rolle i sannsynlighetsregning og

statistikk) fordi funksjonen e−x2

2 har en antiderivert som ikke kan uttrykkesved hjelp av de funksjonene vi kjenner.

Eksempel 2: Vi skal regne ut dobbeltintegralet∫∫

R2 e−x2+y2

2 dxdy pa toforskjellige mater. Lar vi

In =∫ n

−ne−

x2

2 dx,

ser vi først at∫∫

Kn

e−x2+y2

2 dxdy =∫ n

−n

[∫ n

−ne−

x2+y2

2 dx

]dy =

Page 297: Flervariabel analyse med lineær algebra

588 KAPITTEL 6. MULTIPPEL INTEGRASJON

=∫ n

−ne−

y2

2

[∫ n

−ne−

x2

2 dx

]dy = In

∫ n

−ne−

y2

2 dy = I2n

Lar vi n ga mot uendelig, ser vi at∫ ∞

−∞e−

x2

2 dx =

√∫∫

R2e−

x2+y2

2 dxdy

(forutsatt at integralene konvergerer, men det skal vi vise om et øyeblikk).La oss na se hva som skjer nar vi bruker sirklene B(0, n) til a regne ut

dobbeltintegralet. Da er det naturlig a bytte til polarkoordinater, og vi far∫∫

B(0,n)e−

x2+y2

2 dxdy =∫ n

0

[∫ 2π

0e−

r22 r dθ

]dr = 2π

∫ n

0re−

r2

2 dr

Na har det skjedd et lite under — det nye integralet er lett a regne ut vedsubstitusjonen u = r2

2 . Vi far

∫∫

B(0,n)e−

x2+y2

2 dxdy = 2π

∫ n

0re−

r2

2 dr = 2π

∫ n2

2

0e−u du = 2π(1− e−

n2

2 )

Dette uttrykket gar mot 2π nar n gar mot uendelig, og følgelig er∫∫

R2e−

x2+y2

2 dxdy = 2π

Kombinerer vi dette med utregningene ovenfor, ser vi at∫ ∞

−∞e−

x2

2 dx =√

som ogsa kan skrives1√2π

∫ ∞

−∞e−

x2

2 dx = 1

Dette forklarer hvorfor√

2π dukker opp i normalfordelingen. ♣

Hittil har vi bare sett pa uegentlige integraler av ikke-negative funk-sjoner. For a utvide til generelle funksjoner, observerer vi først at enhverfunksjon f kan skrives som en differanse mellom to positive funksjoner; vihar

f(x) = f+(x)− f−(x)

der

f+(x) =

f(x) hvis f(x) > 0

0 ellers

f−(x) =

−f(x) hvis f(x) < 0

0 ellersLegg ogsa merke til at |f(x)| = f+(x) + f−(x).

6.8. UEGENTLIGE INTEGRALER I PLANET 589

Definisjon 6.8.3 La A være en delmengde av R2 slik at A∩Kn er Jordan-malbar for alle n ∈ N, og anta at f : A → R er en begrenset, kontinuerligfunksjon. Vi sier at integralet

∫∫A f(x, y) dxdy konvergerer dersom begge

integralene∫∫

A f+(x, y) dxdy og∫∫

A f−(x, y) dxdy konvergerer, og i sa falldefinerer vi

∫∫

Af(x, y) dxdy =

∫∫

Af+(x, y) dxdy −

∫∫

Af−(x, y) dxdy

Bemerkning: Definisjonen ovenfor kan se litt tungvinn ut — hvorfor siervi ikke bare at integralet

∫∫A f(x, y) dxdy konvergerer dersom grenseverdien

limn→∞∫∫

A∩Knf(x, y) dxdy eksisterer slik vi gjorde for ikke-negative funk-

sjoner? Grunnen er rett og slett at vi da risikerer a fa integraler med ganskerare egenskaper som er vanskelig a holde styr pa. Bruker vi definisjonenovenfor, gjelder de vanlige regnereglene for integraler fortsatt.

Legg forøvrig merke til at siden |f(x)| = f+(x) + f−(x) sa kan de tokravene om at bade

∫∫A f+(x, y) dxdy og

∫∫A f−(x, y) dxdy skal konvergere,

reduseres til ett krav, nemlig at∫∫

A |f(x, y)| dxdy konvergerer. Legg ogsamerke til at hvis vi vet at integralet

∫∫A f(x, y) dxdy konvergerer, sa kan vi

regne det ut ved∫∫

Af(x, y) dxdy = lim

n→∞

∫∫

A∩Kn

f(x, y) dxdy

I sa fall har vi nemlig∫∫

Af(x, y) dxdy =

∫∫

Af+(x, y) dxdy −

∫∫

Af−(x, y) dxdy =

= limn→∞

∫∫

A∩Kn

f+(x, y) dxdy − limn→∞

∫∫

A∩Kn

f−(x, y) dxdy =

= limn→∞

∫∫

A∩Kn

(f+(x, y)− f−(x, y)) dxdy = limn→∞

∫∫

A∩Kn

f(x, y) dxdy

Fra teorien for funksjoner av en variabel vet vi at det ogsa finnes enannen type uegentlige integraler — de hvor integranden gar mot uendelig.Tilsvarende tilfeller finnes ogsa for dobbeltintegraler, men vi skal ikke graveoss ned i denne teorien, men nøye oss med a se pa et eksempel.

Eksempel 3: Vi har lyst til a integrere funksjonen f(x, y) = 1(x2+y2)p , p > 0,

over sirkelen A = B(0, 1). Siden f ikke er definert i origo, og f(x, y) nærmerseg uendelig nar (x, y) → 0, er det ikke opplagt hvordan vi skal gjøre dette.En naturlig ide er a fjerne en liten sirkel rundt origo og først integrere over

Page 298: Flervariabel analyse med lineær algebra

590 KAPITTEL 6. MULTIPPEL INTEGRASJON

omradet Aε = {x ∈ R2 : ε ≤ |x| ≤ 1}. Bytter vi til polarkoordinater, far vida (anta først at p #= 1):

∫∫

1(x2 + y2)p

dxdy =∫ 1

ε

[∫ 2π

0

1r2p

r dθ

]dr = 2π

∫ 1

ε

1r2p−1

dr =

1− p

[1

r2p−2

]1

ε

1− p

(1− ε2−2p

)

Lar vi ε ga mot 0, ser vi at det siste uttrykket gar mor uendelig hvis p > 1og mot π

1−p hvis p < 1. I dette siste tilfellet er det rimelig a sette∫∫

A

1(x2 + y2)p

dxdy =π

1− p,

mens vi i det første sier at integralet divergerer. Gar vi tilbake til det utelattetilfellet p = 1, far vi

∫∫

1(x2 + y2)

dxdy = 2π

∫ 1

ε

1r

dr = 2π

[ln r

]1

ε

= −2π ln ε →∞

som viser at integralet divergerer ogsa i dette tilfellet. ♣

Oppgaver til seksjon 6.8

1. Regn ut∫∫

A e−x2−y2dxdy der A er omradet i første kavadrant mellom x-aksen

og linjen y = x.

2. Avgør om integralet∫∫

R21

1+x2+y2 dxdy konvergerer eller divergerer.

3. Avgør om integralet∫∫

A x dxdy konvergerer nar A er omradet i fjerde kvadrantmellom y-aksen funksjonsgrafen y = lnx

4. Avgør om integralet∫∫

A xy dxdy konvergerer nar A er omradet i første kvadrantunder funksjonsgrafen y = 1

x

5. Regn ut integralet∫∫

Ax

1+y4 dxdy der A er omradet i første kvadrant som liggerover funksjonsgrafen y = x2.

6. La A = {(x, y) ∈ R2 | x2 + y2 ≥ 1}. Avgjør for hvilke verdier av p integralet∫∫A

1(x2+y2)p dxdy konvegerer, og regne ut verdien i disse tilfellene.

6.9 Trippelintegraler

Vi skal na se hvordan vi kan integrere funksjoner av tre variable over omraderi rommet. Teoretisk er ikke dette sa veldig forskjellig fra a integrere funk-sjoner av to variable over omrader i planet, men i praksis blir det ofte litt

6.9. TRIPPELINTEGRALER 591

mer komplisert fordi geometrien er mindre oversiktlig. Vi skal derfor leggehovedvekten pa praktisk utregning av integraler og hoppe over utledningersom er nesten identiske med de to-dimensjonale.

La oss først se hvordan vi kan integrere en funksjon f(x, y, z) over enrektangulær boks

R = [a1, a2]× [b1, b2]× [c1, c2] =

= {(x, y, z) ∈ R3 | a1 ≤ x ≤ a2, b1 ≤ y ≤ b2, c1 ≤ z ≤ c2}

Vi begynner med a lage en partisjon Π av R. En slik partisjon bestar rettog slett av en partisjon av hvert av intervallene [a1, a2], [b1, b2], [c1, c2]:

a1 = x0 < x1 < x2 < . . . xn−1 < xn = a2

b1 = y0 < y1 < y2 < . . . ym−1 < ym = b2

c1 = z0 < z1 < z2 < . . . zl−1 < zl = c2

Partisjonen Π deler R opp i mange mindre “delbokser”. Vi lar

Rijk = [xi−1, xi]× [yj−1, yj ]× [zk−1, zk]

være den ijk-te delboksen, og lar

mijk = inf{f(x, y, z) | (x, y, z) ∈ Rijk}

Mijk = sup{f(x, y, z) | (x, y, z) ∈ Rijk}

være henholdsvis infimum og supremum til funksjonen f over denne delbok-sen. Pa vanlig mate definerer vi na den nedre og den øvre trappesummen tilf med hensyn pa partisjonen Π:

N(Π) =n∑

i=1

m∑

j=1

l∑

k=1

mijk|Rijk|

og

Ø(Π) =n∑

i=1

m∑

j=1

l∑

k=1

Mijk|Rijk|

der|Rijk| = (xi − xi−1)(yj − yj−1)(zk − zk−1)

er volumet til delboksen Rijk.Nedre- og øvreintegralet til f kan vi ogsa definere pa vanlig mate. Ned-

reintegralet er gitt ved∫∫∫

R

f(x, y, z) dxdydz = sup{N(Π) | Π er en partisjon av R}

Page 299: Flervariabel analyse med lineær algebra

592 KAPITTEL 6. MULTIPPEL INTEGRASJON

og øvreintegralet ved∫∫∫

Rf(x, y, z) dxdydz = inf{Ø(Π) | Π er en partisjon av R}

Dermed har vi kommet frem til definisjonen av trippelintegraler:

Definisjon 6.9.1 En begrenset funksjon f : R → R er integrerbar over Rdersom ∫∫∫

R

f(x, y, z) dxdydz =∫∫∫

Rf(x, y, z) dxdydz

I sa fall definerer vi integralet av f over R til a være∫∫∫

Rf(x, y, z) dxdydz =

∫∫∫

R

f(x, y, z) dxdydz =∫∫∫

Rf(x, y, z) dxdydz

Som i det to-dimensjonale tilfellet har vi na to grunnleggende spørsmal— hvilke funksjoner er integrerbare, og hvordan regner vi ut integraler? Vibegynner med det første spørsmalet.

Setning 6.9.2 Anta at R = [a1, a2]×[b1, b2]×[c1, c2] er en rektangulær boksi R3 og at f : R → R er en kontinuerlig funksjon. Da er f integrerbar overR.

Bevis: Akkurat som beviset for teorem 6.1.5. !

La oss na se pa det neste spørsmalet — hvordan vi regner ut trippel-integraler. Akkurat som for dobbeltintegraler kan vi gjøre dette ved iterertintegrasjon, det vil si ved a regne ut flere enkeltintegraler etter hverandre.

Setning 6.9.3 Anta at R = [a1, a2]×[b1, b2]×[c1, c2] er en rektangulær boksi R3 og at f : R → R er kontinuerlig. Da er

∫∫∫

Rf(x, y, z) dxdydz =

∫∫

A

[∫ c2

c1

f(x, y, z) dz

]dxdy =

=∫ a2

a1

[∫ b2

b1

[∫ c2

c1

f(x, y, z) dz

]dy

]dx

der A = [a1, a2]× [b1, b2] er projeksjonen av R ned i xy-planet.

Setningen ovenfor gjelder ogsa for ikke-kontinuerlige, integrerbare funk-sjoner dersom vi er litt forsiktigere med hvordan vi formulerer oss (sammen-lign med setning 6.1.7). Rekkefølgen av de itererte integralene spiller ingenrolle, sa vi kan ogsa regne ut trippelintegraler slik

∫∫∫

Rf(x, y, z) dxdydz =

∫ c2

c1

[∫ b2

b1

[∫ a2

a1

f(x, y, z) dx

]dy

]dz

6.9. TRIPPELINTEGRALER 593

eller slik∫∫∫

Rf(x, y, z) dxdydz =

∫ b2

b1

[∫ c2

c1

[∫ a2

a1

f(x, y, z) dx

]dz

]dy

(i alt er det seks muligheter og vi skriver ikke opp alle). Vær oppmerksompa at selv om resultatet blir det samme, kan det være mye lettere a regneut trippelintegralet i en rekkefølge enn en annen.

La oss se pa et eksempel:

Eksempel 1: Vi skal regne ut∫∫∫

R(x + ye2z) dxdydz, der R = [0, 1] ×[1, 3]×[0, 2]. Legg merke til hvordan vi integrerer med hensyn pa den aktuellevariabelen som om alle andre variable var konstanter.

∫∫∫

R(x + ye2z) dxdydz =

∫ 2

0

[∫ 3

1

[∫ 1

0(x + ye2z) dx

]dy

]dz =

=∫ 2

0

[∫ 3

1

[x2

2+ xye2z

]x=1

x=0

dy

]dz =

∫ 2

0

[∫ 3

1

(12

+ ye2z

)dy

]dz =

=∫ 2

0

[y

2+

y2

2e2z

]y=3

y=1

dz =∫ 2

0

(1 + 4e2z

)dz =

[z + 2e2z

]2

0

= 2e4 ♣

Trippelintegraler i MATLAB: Trippelintegraler i MATLAB utføres pasamme mate som dobbeltintegraler, bortsett fra at vi ma bruke kommandoentriplequad istedenfor doublequad. Vil vi for eksempel ha MATLAB til aregne ut integralet i eksemplet ovenfor, skriver vi

>> triplequad(@(x,y,z)(x+y.*exp(2*z)),0,1,1,3,0,2)

Vær oppmerksom pa at MATLAB kan bruke lang tid pa a regne ut trippel-integraler. Dersom en av integrasjonene er enkel, kan det derfor være greita utføre den for hand før du kobler inn MATLAB.

Trippelintegraler over mer generelle omrader

Ofte ønsker vi a regne ut trippelintegraler over omrader som ikke er rektan-gulære bokser. Vi bruker da det samme trikset som for dobbeltintegraler;vi putter omradet inni en tilstrekkelig stor rektangulær boks og “nuller ut”funksjonen utenfor det omradet vi er interessert i:

Definisjon 6.9.4 Anta at S er et begrenset omrade i R3, og la R væreen rektangulær boks som inneholder S i sitt indre. Hvis f : S → R er enbegrenset funksjon, sier vi at f er integrerbar over S dersom funksjonen

fS(x, y, z) =

f(x, y, z) hvis (x, y, z) ∈ S

0 ellers

Page 300: Flervariabel analyse med lineær algebra

594 KAPITTEL 6. MULTIPPEL INTEGRASJON

er integrerbar over R. I sa fall setter vi∫∫∫

Sf(x, y, z) dxdydz =

∫∫∫

RfS(x, y, z) dxdydz

Integrerbarhet over begrensede omrader er mer komplisert enn integrer-barhet over rektangler siden vi ogsa ma ta hensyn til hvordan omradet serut. Den neste setningen er nyttig i mange situasjoner.

Setning 6.9.5 Anta at A er en lukket, begrenset, Jordan-malbar mengdei xy-planet, og at g, h : A → R er to kontinuerlige funksjoner slik atg(x, y) ≤ h(x, y) for alle (x, y) ∈ A. La S være omradet mellom de tofunksjonsgrafene, dvs.

S = {(x, y, z) ∈ R3 | (x, y) ∈ A og g(x, y) ≤ z ≤ h(x, y)}

Da er enhver kontinuerlig funksjon f : S → R integrerbar over S, og

∫∫∫

Sf(x, y, z) dxdydz =

∫∫

A

[∫ h(x,y)

g(x,y)f(x, y, z) dz

]dxdy

Legg merke til at nar vi bruker resultatet ovenfor, regner vi først ut etenkeltintegral

∫ h(x,y)g(x,y) f(x, y, z) dz og deretter et dobbeltintegral. Nar vi reg-

ner ut dobbeltintegralet, har vi selvfølgelig lov til a bruke alle de triksene vikjenner — vi kan regne det ut som et iterert integral, men vi kan ogsa byttevariable hvis det er lønnsomt. Her er et eksempel.

Eksempel 2: Beregn integralet∫∫

A

∫x dxdy dz

der A er omradet som ligger over xy-planet, men under flaten z = 4−x2−y2.Figur 1 viser omradet S. Projeksjonen A av S ned i xy-planet

Figur 1: Paraboloiden z = 4− x2 − y2

6.9. TRIPPELINTEGRALER 595

er sirkelen om origo med radius 2. I dette tilfellet er den nedre avgrensningenav omradet konstanten 0 og den øvre funksjonen z = h(x, y) = 4− x2 − y2.Vi far dermed (legg merke til at vi i den første integrasjonen far xz og ikkex2

2 — vi integrerer med hensyn pa z og ikke x!)

I =∫∫

S

∫x dxdy dz =

∫∫

A

4−x2−y2∫

0

x dz

dxdy

=∫∫

A

[xz

]z=4−x2−y2

z=0

dxdy =∫∫

A

(4x− x3 − y2x) dxdy

Siden A er en sirkel, lønner det seg a skifte til polarkoordinater. Vi far

I =2π∫

0

2∫

0

(4r cos θ − r3 cos3 θ − r3 cos θ sin2 θ)r dr

=2π∫

0

2∫

0

(4r2 cos θ − r4 cos3 θ − r4 cos θ sin2 θ)dr

=2π∫

0

(323

cos θ − 325

cos3 θ − 325

cos θ sin2 θ

)dθ

Det første og det siste av disse integralene er greie, vi har

2π∫

0

323

cos θ dθ =[323

sin θ

]2π

0

= 0

og2π∫

0

325

cos θ sin2 θ dθ =[3215

sin3 θ

]2π

0

= 0

Det midterste integralet skriver vi om

2π∫

0

325

cos3 θ dθ =2π∫

0

325

(1− sin2 θ) cos θ dθ

=[325

sin θ − 3215

sin3 θ

]2π

0

= 0.

Altsa er I = 0− 0− 0 = 0.Nar svaret blir sa enkelt som dette, er det grunn til a stoppe opp og

tenke seg om. Kunne vi ha kommet frem pa en enklere mate? I dette tilfellet

Page 301: Flervariabel analyse med lineær algebra

596 KAPITTEL 6. MULTIPPEL INTEGRASJON

er svaret ja — pa grunn av symmetrien til integrasjonsomradet er det klartat bidraget fra positive og negative x-verdier vil oppveie hverandre. Det kanvære lurt a se seg om etter slike symmetrier før man begynner – ofte kan deforenkle regnearbeidet betraktlig. !

Vi tar med et eksempel til.

Eksempel 3: Vi skal integrere funksjonen f(x, y, z) = xy over omradet Rsom ligger under planet z = 2x + 4y og over parboloiden z = x2 + y2. Figur2 viser hvordan planet skjærer en skalk av paraboloiden

Figur 2: Planet z = 2x + 4y skjærer gjennom paraboloiden z = z2 + y2

Vi ma først finne ut hvor de to flatene skjærer hverandre. Setter vi de toz-verdiene lik hverandre, far vi

x2 + y2 = 2x + 4y

For a finne ut hva slags kurve dette er, flytter vi førstegradsleddene over paden andre siden og fullfører kvadratene:

x2 + y2 = 2x + 4y ⇐⇒ x2 − 2x + y2 − 4y = 0 ⇐⇒ (x− 1)2 + (y − 2)2 = 5

Dette er ligningen til en sirkel med sentrum i (1, 2) og radius√

5. Innsidenav denne sirkelen er altsa projeksjonen A av omradet R ned i xy-planet. Vihar dermed

∫∫∫

Rxy dxdydz =

∫∫

A

[∫ 2x+4y

x2+y2xy dz

]dxdy

Utfører vi den innerste integrasjonen, far vi

I =∫∫

A

[xyz

]z=2x+4

z=x2+y2

dxdy =∫∫

Axy

(2x + 4y − (x2 + y2)

)dxdy

6.9. TRIPPELINTEGRALER 597

Det er fristende a gange ut parentesene, men la oss tenke litt fremover først.Neste trinn i utregningen er a integrere over sirkelskiven

A = {(x, y) ∈ R2 | (x− 1)2 + (y − 2)2 ≤√

5}

Den enkleste maten a gjøre dette pa, er a bytte til polarkoordinater medsentrum i (1, 2), altsa a sette

x− 1 = r cos θ og y − 2 = r sin θ

Siden 2x + 4y − x2 − y2 = 5− (x− 1)2 − (y − 2)2 = 5− r2 (dette er sammekvadratkompletteringen som ovenfor), ser vi at integralet na kan skrives(husk Jacobi-determinanten r):

I =∫ √

5

0

[∫ 2π

0(1 + r cos θ)(2 + r sin θ)(5− r2)r dθ

]dr

Ganger vi ut, gir dette

I =∫ √

5

0(5− r2)r

[∫ 2π

0

(2 + r sin θ + 2r cos θ + r2 sin θ cos θ

)dθ

]dr =

=∫ √

5

0(5− r2)r

[2θ − r cos θ + 2r sin θ +

r2

2sin2 θ

]θ=2π

θ=0

dr =

= 4π

∫ √5

0(5− r2)r dr = 4π

∫ √5

0(5r − r3) dr =

= 4π

[52r2 − r3

3

]√5

0

= 50π − 20π√

53

Som vi ser, blir utregningene ganske lange og kompliserte selv om integran-den og integrasjonsomradet i utgangspunktet ikke ser altfor kompliserte ut.Dette er slett ikke uvanlig for trippelintegraler. ♣

Setning 6.9.5 gjelder selvfølgelig ogsa med variablene byttet om. Ønskervi for eksempel a integrere over et omrade med formen

S = {(x, y, z) ∈ R3 | (y, z) ∈ A og g(y, z) ≤ x ≤ h(y, z)},

bruker vi formelen

I =∫∫∫

Sf(x, y, z) dxdydz =

∫∫

A

[∫ h(y,z)

g(y,z)f(x, y, z) dx

]dydz

Mer om trippelintegraler i MATLAB: Skal vi bruke MATLAB til aintegrere over omrader som ikke er rektangulære bokser, ma vi bruke detsamme trikset som vi brukte for dobbeltintegraler; vi ma “nulle ut” funksjo-nen over de delene vi ikke er interessert i. Ønsker vi for eksempel a integrerefunksjonen f(x, y, z) = x2y + z2 over kulen med sentrum i origo og radius1, skriver vi

Page 302: Flervariabel analyse med lineær algebra

598 KAPITTEL 6. MULTIPPEL INTEGRASJON

>> triplequad(@(x,y,z)((x.^2.*y+z.^2).*(x.^2+y.^2+z.^2<=1)),-1,1,-1,1,-1,1)

Vi minner om at trippelintegraler tar tid (selv for MATLAB), og at det kanhende du ma vente pa svaret noen minutter.

Oppgaver til seksjon 6.9

1. Beregn trippelintegralet:

a)∫∫

A

∫xyz dxdydz nar A = [0, 1]× [0, 1]× [0, 1]

b)∫∫

A

∫(x + yez) dxdydz nar A = [−1, 1]× [0, 1]× [1, 2]

c)∫∫

A

∫zy cos(xy) dxdydz nar A = [1, 2]× [π, 2π]× [0, 1]

d)∫∫

A

∫(x + y + z) dxdydz nar A = [0, 1]× [0, 2]× [0, 3]

e)∫∫

A

∫(√y − 3z) dxdydz nar A = [2, 3]× [0, 1]× [−1, 1]

2. Beregn trippelintegralet:

a)∫∫

A

∫(xy + z) dxdydz nar A = {(x, y, z) : 0 ≤ x ≤ 1, 0 ≤ y ≤ 2,

0 ≤ z ≤ x2y}

b)∫∫

A

∫z dxdydz nar A = {(x, y, z) : 0 ≤ x ≤ 2, 0 ≤ y ≤

√x ,

−y2 ≤ z ≤ xy}

c)∫∫

A

∫(x + y)z dxdydz nar A = {(x, y, z) : 0 ≤ y ≤ 4, 0 ≤ x ≤ √y ,

0 ≤ z ≤ 4}

d)∫∫

A

∫(3y2 − 3z) dxdydz nar A er omradet avgrenset av koordinatplanene

og planet 3x + 2y − z = 6

e)∫∫

A

∫xy dxdydz nar A er pyramiden med hjørner i (0, 0, 0), (1, 0, 0)

(0, 1, 0) og (0, 0, 1).

3. Bruk MATLAB til a regne ut integralene i oppgave 1 (det kan ta tid!).

4. Bruk MATLAB til a regne ut integralene i oppgave 2 (det kan ta tid!).

5. Anta at R er en rektangulær boks, og at f, g : R → R er kontinuerlige funksjoner.Vis at

(i)∫∫∫

R kf(x) dxdydz = k∫∫∫

R f(x) dxdydz for alle konstanter k

(ii)∫∫∫

R(f(x) + g(x)) dxdydz =∫∫∫

R f(x) dxdydz +∫∫∫

R g(x) dxdydz

(iii)∫∫∫

R(f(x)− g(x)) dxdydz =∫∫∫

R f(x) dxdydz −∫∫∫

R g(x) dxdydz

6.10. SKIFTE AV VARIABLE I TRIPPELINTEGRALER 599

6.10 Skifte av variable i trippelintegraler

Teorien for skifte av variable i trippelintegraler er nesten identisk med dentilsvarende teorien for dobbeltintegraler, og vi gir derfor bare en rask gjen-nomgang av de viktigste resultatene før vi gar løs pa eksemplene. En be-grenset delmengde A av R3 kalles Jordan-malbar dersom integralet

∫∫∫

A1 dxdydz

eksisterer — altsa hvis funksjonen 1A definert ved

1A(x, y, z) =

1 hvis (x, y, z) ∈ A

0 ellers

er integrerbar. Vi kan na formulere teoremet for skifte av variabel pa akkuratsamme mate som for dobbeltintegraler.

Teorem 6.10.1 (Skifte av variabel i trippelintegral) La U være enapen, begrenset mengde i R3 og anta at T : U → R3 er en injektiv funksjonmed kontinuerlige partiellderiverte slik at detT′ #= 0 pa hele U . Hvis D ⊂ Uer en lukket, Jordan-malbar mengde, og f : T(D) → R er en kontinuerligfunksjon, sa er∫∫∫

T(D)f(x, y, z) dxdydz =

∫∫∫

Df(T(u, v, w))|detT′(u, v, w)| dudvdw

La oss forsøke a forklare hva dette betyr. Vi tenker oss at vi starter medet trippelintegral

∫∫∫A f(x, y, z) dxdydz der omradet A er komplisert a in-

tegrere over. Det finnes imidlertid et mye penere omrade D og en funksjonT : D → A som avbilder hvert punkt (u, v, w) ∈ D pa et korresponderendepunkt T(u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) i A. Dersom avbildnin-gen D “fyller ut” hele A, har vi likheten

∫∫∫

Af(x, y, z) dxdydz =

=∫∫∫

Df(x(u, v, w), y(u, v, w), z(u, v, w))

∣∣∣∣∂(x, y, z)∂(u, v, w)

∣∣∣∣ dudvdw

der∣∣∣ ∂(x,y,z)∂(u,v,w)

∣∣∣ er tallverdien til Jacobi-determinanten

∂(x, y, z)∂(u, v, w)

=

∣∣∣∣∣∣∣∣

∂x∂u

∂x∂v

∂x∂w

∂y∂u

∂y∂v

∂y∂w

∂z∂u

∂z∂v

∂z∂w

∣∣∣∣∣∣∣∣

Page 303: Flervariabel analyse med lineær algebra

600 KAPITTEL 6. MULTIPPEL INTEGRASJON

Vi kan altsa erstatte integralet over det kompliserte omradet A med et in-tegral over det enklere omradet D, men prisen vi ma betale er a fa inn enJacobi-faktor

∣∣∣ ∂(x,y,z)∂(u,v,w)

∣∣∣ i integralet.

Eksempel 1: Vi skal integrere funksjonen f(x, y, z) = 4x − y + 2z overparallellogrammet A utspent av vektorene a = (1, 0,−1), b = (0, 1, 2) ogc = (2, 3, 1).

Siden parallellogrammet ligger skjevt i forhold til aksene, blir det kom-pliserte integrasjonsgrenser hvis vi forsøker a integrere direkte. Vi skal derforprøve a “rette opp” parallellogrammet før vi integrerer. Ideen er a bruke enfunksjon T som avbilder boksen D utspent av enhetsvektorene e1 = (1, 0, 0),e2 = (0, 1, 0) og e3 = (0, 0, 1) pa den opprinnelige boksen A. Dette er ikkesa vanskelig; vi bruker bare lineæravbildningen som avbilder e1 pa a, e2 pab og e3 pa c (husk setning 2.8.4), dvs.

T(u, v, w) = (u + 2w, v + 3w,−u + 2v + w)

Vi har altsa x = u+2w, y = v+3w, z = −u+2v+w, og Jacobi-determinantenblir

∂(x, y, z)∂(u, v, w)

=

∣∣∣∣∣∣

1 0 20 1 3

−1 2 1

∣∣∣∣∣∣= −3

(vanligvis blir Jacobi-determinanten en funksjon av u, v, w, men siden av-bildningen T er lineær, blir den et tall i dette tilfellet). Ifølge teoremetovenfor er na

I =∫∫∫

A(4x− y + 2z) dxdydz =

=∫∫∫

D

(4(u + 2w)− (v + 3w) + 2(−u + 2v + w)

)· |− 3| dudvdw =

=∫∫∫

D(2u + 3v + 7w) · 3 dudvdw =

∫∫∫

D(6u + 9v + 21w) dudvdw

Det gjenstar a integrere over D, men det er enkelt:

I =∫ 1

0

[∫ 1

0

[∫ 1

0(6u + 9v + 121w) du

]dv

]dw =

=∫ 1

0

[∫ 1

0

[(3u2 + 9uv + 21uw)

]u=1

u=0

dv

]dw =

=∫ 1

0

[∫ 1

0(2 + 9v + 21w) dv

]dw =

∫ 1

0

[3v +

92v2 + 21vw)

]v=1

v=0

dw =

=∫ 1

0(152

+ 21w) dw =[152

w +212

w2

]w=1

w=0

= 18 ♣

De vanligste koordinatsystemene a bytte til er sylinderkoordinater ogkulekoordinater. Vi skal na ta en grundig kikk pa disse.

6.10. SKIFTE AV VARIABLE I TRIPPELINTEGRALER 601

Integrasjon i sylinderkoordinater

Fra seksjon 3.7 kjenner vi sammenhengen mellom sylinderkoordinater ogvanlige (kartesiske) koordinater:

x = r cos θ, y = r sin θ og z = z

Dette gir Jacobi-determinanten

∂(x, y, z)∂(r, θ, z)

=

∣∣∣∣∣∣

cos θ −r sin θ 0sin θ r cos θ 0

0 0 1

∣∣∣∣∣∣= r

Jacobi-determinanten for sylinderkoordinater er altsa den samme som forpolarkoordinater i planet (dette er ingen tilfeldighet — sylinderkoordinaterer bare polarkoordinater med en ekstra koordinat som ikke endrer seg).Formelen for skifte av variabel blir na seende slik ut

∫∫∫

Af(x, y, z) dxdydz =

∫∫∫

Df(r cos θ, r sin θ, z)r drdθdz

der D er omradet beskrevet i sylinderkoordinater.Ikke unaturlig egner sylinderkoordinater seg godt nar vi skal integrere

over et omrade som ligner en sylinder. Her er et eksempel.

Eksempel 2: Vi skal integrere funksjonen f(x, y, z) = x2z over det omradetA som ligger over xy-planet og inni bade sylinderen x2 + y2 = 1 og kulenx2 + y2 + z2 = 4. Dette omradet ser ut som en staende sylinder avrundet aven kuleflate pa toppen. Skifter vi variable til sylinderkoordinater, far vi

I =∫∫∫

Ax2z dxdydz =

∫∫∫

D(r cos θ)2z r drdθdz =

∫∫∫

Dr3z cos2 θ drdθdz

der D er omradet beskrevet i sylinderkoordinater. Det er ikke sa vanskelig afinne denne beskrivelsen: Siden vi hele tiden skal befinne oss inni en sylindermed radius 1, ma vi ha 0 ≤ r ≤ 1 og 0 ≤ θ ≤ 2π, og siden vi ma holde ossover xy-planet og innenfor kulen med radius 4, ma vi ha 0 ≤ z ≤

√4− r2

(dette uttrykket far vi ved a løse ligningen x2 + y2 + z2 = 4 for z og brukeat x2 + y2 = r2.) Dermed har vi

I =∫ 2π

0

[∫ 1

0

[∫ √4−r2

0r3z cos2 θ dz

]dr

]dθ

Det gjenstar a utføre integrasjonene:

I =∫ 2π

0

[∫ 1

0

[r3 z2

2cos2 θ

]√4−r2

0

dr

]dθ =

Page 304: Flervariabel analyse med lineær algebra

602 KAPITTEL 6. MULTIPPEL INTEGRASJON

=12

∫ 2π

0

[∫ 1

0r3(4− r2) cos2 θ dr

]dθ =

12

∫ 2π

0cos2 θ

[∫ 1

0(4r3 − r5)dr

]dθ =

=12

∫ 2π

0cos2 θ

[(r4 − r6

6)]1

0

dθ =512

∫ 2π

0cos2 θ dθ

Det gjenstaende integralet kan løses pa mange mater. Vi velger a brukeformelen cos 2θ = 2 cos2 θ − 1, som gir cos2 θ = 1+cos 2θ

2 . Dermed er

I =524

∫ 2π

0(1+cos 2θ) dθ =

524

[θ+

12

sin 2θ

]2π

0

=5π

12♣

I noen integraler lønner det seg a bruke sylinderkoordinater med sentrumi et annet punkt enn origo. Ønsker vi a ha sentrum i punktet (a, b, c), brukervi substitusjonen

x = a + r cos θ, y = b + r sin θ og z = c + z

Siden konstantene blir borte nar vi deriverer, er Jacobi-determinanten fort-satt r.

Integrasjon i kulekoordinater

Fra seksjon 3.7 kjenner vi sammenhengen mellom kulekoordinater og vanligekoordinater:

x = ρ sinφ cos θ, y = ρ sinφ sin θ og z = ρ cos φ

Jacobi-determinanten blir dermed

∂(x, y, z)∂(ρ,φ, θ)

=

∣∣∣∣∣∣

sinφ cos θ ρ cos φ cos θ −ρ sinφ sin θsinφ sin θ ρ cos φ sin θ ρ sinφ cos θ

cos φ −ρ sinφ 0

∣∣∣∣∣∣= ρ2 sinφ

der vi i det siste skrittet har brukt formelen cos2 v+sin2 v = 1 bade for v = θog for v = φ. Legg merke til at siden 0 ≤ φ ≤ π, sa er Jacobi-determinantenρ2 sinφ aldri negativ. Formelen for skifte av variabel blir dermed

∫∫∫

Af(x, y, z) dxdydz =

=∫∫∫

Df(ρ sinφ cos θ, ρ sinφ sin θ, ρ cos φ)ρ2 sinφ dρdφdθ

der D er omradet A beskrevet i kulekoordinater.Kulekoordinater egner seg godt nar vi integrerer over et omrade som er

(delvis) begrenset av en kuleflate. Her er et eksempel:

6.10. SKIFTE AV VARIABLE I TRIPPELINTEGRALER 603

Eksempel 3: Vi skal integrere funksjonen f(x, y, z) = z over omradet Rsom ligger inni bade kjeglen z =

√x2 + y2 og kulen x2 + y2 + z2 = 1.

Figur 1: Kjeglen z =√

x2 + y2

Figur 1 viser kjeglen — kuleflaten ville ligge over denne som et krumt lokk.La oss prøve a finne ut hvilke verdier av ρ, θ, og φ som svarer til punkter

i integrasjonsomradet. Siden kjegleflaten danner en vinkel pa 45◦ med z-aksen, ma φ ga fra 0◦ til 45◦, altsa fra 0 til π

4 radianer. Radien ρ skal løpefra origo til kuleskallet, altsa fra 0 til 1, mens θ kan ha en hvilken som helstverdi, og gar altsa fra 0 til 2π. Integralet blir na

I =∫∫∫

Rz dxdydz =

∫ π4

0

[∫ 1

0

[∫ 2π

0ρ cos φ ρ2 sinφ dθ

]dρ

]dφ =

=∫ π

4

0

[∫ 1

0

[∫ 2π

0ρ3 sinφ cos φ dθ

]dρ

]dφ =

= 2π

∫ π4

0

[∫ 1

0ρ3 sinφ cos φ dρ

]dφ = 2π

∫ π4

0

[ρ4

4sinφ cos φ

]ρ=1

ρ=0

dφ =

2

∫ π4

0sinφ cos φ dφ =

π

2

[sin2 φ

2

]π4

0

2· (√

2/2)2

2=

π

8♣

La oss se pa et eksempel til:

Eksempel 4: Anta at A er et omrade i rommet. Tenk deg at P er et punktutenfor A, og at vi ønsker a regne ut den gjennomsnittlige avstanden fraet punkt i A til P . Dersom P har koordinatene (a, b, c) er denne gjennom-snittsavstanden gitt ved

1Vol(A)

∫∫∫

A

√(x− a)2 + (y − b)2 + (z − c)2 dxdydz

der Vol(A) er volumet til A (tenk gjennom hvorfor vi ma dele med volumet!)La oss bruke denne formelen pa en kule A med radius 1 og et punkt P

utenfor kulen. Vi ønsker altsa a finne gjennomsnittsavstanden fra et punktinni kulen til P .

Page 305: Flervariabel analyse med lineær algebra

604 KAPITTEL 6. MULTIPPEL INTEGRASJON

Vi begynner med a legge kulen i origo og P i punktet (0, 0, a) der a > 1.Siden kulen har volum 4π

3 , er gjennomsnittsavstanden da gitt ved I4π3

der I

er integralet

I =∫∫∫

A

√x2 + y2 + (z − a)2 dxdydz

og A er kulen. Bytter vi til kulekoordinater, far vi∫ 1

0

[∫ π

0

[∫ 2π

0

√(ρ sinφ cos θ)2 + (ρ sinφ sin θ)2 + (ρ cos φ− a)2 dθ

]ρ2 sinφ dφ

]dρ

Ganger vi ut parentesene og bruker var gamle venn sin2 v + cos2 v = 1 etpar ganger, sitter vi igjen med

I =∫ 1

0

[∫ π

0

[∫ 2π

0

√ρ2 − 2aρ cos φ + a2 ρ2 sinφ dθ

]dφ

]dρ

Siden integranden ikke inneholder θ, er den innerste integrasjonen enkel, ogvi far

I = 2π

∫ 1

0

[∫ π

0

√ρ2 − 2aρ cos φ + a2 ρ2 sinφ dφ

]dρ

Det neste integralet er verre, men setter vi u = ρ2 − 2aρ cos φ + a2, far vidu = 2aρ sinφ dφ. Dermed er

∫ √ρ2 − 2aρ cos φ + a2 ρ2 sinφ dφ =

ρ

2a

∫ √u du =

ρ

3au

32 + C =

3a

(ρ2 − 2aρ cos φ + a2

) 32 + C

Setter vi inn grensene, ser vi at

I = 2π

∫ 1

0

[ ρ

3a

(ρ2 − 2aρ cos θ + a2

) 32

φ=0dρ =

=2π

3a

∫ 1

[(ρ2 + 2aρ + a2)

32 − (ρ2 − 2aρ + a2)

32

]dρ =

=2π

3a

∫ 1

[((ρ + a)2)

32 − ((ρ− a)2)

32

]dρ =

=2π

3a

∫ 1

[(ρ + a)3 − (a− ρ)3

]dρ

der vi i siste skritt har brukt at ((ρ− a)2)32 = (a− ρ)3 siden a ≥ ρ. Ganger

vi ut parentesene inni integralet og forkorter, far vi

I =2π

3a

∫ 1

0(6a2ρ2 + 2ρ4) dρ =

3a

[2a2ρ3 +

2ρ5

5

]1

0

=4π(5a2 + 1)

15a

6.10. SKIFTE AV VARIABLE I TRIPPELINTEGRALER 605

Gjennomsnittsavtanden er dermed I4π3

= a + 15a . Overbevis deg selv om at

det er rimelig at gjennomsnittsavstanden er litt større enn avstanden a fraP til sentrum i kulen. ♣

I noen integraler lønner det seg a bruke kulekoordinater med sentrum iet annet punkt enn origo. Ønsker vi a ha sentrum i punktet (a, b, c), brukervi substitusjonen

x = a + ρ sinφ cos θ, y = b + ρ sinφ sin θ og z = c + ρ cos φ

Siden konstantene blir borte nar vi deriverer, er Jacobi-determinanten fort-satt ρ2 sinφ. Vi skal se flere eksempler pa bruk av kulekoordinater i nesteseksjon.

Integrasjon i Rn

Det gar selvfølgelig an a integrere funksjoner f(x1, x2, . . . , xn) med flere enntre variable. Disse integralene betegnes med

∫· · ·

Sf(x1, x2, . . . , xn) dx1dx2 . . . dxn

Den grunnleggende teorien er den samme, men det er vanskeligere a visuali-sere omradene vi skal integrere over.

Ogsa n-dimensjonale integraler kan regnes ut ved iterasjon. Dersom om-radet S er pa formen

S = {(x1, . . . , xn−1) ∈ A | g(x1, . . . , xn−1) ≤ xn ≤ h(x1, . . . , xn−1)}

sa er (under rimelige betingelser)∫

· · ·∫

Sf(x1, x2, . . . , xn) dx1dx2 . . . dxn =

=∫

· · ·∫

A

[∫ h(x1,...,xn−1)

g(x1,...,xn−1)f(x1, x2, . . . , xn) dxn

]dx1dx2 . . . dxn−1

Kjerneregelen er ogsa den samme som før:

Teorem 6.10.2 (Skifte av variable i Rn) La U være en apen, begrensetmengde i Rn og anta at T : U → Rn er en injektiv funksjon med kontinuer-lige partiellderiverte slik at detT′ #= 0 pa hele U . Hvis D ⊂ U er en lukket,Jordan-malbar mengde, og f : T(D) → R er en kontinuerlig funksjon, sa er

∫· · ·

T(D)f(x1, x2, , . . . , xn) dx1dx2 . . . dxn =

=∫

· · ·∫

Df(T(u1, u2, . . . , un))|detT′(u1, u2, . . . , un)| du1du2 . . . dun

Page 306: Flervariabel analyse med lineær algebra

606 KAPITTEL 6. MULTIPPEL INTEGRASJON

Vi skal ikke komme nærmere inn pa integrasjon i mer enn tre varible her— skulle du støte pa slike integraler i andre fag (og det er slett ikke utenke-lig!), greier du deg som regel godt med formlene ovenfor og den intuisjonendu har fra to og tre dimensjoner.

Oppgaver til seksjon 6.10

1. Bruk sylinderkoordinater til a beregne:

a)∫∫

A

∫x dxdydz nar A = {(x, y, z) : x, y ≥ 0 og x2 + y2 ≤ 9,

og 0 ≤ z ≤ 2}

b)∫∫

A

∫xy dxdydz nar A = {(x, y, z) : x2 + y2 ≤ 1 og

0 ≤ z ≤ 4− x− y

c)∫∫

A

∫z√

x2 + y2 dxdydz nar A = {(x, y, z) : x2 + (y − 1)2 ≥ 1 og

0 ≤ z ≤ 2},

2. Bruk kulekoordinater til a beregne trippelintegralet:

a)∫∫

A

∫(x2 + y2) dxdydz nar A er kulen om origo med radius 1

b)∫∫

A

∫x dxdydz nar A = {(x, y, z) : x, y ≥ 0, z ≥ 1

2 og

x2 + y2 + z2 ≤ 1}

c)∫∫

A

∫1 dxdydz nar A = {(x, y, z) : z2 ≤ x2 + y2 ≤ 1, 3y2 ≤ x2, x ≥ 0}

3. Regn ut trippelintegralet.

a)∫∫∫

A z dxdydz der A er omradet over paraboloiden z = x2 + y2 og underkuleflaten x2 + y2 + z2 = 2.

b)∫∫∫

A x dxdydz der A = {(x, y, z) | x2 + y2 ≤ z ≤ 4}.

c)∫∫∫

A e−√

x2+y2+z2dxdydz der A er kulen med sentrum i origo og radius 1.

d)∫∫∫

A

√x2 + y2 dxdydz der A er omradet inni sylinderen x2 +y2 = 1, mellom

xy-planet og flaten z = (x2 + y2) 32 .

e)∫∫∫

A(x2+y2) dxdydz der A er omradet begrenset av sylinderen x2−2x+y2 =1 og planene z = 0 og z = 2.

f)∫∫∫

A(x − 3y + 4z) dxdydz der A er parallellepipedet utspent av vektorene(1,−1, 0), (2, 0, 3) og (0, 0, 4).

4. La A være parallellepipedet utspent av tre vektorer

a1

a2

a3

,

b1

b2

b3

og

c1

c2

c3

som ikke ligger i samme plan, og la M være matrisen M =

a1 b1 c1

a2 b2 c2

a3 b3 c3

6.11. ANVENDELSER AV TRIPPELINTEGRALER 607

a) Vis at avbildningen

xyz

= T

uvw

= M

uvw

avbilder enhetskuben

K utspent av e1, e2 og e3 pa A.

b) Vis at for alle kontinuerlige funksjoner f er∫∫∫

Af(x, y, z) dxdy =

= det M

∫ 1

0

∫ 1

0

∫ 1

0f(a1u+b1v+c1w, a2u+b2v+c2w, a3u+b3v+c3w) dudvdw

c) Regn ut∫∫

A(2x−3z) dxdy der A er parallellogrammet utspent av

2

−10

,

13−1

og

010

.

5. (Eksamen i MAT1110 14/6, 2004) La D være omradet som bade ligger pa innsi-den av kjeglen z =

√x2 + y2 og pa innsiden av kuleflaten x2 + y2 + z2 = 1. Beregn∫∫∫

D z dxdydz.

6. (Kontinuasjonseksamen i MAT1110 2006) Regn ut∫∫∫

R

√x2 + y2 dxdydz

der R = {(x, y, z) ∈ R3 | x2 + y2 + z2 ≤ 4}.

7. La A være kulen med sentrum i origo og radius R, og anta at a > R. Vis at∫∫∫

A

1√x2 + y2 + (z − a)2

dxdydz =4πR3

3a

Dette resultatet er viktig i fysikk der det kan brukes til a vise at gravitasjonskraftenfra en homogen kule er den samme som om all massen var samlet i sentrum.

8. En begrenset mengde A ⊂ R3 har innhold null dersom det for enhver ε > 0finnes en endelig samling R1, R2, . . . , Rn av rektangulære bokser med sider parallellemed koordinataksene slik at A ⊂ R1 ∪ R2 ∪ . . . ∪ Rn, og summen av volumene tilR1, R2, . . . , Rn er mindre enn ε. Vis at hvis K er en lukket, begrenset delmengdeav R3 og f : K → R er kontinuerlig, sa har grafen til f innhold null.

6.11 Anvendelser av trippelintegraler

Vi skal na se pa noen praktiske anvendelser av trippelintegraler. Mange avdisse anvendelsene ligner pa de anvendelsene av enkelt- og dobbeltintegralersom du kjenner fra tidligere.

Page 307: Flervariabel analyse med lineær algebra

608 KAPITTEL 6. MULTIPPEL INTEGRASJON

La oss tenke oss at vi har et tredimensjonalt legeme som utgjør et omradeS ⊂ R3. Anta videre at dette legemet har en varierende tetthet beskrevetved en funksjon f(x, y, z) (dette betyr at en liten del av legemet rundtpunktet (x, y, z) med volum V har masse tilnærmet lik f(x, y, z)V ). Dentotale massen til dette legemet er da gitt ved trippelintegralet

M =∫∫∫

Sf(x, y, z) dxdydz

Er tettheten konstant lik 1, er massen og volumet like, og vi far

Volum(S) =∫∫∫

S1 dxdydz

Eksempel 1: Vi skal finne volumet til omradet S avgrenset at paraboloidenz = x2 + y2 og planet z = 2x − 4y + 4. Lager du en figur, ser du at planetligger som et lokk over paraboloiden, og at volumet derfor er

V =∫∫∫

S1 dxdydz =

∫∫

A

[∫ 2x−4y+4

x2+y21 dz

]dxdy =

=∫∫

A(2x− 4y + 4− x2 − y2) dxdy

der A er projeksjonen av S ned i xy-planet. For a se hvilket omrade detteer, finner vi skjæringskurven mellom de to flatene:

x2 + y2 = 2x− 4y + 4 ⇐⇒ x2 − 2x + 1 + y2 + 4y + 4 = 4 + 1 + 4 ⇐⇒

⇐⇒ (x− 1)2 + (y + 2)2 = 32

A er altsa sirkelskiven i xy-planet med sentrum i (1,−2) og radius 3. For akomme videre, bytter vi til polarkoordinater med sentrum i (1,−2), dvs. visetter

x = 1 + r cos θ og y = −2 + r sin θ

Jacobi-determinanten er r, og vi far

V =∫ 3

0

[∫ 2π

0

(2(1 + r cos θ)− 4(−2 + r sin θ)+

+ 4− (1 + r cos θ)2 − (−2 + r sin θ)2)

r dθ

]dr =

=∫ 3

0

[∫ 2π

0

(9r − r3) dθ

]dr = 2π

∫ 3

0(9r − r3) dr =

= 2π

[9r2

2− r4

4

]3

0

=81π

2

6.11. ANVENDELSER AV TRIPPELINTEGRALER 609

(du far litt enklere regninger om du fullfører kvadratet i integranden før dusetter inn de nye koordinatene). ♣

Bemerkning: I eksemplet ovenfor kunne vi like godt ha regnet ut volumetved hjelp av et dobbeltintegral. Det finnes imidlertid eksempler der det erenklere a bruke trippelintegraler; det gjelder spesielt i tilfeller der vi magjøre et ekte tre-dimensjonalt variabelskifte.

La oss ogsa regne ut massen til et romlegeme.

Eksempel 2: Vi skal regne ut massen til den begrensede kjeglen z =√x2 + y2, 0 ≤ z ≤ 1, nar tettheten er proporsjonal med avstanden til origo.At tettheten er proporsjonal med avstanden til origo, betyr at den har

formen f(x, y, z) = k√

x2 + y2 + z2. Vi har dermed

M =∫∫∫

Ak√

x2 + y2 + z2 dxdydz

Det er mulig a løse dette integralet bade med sylinderkoordinater og kule-koordinater. Vi velger kulekoordinater som viser seg a gi de enkleste regnin-gene. Vi ser at f(x, y, z) = kρ, og vi vet at Jacobi-determinanten er ρ2 sin φ.Dermed har vi

M = k

∫∫∫

Sρ3 sin φ drρdφdθ

Grensene for φ og θ er greie a finne. Siden sidekanten i kjeglen danner envinkel π

4 med z-aksen, ma φ ga fra 0 til π4 . Alle θ-verdier er mulige, sa θ gar

fra 0 til 2π. For a finne grensene til ρ ser vi pa figur 1 som viser et snittgjennom kjeglen (de tykke strekene er kjegleveggen). Enkel trigonometri pa

"

!SSSSSSS

φ1 ρ = 1cos φ

O

A B

%%

%%

%%

%

++

++

++

+

Figur 1: Tverrsnitt gjennom kjeglen

trekanten OAB viser at |OB| = 1cos φ . Dermed gar ρ fra 0 til 1

cos φ og vi har

M = k

∫ π4

0

[∫ 1cos φ

0

[∫ 2π

0ρ3 sinφ dθ

]dρ

]dφ

Page 308: Flervariabel analyse med lineær algebra

610 KAPITTEL 6. MULTIPPEL INTEGRASJON

Integrasjonene blir na ganske greie:

M = 2kπ

∫ π4

0

[∫ 1cos φ

0ρ3 sinφ dρ

]dφ = 2kπ

∫ π4

0

[ρ4

4sinφ

]ρ= 1cos φ

ρ=0

dφ =

=kπ

2

∫ π4

0

sinφ

cos4 φdφ =

2

[−cos−3 φ

−3

]π4

0

=kπ

6

[1

cos3 φ

]π4

0

der vi i siste integrasjon har brukt substitusjonen u = cos φ. Setter vi inngrensene, far vi

M =kπ

6

(1

(√2

2

)3−1)

=kπ

6(2√

2−1) ♣

Vi kan ogsa bruke trippelintegraler til a regne ut massemiddelpunktettil et legeme. Dersom tettheten er f(x, y, z), er koordinatene (x, y, z) tilmassemiddelpunktet gitt ved

x =∫∫∫

S xf(x, y, z) dxdydz

M

y =∫∫∫

S yf(x, y, z) dxdydz

M

z =∫∫∫

S zf(x, y, z) dxdydz

M

der M =∫∫∫

S f(x, y, z) dxdydz er massen. Det tar mye tid a regne utet massemiddelpunkt siden det er 4 integraler man skal beregnes. Ofte erdet imidlertid mulig a slippe unna med færre beregninger dersom man er littsmart. Ønsker man f.eks. a finne massemiddelpunktet til legemet i eksempletovenfor, ser man at x og y er 0 av symmetrigrunner. For a finne massemid-delpunktet er det derfor nok a regne ut z. Dette er ikke sa vanskelig na somvi vet hva grensene skal være (husk at z = ρ cos φ):

I =∫∫∫

Szf(x, y, z) dxdydz =

= k

∫ π4

0

[∫ 1cos φ

0

[∫ 2π

0ρ4 cos φ sinφ dθ

]dρ

]dφ

Vi regner som ovenfor

I = 2kπ

∫ π4

0

[∫ 1cos φ

0ρ4 cos φ sin φ dρ

]dφ =

2kπ

∫ π4

0

[ρ5

5cos φ sinφ

]ρ= 1cos φ

ρ=0

dφ =2kπ

5

∫ π4

0

sinφ

cos4 φdφ =

6.11. ANVENDELSER AV TRIPPELINTEGRALER 611

=2kπ

5

[−cos−3 φ

−3

]π4

0

=2kπ

15

[1

cos3 φ

]π4

0

=2kπ

15(2√

2− 1)

Dermed har vi

z =2kπ15 (2

√2− 1)

kπ6 (2

√2− 1)

=45

Massemiddelpunktet er altsa (0, 0, 45).

Oppgaver til seksjon 6.11

1. Bruk et trippelintegral til a regne ut volumet til en kule med radius R.

2. Finn volumet til det omradet som ligger under grafen z = ex+y og over trekantenmed hjørner i (0, 0, 0), (1, 0, 0) og ( 1

2 , 12 , 0).

3. Finn volumet av den delen av kulen x2+y2+z2 = R2 som ligger over kjegleflatenz =

√x2+y2

3 .

4. Finn volumet til omradet som ligger inni bade sylinderen x2 + y2 = 1 og kulenx2 + y2 + z2 = 4.

5. Finn volumet til ellipsoiden x2

a2 + y2

b2 + z2

c2 = 1 ved a innføre nye variableu = x

a , v = yb , w = z

c .

6. Finn massen til sylinderen x2 + y2 ≤ 1, 0 ≤ z ≤ 1, nar tettheten er f(x, y, z) =1

(x2+y2+z2) .

7. Finn massemiddelpunktet til omradet

A = {(x, y, z) | x2 + y2 ≤ z ≤ 4}

nar tettheten er 1.

8. Vis at massemiddelpunktet til en homogen pyramide med hjørner i (0, 0, 0),(a, 0, 0), (0, b, 0) og (0, 0, c) er 1

4 (a, b, c).

9. (Eksamen i MAT1110 13/6, 2005) La D være det begrensede omradet i R3 somer gitt ved ulikhetene x2 + y2 ≤ z ≤

√2− x2 − y2. Finn volumet av D.

10. (Eksamen i MAT1110 16/8, 2007) Finn volumet til omradet over xy-planet somligger under kuleflaten x2 + y2 + z2 = 1 og over kjegleflaten z2 = 3x2 + 3y2

11. (Prøveeksamen i MAT1110 V-06) R er omradet i rommet avgrenset av flatenez = 6− x2 − y2 og z = x2 − 4x + y2.

a) Vis at integralet I =∫∫∫

R y dxdydz er lik∫∫

S(6y − 2x2y − 2y3 + 4xy) dxdy

der S = {(x, y) ∈ R2 | (x− 1)2 + y2 ≤ 4}.

Page 309: Flervariabel analyse med lineær algebra

612 KAPITTEL 6. MULTIPPEL INTEGRASJON

b) Regn ut integralet i a).

c) C er skjæringskurven mellom flatene z = 6− x2− y2 og z = x2− 4x + y2, ogden er orientert mot klokken sett ovenfra. Vis at C har parametriseringen

r(t) = (1 + 2 cos t) i + 2 sin t j + (1− 4 cos t)k

og regn ut kurveintegralet∫

C F · dr der F(x, y, z) = z i + y j + xk. Fasit

Finner du feil i fasiten, sa send en e-post til [email protected].

Kapittel 1

Seksjon 1.1

1: a + b = (−2, 3, 9,−5,−2), a − b = (4,−7,−1,−5, 4), sa = (3,−6, 12,−15, 3),a · b = 42: a+b = (7, 2, 5,−8,−5, 3), a−b = (7,−2, 3, 4,−5, 5), sa = (−28, 0,−16, 8, 20,−16),a · b = 125: m · p der m = (m1,m2, . . . ,mn) og p = (p1, p2, . . . , pn).

Seksjon 1.2

1: Skalarprodukt: −5, vinkel: θ ≈ 109.65◦2: 10

√2

3: ca. 67.8◦4: ca. 31.8◦.5: ca. 70◦, p = 1

2b6: 12

7

√14

7: (4, 3) = (2, 4) + (2,−1)8: (2, 2, 1) = ( 1

2 , 0,− 12 ) + ( 3

2 , 2, 32 )

9: 30◦ og 45◦, cos 15◦ =√

6+√

24

10: Utallige muligheter, f.eks. (1, 0, 3) og (0, 1, 2). Sjekk dine svar ved a ta skalar-produktet med (3, 2,−1).12: b) − 43

2 , c) 90◦13: Umulig ifølge trekantulikheten.14: Umulig ifølge Schwarz’ ulikhet.18: For eksempel r(t) = (−1 + 2t,−1 + 3t, 2 + t) (det er mange muligheter)19: For eksempel r(t) = (−3 + t,−2− 2t, 5− t, 8 + 3t) (det er mange muligheter).Nei20: For eksempel r(t) = (2 + t,−1 + 9t, 3− 5t) (det er mange muligheter).21: For eksempel r(t) = (7 − 5t,−3 + 4t, 2 − 3t, 4 − 5t,−2 + 7t) (det er mangemuligheter).22: For eksempel r(t) = (5 + 2t,−2 + t) (det er mange muligheter)23: For eksempel r(t) = (3t, 2− 2t) (det er mange muligheter)

613

Page 310: Flervariabel analyse med lineær algebra

614 KAPITTEL 6. MULTIPPEL INTEGRASJON

24: y = − 12x + 1

225: a) Skjæringspunkt (15, 24).b) Skipene kolliderer ikke.26:a) Ja, kursene til flyene krysser hverandre i punktet (4000, 4000, 4000).b) Nei, flyene kolliderere ikke. De kommer til møtestedet etter henholdsvis 40 se-kunder og 100

3 sekunder.27: c) ca. 49◦ og ca. 12.7 m.

Seksjon 1.3

1:(

4 + 5i−3 + 4i

).

2: |a| =√

15, |b| =√

193: −1− i

Seksjon 1.4

1: a) (19, 3, 5) b) (−1,−6,−14)2: 6

√5

3:√

34: (9,−5, 6)5: i× j = k, j× k = i, k× i = j6: 07: 7

28: 2x + y − z = 49: 3x− y + 2z = 310: Hint: Bruk setning 1.4.4.

Seksjon 1.5

1: 2A =(

6 −4 8−2 0 12

), −3B =

(−6 −6 3−12 0 18

)

A + B =(

5 0 33 0 0

), A−B =

(1 −4 5

−5 0 12

)

2: 4A− 3B =

−5 −1814 −13 −4

.

3: AT =

1 −1

−2 86 6

, BT =

2 4 12 0 7

−1 −6 −3

4: AT =(

1 −5 20 7 −1

), BT =

(4 −1 2

−1 3 −6

)

(4A−B)T ) =(

0 −19 61 25 2

)

5: a)(

1−7

)

6.11. ANVENDELSER AV TRIPPELINTEGRALER 615

b)

67

22

c)

8

−1810

6: I: 9.7 tonn, II: 11.8 tonn, III: 7.5 tonn

7: X: 88 vogner, Y: 56 vogner, Z: 56 vogner

10:

0.1 0 0.20.2 0.3 0.20.3 0.3 0.10.3 0.3 0.10.1 0.1 0.4

A: 2.6 enheter, B: 7.2 enheter, C: 7.4 enheter, D: 7.4 enheter, E: 5.4 enheter

11: a)

0.94 0 0.010.05 0.2 00.01 0.8 0.99

b) v1 =

0.8460.0650.089

, v2 =

0.796130.0553

0.14857

(vi tar med flere siffer enn det som er

rimelig for a gjøre svaret lett a kontrollere).

12: a)

0 20 50 100.05 0 0 00 0.5 0 00 0 0.3 0.1

b) Unge: 300, unge voksne 250, voksne 0, eldre 3.

13: a)

0 0.1 0.5

0.1 0 0.50.9 0.9 0

b) Per: 45%, Pal: 46%, Espen 9%.

Seksjon 1.6

1. a) AB =(

0 −57 −1

), BA =

(−1 −5

7 0

)

b) AB =

1 4 13 −5 01 −7 1

, BA =

−5 2 3

3 1 −23 1 1

2. AB =(

5 72 3

).

3. AB =

8 −1 −26 3 0

−8 1 2

.

4. a) AB blir en 8× 9 -matrise.

Page 311: Flervariabel analyse med lineær algebra

616 KAPITTEL 6. MULTIPPEL INTEGRASJON

b) B er en 3× 5-matrisec) B har 7 søyler

5. a) AB =

83 6272 4850 80

b) AC =

3 81 410 72 32

21 36 51

c) Uttrykket er ikke definert siden matrisene B og C ikke har samme dimensjon(dermed er ikke summen B + C definert).

d) (BC)T =

6 27

72 5442 69

e) BT CT t er ikke definert siden BT er en 2× 2-matrise og CT er en 3× 2-matrise,sa dimensjonene stemmer ikke overens.

f) (A + CT )B =

89 86

153 10296 144

g) B(AT − 2C) =(

62 −80 −389 −60 −51

)

7. Vi finner første rad i DE ved a multiplisere første rad i D med matrisen E:

(3, 1, 4)

2 7 18 2 81 8 2

= (18, 55, 19)

Vi finner andre søyle i DE ved a multiplisere matrisen D med andre søyle i E:

3 1 41 5 92 6 5

728

=

558966

Regner du ut hele matriseproduktet pa vanlig mate, far du:

DE =

18 55 1951 89 5957 66 60

8. a) Første og andre søyle i produktmatrisen AB er ogsa like.b) Andre søyle i produktmatrisen AB bestar ogsa bare av nuller.

9. 4

10. A2 =(

3 −4−2 3

), A3 =

(7 −10

−5 7

).

11. a) y =

0

−11

b) C =(

9 −38 −3

)

c) Ay = Cx =(

32

)

6.11. ANVENDELSER AV TRIPPELINTEGRALER 617

12. a) M =

0.7 0.05 0.1

0.15 0.75 0.150.1 0.1 0.7

b) N =

1 0.2 00 0.8 0.050 0 0.95

c) K =

0.73 0.2 0.13

0.125 0.605 0.1550.095 0.095 0.665

Fordeling: A: 258, B: 268.5, C: 313.5d) Fordeling: A: 282.8, B: 243.3, C: 258.5 (vi tar med flere siffer enn det som errimelig for a gjøre svaret lett a kontrollere).

Seksjon 1.7

3. Matrisene A, B og D er inverterbare med inverse matriser

A−1 =(−2 7−1 3

), B−1 =

(0.2 0

0 0.25

), D−1 =

(−1 1

0.75 −0.5

)

Matrisen C er singulær (siden den har en søyle som bare bestar av nuller).

4. A =(

2 −5−1 3

)

5. (AB)−1 = B−1A−1 =(

14 594 17

)

10. b) A−1 =(

3 51 2

)

c) Multipliserer vi med A−1 pa begge sider av matriseligningen, far vi(

xy

)=

(3 51 2

) (32

)=

(197

)

Seksjon 1.8

1: a) 14 b) 38 c) 02: 113: 23

24: 275: a) negativt, b) negativt6: Hint: Tolk determinanten som et areal.8: Hint: Utrykk arealet som en determinant9: b) Ligningssystemet har enten ingen eller uendelig mange løsninger avhengig avkonstantene c1 og c2. Linjene a1x + b1y = c1 og a2x + b2y = c2 er nemlig entenparallelle (ingen løsninger) eller sammenfallende (uendelig mange løsninger).10: a) 84 b) 20 c) 011: 712: 5

313: Positivt15: Hint: Tolk determinanten som et volum.16: −127

Page 312: Flervariabel analyse med lineær algebra

618 KAPITTEL 6. MULTIPPEL INTEGRASJON

Kapittel 2

Seksjon 2.1

1: a) Df = R2 \ {(0, 0)}b) Df = {(x, y) ∈ R2|x #= y og x #= −y}c) Df = {(x, y) ∈ R2|x + y > 0}d) Df = {(x, y) ∈ R2| det ikke finnes et heltall k slik at x− y = π

2 + kπ}e) Df = R3 \ {kuleflaten med sentrum i origo og radius 5}

Seksjon 2.3

1: a) 20b) 1c) ed) 1

Seksjon 2.4

1: a) ∂f∂x = 3x2y + 3y4 og ∂f

∂y = x3 + 12xy3

b) ∂f∂x = 2x+3x2

y og ∂f∂y = −x2+x3

y2

c) ∂f∂x = − sin(x + y2) og ∂f

∂y = −2y sin(x + y2)d) ∂f

∂x = 2x ln(xy2) + x og ∂f∂y = 2x2

y

e) ∂f∂x = e−z, ∂f

∂y = e−z og ∂f∂z = −(x + y)e−z

f) ∂f∂x = z2

(1+y2) cos2(x) ,∂f∂y = − 2yz2 tan x

(1+y2)2 og ∂f∂z = 2z tan x

1+y2

g) ∂f∂x = z

1+(x+y)2 , ∂f∂y = z

1+(x+y)2 og ∂f∂z = arctan(x + y)

h) ∂f∂x = −(z2 + u)e−x+3y, ∂f

∂y = 3(z2 + u)e−x+3y, ∂f∂z = 2ze−x+3y og ∂f

∂u = e−x+3y

2: a) ∇f = (2xy, x2)b) ∇f = (cos(xy2z)− xy2z sin(xy2z),−2x2yz sin(xy2z),−x2y2 sin(xy2z))c) ∇f = (w cos veu cos v,−wueu cos v sin v, eu cos v)d) ∇f = ( z2z3

1+z21z2

2, z1z3

1+z21z2

2, arctan(z1z2) + ez3)

3: a) f ′((1, 2); (3,−1)) = 11b) f ′((1, 0); (−1, 1)) = −1c) f ′((1, 0, 1); (1, 1,−1)) = −1d) f ′((π

2 , 1, 0); (2, 0,−1)) = −1

4: a) I retningen gitt av vektoren (24, 173)b) I retningen gitt av vektoren (1, 1, 0)c) I retningen gitt av vektoren (3, 0,−3, 1)

5: Hint: Bruk at ∆V ≈ V ′((r, h); (∆r,∆h)) Anslatt usikkerhet: ∆V ≈ 3.8m3

6: Tommelfingerregelen gjelder nar høyden i centimeter er det dobbelte av vekteni kilo (f.eks høyde 180 cm og vekt 90 kilo). Er man lettere enn dette, er regelen“forsnill” i den forstand at BMI gar opp hvis man legger pa en kilo og en centimeter.

6.11. ANVENDELSER AV TRIPPELINTEGRALER 619

Seksjon 2.5

1: a) ∂2f∂x2 = 6y, ∂2f

∂x∂y = ∂2f∂y∂x = 6x + 4y, ∂2f

∂y2 = 4x

b) ∂2f∂x2 = 0, ∂2f

∂x∂y = ∂2f∂y∂x = cos y, ∂2f

∂y2 = −x sin y

c) ∂2f∂x2 = (x2 + 4x + 2)ex−y, ∂2f

∂x∂y = ∂2f∂y∂x = −(x2 + 2x)ex−y, ∂2f

∂y2 = x2ex−y

d) ∂2f∂x2 = 2z, ∂2f

∂x∂y = ∂2f∂y∂x = 0, ∂2f

∂x∂z = ∂2f∂z∂x = 2x, ∂2f

∂y2 = −2z2,∂2f∂y∂z = ∂2f

∂z∂y = −4yz, ∂2f∂z2 = −2y2

2: a) (6xy + 6x2yz + x3yz2)exz.b) −20x3y4 cos(xyz) + 10x4y5z sin(xyz) + x5y6z2 cos(xyz)

Seksjon 2.6

1: a) F′(x, y) =(

2xy x2

1 2y

)

b) F′(x, y) =(

2xyex2y+z x2ex2y+z ex2y+z

yz2 xz2 2xyz

)

c) F′(x, y) =

arctan(xy) + xy

1+x2y2x2

1+x2y2

ln y xy

y cos y2 x cos y2 − 2xy2 sin y2

d) F′(x, y, z, u) =(

y sin(xu2) + xyu2 cos(xu2) x sin(xu2) 0 2x2yu cos(xu2)0 0 2zu z2

)

Seksjon 2.7

1: ∂k∂x = 8xy2 + 1, ∂k

∂y = 8x2y + 2y

2: ∂k∂x = 2ye−2y(x+z) − (4xy2 + 2yz)e−2y(x+z),

∂k∂y = 2xe−2y(x+z) − 2(2xy + z)(x + z)e−2y(x+z),∂k∂z = e−2y(x+z) − 2(2xy2 + yz)e−2y(x+z)

3: ∂h∂x2

= 54x51x

22x

23 sinx3, ∂h

∂x3= 36x5

1x32x3 sinx3 + 18x5

1x32x

23 cos x3

4: ∂h∂v = e3uv3

u cos(uv)(

9v2 cos(uv)− 2 sin(uv))

5: H′(1,−2) =(

13 −710 0

)

6: H′(−1,−2, 1) =(

5 −13 32 6 −2

)

Seksjon 2.8

1:(

2 −1 1−1 1 −3

)

Page 313: Flervariabel analyse med lineær algebra

620 KAPITTEL 6. MULTIPPEL INTEGRASJON

2:

−1 02 −2

−3 44 7

3: −(

63

)

4:(−1 0

0 1

)

5:(

1 00 2

)

6:(

2 cos θ −2 sin θ2 sin θ 2 cos θ

)

7:

1 0 00 1 00 0 0

8:(

cos θ sin θsin θ − cos θ

)

10:(

cos 2θ sin 2θsin 2θ − cos 2θ

)

11: x = − 37 , y = 1

7 , z = 17 , u = 2

7

b) T(e1) =(− 2

7− 4

7

), T(e2) =

(37

− 17

)

c)(− 2

737

− 47 − 1

7

)

12: a) x = 14 , y = 1

4 . T4(e1) =(

353−136

)

b) u = − 12 , v = 1

2 . T4(e2) =(−544

353

)

c)(

353 −544−136 353

)

14: c) x = 1, y = 2. A10a =(

310 + 2310 − 2

)=

(5905159047

)

Seksjon 2.9

1: A =(

2 −3 1−1 0 1

), c = −

(72

)

2: r(t) =(

5t + 11−4t− 10

)

3: TaF =(−4x + 4y − 8

2x− 2y + 2

)

4: TaF =

4y

x + 2y24x + y − 32

6.11. ANVENDELSER AV TRIPPELINTEGRALER 621

5: Matrise(

1 −24 1

), konstantledd

(1

−1

)

6: Matrise

( √2

2 −√

22√

22

√2

2

), konstantledd

(3

−1

)

7: a) Matrise(−1 0

0 1

), konstantledd

(60

)

b) Matrise(

1 00 −1

), konstantledd

(0

−4

)

8: a) Matrise(

0 −1−1 0

), konstantledd

(11

)

Kapittel 3

Seksjon 3.1

1:v(t) = (3t2, 2t)v(t) = t

√9t2 + 4

a(t) = (6t, 2)a(t) = 18t2+4√

9t2+4

2:v(t) = (− sin t, sin t + t cos t)v(t) =

√2 sin2 t + t sin 2t + t2 cos2 t

a(t) = (− cos t, 2 cos t− t sin t)a(t) = (3−t2) sin 2t+2t(cos 2t+cos2 t)

2√

2 sin2 t+t sin 2t+t2 cos2 t

3:v(t) = (1,−e−t, cos t)a(t) = (0, e−t,− sin t)

4:v(t) = ( 1

t , 2t,− sin t)a(t) = (− 1

t2 , 2,− cos t)

7:b) v(t) = (−a sin t, b cos t)

v(t) =√

a2 sin2 t + b2 cos2 t =√

(a2 − b2) sin2 t + b2

a(t) = (−a cos t,−b sin t) = −r(t)a(t) = (a2−b2) sin 2t

2√

a2 sin2 t+b2 cos2 t

c) s ≈ 25.53

8: 9043/2−827 ≈ 1006.4

9:a) v(t) = (1,− tan t)

Page 314: Flervariabel analyse med lineær algebra

622 KAPITTEL 6. MULTIPPEL INTEGRASJON

v(t) = 1cos t

b) 12 ln 2+

√2

2−√

2= ln(

√2 + 1)

10: a) v(t) = (−2 sin t,√

2 cos t,√

2 cos t)v(t) = 2a(t) = −r(t)b) 4πc) x2 + y2 + z2 = 4e) En sirkel med radius 2 om origo i planet y-z=0.

11:a) v(t) = (cos t− t sin t, sin t + t cos t, 1)v(t) =

√2 + t2

b) 22.43c) π

√2 + 4π2 + ln(

√2π +

√2π2 + 1)

12:a) v(t) = (r(1− cos t), r sin t)v(t) = r

√2√

1− cos ta(t) = (r sin t, r cos t)a(t) = r

√2 sin t

2√

1−cos t

d) 8r

15:a) v(t) = (v0 cos α, v0 sinα− gt)a(t) = (0,−g)b) v2

02g sin2 α

c) v20g

16:t = m

k ln(1 + ku2mg )

ymax = mu2k − m2g

k2 ln(1 + ku2mg )

17:b) r2(t) = (t + 1√

1+cos2 t, sin t + cos t√

1+cos2 t)

d) Fra venstre mot høyre

18: Med origo midt i sirkelen og med startpunkt (b, 0), far vi: x(t) = (a + b) cos t−a cos(a+b

a t)y(t) = (a + b) sin t− a sin(a+b

a t)

19:a) r′(t) = (1, 2t). Finn uttrykket for f ′(t) ved a derivere f(t) = |r(t) − b|2 =(r(t)− b) · (r(t)− b) etter produktregelen.b) Geometrisk beskrivelse: Vektoren fra b til r(t0) star normalt pa tangentvektorenr′(t0).c) Dersom y > 1

2 , sa er (±√

y − 12 , y − 1

2 ) de nærmeste punktene. Dersom y ≤ 12 ,

6.11. ANVENDELSER AV TRIPPELINTEGRALER 623

sa er 0 = (0, 0) det nærmeste punktet.

Seksjon 3.21. 189t6

2. esin t cos2 t(2 sin t cos t + sin2 t cos3 t− 2 sin4 t cos t

)

3. 2 cos(t2)e2t − sin(t cos(t2))− t cos(t2) cos(t cos(t2))− 2te2t sin(t2)++2t3 sin(t2) cos(t cos(t2))

4. 6t6(3t+1)2

t6+1 + 6t(3t + 1) ln(t6 + 1) + (3t + 1)2 ln(t6 + 1)

5.(

2 sin t cos2 t− sin3 tcos2 t− sin2 t + cos t

)

6.

−4(1− t2)t2 + (1− t2)2 + cos t

− sin((1− t2) sin t

)(− 2t sin t + (1− t2) cos t

)

2t(1− t2)− 2t3

7. Avtagende

Seksjon 3.31. 02. 1603. 04. 864

35

5. 13

(2 + 4π2

) 32 − 2

√2

3

6. 2√

2(e−1 − 1)10. 33.7K11. 89

45 liter12. c) π, d) 0

Seksjon 3.41. −482. 03. 1544

21

4. cos 1− cos 2 + 12 (ln 2)2 − e

2 (sin 1 + cos 1) + e2

2 (cos 2 + sin 2)5. π

2 + ln 22 − 1

6. 07. 192

5

8. π2

2

14. 5K(√

17− 1)15. c) 1+2t+2t2√

2+2t+t2, d)K

√2, e)

√2

Seksjon 3.51. Konservativt med potensialfunksjon φ(x, y) = x2y + x2

2. Ikke konservativt3. Konservativt med potensialfunksjon φ(x, y) = x sinxy + 3x− 2y4. Konservativt med potensialfunksjon φ(x, y, z) = xy2z + xz − 2y5. Konservativt med potensialfunksjon φ(x, y, z) = xy sin z + 2xz + 3y6. Ikke konservativ7. 08. −π

Page 315: Flervariabel analyse med lineær algebra

624 KAPITTEL 6. MULTIPPEL INTEGRASJON

9. 010. 311. 012. b) π

2

e) arctan yx =

{ − arctan xy + π

2 nar (x, y) ligger i 1. og 3. kvadrant− arctan x

y −π2 nar (x, y) ligger i 2. og 4. kvadrant

e) For eksempel

φ(x, y) =

arctan( yx ) nar x > 0

arctan( yx ) + π nar x < 0

π2 nar x = 0 og y > 0

Denne funksjonen har et sprang langs den negative y-aksen.

Seksjon 3.61. (x+4)2

9 + (y−1)2

4 = 1. Ellipse med sentrum i (−4, 1) og halvakser a = 3, b = 2.Brennpunkter i (−4−

√5, 1) og (−4 +

√5, 1).

2. (y−1)2 = 4(x+2), parabel med toppunkt i (−2, 1), brennvidde 1 og brennpunkti (−1, 1)3. (x−1)2

4 − (y−2)2

4 = 1. Hyperbel med sentrum i (1, 2), a = 2, b = 2, c = 2√

2.Brennpunkt (1− 2

√2, 2) og (1 + 2

√2, 2). Asymptoter (y − 2) = ±(x− 1)

4. (y+1)2

9 − (x−3)2

16 = 1. Hyperbel med sentrum i (3,−1), a = 4, b = 3, c = 5.Brennpunkt (3,−6) og (3, 4). Asymptoter (y + 1) = ± 3

4 (x− 3)5. (x+1)2

5 + (y−2)2

3 = 1. Ellipse med sentrum i (−1, 2), a =√

5, b =√

3, c =√

2.Brennpunkt (−1−

√2, 2) og (−1 +

√2, 2).

6. (x + 2)2 = −2(y− 4). Parabel med toppunkt (−2, 4), brennvidde 12 , brennpunkt

(− 52 , 4)

7. Ligningen kan omformes til (x−1)2

3 + (y+2)2

9 = −1 som ikke har noen løsninger,10. Parallelt med aksen og sa brutt gjennom F .11. Like lang tid13. a) 3

√21

b) (0,−18)e) ( 24

5 ,−9)14. a) Ellipse med ligning x2

16 + (y−3)2

25 = 1c) S( 4

√5

3 , 193 ), B( 40

√5

21 , 19021 )

15. a) Hyperbel med brennpunkter i A og B, brennvidde c og halvakse a.

Seksjon 3.75. a) 4x− y + z = 4b) −x + y + z = 0c) 12x− 12y + z = 32

Seksjon 3.9Husk at flater kan parametriseres pa mange mater, og at det derfor kan være andreriktige svar enn de som er oppgitt her!1. r(x, y) = x i + y j + (x2 + y2)k for x, y ∈ R ogr(r, θ) = r cos θ i + r sin θ j + r2 k for r ≥ 0, 0 ≤ θ < 2π.2. r(φ, θ) = 2 sinφ cos θ i + 2 sinφ sin θ j + 2 cos φk, der 0 ≤ φ ≤ π

2 , 0 ≤ θ ≤ π2

6.11. ANVENDELSER AV TRIPPELINTEGRALER 625

3. r(θ, z) = cos θ i + sin θ j + z k, der 0 ≤ θ < 2π, 0 ≤ z ≤ 14. r(v, x) = x i + 3 cos v j + 3 sin v k, der 0 ≤ v < 2π, x ∈ R5. r(r, v) = r i + r cos v j + r sin v k, der 0 ≤ v < 2π, r ≥ 06. r(φ, θ) = a sinφ cos θ i + b sinφ cos θ j + c cos φk, der 0 ≤ φ ≤ π, 0 ≤ θ < 2π7. En sylinder med radius 2 og med akse langs x-aksen. Høyden er 2 (strekker sgfra x = 0 til x = 2).8. r(φ, θ) = 2 sinφ cos θ i + 2 sinφ cos θ j + 2 cos φk, der 0 ≤ φ ≤ π

6 , 0 ≤ θ < 2π

Kapittel 4

Seksjon 4.1

1. x = 25, y = −5, z = 12

2. x = − 72 , y = − 11

2 , z = 12

3. z velges fritt, y = 2z − 54 , x = z − 7

2

4. Ingen løsninger

5. x = 15 (a + 2b + 2c), y = 1

5 (2a + b + 2c), z = 15 (2a + 2b + c)

6. x = 913 , y = 57

65 , z = 2765

Seksjon 4.2

1. Alle unntatt C og F er pa trappeform.

2. a)

1 2 10 1 −30 0 1

, b)

1 1 20 1 20 0 1

, c)

1 1 −2 30 1 −7 60 0 0 1

,

d)

1 2 1 10 1 0 3

50 0 0 0

3. x = 16 , y = 1

6 , z = 12

4. z kan velges fritt, x = −z, y = − 12 −

z2 .

5. Ingen løsninger

6. u kan velges fritt, men da er x = 28 + u, y = −5− u, z = 9 + u.

7. Ja

8. Nei

9. u kan velges fritt, men da er x = 3− 2u, y = 1, z = 2− u.

10. 60 biler i A, 40 biler i B og 20 biler i C.

Page 316: Flervariabel analyse med lineær algebra

626 KAPITTEL 6. MULTIPPEL INTEGRASJON

Seksjon 4.3

1. Alle unntatt C og F er pa redusert trappeform

2. a)(

1 00 1

), b)

(1 0 3 10 1 −3 2

), c)

1 0 0 − 8

30 1 0 5

30 0 1 3

d)

1 2 00 0 10 0 00 0 0

4. Ja

5. Nei

6. u kan velges fritt, men da ma man sette x = 12 −

72u, y = 15

4 −154 u, z = − 5

4 + u4 .

7. v og y kan velges fritt, de andre variablene er da gitt ved: x = 7 − y − 2v,z = 26− 7v, u = 10− 2v.

Seksjon 4.4

1. a)(

3−4

), b)

243

− 43

, c) b =

4

− 8373

+ u

0

− 5313

der u ∈ R, d) Ingen

løsning

2.(

47

− 57

),(− 6

7117

)

3. 13

−11

2−7

, 13

−11

5−7

4. a)

1 0 −1 10 1 2 00 0 0 10 0 0 0

b) Løsning for h = 7: Vi kan velge x3 fritt, og da blir: x1 = x3, x2 = −2x3, x4 = 1.

5. a)

1 0 1 10 1 a2 − a− 2 10 0 −a2 + a a

b) Entydig løsning for a #= 0 og a #= 1, uendelig mange løsninger for a = 0, ingenløsninger for a = 1.

6. a)

1 0 −2 10 1 1 −10 0 a2 + 3a− 4 3− 3a

b) Entydig løsning nar a #= 1 og a #= −4, uendelig mange løsninger for a = 1, ingenløsninger for a = −4.

6.11. ANVENDELSER AV TRIPPELINTEGRALER 627

Seksjon 4.5

1. a) 17

(1 23 −1

), b) 1

3

(1 1

−1 2

)c) Ikke inverterbar

2. a)

0 −0.6 0.2

−1 0.2 0.61 0.2 −0.4

, b) Ikke inverterbar, c)

0.75 −1.5 −0.251.25 −1.5 −0.75−0.5 1 0.5

, d)

− 5

979 − 1

9

− 19

59 − 2

929 − 1

949

6. a) B−1 = 13

3 −2 20 1 −10 2 1

b)x = 5, y = 0, z = 3

c) En løsning for a #= −3 (uansett b). Nar a = −3, er det uendelig mange løsningernar b = ±2, og ingen løsninger nar b #= ±2,

9. b) A−1 = 14

2 1 11 2 11 1 2

c) x = 74 , y = 2, z = 9

4d) a = −2, b = 2, c = 6

Seksjon 4.6

1. b = −a1 + 12a2

2. b = (−1)a1 + 2a2 + (−1)a3

3. a) Ja, b) Nei, c) Ja

4. Koeffisientene er x1 = 1009 , x2 = 17

9 , x3 = 1127 , x4 = − 134

27

5. Koeffisientene er: x1 = 1.2047, x2 = −0.2781, x3 = 0.0795, x4 = 0.3222.

6. Ja

7. a) Ja, b) Nei, c) Nei, d) Ja., e) Ja.

8. a) F.eks. vektor 1 og 3, b) F.eks de tre første, c) F.eks. vektor 1, 2 og 4

9. a) Nei (for mange elementer), b) Nei (for fa elementer), c) Ja, d) Ja

10. a) Legg f.eks. til

010

b) Legg f.eks. til

0001

Page 317: Flervariabel analyse med lineær algebra

628 KAPITTEL 6. MULTIPPEL INTEGRASJON

11. b) e1 = 12v1 + 1

2v2, e2 = 12v1 − 1

2v2, d) 12

(1 33 1

)

Seksjon 4.7

1. Det er mange riktige svar pa disse oppgavene.a) For eksempel a1, a2

b) For eksempel i, jc) For eksempel (0, 1, 2), (2, 1, 0)

d) For eksempel

32

−1

,

−1

02

e) For eksempel (3,−1), (2, 0)

2. a) 2, b) 2, c) 2

5. v =√

2v1 + 2√

2v2

Seksjon 4.8

2.(

1 0−1 1

) (1 00 3

) (1 20 1

)

3.

1 0 0

−1 1 00 0 1

1 0 00 0 10 1 0

1 0 00 1 00 0 4

1 0 10 1 00 0 1

1 2 00 1 00 0 1

Seksjon 4.9

1. a) 12, b)-5, c) -7

2. a) 9, b) -9, c) -9

3.a) 1, b) 30, c) -4

11. d) x = 225 , y = 8

5

Seksjon 4.10

1. a) λ1 = 1,λ2 = 3,v1 =(−1

1

),v2 =

(11

)

b) λ1 = 3,λ2 = −1,v1 =(

21

),v2 =

(−2

1

)

c) λ1 = 5,λ2 = 1,v1 =(

31

),v2 =

(−1

1

)

d) λ1 = 2,v1 =(−1

1

)

e) λ1 = 1 +√

3,λ2 = 1−√

3,v1 =(

1√3

),v2 =

(−1√

3

)

6.11. ANVENDELSER AV TRIPPELINTEGRALER 629

f) λ1 = 4 + i,λ2 = 4− i,v1 =(

2−1 + i

),v2 =

(2

−1− i

)

2. a) λ1 = 4,λ2 = 0,λ3 = 1,v1 =

120

,v2 =

−1

20

,v3 =

−2

51

b) λ1 = −2,λ2 = 3,λ3 = 2,v1 =

1

−10

,v2 =

41

−5

,v3 =

−1

14

c) λ1 = 0,λ2 =√

5,λ3 = −√

5,v1 =

31

−1

,v2 =

√5−12√

5− 11

,v3 =

√5+12√

5 + 1−1

4. a) Egenverdier λ1 = 3,λ2 = −2, egenvektorer v1 =(

21

),v2 =

(1

−2

),

lineærkombinasjon x = 35v1 − 11

5 v2

b) Egenverdier λ1 = 5,λ2 = 3, egenvektorer v1 =(

11

),v2 =

(1

−1

), lineær-

kombinasjon x = −4v1 + 2v2

c) Egenverdier λ1 = 1,λ2 = −2, λ3 = −1, egenvektorer v1 =

101

,v2 =

10

−1

,v3 =

165

, lineærkombinasjon x = − 12v1 + v2 + 1

2v3

6. M = 1√5

(1 2

−2 1

), D =

(1 00 6

)

7. Egenvektorene er vanligvis ikke de samme. Vektoren(

11

)er f.eks. en egenvek-

tor for matrisen A =(

1 01 0

), men ikke for AT .

10. Egenvektorene til B er pa formen v = P−1u der u er en egenvektor for A.

12. λ1 = 5,λ2 = −3,λ3 = −1,v1 =

58

11

,v2 =

10

−1

,v3 =

11

−2

Seksjon 4.11

1. xn = −4n + 6 · (−1)n, yn = −4n − 4 · (−1)n

2. x(t) = 132 e5t − 11

2 e−3t, y(t) = 134 e5t + 11

4 e−3t

3. a) Egenverdier λ1 = 1, λ2 = 0.9, egenvektorer v1 =(

21

), v2 =

(11

).

b) r0 = 2000v1 − 1000v2

xn = 4000 − 1000 · 0.9n, yn = 2000 − 1000 · 0.9n. Bestandene stabiliserer seg pahenholdsvis 4000 og 2000 dyr.

Page 318: Flervariabel analyse med lineær algebra

630 KAPITTEL 6. MULTIPPEL INTEGRASJON

4. b) Egenverdiene er λ1 = 1 og λ2 = 0.8. Egenvektorer: v1 =(

11

),v2 =

(1−1

).

c)(

24

)= 3

(11

)+ (−1)

(1−1

), Mn

(24

)=

(3− (0.8)n

3 + (0.8)n

).

d) 12 ganger

5.a) Egenverdier λ1 = 1918 ,λ2 = − 1

18 , egenvektorer v1 =(

11

),v2 =

(1

−1

)

c) xn = 5(

1918

)n + 3(− 1

18

)n, yn = 5

(1918

)n− 3(− 1

18

)n der xn og yn er malt i millio-ner.d) 50%

6. a) M =(

0.8 0.30.2 0.7

)

b) 500

c) λ1 = 1,λ2 = 12 ,v1 =

(32

),v2 =

(−1

1

)

d) xn = 600− 100 · ( 12 )n, yn = 400 + 100 · ( 1

2 )n

e) Pn = 106(6− 0.5n − 1.6 · 1.1n − 0.4 · (0.55)n)

7. a) M =

0 3 41 0 00 1

2 0

b) Egenverdier λ1 = 2, λ1 = −1, egenverdier v1 =

841

,v2 =

2

−21

c)

xn

yn

zn

=

16 · 2n + 8 · (−1)n

8 · 2n − 8 · (−1)n

2 · 2n + 4(−1)n

8. a) M =

1 0.1 0

0.1 1 0.10 0.1 1

b) λ1 = 1,λ2 = 1 +√

210 ,λ3 = 1 −

√2

10 , v1 =

10−1

, v2 =

1√2

1

, v1 =

1

−√

21

c)

xn

yn

xn

= 12 (x0 − z0)

10−1

+ (1 +√

210 )n( 1

4 (x0 + z0) +√

24 y0)

1√2

1

+(1−√

210 )n( 1

4 (x0 + z0)−√

24 y0)

1

−√

21

d) k1 =√

22 , k2 =

√2

9. c) x(t) = 6 000e0.01t − 1 000e−0.01t, y(t) = 2 000e0.01t − 1 000e−0.01t

6.11. ANVENDELSER AV TRIPPELINTEGRALER 631

10. a) x(t) = 500et(cos t + 2 sin t), y(t) = 500et(2 cos t− sin t)b) x(t) = 1250− 750e−4t, y(t) = 625 + 375e−4t

c) Modell a) gir y(t) = 0 nar tan t = 2, dvs. etter ca. 1.1 ar. Modellen i b) girgrenseverdier 1250 og 625.

11. En utvidet versjon av denne oppgaven ligger pahttp://www.uio.no/studier/emner/matnat/math/MAT1110/v06/Oblig1.pdfmed løsningsforslag pahttp://www.uio.no/studier/emner/matnat/math/MAT1110/v06/Oblig1Los.pdf

Kapittel 5

Seksjon 5.1

1. a) lukket b) apen c) hverken lukket eller apen d) lukket e) apen f) lukket g)hverken lukket eller apen h) apen i) lukket

2. a) (2,− 32 ) b) (1,−2) c) (1, 1, e−

12 )

Seksjon 5.4

1. Fikspunkt (−1, 1).

2. Likevektspunkt: x ≈ 297, y ≈ 3970

Seksjon 5.6

1. a) Nullpunkter: 0,±1.

2. b) (±0.7862, 0, 6180) c) (±√√

5−12 ,

√5−12 )

3. a) Førstekomponenten er null pa alle linjer x + y = kπ, k ∈ Z, mens annenkom-ponenten er null pa alle linjer x − y = π

2 + mπ, m ∈ Z. Funksjonen er null i alleskjæringspunkter mellom slike linjer.

Seksjon 5.7

1. G′(1,−2) =(

1 11 0

), H′(1,−2) = −

(1 11 2

)

2. G′(1,−1) = 13

(1 21 −1

), H′(1,−1) = 1

3

(−1 4−1 1

)

3. f ′(x0) = − 3x20

3y20+1

4. ∂g∂x = 4

3 , ∂g∂y = − 4

3

Page 319: Flervariabel analyse med lineær algebra

632 KAPITTEL 6. MULTIPPEL INTEGRASJON

5. a) A−1 = 13

2 0 1

−5 3 −11 0 −1

b) G(0, 12 , 2) = A−1

6. k = − b2x0a2y0

7. k = b2x0a2y0

8. k = − 2ay0

10. ∂z∂x = 1−3yz

3(xy−z2) og ∂z∂y = 2y−3xz

3(xy−z2) forutsatt at z2 #= xy.

11. ∂z∂x = − 4x

2z+e−z og ∂z∂y = − 6y

2z+e−z forutsatt at 2z + e−z #= 0.

12. ∂u∂x = 13

8 og ∂v∂x = 5

4 .

13. b) x′(t) = −∂φ∂y (x(t),y(t))∂φ∂x (x(t),y(t))

y′(t)−∂φ∂z (x(t),y(t))∂φ∂x (x(t),y(t))

z′(t)

Seksjon 5.9

1. a) (2,−1) b) (0, 0) c) (− 32 , 1) d) (−1, 0), e) (1

4 ,−4)

2. a) Min. i (1,−2) b) Sadelpunkt i (−1, 1) c) Min. i (0, 0) d) Maks. i (12 ,− 1

2 ) e)Sadelpunkt i (−2, 0)

3. (1,−2), lokalt minimum.

4. (0, 0) er et lokalt minimum, (− 43 ,− 4

3 ) er et sadelpunkt.

5. (1,− 12 ), sadelpunkt.

6. (−1, 0), lokalt minimum.

7. Lokalt minimum i (0, 0, 0), sadelpunkter i (2, 2, 2), (2,−2,−2), (−2, 2,−2), (−2,−2, 2)

8. a) Stasjonære punkter: (0, 0), (−2, 0), (−1,−1)b) De to første punktene er sadelpunkter, det siste et lokalt makiimum.

9. a) (0, 0), (−2, 0)b) (0, 0) er et lokalt (og faktisk et globalt) minimum, (−2, 0) er et sadelpunkt.

10. a) (0, 0) er et sadelpunkt, (±√

2, 0) er lokale (og globale) maksimumspunkter,(0,±

√2) er lokale (og globale) minimumspunkter.

b) Minimumsverdi: −2e−1 i (0,±√

2). Maksimumsverdi: e−12 i (±1, 0)

11. Sidene i grunnflaten skal være 3√

2V og høyden3√2V2 .

6.11. ANVENDELSER AV TRIPPELINTEGRALER 633

12. a) ∂L∂x = 4− 1000

x2y , ∂L∂y = 2− 1000

xy2

b) x = 5, y = z = 10

13. a) ∂A∂x = 28− 4x− 3y, ∂A

∂y = 28− 4y − 3x, lokalt maksimum for x = y = 4b) Maksimalt areal A = 122 for x = y = 4

14. l = 603√78

, h = 503√78

15. a) ∂P∂x = 60

x2 − 60y, ∂P∂y = 60

y2 − 60x

b) Maksimalverdi P = 1140 for x = y = 1

16. x = y = z = 36

17. x = 650, y = 750

18. a) x = y = 12 000, P = 36 000 000, Q = 48 000 000b) x = 9000, y = 8000, P = 51 500 000, Q = 50 500 000c) x = 9000, y = 12 000, P = 31 500 000, Q = 58 500 000

Seksjon 5.10

1. a) Maks.verdi 5 i punktet (45 ,− 3

5 ), min.verdi -5 i punktet (− 45 , 3

5 ).b) Maks.verdi 3 i punktene (1, 3) og (−1,−3), min.verdi -3 i (1,−3) og (−1, 3).c) Min.verdi 17 i punktet (2,−3, 2). Ingen maksimalverdi.d) Maks.verdi 1 +

√2 i punktet (−

√2

2 ,√

22 , 1 +

√2), min.verdi 1 −

√2 i punktet

(√

22 ,−

√2

2 , 1−√

2)e) Maks.verdi 19√

70i punktet ( 4√

70, 9√

70), min.verdi − 19√

70i punktet (− 4√

70,− 9√

70).

f) Min. verdi − 112 i punktet (2,− 1

6 ,− 56 ).

2. (0, 0, 1), (0, 0,−1)

3. (±1, 0, 0), (0,±1, 0)

8. a) Lokalt min. i (0, 0), sadelpunkter i (±1, 0)b) Min.verdi 0 i (0, 0), maks.verdi ln 2 + 1 i (0,±1)

9. Maks. punkt (2√

55 , 4

√5

5 ), min. punkt −( 2√

55 , 4

√5

5 )

10. a) Ellipse med sentrum i (1,−2), halvakser a = 2, b = 3, brennvidde c =√

5,brennpunkter (1, 2 ±

√5).

b) Maks. punkt (135 ,− 1

5 ), min. punkt (− 35 ),− 19

5 )

11. V = abc3√

3

12. x = R√3, y =

√23R

Page 320: Flervariabel analyse med lineær algebra

634 KAPITTEL 6. MULTIPPEL INTEGRASJON

13. x = b3 , u = π

3

15. a) x0xa2 + y0y

b2 + z0zc2 = 1

b) V = a2b2c2

6x0y0z0

c) x = a√3, y = b√

3, z = c√

3

d)√

32 abc

16. a) Pmax = K ααββSα+β

(α+β)α+β

b) Pmax = K αα11 α

α22 ···ααn

n Sα1+α2+···+αn

(α1+α2+···+αn)α1+α2+···+αn for x1 = α1Sα1+α2+···+αn

, x2 = α2Sα1+α2+···+αn

. . .

18. x = Sα(1−β)−αβKTα−β , y = S(1−β)(1−α)−β(1−α)KT

(α−β)K , z = Sβ(1−α)−αβKTβ−α og u =

S(1−β)(1−α)−α(1−β)KT(β−α)K

Kapttel 6

Seksjon 6.1

1. a) 9, b) π2 +2, c) 2

3 (e−1), d) 2π , e) 1

8

(e8 − e4 − 4

), f) 2(e−1), g) (1− 2

√3

3 ) ln 2+ π6

Seksjon 6.2

1. a) 165 b)459

4 c) 1712 d) 1

6 e) e−12 f) 3

56 g) − 3π2 h) π2

8 i) − e2

12 + e6 + 5

12

3. a) e−12 b) 1 c) e−1

3

Seksjon 6.3

1. a) 815 b) 625

16 π c) π(e16 − e) d) 116 e) 0 f) π

6 (2√

2− 1) g) 51275

3. b) 329

4. π8

Seksjon 6.4

1. a) 83 b) 1

4 c) 12 d) 128√

23 π e) 0 f) 8π

2. x = 34 , y = 3

8

3. x = 47 , y = 3

4

4. 4πR2

5. π6 (17

√17− 1)

6.11. ANVENDELSER AV TRIPPELINTEGRALER 635

6.√

2π.

7. π − 2

9. π120 (25

√5 + 1)

10. 43

11. 270π2

12. 20π

13. R2 sinφ, πR2

8

14.√

2u, 31√

2π5

15. (0, 0, 12 )

16. a) 169 (3π − 4), b) 8π − 16

17. a) 7π2 b) π

6 (5√

5− 1)

18. 81π2

19. b) 8π c) −24π

Seksjon 6.5

1. a) 4 b) 0, c) 712 , d) 135

4

2. 4π2

3. 10−3π9

4. 3πab8

5. 1420

6. 4π3 − 24π

7. 2π

8. a) 43 .

9. a) og b) 76

10. a) og b)√

26 + π

32 −116

Page 321: Flervariabel analyse med lineær algebra

636 KAPITTEL 6. MULTIPPEL INTEGRASJON

11. 4

12. a) Sentrum (1,−2), halvakser a = 2, b = 3 b) 30π c) 30π

Seksjon 6.7

1.a) 16 b) 6 c) 560

81

3. a) − 11027 , b) e2 + 1, c) − 3

4 ln 2 + 34

5. a) ln 22 (1− e−5) b) 2 ln 2 c) 1

2 d) 52 e) 20

7. c) 17 (e7 + e−7 − 2)

8. a) Beskrivelse av linjen: u = 0 eller v = π4 + kπ, der k ∈ Z, Areal = π

4

b) π24 (5

√5− 1)

9. 2

Seksjon 6.8

1. π8

2. Divergerer

3. Konvergerer mot 14

4. Divergerer

5. π8

6. Konvergens for p > 1 mot πp−1

Seksjon 6.9

1. a) 18 b) e2 − e c) 1 d) 18 e) 4

3

2. a) 1415 b)344

√2

945 c) 6725 d) − 216

5 e) 1120

Seksjon 6.10

1. a) 18 b) 0 c) 649

2. a) 815π b) − 3

√3

64 + π24 c) π2

4

3. a) 7π12 b) 0 c) 8π(1− 5

e ) d) π3 e) 8π f) 136

4. c) 9

6.11. ANVENDELSER AV TRIPPELINTEGRALER 637

5. π8

.6. 4π2

Seksjon 6.11

1. 43πR3

2. 12

3. πR3

3

4. 4π3 (8− 3

√3)

5. 4πabc3

6. π2

2 + π ln 2

7. (0, 0, 83 )

9. 4π3

√2− 7π

6

11. b) 0 c) 0