of 78 /78
Vorlesung "Mathematik 2" für Studierende der Fachrichtung "Medieninformatik" Hochschule Bremen / SS 2012 / Dr. H. Scholz Zum Inhalt der Vorlesung Die Vorlesung besteht aus zwei Hauptabschnitten. In der Linearen Algebra wird die Theorie der Vektorräume (Vektorrechnung) behandelt, wobei die Anwendungen auf die analytische Geometrie im Mittelpunkt stehen. Die Beschreibung einfacher geometrischer Objekte in der Ebene und im Raum und die Abbildungen zwischen solchen Objekten sind eine wichtige Grundlage für die Computergrafik. Im zweiten Teil wird dann die reelle Analysis behandelt, wobei es sich größtenteils um aus der Schulmathematik (hoffentlich) bekannte Themen wie Differential- und Integralrechnung handelt. 1 Lineare Algebra und Analytische Geometrie 1.1 Vektorräume - Allgemeine Einführung Anschaulich kann man sich "Vektoren" zunächst als gerichtete Größen vorstellen. Das sind also Größen, die nicht nur durch Angabe eines Zahlenwertes beschrieben werden, sondern zusätzlich noch eine Richtung besitzen. Typische Beispiele sind etwa Kräfte in der Physik. Wenn an einem Punkt mehrere Kräfte angreifen, so darf man deren Beträge nicht einfach addieren, sondern muss sie entsprechend ihrer jeweiligen Wirkungsrichtungen richtig kombinieren: Die Ermittlung der mit einem Fragezeichen versehenen "resultierenden" Kraft ist ein typisches Beispiel für eine Addition von Vektoren. Ungerichtete Größen (in der Physik etwa Masse, Arbeit, Druck, Temperatur etc. ) bezeichnet man in diesem Zusammenhang dann zur besseren Unterscheidung als skalare Größen. Auch in der (analytischen) Geometrie kann man die Vektorrechnung sehr effektiv einsetzen. Hier sind Vektoren im Prinzip gerichtete Strecken, die von einem Punkt zum nächsten führen. Diese geometrischen Anwendungen werden uns (wegen ihrer Bedeutung für die Computer- grafik) im folgenden hauptsächlich interessieren. Mathematik II (MI) SS 2012 - 1 -

Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Embed Size (px)

DESCRIPTION

Zum Inhalt der VorlesungDie Vorlesung besteht aus zwei Hauptabschnitten. In der Linearen Algebra wird die Theorie der Vektorräume (Vektorrechnung) behandelt, wobei die Anwendungen auf die analytische Geometrie im Mittelpunkt stehen. Die Beschreibung einfacher geometrischer Objekte in der Ebene und im Raum und die Abbildungen zwischen solchen Objekten sind eine wichtige Grundlage für die Computergrafik.Im zweiten Teil wird dann die reelle Analysis behandelt, wobei es sich größtenteils um aus der Schulmathematik (hoffentlich) bekannte Themen wie Differential- und Integralrechnung handelt.

Citation preview

Page 1: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Vorlesung "Mathematik 2"

für Studierende der Fachrichtung "Medieninformatik"

Hochschule Bremen / SS 2012 / Dr. H. Scholz

Zum Inhalt der Vorlesung

Die Vorlesung besteht aus zwei Hauptabschnitten. In der Linearen Algebra wird die Theorieder Vektorräume (Vektorrechnung) behandelt, wobei die Anwendungen auf die analytische

Geometrie im Mittelpunkt stehen. Die Beschreibung einfacher geometrischer Objekte in derEbene und im Raum und die Abbildungen zwischen solchen Objekten sind eine wichtigeGrundlage für die Computergrafik.

Im zweiten Teil wird dann die reelle Analysis behandelt, wobei es sich größtenteils um ausder Schulmathematik (hoffentlich) bekannte Themen wie Differential- und Integralrechnunghandelt.

1 Lineare Algebra und Analytische Geometrie

1.1 Vektorräume - Allgemeine Einführung

Anschaulich kann man sich "Vektoren" zunächst als gerichtete Größen vorstellen. Das sindalso Größen, die nicht nur durch Angabe eines Zahlenwertes beschrieben werden, sondernzusätzlich noch eine Richtung besitzen. Typische Beispiele sind etwa Kräfte in der Physik.Wenn an einem Punkt mehrere Kräfte angreifen, so darf man deren Beträge nicht einfachaddieren, sondern muss sie entsprechend ihrer jeweiligen Wirkungsrichtungen richtigkombinieren:

Die Ermittlung der mit einem Fragezeichen versehenen "resultierenden" Kraft ist eintypisches Beispiel für eine Addition von Vektoren. Ungerichtete Größen (in der Physik etwaMasse, Arbeit, Druck, Temperatur etc. ) bezeichnet man in diesem Zusammenhang dann zurbesseren Unterscheidung als skalare Größen.

Auch in der (analytischen) Geometrie kann man die Vektorrechnung sehr effektiv einsetzen.Hier sind Vektoren im Prinzip gerichtete Strecken, die von einem Punkt zum nächsten führen.Diese geometrischen Anwendungen werden uns (wegen ihrer Bedeutung für die Computer-grafik) im folgenden hauptsächlich interessieren.

Mathematik II (MI) SS 2012

- 1 -

Page 2: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Darüber hinaus spielt der Vektorbegriff in der modernen Mathematik eine zentrale Rolle undwird auch in vielen anderen Bereichen nutzbringend eingesetzt, bei denen eine anschaulicheInterpretation als "Pfeile" nicht mehr sinnvoll ist. Wir werden daher zunächst die allgemeineDefinition des Vektorraums als abstrakte algebraische Struktur wiederholen, uns danach aberfast ausschließlich auf die einfachen geometrischen Anwendungen beschränken.

1.1.1 Definition "Vektorraum"

Ein Vektorraum besteht aus einer Menge V, deren Elemente "Vektoren" genannt werden, undeinem zugehörigen Körper K ("Vektorraum V über einem Körper K"). Es sind zweiVerknüpfungen definiert: eine "innere" Verknüpfung ("Vektoraddition", Verknüpfungssymbol "+")

→ x ,

→ y c V x

→ x + →

y c V

eine "äußere" Verknüpfung (Multiplikation eines Vektors mit einem Körperelement)→ x c V, c c K x c

→ x c V

(üblicherweise ohne Verknüpfungssymbol geschrieben).

Diese beiden Verknüpfungen müssen folgenden Axiomen (Rechengesetzen) genügen:

(i) ist eine kommutative Gruppe, das neutrale Element heißt ("Nullvektor")(V, +)→ 0

(ii) für alle , (Assoziativgesetz)(ab)→ x = a(b→

x ) a, b c K→ x c V

(iii) für alle , (a + b)→ x = a

→ x + b

→ x a, b c K

→ x c V

für alle , (Distributivgesetze)a (→ x + →

y ) = a→ x + a

→ y a c K

→ x ,

→ y c V

(iv) für alle 1→ x = →

x→ x c V

Das letzte Axiom (iv) bedeutet, dass das Einselement des Körpers auch neutrales Element fürdie neue externe Multiplikation ist. Das ergibt sich nicht aus den übrigen Axiomen, sondernmuss explizit gefordert werden.

Die Elemente von V heißen dann Vektoren, die Elemente von K werden als Skalare

bezeichnet. Als Skalarenkörper werden wir meistens die reellen Zahlen benutzen. Andere‘

wichtige Beispiele sind ("komplexe Vektorräume") oder Vektorräume über Galois-K = Šfeldern.

Einige "naheliegende" Rechenregeln, die sich direkt aus den Axiomen ableiten lassen, sindz. B.

für alle ,0→ x =

→ 0

→ x c V

für alle ,c→ 0 =

→ 0 c c ‘

für alle .(−1)→ x = −→

x→ x c V

Man beachte, dass auf den beiden Seiten der letzten Gleichung zunächst zwei völlig verschie-dene Dinge stehen: rechts das Inverse von bzgl. der Gruppenoperation, links das Produkt→

x

von mit dem Körperelement "-1".→ x

Mathematik II (MI) SS 2012

- 2 -

Page 3: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.1.2 Bezeichnungsweisen

Statt Vektorraum ist auch die Bezeichnung linearer Raum üblich (engl. vector space oderlinear space). Das Teilgebiet der Mathematik, dass sich mit Vektorräumen und Vektorenbeschäftigt, heißt daher auch lineare Algebra.

Die beiden Operationen (Addition von Vektoren, Multiplikation eines Vektors mit einemKörperelement) fasst man auch unter dem Oberbegriff lineare Operationen zusammen.

Eine Teilmenge von V, die gegenüber den linearen Operationen abgeschlossen ist, stelltselbst wieder einen Vektorraum dar, der als Untervektorraum (oder kurz Unterraum)von V bezeichnet wird.

Nach dem Vorbild der Physik werden die Elemente des Körpers K als Skalare

bezeichnet, der Körper selbst als Skalarenkörper. Typographisch werden Vektoren außer durch Pfeile obendrüber oft auch durch Unter-

streichung oder Fettdruck gekennzeichnet. In älteren Büchern findet man auch noch die(früher weit verbreitete) Schreibweise mit Fraktur- oder Sütterlinbuchstaben. UnterUmständen wird auf eine spezielle typographische Unterscheidung zwischen Vektorenund anderen Größen auch vollkommen verzichtet!

1.1.3 Reelle Standard-Vektorräume

Wir werden uns wie gesagt fast ausschließlich mit reellen Vektorräumen befassen, d. h. mitVektorräumen über dem Körper , und zwar speziell mit den reellen Standardvektorräumen:‘

[ ] ‘, ‘2, ‘3, ..., ‘n, ...

Die Bezeichnungsweisen sind bereits aus dem vorigen Semester bekannt. Es war = n-faches kartesisches Produkt von mit sich selbst‘n ‘

= Menge der n-Tupel reeller Zahlen = (x1, ..., xn) | x1, ..., xn c ‘

Um dies zu einem Vektorraum zu machen, definiert man die linearen Operationen infolgender Weise:

,(x1, ..., xn) + (y1, ..., yn) := (x1 + y1, ..., xn + yn),c (x1, ..., xn) := (cx1, ..., c xn)

d. h. die Addition von Vektoren und die Multiplikation mit reellen Zahlen wird komponen-

tenweise durchgeführt. Man kann nachrechnen, dass damit alle Vektorraum-Axiome erfülltsind (Fleißarbeit), der Nullvektor ist . Der so entstandene Vektorraum wird auch als(0, 0, ..., 0)der arithmetische Vektorraum bezeichnet.‘n

Hinweis: Bei der n-Tupel-Schreibweise hat man die Auswahl zwischen zwei Varianten:

Zeilenschreibweise und Spaltenschreibweise .(x1, ..., xn)x1

:xn

Wir werden später sehen, dass in manchen Fällen die sorgfältige Unterscheidung zwischenZeilen- und Spaltenvektoren eine gewisse Bedeutung hat (z. B. in der Matrizentheorie),ansonsten sind aber beide grundsätzlich gleichberechtigt und gleichbedeutend.

Mathematik II (MI) SS 2012

- 3 -

Page 4: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.1.4 Ortsvektoren und freie Vektoren

Für die Anwendungen in Geometrie, Physik, Technik etc. ist es wichtig, dass man mit denarithmetischen Vektorräumen (insbesondere in den Fällen und ) verschiedene geo-‘2 ‘3

metrische Anschauungen bzw. Interpretationen verbinden kann. (Dass der bzw. die‘2 ‘3

Punktmenge einer Ebene bzw. des dreidimensionalen Raumes darstellen kann, ist aus demvorigen Semester bekannt.) Wir betrachten den einfachsten Fall :‘2

1. OrtsvektorenJedem Punkt wird als Ortsvektor der Pfeil vom Ursprung zu diesem Punkt zugeordnet(x, y)(linke Skizze):

Die Komponenten des Ortsvektors sind also genau die Koordinaten des Endpunktes. (Dassder Ortsvektor als Spalte und der Punkt als Zeile geschrieben wurde, dient nur der besserenUnterscheidung, ist aber keine allgemeingültige Regel.) Die rechte Skizze zeigt die geome-trische Addition zweier Ortsvektoren durch Ergänzung zu einem Parallelogramm (das"Kräfteparallelogramm" der Physiker):

2. "Freie" VektorenEin freier Vektor ist eine Abstraktion, die die Gesamtheit aller Pfeile gleicher Richtung undgleicher Länge repräsentiert (Anfangspunkt beliebig). Er stellt gewissermaßen eine Verschie-bung (Translation) der gesamten Ebene um ein bestimmtes Stück in einer bestimmtenRichtung dar (linke Skizze):

Mathematik II (MI) SS 2012

- 4 -

Page 5: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

In diesem Fall ist die geometrische Vektoraddition noch einfacher zu zeichnen, da man denzweiten Vektor einfach am Endpunkt des ersten ansetzen kann (rechte Skizze).

Verwirrt? - Dann ein paar Tips:

Es handelt sich immer um "denselben" Vektorraum , den man nur mit verschiedenen‘2

Anschauungen verknüpft bzw. auf verschiedene Fragestellungen anwendet. "Positiv denken": die im ersten Moment vielleicht verwirrende Vielfalt spiegelt die große

Flexibilität und vielseitige Verwendbarkeit des neuen "Werkzeugs" Vektorraum wieder! Im Zweifelsfall kann man sich notfalls zunächst immer auf den arithmetischen Vektor-

raum und stures Rechnen zurückziehen - die sinnvollste Interpretation bzw. Nutz-anwendung des Ergebnisses überlegt man sich dann hinterher.

Zum Beispiel liefern die beiden verschiedenen Arten der geometrischen Vektoradditionnatürlich immer dasselbe Ergebnis, das man immer auch durch komponentenweise Additionder beiden Zahlenpaare erhält.

1.1.5 Anwendungsbeispiele

Wir betrachten zwei heuristische Beispiele zur Anwendung von Vektoren im . Die‘2

genauen Einzelheiten werden im weiteren Verlauf des Semesters klar werden.

Beispiel 1:

Bei geometrischen Konstruktionen oder Herleitungen hat man es oft mit folgender Situationzu tun: ausgehend von einem gegebenen Punkt A geht man längs einer gegebenen Geraden gzu einem Zielpunkt B:

Dieser Vorgang

Punkt plus Verschiebung Zielpunkttlässt sich in Vektorsprache beschreiben als

Ortsvektor plus freier Vektor neuer Ortsvektor,twobei der freie Vektor der sogenannte Richtungsvektor der Geraden ist. Man sieht also, dassOrtsvektoren und freie Vektoren auch gemischt werden können (und müssen), um einenbestimmten geometrischen Vorgang korrekt zu beschreiben. (Manche Lehrbücher führen fürdie Addition eines Ortsvektors und eines freien Vektors sogar ein spezielles Additionssymbolein. Das ist auf Dauer aber kaum durchzuhalten und auch eigentlich nicht nötig, wenn mandie anfänglichen Verständnis-Schwierigkeiten erstmal überwunden hat.)

Mathematik II (MI) SS 2012

- 5 -

Page 6: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Beispiel 2:

Die auf ein Segelboot wirkende Kraft ergibt sich aus Windrichtung und Windgeschwindig-keit. Die Richtung dieser Kraft ist direkt die Windrichtung, für die Stärke spielt auch dieSegelstellung noch eine Rolle. Die Fortbewegungsrichtung des Bootes ergibt sich dagegenaus der Ruderstellung. Je stärker diese von der Windrichtung abweicht, desto weniger gutlässt sich der Wind ausnutzen.

Das führt zu einer Art Umkehrung der Vektoraddition: ein gegebener Vektor (Windkraft)muss in eine Summe von zwei Vektoren mit vorgegebenen Richtungen zerlegt werden. Wirwerden später sehen, wie man solche Komponentenzerlegung mit Mitteln der linearenAlgebra einfach durchführen kann. Damit lässt sich also berechnen, welcher Teil derwirkenden Kraft tatsächlich in Vortrieb umgesetzt wird und welcher nutzlos bleibt (odersogar störend wirkt).

1.1.6 Allgemeine Vektorräume

Der Vollständigkeit halber sollen zumindest einige Beispiele allgemeinerer Vektorräume kurzerwähnt werden: "Funktionenräume": Die Menge aller stetigen, reellwertigen Funktionen auf einem

abgeschlossenen Intervall lassen sich auf naheliegende Weise zu einem reellen[a, b] _ ‘Vektorraum machen. Das gleiche gilt z. B. auch für die Menge aller integrierbarenFunktionen auf . Diese Betrachtungsweise ist auch keineswegs nur eine formale[a, b]Spielerei, sondern führt dazu, dass alle Methoden und Resultate der linearen Algebraplötzlich auch auf Problemstellungen der Analysis angewandt werden können!

In der Informatik (speziell Codierungstheorie) spielen auch Vektorräume über endlichenKörpern eine wichtige Rolle. So kann man die Menge aller Bytes als 8-Tupel ausElementen von GF(2) und damit als Vektorraum über GF(2) betrachten, indem man dielinearen Operationen einfach komponentenweise definiert (analog zu den arithmetischenVektorräumen).

Mathematik II (MI) SS 2012

- 6 -

Page 7: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.2 Längen- und Winkelmessung, Skalarprodukt

Vorbemerkung: Die Begriffsbildungen dieses Kapitels lassen sich nicht für allgemeineVektorräume definieren, wir betrachten daher hier grundsätzlich nur reelle Vektorräume.(Das meiste wäre auch noch auf komplexe Vektorräume erweiterbar, worauf wir aberverzichten.) In vielen Fällen werden wir uns der Einfachheit halber sogar auf die reellenStandard-Vektorräume beschränken.‘n

1.2.1 Die Länge eines Vektors

Bereits beim anschaulichen Vektorbegriff waren Länge und Richtung die beiden wesentlichenMerkmale eines Vektors. Für reelle Standard-Vektorräume soll der Längenbegriff jetztpräzisiert und quantifiziert werden.

Im liegt es nahe, den üblichen Längenbegriff der ebenen Geometrie zu benutzen. Nach‘2

dem Satz des Pythagoras ergibt sich für einen (Orts-)Vektor die Länge . Für(x, y) x2 + y2

einen Ortsvektor im erhält man analog die Länge (Pythagoras(x, y, z) ‘3 x2 + y2 + z2

zweimal anwenden). Das führt zu folgender Definition:

Für einen Vektor heißt→ x = (x1, ..., xn) c ‘n

æ→ x æ := x1

2 + ... + xn2

die Länge oder der Betrag des Vektors (auch: "Norm" von ).→ x

→ x

Einfache Eigenschaften:

(1) æ→ x æ = 0 w

→ x =

→ 0

(2) æc→ x æ = c æ

→ x æ

(3) æ→ x + →

y æ [ æ→ x æ + æ→

y æ

Die beiden ersten Eigenschaften sind leicht nachzurechnen. Bei der dritten Eigenschaft("Dreiecksungleichung") ist die direkte Herleitung aus der Definition ebenfalls möglich, abersehr mühsam. Wir begnügen uns daher mit der anschaulichen Begründung, dass der direkteWeg zwischen zwei Punkten immer kürzer ist, als ein Umweg über einen dritten Punkt.(Anders ausgedrückt: in einem Dreieck ist jede einzelne Seite jeweils kürzer als die beidenanderen zusammen - daher der Name.)

Begriffsbildungen und Bezeichnungsweisen: Viele Autoren benutzen statt der doppelten senkrechten Striche auch bei Vektoren nur die

gewöhnlichen einfachen Betragsstriche. Das kann i. a. nicht zu Verwechslungen führen,da man ja sieht, ob dazwischen ein Vektor oder ein Skalar steht. Die deutliche schreib-technische Unterscheidung zwischen dem Betrag einer reellen Zahl und der "Norm" einesVektors ist aber oft auch sehr nützlich - z. B. bei Eigenschaft (2).

Ein Vektor heißt "normiert", wenn gilt. Normierte Vektoren werden→ x c ‘n æ

→ x æ = 1

auch als Einheitsvektoren bezeichnet.

Für , heißt→ x c ‘n →

x !→ 0

1

æ→ x æ

→ x

Mathematik II (MI) SS 2012

- 7 -

Page 8: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

der zugehörige Einheitsvektor. Der Vorgang "Division durch die Länge" heißt +ormieren

eines Vektors.

Bei geometrischen und physikalischen Anwendungen kommt es häufig vor, dass man sich nurfür die Richtung eines Vektors interessiert, während seine Länge eher unerheblich ist. Indiesen Fällen kann man dann von vornherein zu den entsprechenden Einheitsvektoren über-gehen, was den weiteren Rechenaufwand oft erheblich reduziert.

Anmerkung zum Begriff der "Norm":Die angegebene Längendefinition funktioniert nur für reelle Standardvektorräume. Fürallgemeine Vektorräume muss man zunächst überlegen, wie ein sinnvoller Längenbegriffüberhaupt definiert werden kann. Dazu benutzt man genau die drei oben unter "EinfacheEigenschaften" angegebenen Kriterien. Eine auf einem Vektorraum definierte reellwertigeFunktion heißt +orm, wenn sie nur nicht-negative Werte annimmt und diese dreiBedingungen erfüllt. Ein Vektorraum, für den eine solche Norm definiert ist, heißt normierterVektorraum. Zum Beispiel lassen sich auch für einige der früher erwähnten "Funktionen-räume" sinnvolle Normen definieren, was diese Betrachtungsweise besonders fruchtbarmacht. Auch auf dem lassen sich noch andere Normen definieren. Die oben eingeführte‘n

heißt daher genauer "Euklidische Norm", weil sie der Längenmessung im Sinne dereuklidischen Geometrie entspricht.

1.2.2 Das Skalarprodukt

Eines der wichtigsten Hilfsmittel der Vektorrechnung ist das sogenannte Skalarprodukt, dasje zwei Vektoren eine reelle Zahl ("Skalar") zuordnet. Schreibweise:

, .→ x $

→ y = c

→ x ,

→ y c V, c c ‘

Wir verzichten auch hier wieder auf die allgemeine Definition, die besagt, wann eineAbbildung als Skalarprodukt bezeichnet wird, und begnügen uns mit dem für unsV % Vt ‘

wichtigsten Fall der Vektorräume .‘n

Definition:

Für , , heisst→ x ,

→ y c ‘n →

x = (x1, ..., xn) → y = (y1, ..., yn)

→ x $

→ y := x1 y1 + x2 y2 + ... + xn yn c ‘

das "Skalarprodukt" von und .→ x

→ y

Bemerkungen:

Der Punkt als Operationssymbol wird beim Skalarprodukt immer hingeschrieben! In"komplizierteren" Vektorräumen werden daneben auch ganz andere Schreibweisenbenutzt, z. B. statt .< →

x ,→ y > →

x $→ y

Das Wort "Skalarprodukt" bezieht sich darauf, dass zwar zwei Vektoren miteinanderverknüpft werden, das Ergebnis ("Produkt") aber ein Skalar ist.

Insbesondere ist das Skalarprodukt sprachlich und begrifflich sauber von der Multi-plikation "Skalar mal Vektor" (Grundoperation des Vektorraums) zu unterscheiden!Leider wird das Wort "Skalarmultiplikation" manchmal (schlampigerweise) sowohl fürden einen als auch für den anderen Vorgang benutzt - was wirklich gemeint ist, ergibt sichdann nur aus dem Kontext.

Mathematik II (MI) SS 2012

- 8 -

Page 9: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Numerisches Beispiel:

, :→ x = (2, −1, 3) →

y = (7, 2, −5)→ x $

→ y = 2 $ 7 + (−1) $ 2 + 3 $ (−5) = 14 − 2 − 15 = − 3

Die wichtigsten Eigenschaften (Rechenregeln) für das Skalarprodukt sind:

(1) für (c→ x ) $→

y = c (→ x $

→ y ) = →

x $ (c→ y ) →

x ,→ y c ‘n, c c ‘

(2) für → x $ (→

y + → z ) = →

x $→ y + →

x $→ z

→ x ,

→ y ,

→ z c ‘n

(3) für → x $

→ y = →

y $→ x

→ x ,

→ y c ‘n

(4) für → x $

→ x = æ→

x æ2 → x c ‘n

Eigenschaften (1) und (2) besagen, dass das Skalarprodukt mit den Vektorraum-Operationen verträglich ist ("Linearität" des Skalarprodukts).

Eigenschaft (3) heißt "Symmetrie" des Skalarprodukts. (Man vermeidet hier dieBezeichnung "Kommutativität", da es sich nicht um eine Verknüpfung im engerenalgebraischen Sinne handelt, sondern eher um eine reellwertige Funktion von zweiVariablen.)

Eigenschaft (4) zeigt den engen Zusammenhang zwischen Skalarprodukt undLängenmessung auf.

1.2.3 Orthogonalität

In diesem und dem folgenden Abschnitt werden wir sehen, dass man mit dem Skalarproduktnicht nur die Längen- sondern auch die Winkelmessung vollständig beherrscht.

Wir beginnen mit dem wichtigen Sonderfall der Orthogonalität: Zwei Vektoren des ‘n

heißen orthogonal, wenn sie aufeinander senkrecht stehen, d. h. einen Winkel von 90°einschliessen.

Für den Test auf Orthogonalität liefert das Skalarprodukt ein einfaches Kriterium:

Zwei Vektoren sind genau dann orthogonal, wenn ihr Skalarprodukt→ x ,

→ y c ‘n

;ull ist:→ x Ω

→ y w

→ x $

→ y = 0

Zur Begründung betrachtet man das aus den Vektoren und gebildete Dreieck:→ x ,

→ y

→ x − →

y

Für die Länge von gilt mit obiger Gleichung (4):→

x − → y

Mathematik II (MI) SS 2012

- 9 -

Page 10: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

æ→ x − →

y æ2 = (→ x − →

y ) $ (→ x − →

y ) = → x $

→ x − 2

→ x $

→ y + →

y $→ y

= æ→ x æ2 + æ→

y æ2 − 2→ x $

→ y

Wenn und orthogonal sind, gilt aber nach Pythagoras , → x

→ y æ

→ x − →

y æ2 = æ→ x æ2 + æ→

y æ2

also muss sein. Offensichtlich gilt auch die Umkehrung, wobei zu bedenken ist,→ x $

→ y = 0

dass das Skalarprodukt natürlich auch dann Null wird, wenn einer der beteiligten Vektorender Nullvektor ist. Damit obiges Kriterium uneingeschränkt gilt, legt man daher (willkürlich)fest: "Der Nullvektor ist orthogonal zu jedem Vektor".

Beispiele:

Damit ist es jetzt auch leicht, zu einem gegebenen Vektor einen orthogonalen zu finden. Seietwa im der Vektor gegeben. Das Nullwerden des Skalarprodukts lässt sich‘2 →

x = (3, 1)offenbar leicht erzwingen, indem man als orthogonalen Vektor benutzt. Die→

y = (−1, 3)Merkregel lautet: "Komponenten vertauschen und bei einer das Vorzeichen ändern". (Da wirim sind, ist klar, dass man alle übrigen zu orthogonalen Vektoren dann als Vielfache‘2 →

x

von diesem erhält.)→ y

Im hat man sehr viel mehr Möglichkeiten, zu einem gegebenen Vektor einen orthogonalen‘3

zu finden. Ist etwa gegeben, so setzt man einfach eine der drei Komponenten→ x = (3, 1, −2)

auf Null und wendet für die beiden anderen denselben Trick wie oben an. Zu orthogonale→ x

Vektoren sind also etwa:(0, 2, 1), (−2, 0, −3), (−1, 3, 0), ...

1.2.4 Winkelmessung

Für Vektoren und , die nicht orthogonal sind, sondern einen beliebigen Winkel → x

→ y

einschließen, kann man qualitativ dieselbe Skizze wie oben benutzen, wobei das Dreieck jetztaber nicht mehr rechtwinklig ist. Statt des Pythagoras benutzt man daher den "Cosinussatz",der besagt, dass in einem ebenen Dreick mit den Seiten a, b, c gilt:

,c2 = a2 + b2 − 2ab cos

wobei der Winkel zwischen a und b ist. In die vektorielle Schreibweise übersetzt heißt das:

.æ→ x − →

y æ2 = æ→ x æ2 + æ→

y æ2 − 2æ→ x ææ

→ y æ cos

Der Vergleich mit der durch Ausmultiplizieren hergeleiteten Gleichung für (sieheæ→ x − →

y æ2

oben) ergibt in diesem Fall:

mit .→ x $

→ y = æ→

x ææ→ y æ cos =Õ(→

x ,→ y )

Diese Formel ist für die Arbeit mit Skalarprodukten von zentraler Bedeutung. Man kann sieeinerseits als alternative Möglichkeit zur Berechnung des Skalarprodukts ansehen, wennnämlich die Größen der rechten Seite (Längen der Vektoren und eingeschlossener Winkel)bekannt sind. Häufiger dient sie aber umgekehrt zur Berechnung des Winkels aus demSkalarprodukt:

cos =→ x $

→ y

æ→ x ææ

→ y æ

Zur Ermittlung von muss man dann noch die Arcuscosinus-Funktion anwenden, diebekanntlich Werte zwischen 0 und liefert. Man erhält also immer den kleineren (nichtüberstreckten) Winkel zwischen den beiden Vektoren. Qualitativ sollte man sich merken:

Mathematik II (MI) SS 2012

- 10 -

Page 11: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

stumpfer Winkel (90° < < 180°)uSkalarprodukt negativ

Orthogonalität ( 90°) =uSkalarprodukt Null

spitzer Winkel (0° < < 90°)uSkalarprodukt positiv

1.2.5 Komponentenzerlegung

Als drittes liefert die Cosinusformel auch noch eine anschauliche Interpretation für dasSkalarprodukt, und zwar im Zusammenhang mit der bereits in 1.1.5 erwähnten Grundaufgabeder Komponentenzerlegung eines Vektors.

Aufgabenstellung: Ein gegebener Vektor soll in zwei zueinander senkrechte Komponenten→ a

zerlegt werden, von denen einer in eine vorgegebene Richtung zeigt.→ b

Gesucht ist also eine Darstellung

,→ a = →

aæ + → aΩ

wobei ein Vielfaches von ist ("parallel" zu ) und senkrecht auf steht. Stellt man→ aæ

→ b

→ b

→ aΩ

→ b

sich diese Addition als "Kräfteparallelogramm" vor, so ist dieses Parallelogramm also sogar

ein Rechteck, dessen Diagonale gerade das gegebene sein muss. Eine der Rechtecksseiten→ a

muss auf liegen:→ b

Die Seiten dieses Rechtecks sind offenbar die gesuchten Zerlegungskomponenten.

Die Richtung von ist bekannt, nämlich genau die Richtung des vorgegebenen . Die→ aæ

→ b

Länge von ermittelt man mit elementarer Trigonometrie (Definition des Cosinus am→ aæ

rechtwinkligen Dreieck) unter Benutzung des Winkels : =Õ(→ a ,

→ b )

cos = AnkatheteHypotenuse

→ aææ

æ→ a æ

u æ→ aææ = æ→

a æ cos

Mathematik II (MI) SS 2012

- 11 -

Page 12: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Die rechte Seite tritt auch in der Cosinusformel für das Skalarprodukt auf, so dass manweiterschreiben kann:

(*)æ→ aææ =

→ a $

→ b

æ→ b æ

Damit sind Richtung und Länge von bekannt, also kann man diesen Vektor (und daraus→ aæ

folgend dann auch ) jetzt konkret angeben:→ aΩ

, .→ aæ =

→ a $

→ b

æ→ b æ2

→ b

→ aΩ = →

a − → aæ

Bemerkungen:

Dass die Länge von im Nenner quadratisch auftritt, liegt daran, dass man zunächst→ b

→ b

durch seine eigene Länge dividiert (um einen Einheitsvektor zu erhalten) und dann mitder gewünschten Länge gemäß (*) multipliziert.

Man beachte, dass die obige Herleitung nur für den Fall gilt, dass und einen spitzen→ a

→ b

Winkel einschließen, das Skalarprodukt also positiv ist. Andernfalls muss man sichgenauere Gedanken über Vorzeichen machen. Die erhaltene Zerlegungsformel gilt zwarwieder allgemein, nicht aber das Zwischenergebnis (*). Nur wenn man das Skalarproduktzwischen Betragsstriche setzt, ist auch diese Formel immer richtig.

Die Gleichung (*) beinhaltet die angekündigte anschauliche Bedeutung des Skalar-

produkts. Die Länge von ist die Länge der "senkrechten Projektion von auf "→ aæ

→ a

→ b

(siehe Skizze) oder anschaulich ausgedrückt: die Länge des "Schattens", den bei→ a

senkrechtem Lichteinfall auf wirft. Diese Länge wird also im Prinzip durch das→ b

Skalarprodukt (genauer: dessen Betrag) geliefert, allerdings leider noch multipliziert mit

der Länge von .→ b

Da der Vektor nur zur Vorgabe einer Richtung dient, ist es sinnvoll, für von→ b

→ b

vornherein einen Einheitsvektor zu benutzen. Dann bedeutet das Skalarprodukt direkt diebesagte Schattenlänge und die Formeln für die Komponentenzerlegung werden besonderseinfach:

, .→ aæ = (→

a $→ b )

→ b

→ aΩ = →

a − → aæ

Das ist einer der Gründe, warum viele Anwender (Physiker, Ingenieure etc.) alleVektoren, deren Länge nicht von Bedeutung ist, immer möglichst sofort normieren.

Da das Skalarprodukt also dazu dienen kann, aus den Anteil herauszufiltern, der in→ a

Richtung von zeigt, ist es insbesondere bei Physikern oft üblich, das Skalarprodukt → b

als "a in b" auszusprechen.→ a $

→ b

Hat man es mit Vektoren aus dem zu tun, so kann man die Komponentenzerlegung‘2

auch ohne Skalarprodukt bewältigen. Man bastelt sich mit dem früher erwähnten Trick

einen zu senkrechten Vektor und macht den Ansatz . Das liefert zwei→ b

→ c

→ a

!= x→ b + y

→ c

lineare Gleichungen für die Unbekannten x und y. Der Rechenaufwand ist i. a. nichtgrößer als bei Benutzung des Skalarprodukts. Bereits im funktioniert dieses Verfahren‘3

aber nicht mehr!

Mathematik II (MI) SS 2012

- 12 -

Page 13: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Anwendungsbeispiel:

Auf einen Massenpunkt in der Ebene wirke die konstante Kraft . Der Punkt kann→ F = (1, 2)

sich aber nur auf einer Schiene bewegen, die in der Richtung verläuft. Um→ b = (2, 1)

festzustellen, welcher Anteil der Kraft wirksam in Beschleunigung umgesetzt wird, ist in→ F

zwei Komponenten parallel bzw. senkrecht zu zu zerlegen. Es gilt:→ b

.→ Fæ =

→ F $

→ b

æ→ b æ2

→ b =

(1, 2) $ (2, 1)4 + 1 (2, 1) = 4

5 (2, 1)

Der Anteil bleibt für die Beschleunigung wirkungslos, kann aber→ FΩ =

→ F −

→ Fæ = 3

5 (−1, 2)

z. B. für die Berechnung der auftretenden Reibung in der Führungsschiene nützlich sein.Alternativer Anastz gemäß obiger Bemerkung: . Das liefert (1, 2) != x (2, 1) + y (1, −2)

und , woraus man letztlich ebenfalls und erhält.2x + y = 1 x − 2y = 2 x = 4/5 y = −3/5

Mathematik II (MI) SS 2012

- 13 -

Page 14: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.3 Lineare Unabhängigkeit, Basis und Dimension

1.3.1 Linearkombinationen, lineares Erzeugnis

In einem Vektorraum V über einem Körper K heißt jeder Ausdruck der Form

(mit und )a1→ x1 + a2

→ x2 + ... + an

→ xn a1, a2, ..., an c K

→ x1 ,

→ x2 , ...,

→ xn c V

eine Linearkombination der Vektoren . (Dabei ist n eine natürliche Zahl .)→ x1 ,

→ x2 , ...,

→ xn m 1

Ist eine Menge von Vektoren fest vorgegeben, so heißt die Menge allerM = → x1 ,

→ x2 , ...,

→ xn

damit gebildeten Linearkombinationen das lineare Erzeugnis von M (engl. "span"):

.span (M) = a1→ x1 + a2

→ x2 + ... + an

→ xn : a1, a2, ..., an c K

Hinweis: Eine solche Menge ist offenbar gegenüber den Vektorraum-Operationenabgeschlossen, bildet also selbst wieder einen Vektorraum. Daher wird oft auch alsspan (M)der von M erzeugte (oder "aufgespannte") Unterraum bezeichnet.

Beispiele für Linearkombinationen von zwei bzw. drei Vektoren im sind etwa‘2

bzw. .2, 5 2−1 + (−3) 3

7 2 11 + 2

3 − 8 45

Da in der Definition erlaubt ist, gilt aber auch ein Ausdruck der Form bereitsn = 1 5 3−1

als "Linearkombination".

Das Erzeugnis einer einelementigen Menge (d. h. eines einzelnen Vektors) sieht also wiefolgt aus:

, span ( 3−1 ) = a

3−1 : a c ‘

es handelt sich also um alle Vielfachen des gegebenen Vektors.

Für die zweielementige Menge hat manM = 2−1 , −6

3

.span (M) = span ( 2−1 , −6

3 ) = a2

−1 + b−63 : a, b c ‘

Beachte: Da der zweite erzeugende Vektor ein Vielfaches des ersten ist, würde jeder derbeiden Vektoren auch bereits alleine denselben Unterraum aufspannen!

Dagegen ist etwa

,span ( 2−1 , 1

3 ) = a2

−1 + b13 : a, b c ‘ = ‘2

diese beiden Vektoren erzeugen also bereits den gesamten . (Das sieht man vielleicht nicht‘2

auf Anhieb, aber weiter unten wird klar, warum sich das ohne weitere Rechnung sofort sagenlässt.)

Ein Beispiel im :‘3

span (110

,111

,001

) = ... ?

Mathematik II (MI) SS 2012

- 14 -

Page 15: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.3.2 Lineare Unabhängigkeit

An den obigen Beispielen sieht man, dass es wünschenswert ist, die erzeugende Mengejeweils so zu "optimieren", dass sie nicht unnötig viele Vektoren enthält. Dazu dient diefolgende Begriffsbildung.

Eine Menge von Vektoren heißt linear unabhängig, wenn sich kein M = → x1 ,

→ x2 , ...,

→ xn

als Linearkombination der übrigen darstellen lässt.→ x i

Äquivalente Formulierungen hierfür sind: Man kann keinen Vektor aus M weglassen, ohne dass dadurch verkleinert wird.span (M)

Aus folgt immer .a1→ x1 + a2

→ x2 + ... + an

→ xn =

→ 0 a1 = a2 = ... = an = 0

(in Worten: Der Nullvektor lässt sich nicht als "echte" Linearkombination der Vektoren darstellen.)→

x1 ,→ x2 , ...,

→ xn

Die letztgenannte Eigenschaft liefert auch ein praktisches Verfahren, mit dem man imkonkreten Fall die lineare Abhängigkeit oder Unabhängigkeit von Vektoren explizitnachprüfen kann.

Spezialfälle: Im Falle einer einelementigen Menge M hat man sich auf folgende Konvention geeinigt:

ein einzelner Vektor gilt immer als linear unabhängig, der Nullvektor selbst→ x !

→ 0

dagegen ist linear abhängig. (Das wirkt zunächst etwas gequält, aber damit bleibt dasobige Prüf-Kriterium formal immer gültig!)

Zwei Vektoren sind genau dann linear abhängig, wenn sie Vielfache voneinander sind.Wirklich Rechnen und/oder Denken muss man also erst ab drei Vektoren!

Beispiele im :‘3

(1) Die drei Vektoren sind linear abhängig.→ x1 =

110

,→ x2 =

111

,→ x3 =

001

Begründung: ist eine Linearkombination der beiden anderen, nämlich .→ x2

→ x2 = →

x1 + → x3

(Das heißt auch, dass man weglassen kann, ohne das Erzeugnis zu verkleinern.→ x2

Außerdem liefert eine nicht-triviale Darstellung des Nullvektors.)→ x1 − →

x2 + → x3 =

→ 0

(2) Die drei Vektoren sind offenbar linear unabhängig.→ x1 =

100

,→ x2 =

010

,→ x3 =

001

(3) Ein etwa schwierigeres Beispiel liefern . → x1 =

123

,→ x2 =

231

,→ x3 =

312

Es gibt zwar keine "offensichtlichen" Abhängigkeiten, zum tatsächlichen Nachweis derUnabhängigkeit kommt man aber um das explizite Nachrechnen des obigen Kriteriums

nicht herum. Man macht also den Ansatz und erhält daraus für a,a→ x1 + b

→ x2 + c

→ x3 =

→ 0

Mathematik II (MI) SS 2012

- 15 -

Page 16: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

b, c das lineare Gleichungssystem

,a + 2b + 3c = 0,2a + 3b + c = 0,3a + b + 2c = 0

aus dem man mit etwas Mühe tatsächlich herausbekommt, dass nur a = b = c = 0möglich ist.

1.3.3 Basis und Dimension

Jeder Vektor lässt sich offenbar schreiben als→ a = x

y c ‘2

,xy = x

10 + y

01

d. h. die Vektoren und spannen den gesamten auf. Das gilt auch für viele andere10

01 ‘2

Paare von Vektoren aus dem , während das Erzeugnis eines einzelnen Vektors offenbar nie‘2

den gesamten Raum ergeben kann. Andererseits findet man unter drei Vektoren im ‘2

garantiert immer mindestens einen, der sich als Linearkombination der beiden anderenschreiben lässt, d. h. drei (oder mehr) Vektoren im können nie linear unabhängig sein.‘2

Diese Erkenntnis ist die Motivation für folgende Definition:

Es seien Vektoren eines Vektorraums V. Die Menge heißt→ b1 ,

→ b2 , ...,

→ bn

→ b1 ,

→ b2 , ...,

→ bn

Basis von V, wenn die folgenden beiden Aussagen gelten:

(i) linear unabhängig→ b1 ,

→ b2 , ...,

→ bn

(ii) span (→ b1 ,

→ b2 , ...,

→ bn ) = V

Beachte: Wegen (i) kann man keinen Vektor weglassen, ohne (ii) zu verletzen; wegen (ii)kann man keinen Vektor hinzufügen, ohne (i) zu verletzen. Man sagt auch: Eine Basis istsowohl ein "minimales Erzeugendensystem" als auch eine "maximale linear unabhängigeMenge".

Aus der Tatsache, dass man bei einer Basis weder Vektoren weglassen noch hinzufügenkann, folgt nicht etwa, dass die Basis eines Vektorraums eindeutig ist. Man kann nämlichdurchaus einzelne Vektoren gegen geeignete andere austauschen, ohne dass die Basis-Eigenschaft verloren geht. Ein Vektorraum hat daher viele verschiedene Basen. Es gilt aber:

Alle Basen eines Vektorraums haben gleich viele Elemente. Diese Anzahl heißt die

Dimension des Vektorraums.

In den reellen Standardvektorräumen benutzt man gerne die folgenden "Standardbasen":

: ‘2 10

,01

: ‘3

100

,010

,001

Mathematik II (MI) SS 2012

- 16 -

Page 17: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

: ‘n

100:0

,

010:0

,

001:0

, ... ,

000:1

Die üblichen "Komponenten" eines Vektors sind in diesem Sinne also nichts anderes als dieKoeffizienten, die man für die Darstellung des Vektors als Linearkombination dieserspeziellen Basisvektoren benötigt.

An diesen Standardbasen sieht man auch, dass tatsächlich gilt, d. h. unsere neuedim ‘n = n

Definition stimmt mit dem "naiven" Dimensionsbegriff überein.

(Spätestens jetzt ist auch klar, warum beim letzten Beispiel in Abschnitt 1.3.1 der ganze ‘2

herauskommen muss: Die beiden Vektoren sind offensichtlich nicht Vielfache voneinander,also linear unabhängig. Im sind zwei linear unabhängige Vektoren aber bereits‘2

notwendigerweise eine Basis.)

Mathematik II (MI) SS 2012

- 17 -

Page 18: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.4 Vektorprodukt und Spatprodukt

Das Vektorprodukt ist ein spezielles Konstrukt, das es nur im gibt. Dort ist es für gewisse‘3

geometrische Fragestellungen aber ein sehr nützliches Hilfsmittel.

1.4.1 Definition und Rechenregeln

Das Vektorprodukt ist eine Verknüpfung, die je zwei Vektoren des wieder einen solchen‘3

Vektor zuordnet:.→

x ,→ y c ‘3 x

→ x %

→ y c ‘3

(Wegen des benutzten Verknüpfungssymbols wird das Vektorprodukt manchmal auch als"Kreuzprodukt" bezeichnet.) Die Berechnungsvorschrift lautet:

.x1

x2

x3

%

y1

y2

y3

:=x2 y3 − x3 y2

−x1 y3 + x3 y1

x1 y2 − x2 y1

Diese kompliziert aussehende Formel sollte man nicht auswendiglernen, sondern sich lieberdas Konstruktionsprinzip merken: jede Komponente des Vektorprodukts entsteht jeweils ausden beiden anderen Komponenten der beiden Faktoren, die "über Kreuz" multipliziert undsubtrahiert werden. Die korrekte Verteilung der Vorzeichen erfordert allerdings einigeSorgfalt.

Beispiel: .13

−2%

2−15

:=13−9− 7

In einem späteren Kapitel (über Determinanten) werden wir eine einfache Merkregel fürdieses Berechnungsverfahren kennenlernen.

Die folgenden Rechenregeln beinhalten zunächst nur die "Verträglichkeit" des Vektor-produkts mit den beiden Vektorraum-Operationen:

für (→ x ) %→

y = → x % (→

y ) = (→ x %

→ y ) c ‘,

→ x ,

→ y c ‘3

für → x % (→

y + → z ) = →

x %→ y + →

x %→ z

→ x ,

→ y ,

→ z c ‘3

für (→ x + →

y ) %→ z = →

x %→ z + →

y %→ z

→ x ,

→ y ,

→ z c ‘3

Für das Vektorprodukt charakteristisch sind dagegen folgende Eigenschaften:

für → x %

→ x =

→ 0

→ x c ‘3

für → x %

→ y = −→

y %→ x

→ x ,

→ y c ‘3

Letzteres heißt auch die "Anti-Kommutativität" des Vektorprodukts.

Hinweis: Da das Ergebnis des Vektorprodukts wieder ein Vektor ist, kann man hier auchDreifach- (oder Mehrfach-)Produkte betrachten. Hierfür gilt aber nicht das Assoziativgesetz!Die Produkte

und (→ x %

→ y ) %→

z→ x % (→

y %→ z )

liefern also i. a. unterschiedliche Vektoren. Glücklicherweise braucht man solche Dreifach-produkte sehr selten. Bei Bedarf kann man sie auch auf einfachere Operationen zurückführen("Graßmann-Identität"):

Mathematik II (MI) SS 2012

- 18 -

Page 19: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

(→ x %

→ y ) %→

z = (→ x $

→ z )→

y − (→ y $

→ z )→

x

1.4.2 Geometrische Bedeutung

Bildet man das Skalarprodukt eines Vektorprodukts mit einem seiner Faktoren, so rechnetman leicht nach, dass gilt

und ,→ x $ (→

x %→ y ) = 0

→ y $ (→

x %→ y ) = 0

d. h. das Vektorprodukt steht senkrecht auf seinen beiden Faktoren. Damit kann manalso zu zwei Vektoren im Raum einen dritten finden, der auf beiden senkrecht steht. Manbeachte aber, dass das nur funktioniert, wenn die gegebenen Vektoren linear unabhängig sind.Wenn sie dagegen parallel (also Vielfache voneinander) sind, so gibt es zwar sehr vieleorthogonale Vektoren, das Vektorprodukt liefert aber keinen davon, sondern nur denNullvektor (siehe oben)!

Auch die Länge des Vektorprodukts hat eine geometrische Bedeutung. Es gilt

mit .æ→ x %

→ y æ = æ→

x ææ→ y æ sin =Õ(→

x ,→ y )

Anschaulich ist das bekanntlich der Flächeninhalt des von und aufgespannten→ x

→ y

Parallelogramms.

Wenn und linear unabhängig sind, so gibt es trotzdem noch genau zwei Vektoren, die→ x

→ y

die genannten Eigenschaften bezüglich Richtung und Länge besitzen. Diese unterscheidensich nur noch durch das Vorzeichen. Um vorhersehen zu können, welchen von diesen beidendas Vektorprodukt tatsächlich liefert, muss man noch folgendes wissen:

Die Vektoren bilden ein Rechtssystem.→ x ,

→ y ,

→ x %

→ y

(Man kann das auch andersherum betrachten: Das Vektorprodukt liefert die Möglichkeit, aufdem eine "Orientierung"einzuführen, d. h. eine objektive Definition der Begriffe "rechts"‘3

und "links".)

Ein Rechtssystem ist wie folgt definiert: Man betrachte die Drehung, die den ersten Vektorauf dem kürzesten Wege in die Richtung des zweiten überführt. Der dritte zeigt dann in dieRichtung, in die eine Rechtsschraube sich bei einer solchen Drehung bewegen würde. (Daman es im Alltag bei Schrauben, Wasserhähnen etc. fast nur mit Rechtsgewinden zu tun hat,hat man normalerweise kein Problem, sich diese Richtung anschaulich vorzustellen.)

Als Merkregel kann man auch die sogenannte "Rechte-Hand-Regel" verwenden: Benutzt manden Daumen der rechten Hand für und den Zeigefinger für , so zeigt das Vektorprodukt→

x→ y

in Richtung des Mittelfingers, d. h. zur Handinnenseite.

Bemerkung: Die Richtungen der (positiven) Koordinatenachsen in der Reihenfolge x, y, zbilden bei der in der Mathematik üblichen Anordnung ein Rechtssystem. In manchen Grafik-programmen (CAD-Systeme) ist das anders. Lässt man etwa die z-Achse nach unten zeigen,so entsteht ein Linkssystem.

Mathematik II (MI) SS 2012

- 19 -

Page 20: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.4.3 Das Spatprodukt

Bildet man ein Produkt aus drei Vektoren, indem man zunächst von zweien das Vektor-produkt bildet und dann das Skalarprodukt des Ergebnisses mit dem dritten Vektor, so erhältman das sogennannte "Spatprodukt" der drei Vektoren :

→ x ,

→ y ,

→ z c ‘3

.→ x $ (→

y %→ z ) c ‘

Aus den geometrischen Eigenschaften des Vektorprodukts und des Skalarprodukts ergibt sichohne allzu viel Mühe die Tatsache, dass das Spatprodukt das Volumen des "Parallelepipeds"liefert, das von den drei Vektoren aufgespannt wird. Ein Parallelepiped (auch "Spat") kannman sich am besten als Verallgemeinerung eines Quaders vorstellen, bei dem auf die Recht-winkligkeit verzichtet wurde. Alle sechs Seitenflächen sind also Parallelogramme, gegenüber-liegende Seitenflächen sind aber immer noch parallel:

Die sechs möglichen Permutationen der drei beteiligten Vektoren müssen daher bis aufsVorzeichen immer dasselbe Ergebnis liefern. Es gilt:

→ x $ (→

y %→ z ) = →

y $ (→ z %

→ x ) = →

z $ (→ x %

→ y )

= − → x $ (→

z %→ y ) = − →

z $ (→ y %

→ x ) = − →

y $ (→ x %

→ z )

Bemerkungen:

(1) Wenn man das Vektorprodukt als ersten Faktor des Skalarprodukts schreibt, gibt es nochweitere Varianten, die wegen der Kommutativität des Skalarprodukts aber nichts Neuesliefern.

(2) Das Vorzeichen ist für ein geometrisches Volumen natürlich bedeutungslos und spiegeltnur die aus der (willkürlichen) Reihenfolge der drei Vektoren resultierende Orientierungwider.

(3) In Anwendungsbereichen, in denen viel mit Spatprodukten gearbeitet wird, ist esmanchmal üblich, die Beklammerung und die Verknüpfungssymbole komplettwegzulassen. Man muss dann also wissen, dass mit einem Ausdruck wie

→ x

→ y

→ z

dann immer das Spatprodukt gemeint ist!

Mathematik II (MI) SS 2012

- 20 -

Page 21: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.5 Geraden und Ebenen

Mit diesem Abschnitt steigen wir in die Anwendung der Vektorrechnung auf die analytischeGeometrie ein. Es liegt im Wesen der linearen Algebra, dass sich die einfachen "linearen"(d. h. nicht gekrümmten) Objekte "Gerade" und "Ebene" auf diese Weise besonders gutbeschreiben lassen.

Sowohl im als auch im ist das Erzeugnis (der "span") eines einzelnen Vektors ( )‘2 ‘3 !→ 0

immer ein eindimensionaler Unterraum - anschaulich eine Gerade durch den Ursprung. DasErzeugnis zweier linear unabhängiger Vektoren im ist ein zweidimensionaler Unterraum,‘3

was anschaulich eine Ebene durch den Ursprung darstellt.

Da ein Unterraum immer den Nullvektor enthalten muss, sind beliebige Geraden und Ebenen,die nicht durch den Ursprung gehen, also keine Unterräume mehr. Sie lassen sich abervektoriell sehr gut beschreiben, indem man sie als "aus dem Ursprung heraus verschobeneUnterräume" betrachtet.

1.5.1 Geraden in der Ebene

Eine beliebige Gerade g in der Ebene beschreibt man vorzugsweise durch die sogenannte"Punkt-Richtungs-Form" der Geradengleichung, z. B.:

,x

y=

13

+ 2

−1 c ‘

Der erste Vektor ist ein Ortsvektor zu einem (beliebig wählbaren!) Punkt der Geraden - imBeispiel ist das der Punkt (1,3). Der zweite Vektor ist ein freier Vektor, der die Richtung derGeraden angibt. Wenn man den Vorfaktor dieses Vektors ganz durchlaufen lässt, so ‘

durchläuft die angegebene Vektorsumme offenbar genau alle Punkte der Geraden. Andersausgedrückt: Der zweite Summand ist der "span" des Vektors (2,-1), der erste Summandverschiebt diesen Unterraum in die gewünschte Position.

Mathematik II (MI) SS 2012

- 21 -

Page 22: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Zusammenfassung:

Die Punkt-Richtungs-Form der Geradengleichung im lautet‘2

, .→ x = →

p + → a c ‘

Dabei heißt der Aufpunkt, der Richtungsvektor und der Parameter. → p

→ a

Diese Darstellung wird auch als "Parameterdarstellung" der Geraden bezeichnet.

Bemerkungen: Da der Aufpunkt beliebig auf der Geraden wählbar ist und auch der Richtungsvektor

durch ein beliebiges (auch negatives) Vielfaches ersetzt werden kann, ist dieseDarstellung alles andere als eindeutig. Jede Gerade besitzt also viele verschiedeneParameterdarstellungen. Umgekehrt kann man zwei solchen Darstellungen nicht ohneweiteres ansehen, ob sie vielleicht dieselbe Gerade beschreiben!

Sobald Aufpunkt und Richtungsvektor einmal festgelegt sind, gibt es eine eindeutigeZuordnung zwischen den Werten von und den Punkten der Gerade. Die Gerade wirddamit zu einem Exemplar der Zahlengeraden , wobei das die "Beschriftung" liefert‘ (mit dem Aufpunkt als Nullpunkt).

Zu zwei verschiedenen Punkten gibt es bekanntlich immer genau eine Verbindungsgerade.

Sind und die beiden gegebenen Punkte, so benutzt man einfach als Aufpunkt und→ p1

→ p2

→ p1

den Differenzvektor als Richtungsvektor. Die Verbindungsgerade lautet dann→ p2 − →

p1

, .→ x = →

p1 + (→ p2 − →

p1) = → p2 + (1 − ) →

p1 c ‘

Diese Darstellung heißt auch Zwei-Punkte-Form der Geradengleichung.

Beispiel:

Zwei verschiedene Geraden im können entweder parallel sein oder sich schneiden. Diese‘2

Unterscheidung kann man direkt an den Richtungsvektoren ablesen: Zwei Geraden sindgenau dann parallel, wenn ihre Richtungsvektoren parallel (d. h. Vielfache voneinander) sind.(Man beachte aber, dass dies noch die Möglichkeit einschliesst, dass die Geraden überhauptidentisch sind. Um das zu überprüfen kann man z. B. testen, ob der Aufpunkt der einenGeraden auch die andere Geradengleichung erfüllt.)

Wenn die Richtungsvektoren nicht parallel sind, möchte man natürlich den Schnittpunktermitteln. Da dieser Punkt beide Geradengleichungen erfüllen muss, geht das einfach durchGleichsetzen:

,g1 :x

y=

13

+ 2

−1 c ‘

,g2 :x

y=

34

+ 23

c ‘

Die Richtungsvektoren sind nicht parallel, also existiert ein Schnittpunkt S, für den geltenmuss:

13

+ 2

−1!=

34

+ 23

Mathematik II (MI) SS 2012

- 22 -

Page 23: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Dies ist eine Vektorgleichung für die zwei unbekannten Größen und . Komponenten- weise geschrieben liefert das zwei gewöhnliche Gleichungen mit zwei Unbekannten:

1 + 2 = 3 + 23 − = 4 + 3

Daraus erhält man (z. B. mit dem üblichen Eliminationsverfahren) , . Setzt man = − 12 = 1

2

dieses in die Gleichung für ein oder das in die Gleichung für , so erhält man g1 g2

beidemale denselben Punkt, nämlich den Schnittpunkt .S = (2, 52 )

1.5.2 Geraden im Raum

Sowohl die Punkt-Richtungs-Form (Parameterdarstellung) als auch die Zwei-Punkte-Formder Geradengleichung sehen im formal genauso aus wie im . Die beteiligten Vektoren‘3 ‘2

haben jetzt allerdings drei statt zwei Komponenten, also etwa:

, .x

y

z

=102

+ 3

−12

c ‘

Dass zwei Geraden parallel (ggf. sogar identisch) sind, erkennt man wieder daran, dass dieRichtungsvektoren Vielfache voneinander sind. Anders als im müssen sich nicht-parallele‘2

Geraden im Raum aber nicht notwendig schneiden. Häufiger ist sogar der Fall, dass sie dasnicht tun ("windschiefe" Geraden). Rechnerisch bekommt man das heraus, indem mandenselben Ansatz für die Schnittpunktsberechnung macht wie im (d. h. Gleichsetzen der‘2

beiden Parameterdarstellungen). Liest man die entstehende vektorielle Gleichung wiederkomponentenweise, so entstehen diesmal drei gewöhnliche lineare Gleichungen für die zweiUnbekannten und . Wenn diese Gleichungen widersprüchlich sind, gibt es keine Lösung, also auch keinen Schnittpunkt.

1.5.3 Ebenen im Raum

Auch zur Beschreibung von Ebenen im Raum gibt es eine Punkt-Richtungs-Form. Da es sichum zweidimensionale Objekte handelt, braucht man jetzt natürlich zwei (linear unabhängige)Richtungsvektoren und auch zwei Parameter, also z. B.

, .x

y

z

=102

+ 3

−12

+ 01

−5, c ‘

Allgemein:

Punkt-Richtungs-Form der Ebenengleichung im : ‘3

, .→ x = →

p + → a +

→ b , c ‘

Man kann dies wieder ansehen als den von und aufgespannten Unterraum, der dann mit→ a

→ b

Hilfe des Aufpunkts an die gewünschte Position verschoben wird:→ p

Mathematik II (MI) SS 2012

- 23 -

Page 24: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Auch diese Darstellung ist natürlich nicht eindeutig. Man kann für einen beliebigen Punkt→ p

der Ebene nehmen und für und ein beliebiges Paar aufspannender Vektoren.→ a

→ b

Die Frage, ob zwei in dieser Form gegebene Ebenen parallel (oder sogar identisch) sind, istdeutlich schwieriger zu beantworten als bei Geraden. Im Prinzip muss man prüfen, ob diebeiden Paare von Richtungsvektoren denselben Unterraum aufspannen. Etwas einfacher gehtes unter Benutzung des +ormalenvektors - siehe unten.

Eine Ebene im Raum ist bekanntlich durch drei nicht-kollineare Punkte eindeutig festgelegt.

Sind drei solche Punkte , und gegeben, so kann man die zugehörige Ebene hin-→ p1

→ p2

→ p3

schreiben indem man etwa als Aufpunkt benutzt und die Differenzvektoren von zu den→ p1

→ p1

beiden anderen Punkten als Richtungsvektoren:

, → x = →

p1 + (→ p2 − →

p1) + (→ p3 − →

p1) = (1 − − ) → p1 + →

p2 + → p3 , c ‘

Dies ist die Drei-Punkte-Form der Ebenengleichung.

Wenn Geraden und Ebenen im Raum durch ihre Parameterdarstellungen gegeben sind, kannman die Standardaufgaben der analytischen Geometrie zu Schnittmengenberechnungen(Schnittgerade zweier Ebenen, Schnittpunkt einer Gerade mit einer Ebene etc.) i. a. durcheinfaches Gleichsetzen der jeweiligen Formeln und Lösen der enstehenden linearenGleichungssysteme bewältigen. Für letzteres reicht meistens ein "unsystematisches"Eliminationsverfahren, wie man es aus der Schule kennt (Beispiele in den Übungsaufgaben).Einen etwas professionelleren Umgang mit linearen Gleichungssystemen lernen wir in einemspäteren Kapitel kennen.

1.5.4 Der ;ormalenvektor einer Ebene

Für eine Ebene E im heißt jeder Vektor , der senkrecht auf der Ebene steht, ein‘3 → n

+ormalenvektor von E. Ist die Ebene in der Form

→ x = →

p + → a +

→ b

gegeben, so muss also sowohl zu als auch zu orthogonal sein. Bei der in 1.5.3→ n

→ a

→ b

angegebenen Ebene muss man also einen Vektor finden, der zu (3,-1,2) und (0,1,-5)orthogonal ist. Das leistet bekanntlich das Vektorprodukt, also

Mathematik II (MI) SS 2012

- 24 -

Page 25: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

.→ n = (3, −1, 2) % (0, 1, −5) = (3, 15, 3)

Es ist klar, dass mit auch jedes Vielfache ein Normalenvektor ist. (Im obigen Beispiel→ n

könnte man etwa den gemeinsamen Faktor 3 zur Vereinfachung herausdividieren oder auchgleich zum Normaleneinheitsvektor übergehen.) Weitere Möglichkeiten gibt es aber nicht, dadie Normalenrichtung einer Ebene offenbar eindeutig ist.

Der Normalenvektor ist ein wichtiges Hilfsmittel für den Umgang mit Ebenen. TypischeAnwendungen sind etwa:

(A) Parallelität und eigungswinkel

Zwei Ebenen sind genau dann parallel, wenn ihre Normalenvektoren parallel sind. Statt dermühsamen Überprüfung, ob die beiden erzeugenden Vektoren der einen Ebene denselbenUnterraum aufspannen wie die erzeugenden Vektoren der anderen Ebene, reicht also dieBerechnung der beiden Normalenvektoren. Sind diese Vielfache voneinander, so sind dieEbenen parallel. Auch der Neigungswinkel zwischen zwei Ebenen, der elementargeometrischgar nicht so leicht zu ermitteln ist, lässt sich einfach auf den Winkel zwischen den Normalen-vektoren zurückführen.

(B) Unterscheidung von "Vorderseite" und "Rückseite"

Bei der Berechnung eines Normalenvektors ist das Vorzeichen noch mehr oder wenigerwillkürlich (Reihenfolge des Vektorprodukts!). Sobald man sich aber für einen Normalen-vektor entschieden hat, sind dadurch die beiden Seiten der Ebene unterscheidbar geworden.Man stelle sich etwa vor, dass die Ebene aus 1.5.3 in einem 3D-Computerspiel eine Wandrepräsentiert. Von zwei Spielfiguren, die sich in den Punkten und A = (4, 4, 3) B = (3, −5, −2)befinden, möchte man jetzt wissen, ob sie auf derselben Seite der Ebene stehen oder aufverschiedenen. Dazu berechnet man zunächst die Richtungsvektoren vom Aufpunkt derEbene zu den Punkten A und B und dann deren Skalarprodukte mit dem oben berechnetenNormalenvektor:

→ a = (4, 4, 3) − (1, 0, 2) = (3, 4, 1) u

→ a $

→ n = 72 > 0

.→ b = (3, −5, −2) − (1, 0, 2) = (2, −5, −4) u

→ b $

→ n = − 81 < 0

Positives Skalarprodukt bedeutet einen spitzen Winkel, also steht A auf der Seite, zu der derNormalenvektor zeigt. Negatives Skalarprodukt bedeutet einen stumpfen Winkel, also steht Bauf der anderen Seite. Ähnliche Fragestellungen kommen häufig vor. Ist etwa A der Stand-punkt des Betrachters und B eine Lichtquelle, so kann man auf dieselbe Art feststellen, ob Adie beleuchtete oder die unbeleuchtete Seite der Fläche sieht.

(C) Reflexionsverhalten

Auch die Reflexion von Lichtstrahlen an einer Ebene (z. B. für Ray-Tracing-Verfahren) lässtsich mit Hilfe des Normalenvektors beschreiben. Dazu muss man wissen, dass das physikali-sche Reflexionsgesetz neben "Einfallswinkel gleich Ausfallswinkel" auch besagt, dasseinfallender Strahl, reflektierter Strahl und Normalenvektor in einer gemeinsamen Ebeneliegen. Ist Q der Ort der Lichtquelle und P der Punkt, in dem der Lichtstrahl die Ebene trifft,

so betrachtet man zunächst den Vektor (also die dem einfallenden Strahl entgegen-→ q =

→ PQ

gesetzte Richtung) und zerlegt diesen in seine Komponenten parallel und senkrecht zumNormalenvektor. Daraus kann man dann durch eine einfache Vorzeichenänderung den

Richtungsvektor des reflektierten Strahls berechnen:→ r

Mathematik II (MI) SS 2012

- 25 -

Page 26: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

In Formeln ausgedrückt:

.→ q = →

qæ + → qΩ u

→ r = →

qæ − → qΩ = 2

→ qæ − →

q

Unter Benutzung der bekannten Zerlegungsformel liefert das das vektorielle Reflexionsgesetz:

.→ r = 2

→ q $

→ n

æ→ n æ2

→ n − →

q

(Bei Benutzung des Normaleneinheitsvektors wird diese Formel wieder besonders einfach!)

(D) Hessesche ormalenform

Bildet man das Skalarprodukt eines Normalenvektors mit der Punkt-Richtungs-Form der

Ebenengleichung, so werden die Produkte und (wegen der Orthogonalität) zu→ n $

→ a

→ n $

→ b

Null und es bleibt:

bzw. .→ n $

→ x = →

n $→ p

→ n $ (→

x − → p ) = 0

Letzteres heißt "Hessesche Normalenform" der Ebenengleichung. Sie ist besonders gut

geeignet, um zu testen, ob ein gegebener Punkt auf der Ebene liegt oder nicht. Da und → x0

→ n

feste Vektoren sind, ist ihr Skalarprodukt einfach eine reelle Konstante d, so dass man die→ p

Hesseform auch wie folgt schreiben kann:

.→ n $

→ x = d

Denkt man sich das linksstehende Skalarprodukt komponentenweise ausmultipliziert, soerhält man die in der "klassischen" (d. h. nicht-vektoriellen) analytischen Geometrie üblicheEbenengleichung:

.E = (x, y, z) c ‘3 | a x + b y + c z = d

Dass die Koeffizienten a, b und c dabei den Normalenvektor liefern, ist elementargeometrisch(also ohne Vektoren und Skalarprodukte) gar nicht so leicht zu erkennen!

Mathematik II (MI) SS 2012

- 26 -

Page 27: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.5.5 Konvexe Kombinationen

Macht man in der Zwei-Punkte-Form der Geradengleichung

, ,→ x = →

p2 + (1 − ) → p1 c ‘

die zusätzliche Einschränkung , so erhält man nicht mehr die gesamte Gerade,0 [ [ 1sondern nur noch die Strecke zwischen den beiden Punkten und .

→ p1

→ p2

Allgemein definiert man: Eine Linearkombination

, und )a1→ x1 + a2

→ x2 + ... + an

→ xn (a1, a2, ..., an c ‘

→ x1 ,

→ x2 , ...,

→ xn c ‘

n

heißt konvexe Kombination, wenn gilt

(für alle ) und .0 [ a i [ 1 i = 1, ... , n a1 + a2 + $ $ $ +an = 1

Eine konvexe Kombination von zwei Vektoren liefert immer eine Strecke, bei drei Vektorenerhält man i. a. ein Dreieck, z. B. im :‘3

(Falls die drei Punkte zufällig auf einer Geraden liegen, erhält man natürlich wieder nur eineStrecke.)

Vier Punkte in der Ebene liefern im allgemeinen Fall als konvexe Kombination das vondiesen Punkten gebildete (unregelmäßige) Viereck. Es kann aber auch nur ein Dreieck sein,wenn nämlich der vierte Punkt sowieso schon im Innern dieses Dreiecks liegt.

Im Raum ist die konvexe Kombination von vier Punkten im allgemeinen Fall ein(unregelmäßiges) Tetraeder.

Bemerkung zur Begriffsbildung: Eine Teilmenge des heißt konvex, wenn sie zu je zwei‘n

Punkten immer auch die gesamte Verbindungsstrecke enthält. (Einbuchtungen, Aushöh-lungen und dergleichen sind also verboten.) Konvexe Kombinationen liefern genau die"konvexe Hülle" der gegebenen Punkte, d. h. die kleinstmögliche konvexe Menge, die diesePunkte enthält. Im kann man sich das anschaulich durch ein um die gegebenen Punkte‘2

gespanntes Gummiband vorstellen.

Mathematik II (MI) SS 2012

- 27 -

Page 28: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.6 Matrizen

1.6.1 Definition und einfache Eigenschaften

Eine Matrix (Plural: Matrizen, engl. Plural: matrices) ist ein rechteckiges Zahlenschema,z. B.

.1, 4 3 − 2, 7

5 − 0, 9 17

(Die Einträge werden bei uns immer reelle Zahlen sein. Man kann Matrizen aber auch ausElementen anderer Körper bilden.)

Ist m die Zeilenanzahl und n die Spaltenanzahl dieses Schemas, so spricht man von einer . Obiges Beispiel ist also eine -Matrix. (Dass die erste Angabe sich auf diem % n − Matrix 2 % 3

Zeilen bezieht und die zweite auf die Spalten, ist eine allgemeingültige Konvention fürMatrizen, Merkregel: "Zeile zuerst, Spalte später".)

Zur formalen Benennung von Matrixelementen benötigt man eine Doppelindizierung. DasElement in der i-ten Zeile und der j-ten Spalte einer Matrix A heißt dann etwa (auch hiera i, j

wieder: erster Index = Zeile, zweiter Index = Spalte). Für eine -Matrix A ergibt das diem % n

Schreibweise:

A =

a1,1 a1,2 $ $ $ a1, n

a2,1 a2,2 $ $ $ a2, n

: : :am ,1 am ,2 $ $ $ am , n

oder kurz:

, .A = (ai, j) 1 [ i [ m, 1 [ j [ n

Wenn es gefahrlos möglich ist, lässt man das Komma zwischen den Indizes der Einfachheithalber auch gerne weg. Man schreibt dann also und auch , , .... Letzteres wird abera i j a11 a12

trotzdem "a-eins-eins", "a-eins-zwei" usw. ausgesprochen, nicht etwa "a-elf", "a-zwölf"!

Eine Matrix mit heißt quadratische Matrix.n = m

Die sogenannte Hauptdiagonale einer Matrix besteht aus den Elementen a11, a22, a33, ...(Zeilenindex = Spaltenindex). Sie beginnt also immer mit dem Element in der linken oberenEcke und verläuft nach rechts unten. Bei nicht-quadratischen Matrizen endet sie aber nicht inder rechten unteren Ecke - was man von einer Diagonalen vielleicht erwarten würde - sondernirgendwo am rechten bzw. unteren Rand.

Die zu einer Matrix A transponierte Matrix, geschrieben als , erhält man durchAT

Spiegelung an der Hauptdiagonalen. Das bedeutet, dass Zeilen und Spalten ihre Rollentauschen. Ist A eine -Matrix, so ist eine -Matrix. Je nach der genauen Form derm % n AT n %m

Matrix kann das wie folgt aussehen:

Mathematik II (MI) SS 2012

- 28 -

Page 29: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

In diesem Sinne sind also etwa die beiden folgenden Matrizen transponiert zueinander:

−1 0 23 −5 −8

v

−1 30 −52 −8

Quadratische Matrizen ändern ihre Form beim Transponieren natürlich nicht:

Eine quadratische Matrix, für die sogar gilt , heißt symmetrische Matrix.A = AT

Bemerkung:Wir hatten schon in Abschnitt 1.1.3 gesehen, dass man bei Vektoren des zwischen Zeilen-‘n

und Spaltenschreibweise unterscheiden kann. Im Zusammenhang mit Matrizen wird dieseUnterscheidung auch inhaltlich wichtig: Ein Zeilenvektor des ist eine -Matrix.‘n 1 % n

Ein Spaltenvektor des ist eine -Matrix.‘n n % 1 Der Wechsel zwischen Zeilen- und Spaltenschreibweise entspricht matrizentheoretisch

dem Transponieren.Manchmal ist es auch sinnvoll, sich klarzumachen, dass eine -Matrix einfach nur eine1 % 1reelle Zahl ist.

1.6.2 Rechenoperationen

(A) Grundoperationen

Eine Matrix A kann man mit einem Skalar (d. h. einer reellen Zahl) multiplizieren. Diesgeschieht elementweise, d. h. es wird jedes einzelne Matrixelement mit diesem Faktormultipliziert:

, .A = (ai, j) u c A := (c $ a i, j) 1 [ i [ m, 1 [ j [ n, c c ‘

Konkretes Beispiel:

31 0 −23 −2 7

=3 0 −69 −6 21

Ebenso kann man zwei Matrizen vom gleichen Typ (d. h. beide haben gleiche Zeilen- undgleiche Spaltenzahl) elementweise addieren. Dazu denkt man sich die beiden Matrizen"übereinandergelegt" und addiert jeweils die beiden Elemente an gleicher Position. Formalheißt das:

, .A = (ai, j), B = (bi, j) u A + B := (a i, j + bi, j) 1 [ i [ m, 1 [ j [ n

Auch hier wieder ein konkretes Besispiel:

Mathematik II (MI) SS 2012

- 29 -

Page 30: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1 0 −23 −2 7

+0 0 5

−2 −1 3=

1 0 31 −3 10

Aus diesen Definitionen kann man direkt ablesen, dass die "üblichen" Rechenregeln gelten.Z. B. ist die Addition kommutativ, die Multiplikation mit Skalaren ist distributiv gegenüberder Matrizenaddition usw. Kurzgefasst kann man sagen, dass die Menge aller -Matrizenm % n

(für festes m und n) mit den genannten Operationen selbst wieder einen Vektorraum über ‘

bildet. Der "Nullvektor" ist natürlich die Nullmatrix, deren Einträge sämtlich Null sind.

(B) Matrizenmultiplikation

Die Multiplikation von Matrizen ist ein wesentlich komplizierterer Vorgang. Damit für zweiMatrizen A und B das Matrizenprodukt AB überhaupt definiert werden kann, müssen sie"zueinander passen", genauer: die Spaltenzahl von A muss mit der Zeilenzahl von B

übereinstimmen. Wenn A eine -Matrix ist, so muss also B eine -Matrix sein (das km % n n % k

ist dann wieder beliebig).

Ist diese Bedingung erfüllt, so definiert man das Produkt als diejenige -Matrix,C = AB m % k

die an der Position den Wert des Skalarprodukts aus der i-ten Zeile von A und der j-ten(i, j)Spalte von B enthält. Die Berechnung eines einzelnen Elements der Produktmatrix sieht alsoschematisch wie folgt aus:

$ $ $

1 0 −2$ $ $

$ $ $

$

$ $ 3 $ $$ $ −5 $ $$ $ 1 $ $

=

$ $ $ $ $

$ $ 1 $ $$ $ $ $ $

$ $ $ $ $

Angegeben sind die zweite Zeile von A und die dritte Spalte von B. Wegen der Bedingungdes "Zusammenpassens" sind das zwei gleichlange Vektoren. Diese multipliziert man imSinne des Skalarprodukts und erhält . Dieser Wert wird in die1 $ 3 + 0 $ (−5) + (−2) $ 1 = 1zweite Zeile und dritte Spalte der Produktmatrix eingetragen. Die gesamte Produktmatrixerhält man, indem man diesen Vorgang für alle Zeilen von A und alle Spalten von Bdurchführt.

Formelmäßig kann man diesen Prozess wie folgt hinschreiben:

für c i , j = a i, 1 b 1, j + a i, 2 b 2, j + $ $ $ + a i, n b n , j 1 [ i [ m, 1 [ j [ k

oder kürzer

für .c i , j =n

=1 a i, b , j 1 [ i [ m, 1 [ j [ k

Beispiel:

3 −1−2 01 5

$3 01 4

=8 −4

−6 08 20

Die angegebenen Formelausdrücke für das Matrizenprodukt braucht man etwa dann, wennman Programm-Code zur Matrizenmultiplikation schreiben will (zur Übung empfohlen!). Fürdas Rechnen "von Hand" ist es sinnvoller, sich nur die prinzipielle Vorgehensweise einzu-prägen. Als Hilfsmittel kann dabei das sogenannte Falk-Schema dienen, bei dem die beidenzu multiplizierenden Matrizen in einer speziellen Weise "über Eck" angeordnet werden:

Mathematik II (MI) SS 2012

- 30 -

Page 31: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Der markierte Wert , der aus Zeile i und Spalte j entsteht, wird genau im Kreuzungspunktc i j

eingetragen. Dadurch entsteht in der rechten unteren Ecke des Schemas die Produktmatrix.Mit etwas Übung kann man die Matrizen aber genauso gut multiplizieren, wenn sie direktnebeneinander stehen.

(C) Rechenregeln

Sofern die entsprechenden Matrizenprodukte überhaupt definiert sind, verhält sich dieMatrizenmultiplikation assoziativ und distributiv:

, .(A $ B) $ C = A $ (B $ C) A $ (B + C) = A $ B + A $ C

Für die erste Gleichung muss A mit B und B mit C zusammenpassen, für die zweiteGleichung muss A sowohl mit B als auch mit C zusammenpassen. (Schon die Addition istnatürlich nur möglich, wenn B und C dieselbe Form haben.)

Die Frage nach der Kommutativität kann man sinnvollerweise nur dann stellen, wenn dieMatrizenprodukte AB und BA beide definiert sind und gleichgroße Ergebnisse liefern. Da diesoffenbar nur bei quadratischen Matrizen A und B der Fall ist, gehen wir darauf erst imnächsten Abschnitt ein.

Die quadratische -Matrix, die in der Hauptdiagonale Einsen und sonst nur Nullenn % n

enthält, heißt n-reihige Einheitsmatrix, kurz :En

E2 =1 00 1

, E3 =1 0 00 1 00 0 1

, E4 =

1 0 0 00 1 0 00 0 1 00 0 0 1

, ...

(Wenn die gemeinte Größe aus dem Zusammenhang klar ist, schreibt man oft auch nur E statt .)En

Ist A eine -Matrix, so gilt und . Dies schreibt man oft auch nur inm % n Em $ A = A A $ En = A

der vereinfachten Form und , weil die richtige Größe der jeweils zuE $ A = A A $ E = A

benutzenden Einheitsmatrizen sich aus der Gestalt von A zwingend ergibt.

Als wichtigen Sonderfall wollen wir noch Matrizenprodukte betrachten, bei denen einer derFaktoren ein Vektor ist. Die Regel über das Zusammenpassen besagt in diesem Fall offenbar,dass ein Zeilenvektor nur von links an eine Matrix passen kann, ein Spaltenvektor nur vonrechts:

-Matrix mal -Matrix liefert -Matrix1 % n n % k 1 % k

-Matrix mal -Matrix liefert -Matrixm % n n % 1 m % 1

Mathematik II (MI) SS 2012

- 31 -

Page 32: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Das Ergebnis ist also jeweils wieder ein Zeilen- bzw. Spaltenvektor. Schematisch:

In diesem Sinne kann man übrigens auch das Skalarprodukt selbst als Matrizenprodukt einesZeilen- und eines Spaltenvektors auffassen. Manche Autoren legen sogar Wert darauf, beiSkalarprodukten immer den ersten Faktor als Zeile und den zweiten als Spalte zu schreiben,weil alles andere matrizentheoretisch unsinnig ist. (Die Variante "Spalte mal Zeile" wäresogar zulässig, würde als Matrizenprodukt aber eine -Matrix liefern!)n % n

1.6.3 Quadratische Matrizen

Sind A und B quadratische Matrizen gleicher Größe, so sind die Produkte AB und BA beidedefiniert und die Produktmatrizen sind vom gleichen Typ wie die Faktoren. Bezeichnet manmit die Menge aller -Matrizen, so ist die Matrizenmultiplikation hierauf alsoMn(‘) n % n

sogar eine "Verknüpfung" im algebraischen Sinne. Diese Verknüpfung besitzt auch einneutrales Element, nämlich die Einheitsmatrix . Es handelt sich aber nicht um eineEn

Gruppenverknüpfung, da die Inversenbildung nicht immer möglich ist. Die Frage, wann zueiner Matrix eine "inverse Matrix" mit existiert, wird uns späterA c Mn A− 1 A $ A−1 = En

noch genauer beschäftigen.

Die Menge wird auch als "Matrizenring" der Ordnung n über bezeichnet. Mit demMn(‘) ‘

Wort "Ring" bezeichnet man allgemein eine algebraische Struktur, in der eine Addition undeine Multiplikation mit den "üblichen" Rechengesetzen erklärt sind und die bezüglich derAddition die Gruppenaxiome erfüllt. Im Gegensatz zu einem Körper wird aber nicht dieExistenz von multiplikativen Inversen gefordert (sogar nicht einmal die Existenz eines

Einselements). Der bekannteste Ring ist die Menge Z der ganzen Zahlen. Andere Ringe,

denen man auch als Nicht-Mathematiker gelegentlich begegnen kann, sind z. B. Polynom-

ringe. Polynome kann man bekanntlich addieren, subtrahieren und multiplizieren. EineDivision ist dagegen nur in Einzelfällen möglich, im allgemeinen aber nicht.

Die Matrizenringe sind "nicht-kommutative Ringe mit Einselement". Das bedeutet,Mn(‘)dass es ein neutrales Element bezüglich der Multiplikation gibt (nämlich die Einheitsmatrixder passenden Größe), die Matrizenmultiplikation i. a. aber nicht kommutativ ist:

, aber .1 20 3

$2 11 0

=4 13 0

2 11 0

$1 20 3

=2 71 2

Zum Schluss noch eine Bemerkung zu Produkten quadratischer Matrizen mit Vektoren, dadiese für uns im nächsten Abschnitt besonders wichtig werden. Einen Vektor der richtigenLänge kann man immer auf zwei Arten mit einer quadratischen Matrix multiplizieren:entweder von links (als Zeile) oder von rechts (als Spalte). Beides muss sauber unterschiedenwerden, da es i. a. unterschiedliche Ergebnisse liefert:

aber .(1, 2 ) 2 3

1 0= ( 4, 3 ) 2 3

1 012

=81

Mathematik II (MI) SS 2012

- 32 -

Page 33: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.7 Abbildungen von Vektorräumen

1.7.1 Lineare Abbildungen

Bei Abbildungen zwischen Vektorräumen interessiert man sich natürlich vorwiegend fürsolche, die mit der Vektorraum-Struktur "verträglich" sind. Die entsprechende Definitionlautet:

Eine Abbildung zwischen zwei Vektorräumen über demselben Skalaren-f : V1 t V2

körper K heißt lineare Abbildung, wenn gilt:

(i) für alle f (→ x + →

y ) = f (→ x ) + f (→

y ) → x ,

→ y c V1

(ii) für alle f (c→ x ) = c f (→

x ) c c K,→ x c V1

Bedingung (i) besagt, dass es egal sein soll, ob man zwei Vektoren erst addiert und dann

abbildet, oder umgekehrt. Bedingung (ii) ist die analoge Forderung für die Multiplikation mitSkalaren.

Sind und reelle Standardvektorräume, so lassen sich viele bekannte geometrischeV1 V2

Operationen (Drehungen, Spiegelungen, Streckungen, Scherungen, ...) durch lineareAbbildungen beschreiben. Anschaulich bedeutet die "Linearität", dass im allgemeinenGeraden in Geraden und Ebenen in Ebenen überführt werden. (Genauer gilt, dass Unterräumeauf Unterräume abgebildet werden, es kann aber z. B. auch eine Ebene zu einer Geradenwerden.) Allerdings folgt aus den obigen Bedingungen sofort, dass für lineare Abbildungenimmer gilt

,f (→ 0 ) =

→ 0

d. h. der Nullvektor (Koordinatenursprung) bleibt immer fest. Als Drehungen treten also nurDrehungen um den Ursprung auf, als Spiegelungen nur solche an Ursprungsgeraden etc. Wirwerden aber später sehen, dass man sich von dieser Einschränkung verhältnismäßig leichtbefreien und dann auch beliebige Drehungen, Spiegelungen etc. behandeln kann.

Lineare Abbildungen zwischen reellen Standardvektorräumen hat man auch rechnerisch sehrgut im Griff:

Ist eine lineare Abbildung, so lässt sich f durch eine -Matrix Af : ‘n t ‘m m % n

beschreiben:.f (→

x ) = A→ x

Auf der rechten Seite steht das Matrizenprodukt aus A und dem Spaltenvektor . Aus→ x c ‘n

Abschnitt 1.6.2 wissen wir, dass das Ergebnis dann in der Tat ein (Spalten-)Vektor der Längem ist.

Die Matrix A heißt die "der Abbildung f zugeordnete Matrix". Sie ist durch f eindeutigbestimmt. Umgekehrt liefert jede solche Matrix in der Tat eine lineare Abbildung.

Bemerkung:

Die Vereinbarung, die zugeordnete Matrix so zu definieren, dass der Funktionswert durch"Matrix mal Spalte" gegeben ist, ist zunächst willkürlich. Einige Autoren benutzen auch die

Mathematik II (MI) SS 2012

- 33 -

Page 34: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Variante "Zeile mal Matrix" (wird aber zunehmend seltener). Beide Vorgehensweisen sindgrundsätzlich gleichwertig und unterscheiden sich nur dadurch, dass alle Matrizen zutransponieren sind. Wichtig zu wissen ist das vor allem dann, wenn man Bücher, die sich indiesem Punkt unterscheiden, parallel benutzen will (oder muss).

1.7.2 Beispiele linearer Abbildungen

Mit etwas Übung kann man einer Matrix das qualitative Verhalten der von ihr geliefertenAbbildung ungefähr ansehen. Dafür betrachten wir zunächst den einfachsten Fall einerAbbildung und überlegen uns, was mit den Vektoren der Standardbasis passiert:f : ‘2 t ‘2

, , .A =a b

c d

a b

c d

10

=a

c

a b

c d

01

=b

d

Das heißt: Die Spalten der Matrix sind die Bildvektoren der Standardbasis. Da dieStandardbasis genau aus den Einheitsvektoren in Richtung der Koordinatenachsen besteht,weiß man also schon mal, was mit diesen Achsen passiert.

Beispiele:

(1) d. h. ,3 00 1

2

10x

30

,01x

012

also in x-Richtung eine Streckung um den Faktor 3, in y-Richtung um den Faktor 12

("Stauchung")

(2) d. h. ,0 −11 0

10x

01

,01x

−10

also offenbar eine Drehung um 90°

(3) d. h. ,0 11 0

10x

01

,01x

10

Spiegelung an der ersten Winkelhalbierenden

(4) d. h. ,1 10 1

10x

10

,01x

11

die x-Achse bleibt fest, die y-Achse wird zur Winkelhalbierenden - insgesamt ergibt daseine Abbildung, die man in der Elementargeometrie als "Scherung" bezeichnet.

(5) Mit etwas elementarer Trigonometrie kann man sich auch überlegen, wie die Matrixeiner Drehung (um den Ursprung) mit beliebigem Drehwinkel aussehen muss:

cos − sinsin cos

Grundsätzlich funktioniert die anschauliche Interpretation der Matrixspalten natürlichgenauso für Abbildungen . Allerdings ist es hier schon deutlich schwieriger, sichf : ‘3 t ‘3

allein aus den Bildern der Standardbasis eine Anschauung vom Wirken der Abbildung zuverschaffen. (Wer ein gutes räumliches Vorstellungsvermögen hat, ist klar im Vorteil!) Wirbetrachten daher nur ein sehr einfaches Beispiel:

Mathematik II (MI) SS 2012

- 34 -

Page 35: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

0 −1 01 0 00 0 1

Die letzte Spalte besagt, dass die z-Achse fest bleibt. Die ersten beiden Spalten haben alsletzte Komponente jeweils eine Null, also wird die x-y-Ebene insgesamt in sich selbstabgebildet. Durch Vergleich mit obigem Beispiel (2) sieht man genauer, dass es sich um eine90°-Drehung handelt. Insgesamt beschreibt die Matrix also die 90°-Drehung um die z-Achse.Damit ist auch klar, wie eine beliebige Drehung um die z-Achse aussehen muss, nämlich:

cos − sin 0sin cos 0

0 0 1

Drehungen um die x-Achse bzw. die y-Achse lassen sich ganz analog konstruieren.Drehungen um beliebige Achsen, sind dann schon wesentlich schwieriger.

Bemerkung:

Die Hintereinanderausführung (Verkettung) von linearen Abbildungen entspricht demMatrizenprodukt der zugehörigen Matrizen. Betrachtet man etwa die beiden Abbildungen ausPunkt (2) und (3) des obigen Beispiels, so kann man diese auf zwei Arten verketten:

"erst Drehung, dann Spiegelung" liefert 0 11 0

0 −11 0

=1 00 −1

"erst Spiegelung, dann Drehung" liefert 0 −11 0

0 11 0

=−1 00 1

Es ist also offenbar nicht egal, in welcher Reihenfolge man die Abbildungen verkettet(Nicht-Kommutativität des Matrizenprodukts!). Man beachte auch, dass die zuerst

anzuwendende Abbildung als rechter Faktor des Matrizenprodukts zu schreiben ist. Das liegtdaran, dass wir vereinbart haben, die Argumente (Vektoren) immer von rechts an dieMatrizen dranzumultiplizieren.

1.7.3 Affine Abbildungen

Lineare Abbildungen bzw. sind zwar grundsätzlich gut geeignetf : ‘2 t ‘2 f : ‘3 t ‘3

um geometrische Operationen wie Streckungen, Drehungen, Spiegelungen, Scherungen etc.zu beschreiben, die Fixierung des Ursprungs bedeutet aber doch eine lästige Einschränkung.

Durch eine einfache Erweiterung kann man aber erreichen, dass auch Streckungen undDrehungen mit beliebigen Zentren sowie Spiegelungen und Scherungen mit beliebigenAchsen darstellbar werden. Dazu reicht es, einen einzigen neuen Typ von Abbildungenhinzuzunehmen, nämlich die Translationen.

Eine Translation verschiebt die gesamte Ebene (oder den gesamten Raum) in einerbestimmten Richtung um eine feste Distanz. Vektoriell bedeutet das nur die Addition einesfesten Vektors:

.f : ‘n t ‘n, f (→ x ) = →

x + → a ,

→ a c ‘n fest

Der konstante Vektor heißt "Translationsvektor".→ a

Mathematik II (MI) SS 2012

- 35 -

Page 36: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Beispiel:

x

yx

x

y+

2−1

Dies stellt eine Translation der Ebene um 2 in x-Richtung und um -1 in y-Richtung dar.

Definition:Jede Abbildung , die sich als beliebige Kombination von linearen Abbildungenf : ‘n t ‘n

und Translationen darstellen lässt, heißt affine Abbildung.

Jede affine Abbildung lässt sich in der Standardform

f (→ x ) = A

→ x + →

a

schreiben.

Beispiel:

x

yx

1 −10 3

x

y+

2−1

Als konkrete Beispiele wollen wir die 90°-Drehung um das Zentrum und die(2, −1)Spiegelung an der Geraden durch und als affine Abbildungen konstruieren. Für(−1, 0) (0, −1)die Drehung schieben wir erst das gewünschte Zentrum in den Ursprung, wenden dann diebekannte 90°-Drehung um den Ursprung an (lineare Abbildung!) und schieben zurück:

f 1 :x

yx

0 −11 0

(x

y+

−21

) +2

−1

Die Addition von bewirkt gerade die Verschiebung des Punktes in den(−2, 1) (2, −1)Ursprung. Das Ergebnis wird mit der Drehmatrix multipliziert. Die Addition von (2, −1)bewirkt dann das Zurückschieben des Ursprungs nach .(2, −1)

Durch Ausmultiplizieren und Zusammenfassen erhält man die Standardform derkonstruierten affinen Abbildung:

$ $ $ =0 −11 0

x

y+

0 −11 0

−21

+2

−1

=0 −11 0

x

y+

−1−2

+2

−1=

0 −11 0

x

y+

1−3

Für die Spiegelung verfährt man ganz analog:

f 2 :x

yx

0 −1−1 0

(x

y+

10

) +−10

Man beachte, dass man hier bei der ersten Translation noch mehrere Möglichkeiten hat, da esegal ist, welcher Punkt der gegebenen Geraden im Ursprung landet. Anschließend kommt dieSpiegelung an der zweiten Winkelhalbierenden. (Zur Erinnerung: Man muss sich nurüberlegen, wo die Basisvektoren und landen, und hat die Spalten der Matrix.)(1, 0) (0, 1)Beim Zurückschieben hat man dann natürlich keine Wahlmöglichkeiten mehr, sondern mussdas Negative der ersten Translation benutzen.

Mathematik II (MI) SS 2012

- 36 -

Page 37: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Durch Vereinfachen erhält man wieder die Standardform:

$ $ $ =0 −1

−1 0x

y+

0 −1−1 0

10

+−10

=0 −1

−1 0x

y+

0−1

+−10

=0 −1

−1 0x

y+

−1−1

Zum Schluss betrachten wir noch die Verkettung der beiden Abbildungen:f 2 ) f 1

f 2 ) f 1 :x

yx

0 −1−1 0

(0 −11 0

x

y+

1−3

) +−1−1

=0 −1

−1 00 −11 0

x

y+

0 −1−1 0

1−3

+−1−1

=−1 00 1

x

y+

3−1

+−1−1

=−1 00 1

x

y+

2−2

Bemerkung:

In der Computergrafik benutzt man oft einen Trick, mit dem man z. B. eine affine Abbildung durch eine einzige Matrix(!) beschreiben kann. Diese wird geschickt aus der‘2 t ‘2 3 % 3 −

eigentlichen Matrix und dem Translationsvektor zusammengebastelt. In den2 % 2 −Programmiersprachen des Microsoft Visual Studio gibt es hierfür bereits eine fertige Klasse("matrix"), die solche Matrizen verfügbar macht. Die genaue Funktionsweise dieses3 % 3 −Tricks und der konkrete Umgang damit sind in der Hilfe-Funktion auch recht gut erklärt.Damit sollte man sich aber erst befassen, wenn man lineare und affine Abbildungen sicherverstanden hat - andernfalls kann dieser formale Umweg über die nächst-höhere Dimensionsehr verwirrend sein!

Mathematik II (MI) SS 2012

- 37 -

Page 38: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.8 Determinanten

Eine genauere Beschäftigung mit linearen Abbildungen erfordert im Prinzip zunächst eintieferes Eindringen in die Matrizentheorie. Aus Zeitgründen müssen wir uns auf sehr wenigesbeschränken. Zu diesem Wenigen gehört das Thema "Determinanten". Wir werden sehen,dass die Determinante einer Matrix zwar nur ein einzelner Zahlenwert ist, der aber wichtigeInformationen über die gesamte Matrix und die zugehörige lineare Abbildung liefert.

1.8.1 Einführung und einfache Fälle

Jeder quadratischen Matrix A (über ) wird eine reelle Zahl Det A zugeordnet, die man die‘

Determinante von A nennt. Schreibweise (am Beispiel einer dreireihigen Matrix A):

A =a11 a12 a13

a21 a22 a23

a31 a32 a33

u Det A =a11 a12 a13

a21 a22 a23

a31 a32 a33

Die allgemeine Definition des Determinantenbegriffs ist recht kompliziert und auch nichtsehr anschaulich. Wir begnügen uns daher mit der "kochrezeptartigen" Angabe einigerBerechnungsverfahren. (Bis zu einem gewissen Grade können diese auch als Ersatz für dieunterschlagene "richtige" Definition dienen.) In den folgenden Abschnitten werden wir danneinige typische Fragestellungen betrachten, bei denen die Determinante eine nützliche Rollespielen kann.

Für -Matrizen wird die Determinante nach folgender Formel berechnet:2 % 2

.A =a11 a12

a21 a22u Det A =

a11 a12

a21 a22= a11 a22 − a12 a21

Im Klartext: Produkt der Hauptdiagonalelemente minus Produkt der beiden anderen Elemente("Nebendiagonale").

Für -Matrizen lautet die Formel:3 % 3

a11 a12 a13

a21 a22 a23

a31 a32 a33

= a11 a22 a33 + a12 a23 a31 + a13 a21 a32

− a11 a23 a32 − a12 a21 a33 − a13 a22 a31

Das merkt man sich am besten mit der sogenannten "Regel von Sarrus":

Dazu schreibt man die ersten beiden Spalten noch ein weiteres Mal rechts neben die Matrix(quasi als vierte und fünfte Spalte), bildet jeweils die Produkte in den drei Hauptdiagonalen

Mathematik II (MI) SS 2012

- 38 -

Page 39: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

und den drei Nebendiagonalen und addiert diese alle dann mit den richtigen Vorzeichen ("+"in den Hauptdiagonalen, "-" in den Nebendiagonalen). Das liefert genau die sechs Dreifach-produkte der obigen Formel. (Mit etwas Übung kann man irgendwann auch auf das Ergänzender vierten und fünften Spalte verzichten und stattdessen die "gebrochenen" Diagonalenverfolgen.)

Beispiel: A =−2 0 31 0 −12 −5 8

u Det A = 0 + 0 − 15 − (0 − 10 + 0) = − 5

1.8.2 Determinantenberechnung durch "Entwickeln"

Für größere Matrizen werden die direkten Berechnungsverfahren sehr unübersichtlich und esgibt auch keine einfachen Merkregeln mehr. Stattdessen benutzt man daher das sogenannte"Entwickeln" einer Determinante nach einer (beliebig auswählbaren) Zeile oder Spalte. Dazumultipliziert man zunächst jedes Element der gewählten Zeile oder Spalte mit seiner"komplementären Unterdeterminante". Was das bedeutet, sehen wir uns am Beispiel einer

-Matrix an, die wir zunächst mal nach der ersten Zeile entwickeln:3 % 3

a11 − − − −

| a22 a23

| a32 a33

liefert a11a22 a23

a32 a33

− − a12 − −

a21 | a23

a31 | a33

liefert a12a21 a23

a31 a33

− − − − a13

a21 a22 |a31 a32 |

liefert a13a21 a22

a31 a32

Die "komplementäre Unterdeterminante" besteht also immer aus den Einträgen, die übrigbleiben, wenn man sich die Zeile und Spalte des aktuell betrachteten Elements wegdenkt. Diedrei so erhaltenen Teilergebnisse sind dann mit alternierenden Vorzeichen zu addieren, d. h.

a11 a12 a13

a21 a22 a23

a31 a32 a33

= + a11a22 a23

a32 a33− a12

a21 a23

a31 a33+ a13

a21 a22

a31 a32

(siehe oben)= $ $ $

Generell sind die Vorzeichen dabei nach der sogenannten "Schachbrettregel" zu verteilen(Plus- und Minuszeichen wechseln sich ab wie die schwarzen und weißen Felder einesSchachbretts). Beim Entwickeln nach der zweiten Zeile muss man also mit einemMinuszeichen anfangen:

a11 a12 a13

a21 a22 a23

a31 a32 a33

= − a21a12 a13

a32 a33+ a22

a11 a13

a31 a33− a23

a11 a12

a31 a32= $ $ $

Mathematik II (MI) SS 2012

- 39 -

Page 40: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Der große Vorteil dieses Verfahrens (auch schon bei -Matrizen) besteht darin, dass man3 % 3sich die Zeile oder Spalte zum Entwickeln selbst aussuchen kann. Besonders praktisch sindsolche Zeilen oder Spalten, die möglichst viele Nullen enthalten. Bei der Matrix aus obigemBeispiel würde ein erfahrener Determinanten-Berechner die Regel von Sarrus gar nicht erst inBetracht ziehen, sondern sofort "Entwickeln nach der zweiten Spalte", weil dabei nur eineinziger Term zu berechnen ist, nämlich

.(−5)−2 31 −1

= (−5) $ (−1) = 5

Man darf dann aber auf keinen Fall das zusätzliche Minuszeichen nach der Schachbrettregelvergessen, d. h. es ist .Det A = − 5

Mit diesem Verfahren kann man jetzt auch größere Determinanten berechnen. Eine 4 % 4 −Matrix erfordert dann "nur noch" die Berechnung von vier Determinanten. Eine 3 % 3 − 5 % 5 −Matrix führt zunächst auf fünf Determinanten, also letztlich auf zwanzig 4 % 4 − 3 % 3 −Determinanten usw. Für die Berechnung von Hand ist schon letzteres kaum noch zumutbar.Für größere Matrizen steigt der Rechenaufwand dann sogar so dramatisch, dass diesesVerfahren auch maschinell nicht mehr wirklich praktikabel ist.

*****+achtrag zu Abschnitt 1.4.1:

Jetzt kann auch die versprochene Merkregel für die Berechnung von Vektorproduktennachgeliefert werden. Dazu schreibt man die gegebenen Vektoren und als zweite und→

x→ y

dritte Zeile einer formalen Determinante, deren erste Zeile leer bleibt ("Platzhalterzeile"):

$ $ $

x1 x2 x3

y1 y2 y3

Dann tut man so, als ob man diese Determinante nach der ersten Zeile entwickelt. Die dabeizu berechnenden Unterdeterminanten liefern genau die benötigten Terme für das Vektor-produkt. Der Unterschied zu einer "normalen" Entwicklung besteht also nur darin, dass manz. B. die Unterdeterminante, die eigentlich mit dem ersten Element der ersten Zeile zumultiplizieren wäre, jetzt direkt in die erste Komponente des Ergebnisvektors einträgt usw.Man beachte insbesondere das (aus der Schachbrettregel stammende) zusätzliche negativeVorzeichen in der zweiten Komponente, das leicht vergessen wird.

Beispiel: (3, −1, 2) % (0, 1, −5) = ?

$ $ $

3 −1 20 1 −5

ü (−1 21 −5

, −3 20 −5

,3 −10 1

) = (3, 15, 3)

Den Zwischenschritt (zweireihige Determinanten) muss man normalerweise gar nichthinschreiben, wenn sich die Werte einigermaßen leicht im Kopf berechnen lassen. Mit etwasÜbung kann man sogar auf das explizite Hinschreiben der formalen Determinante verzichtenund sich die benötigten Werte direkt aus den beiden Vektoren zusammensuchen, die jasowieso irgendwo auf dem Papier stehen. Die Gefahr von Rechenfehlern (insbesondereVorzeichenfehlern) ist dabei aber nicht zu unterschätzen.

Mathematik II (MI) SS 2012

- 40 -

Page 41: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Diese Merkregel funktioniert übrigens genauso gut in der "transponierten" Form mit Spaltenstatt Zeilen. Insbesondere für Vektoren, die von vornherein als Spalten gegeben sind, ist dasoft praktischer.

1.8.3 Wichtige Spezialfälle

Besonders einfach ist die Determinantenberechnung für sogenannte Diagonalmatrizen. Dassind Matrizen, bei denen nur die Hauptdiagonalelemente von Null verschieden sind, also z. B.

A =

2 0 0 00 −3 0 00 0 1 00 0 0 −5

Durch Entwickeln sieht man sofort, dass die Determinante einfach das Produkt der Haupt-diagonal-Elemente ist: .Det A = 2 $ (−3) $ 1 $ (−5) = 30

Dasselbe gilt aber auch schon für sogenannte Dreiecksmatrizen, bei denen von Nullverschiedene Einträge entweder nur oberhalb oder nur unterhalb der Hauptdiagonaleauftreten. Z. B. ist

A =

2 7 −2 110 −3 17 −80 0 1 10 0 0 −5

eine "rechte obere Dreiecksmatrix". Auch hier ist die Determinante einfach das Produkt derHauptdiagonal-Elemente, also wieder . (Das sieht man sofort, wenn man einfachDet A = 30immer nach der ersten Spalte entwickelt!) Diese Tatsache macht man sich zunutze, umeffektive Algorithmen zur Determinantenberechnung großer Matrizen zu erhalten. Es gibtnämlich relativ einfache Operationen, mit denen man jede quadratische Matrix in Dreiecks-gestalt überführen kann, ohne dass der Wert der Determinante sich dabei ändert (siehe später,Stichwort Gauß-Algorithmus).

1.8.4 Geometrische Bedeutung der Determinante

Die geometrische Bedeutung der Determinante einer Matrix besteht darin, dass sie den2 % 2 −(vorzeichenbehafteten) Flächeninhalt des von den Spaltenvektoren der Matrix aufgespanntenParallelogramms liefert. Da diese Spalten bekanntlich genau die Bilder der Standardbasissind, wird also das "Einheitsquadrat" auf ein Parallelogramm des Flächeninhalts Det A

abgebildet:

Diese Flächeninhalts-Eigenschaft sieht man der oben angegebene Formel für eine 2 % 2 −Determinante natürlich nicht auf den ersten Blick an. Das Nachrechnen ist ziemlich mühsam

Mathematik II (MI) SS 2012

- 41 -

Page 42: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

und bringt auch wenig für das Verständnis, weshalb wir hier darauf verzichten ( Übungs-taufgabe!). Der geometrische Flächeninhalt ist natürlich immer eine positive Größe (also derBetrag von ). Das Vorzeichen der Determinante sagt zusätzlich etwas darüber aus, obDet A

der Durchlaufungssinn (linksrum/rechtsrum) beim Übergang vom Einheitsquadrat zumParallelogramm erhalten bleibt oder nicht.

Es ist eine typische Eigenschaft linearer Abbildungen, dass der Faktor, um den die Flächen-inhalte geometrischer Objekte sich ändern, eine Konstante ist. Wenn also das Einheitsquadratz. B. auf ein Parallelogramm mit dem Flächeninhalt 3 abgebildet wird, so weiß man, dassdiese Abbildung die Flächeninhalte aller geometrischen Objekte verdreifacht. Dassselbe giltauch in höheren Dimension, so dass man festhalten kann:

Die Determinante einer -Matrix (genauer: ihr Betrag) gibt den Faktor an, mit dem die2 % 2zugehörige lineare Abbildung alle Flächeninhalte vergrößert bzw. verkleinert.

Allgemein gibt die Determinante einer -Matrix den Faktor an, mit dem dien % n

zugehörige lineare Abbildung das n-dimensionale Volumen vergrößert bzw. verkleinert. Eine negative Determinante bedeutet immer eine "Orientierungsumkehr", d. h. die

Abbildung enthält einen Spiegelungsanteil.

Insbesondere liefert die Determinante einer -Matrix wieder das Volumen des von den3 % 3Spaltenvektoren der Matrix aufgespannten Parallelepipeds (Bild des Einheitswürfels). In derTat ist diese Determinante nichts anderes als das Spatprodukt der drei Spaltenvektoren. Dassieht man auch direkt, wenn man die neue Merkregel für das Vektorprodukt mit der früherenDefinition des Spatprodukts verknüpft.

1.8.5 Weitere Eigenschaften

Die Determinantenberechnung ist multiplikativ, d. h. es gilt

.Det (AB) = Det A $Det B

(Da das Matrizenprodukt der Hintereinanderausführung von Abbildungen entspricht, folgtdas natürlich direkt aus der geometrischen Bedeutung.) Bei der Multiplikation einer Matrixmit einem Skalar ist dagegen zu beachten, dass für die Determinante dann gilt

(falls A eine Matrix ist).Det (c A) = cn Det A n % n −

Außerdem ist es manchmal nützlich zu wissen, dass gilt.Det AT = Det A

Ist A eine invertierbare Matrix, für die also die inverse Matrix existiert, so folgt aus derA− 1

Multiplikativität:

.Det A $Det A− 1 = Det (A $ A− 1) = Det E = 1

Daraus kann man entnehmen, dass für jede invertierbare Matrix A gilt:

und .Det A ! 0 Det A− 1 = 1Det A

Den wichtigen Sonderfall einer Matrix bzw. linearen Abbildung, deren Determinante Null ist,wollen wir noch etwas näher betrachten. heißt ja, dass das n-dimensionaleDet A = 0Volumen aller geometrischen Objekte zu Null wird. Das kann nur bedeuten, dass derGesamtraum insgesamt auf einen niederdimensionalen Unterraum abgebildet wird.‘n

(Beispiele wären etwa Abbildungen, die den ganzen auf eine einzige Gerade abbilden oder‘2

den ganzen auf eine einzige Ebene.) Anders ausgedrückt: die Bilder der Standardbasis‘3

spannen ihrerseits nicht mehr den gesamten Raum auf, bilden also selbst keine Basis mehr,

Mathematik II (MI) SS 2012

- 42 -

Page 43: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

können demnach auch nicht linear unabhängig sein. Man hat also folgendes schöneKriterium:

die Spalten von A sind linear abhängigDet A = 0 w

(Dasselbe gilt übrigens auch für die Zeilen von A.) Diese Tatsache kann man oft auch sehr gutzum Test auf lineare Abhängigkeit oder Unabhängigkeit von Vektoren benutzen. In denBeispielen am Ende von Abschnitt 1.3.2 ging es um derartige Fragestellungen, die wir jetztauch dadurch lösen können, dass wir aus den gegebenen Vektoren eine Matrix basteln undderen Determinante berechnen:

1.3.2, Bsp.(1): lineare Abhängigkeit1 1 01 1 00 1 1

= 0 u

1.3.2, Bsp.(3): lineare Unabhängigkeit1 2 32 3 13 1 2

= − 18 u

Mathematik II (MI) SS 2012

- 43 -

Page 44: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.9 Orthogonale Abbildungen

Für geometrische Anwendungen sind besonders solche Abbildungen wichtig, dief : ‘n t ‘n

sowohl längen- als auch winkeltreu sind. Da alle geometrischen Objekte bei einer solchenAbbildung nach Form und Größe unverändert bleiben, nennt man sie auch Bewegungen oderKongruenzabbildungen. Solange man sich auf lineare Abbildungen beschränkt (also nochkeine Translationen betrachtet), spricht man auch von orthogonalen Abbildungen (Grundsiehe später). Offenbar kommen dafür nur Drehungen, Spiegelungen und Kombinationendavon in Frage.

1.9.1 Definition und einfache Eigenschaften

Da wir wissen, dass sowohl die Längen- als auch die Winkelmessung durch das Skalar-produkt geliefert wird, kann man folgende Definition benutzen:

Eine lineare Abbildung heißt orthogonale Abbildung, wenn für alle f : ‘n t ‘n

gilt→ x ,

→ y c ‘n

,f (→ x ) $ f (→

y ) = → x $

→ y

d. h. "das Skalarprodukt bleibt unter f erhalten".

Eine Matrix A heißt orthogonale Matrix, wenn die dadurch beschriebene Abbildungn % n −orthogonal ist.

Um von einer gegebene Matrix herauszufinden, ob sie orthogonal ist, ist die Definition weniggeeignet. Man benötigt also ein praktisches Testkriterium. Wegen der geometrischenBedeutung der Determinante ist klar, dass immer gelten muss:

A orthogonal .u Det A = !1

Die Umkehrung hiervon gilt aber nicht! So hat etwa auch die folgende Matrix

2 00 1

2

die Determinante 1 (erhält also den Flächeninhalt), verzerrt aber trotzdem alle geometrischenObjekte (Streckung in x-Richtung, Stauchung in y-Richtung). Anders ausgedrückt: für dieOrthogonalität einer Matrix A ist die Bedingung zwar notwendig, aber nichtDet A = !1hinreichend.

Um eine hinreichende Bedingung für die Orthogonalität einer Matrix zu finden, erinnernwir uns daran, dass die Spalten der Matrix gerade die Bildvektoren der Standardbasis sind, im

also etwa die Bilder von , und . Wegen der Längen- und Winkel-‘3 (1, 0, 0) (0, 1, 0) (0, 0, 1)treue müssen diese Bildvektoren ebenfalls wieder die Länge 1 haben und wechselseitigaufeinander senkrecht stehen. Das liefert folgendes einfache Kriterium:

Eine Matrix A ist genau dann eine orthogonale Matrix, wenn gilt: n % n −(i) alle Spalten sind Einheitsvektoren(ii) je zwei Spalten sind orthogonal

(Das ist natürlich auch der Grund für die Namensgebung orthogonaler Matrizen undAbbildungen.)

Mathematik II (MI) SS 2012

- 44 -

Page 45: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Das praktische Verfahren zum Test einer Matrix auf Orthogonalität läuft also wie folgt:(i) Berechne für alle Spalten die Quadratsumme der Einträge

hier muss immer 1 herauskommenu(ii) Berechne für alle Paare von (verschiedenen) Spalten das Skalarprodukt

hier muss immer 0 herauskommenu

Das Vorzeichen der Determinante liefert dann die wichtigste Typunterscheidung für ortho-gonale Abbildungen:

A orthogonal, A beschreibt eine DrehungDet A = +1 u

A orthogonal, A enthält einen SpiegelungsanteilDet A = −1 u (Umkehr der Orientierung)

Man beachte, dass im zweiten Fall neben "reinen" Spiegelungen auch Kombinationen ausSpiegelung und Drehung auftreten können.

Bemerkung: Aus der Tatsache, dass die Spalten paarweise orthogonale Einheitsvektoren sind,folgt auch, dass für orthogonale Matrizen immer gilt (warum?). OrthogonaleA− 1 = AT

Matrizen lassen sich also besonders einfach und ohne Rechnung invertieren!

1.9.2 Orthogonale Abbildungen im ‘2

Im hat man die orthogonalen Abbildungen durch das obige Kriterium bereits völlig im‘2

Griff. Jeder Einheitsvektor im lässt sich schreiben als Ortsvektor zu einem Punkt des‘2

Einheitskreises, also in der Form mit . Es gibt dann jeweils zwei zu(cos, sin) 0 [ < 2einem solchen Vektor orthogonale Einheitsvektoren, nämlich und (− sin, cos)

. Alle orthogonalen Matrizen haben also entweder die Form(sin, − cos)

, ,D =cos − sinsin cos

0 [ < 2

oder

, .S =cos sinsin − cos

0 [ < 2

Ersteres sind die Drehungen um den Winkel ( ), letzteres die Spiegelungen an Det D = +1der Gerade, die mit der positiven x-Achse den Winkel einschließt ( ).1

2 Det S = −1

Damit kann man also nicht nur jeder orthogonalen Matrix sofort ansehen, was sie2 % 2 −bewirkt, sondern auch umgekehrt zu einer gewünschten Drehung oder Spiegelung des ‘2

immer sofort die richtige Matrix hinschreiben.

1.9.3 Orthogonale Abbildungen im ‘3

Im sind die Verhältnisse etwas komplizierter. Die reinen Drehungen um eine beliebige‘3

Ursprungsgerade als Drehachse sind auch hier wieder dadurch charakterisiert, dass dieDeterminante den Wert +1 hat. Die orthogonalen Abbildungen mit sind dagegenDet A = −1sogenannte Drehspiegelungen.

Eine Drehspiegelung besteht aus einer Drehung um eine Ursprungsgerade und der gleich-zeitigen Spiegelung an der zur Drehachse senkrechten Ebene durch den Ursprung. (Diese

Mathematik II (MI) SS 2012

- 45 -

Page 46: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Ebene hat auch bei reinen Drehungen eine gewisse Bedeutung und wird als "Drehebene"bezeichnet. Bei Drehspiegelungen hat sie dann zusätzlich noch die Funktion der Spiegelungs-ebene.)

reine Drehung Drehspiegelung

Als Sonderfall liefern die Drehspiegelungen mit dem Drehwinkel natürlich genau die = 0"reinen" Spiegelungen. Man beachte aber, dass auch bei die "Drehachse" eindeutig = 0bestimmt ist, nämlich als Normalenrichtung der Spiegelungsebene.

Es ergeben sich zwei Grundaufgaben: Ermittlung der Matrix nach Vorgabe von Drehachse und Drehwinkel Berechnung von Drehachse und Drehwinkel aus einer gegebenen orthogonalen Matrix

Wie die Matrizen für Drehungen um die Koordinatenachsen aussehen, haben wir bereitsfrüher gesehen (Abschnitt 1.7.2). Drehungen bzw. Drehspiegelungen zu beliebigen Achsen zukonstruieren, ist schon etwas schwieriger. Da gerade dies für die Praxis aber besonderswichtig ist, wird es im folgenden Abschnitt 1.9.4 anhand eines konkreten Beispiels behandelt.

Für die umgekehrte Fragestellung, wie man aus einer orthogonalen Matrix die Dreh-3 % 3 −achse und den Drehwinkel ermittelt, benötigt man weitere Hilfsmittel aus der Matrizen-theorie. Da diese Fragestellung für die Praxis auch von geringerer Bedeutung ist, begnügenwir uns mit einigen Andeutungen:

Da die Drehachse bei der Abbildung ihre Lage nicht verändert, lässt sich ein Richtungs-vektor immer aus der Bedingung

→ x

(für Drehungen)A→ x = →

x

bzw.(für Drehspiegelungen)A

→ x = − →

x

ermitteln. Das bedeutet nichts anderes als das Lösen eines linearen Gleichungssystems(unsystematisch wie bisher oder mit den Verfahren aus Kapitel 1.10). Solche speziellenGleichungssysteme der Form (mit einem ) werden in der Matrizen-A

→ x = c

→ x c c ‘

theorie unter dem Thema Eigenwerte und Eigenvektoren behandelt (hier aus Zeitgründennicht weiter verfolgt, aber zum Selbststudium empfohlen).

Mathematik II (MI) SS 2012

- 46 -

Page 47: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Für den Cosinus des Drehwinkels einer reinen Drehung gibt es eine verblüffend einfache(allerdings nicht ganz leicht herzuleitende) Formel:

cos = 12 (a11 + a22 + a33 − 1).

Die darin auftretende Summe der drei Hauptdiagonalelemente wird oft auch als "Spur"der Matrix bezeichnet, die Gleichung selbst als "Spurformel für den Drehwinkel". Manbeachte, dass der Drehwinkel dadurch nur bis aufs Vorzeichen festgelegt ist ( und −haben denselben Cosinuswert!). Die Frage, welches der "richtige" Winkel ist, lässt sicherst dann sinnvoll beantworten, wenn man zuvor der Drehachse (willkürlich) eineOrientierung verpasst hat. Anders ausgedrückt: erst wenn man die Drehachse mit einerPfeilspitze versehen hat, kann man Links- und Rechtsdrehungen unterscheiden.

1.9.4 Anwendungsbeispiel: Konstruktion einer Drehung im ‘3

Als konkretes Beispiel wollen wir die Matrizen konstruieren, die die Drehungen um dieAchse mit dem Richtungsvektor beschreiben, und zwar gleich für beliebige Dreh-(1, 1, 2)winkel . Wir versuchen, diese Drehung durch die Verkettung von drei (hoffentlicheinfacheren) Drehmatrizen zusammenzubasteln:

D = A B C

Die Idee besteht darin, dass zunächst C die gegebene Drehachse in die x-Achse überführt. FürB benutzt man dann die bekannte Matrix für die Drehung um die x-Achse und um dengegebenen Winkel:

B =1 0 00 cos − sin0 sin cos

Die Matrix A muss dann nur die Wirkung von C rückgängig machen, also die x-Achse wiederin die gewünschte Drehachse überführen. Das heißt offenbar, dass sein muss.A = C − 1

Eine Matrix C mit der gewünschten Eigenschaft zu finden, sieht zunächst sehr schwierig aus.Die Matrix A lässt sich dagegen sehr leicht konstruieren. Wir wissen einerseits, dass sie diex-Achse in die gewünschte Drehachse überführt, andererseits muss die erste Spaltebekanntlich genau das Bild des Vektors sein. Wir müssen also nur den Einheitsvektor(1, 0, 0)in Richtung der Drehachse berechnen und in die erste Spalte eintragen:

A =

16

? ?

16

? ?

26

? ?

Die anderen beiden Spalten müssen die Bildvektoren von und sein. Wegen(0, 1, 0) (0, 0, 1)der Längen- und Winkeltreue müssen dies also wieder zwei Einheitsvektoren sein, die auf derDrehachse und aufeinander senkrecht stehen. Ein zur Drehachse senkrechter Vektor ist z. B.

. Den dritten, zu beiden senkrechten Vektor liefert das Vektorprodukt:(1, −1, 0)

.(1, 1, 2) % (1, −1, 0) = (2, 2, −2)

(Hier muss man auf die richtige Reihenfolge achten, damit die Bildvektoren wieder einRechtssystem bilden und man sich nicht versehentlich eine Spiegelung einfängt!)

Mathematik II (MI) SS 2012

- 47 -

Page 48: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Die beiden gefundenen Vektoren muss man jetzt nur noch normieren und in die Matrixeintragen:

.A =

16

12

13

16

−12

13

26

0 −13

(Sicherheitshalber könnte man an dieser Stelle nochmal die Orthogonalität der Spalten undauch überprüfen.) Det A = 1

Da es sich um eine orthogonale Matrix handelt, erhält man einfach durchC = A− 1

transponieren:

.C =

16

16

26

12

−12

0

13

13

−13

Unsere gesuchte Drehmatrix ergibt sich dann aus . Die Ausführung dieser Matrizen-D = ABC

multiplikation von Hand ist allerdings schon ziemlich lästig – das sollte man dem Rechnerüberlassen.

Programmtechnisch sind solche Drehungen dann also doch recht einfach zu realisieren: Benutzer gibt Drehachse (Richtungsvektor) vor Ergänze diesen Vektor durch zwei weitere zu einem "orthogonalen Rechtssystem"

(Vektorprodukt!) Normiere die drei Vektoren und benutze sie als Spalten einer Matrix A und als Zeilen

einer Matrix C Benutze für B die oben angegebene Drehmatrix für Drehungen um die x-Achse und

berechne .D = ABC

Damit kann man jetzt beliebige Punkte oder geometrische Objekte problemlos um diegegebene Achse rotieren lassen.

Mathematik II (MI) SS 2012

- 48 -

Page 49: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.10 Lineare Gleichungssysteme

1.10.1 Definition und Begriffe

Eine Gleichung der Form mit reellen Konstanten a, b und einer Unbekannten x heißtax = b

eine lineare Gleichung. Für ist sie immer eindeutig lösbar: .a ! 0 x = b÷a

Eine lineare Gleichung in mehreren Unbekannten wäre etwa

ax + by + cz = d

(für die Unbekannten x, y, z). Eine solche Gleichung ist natürlich nicht mehr eindeutig lösbar,sondern besitzt i. a. unendlich viele Lösungen.

Bemerkung: Die Bezeichnung "linear" bezieht sich darauf, dass die einzelnen Unbekanntenweder in höherer Potenz noch in gemischten Produkten oder anderen Verknüpfungenauftreten. Die linke Seite ist im Prinzip immer eine "Linearkombination" der Unbekannten.

Wirklich interessant wird es, wenn man mehrere lineare Gleichungen (für dieselbenUnbekannten) hat, z. B.:

3x − 2y + 5z = 74x − 2z = 1

So etwas nennt man ein lineares Gleichungssystem, kurz LGS.

Die typischen Aufgabenstellungen für ein LGS sind: Frage nach der Lösbarkeit (Gibt es mindestens eine Lösung?) Frage nach der Anzahl der Lösungen (Gibt es eine eindeutige Lösung oder mehrere?) Explizite Ermittlung sämtlicher Lösungen

Es gibt (relativ) einfache Algorithmen, mit denen sich die oben genannten Fragen fürbeliebige LGS immer eindeutig beantworten lassen. Insbesondere kann man die Gesamtheitder Lösungen immer explizit berechnen.

Wir führen zunächst eine kompaktere Schreibweise ein. Ein LGS, das aus m Gleichungen fürdie n Unbekannten besteht, sieht prinzipiell wie folgt aus:x1, ... , xn

a11 x1 + a12 x2 + $ $ $ +a1n xn = r1

a21 x1 + a22 x2 + $ $ $ +a2n xn = r2

§ § § §am 1 x1 + am 2 x2 + $ $ $ +am n xn = rm

Dies lässt sich wesentlich kürzer mit Matrizen und Vektoren schreiben:

A→ x = →

r

Dabei ist A die Matrix, die genau aus allen Koeffizienten des LGS besteht. Siem % n − a i j

heißt daher die Koeffizientenmatrix des LGS. Das ist der aus den Unbekannten bis → x x1 xn

gebildete Spaltenvektor. Ebenso ist der Vektor . Dieser heißt die "rechte Seite"→ r (r1, ... , rm)

oder auch die "Inhomogenität" des LGS.

Das anfangs betrachtete LGS mit zwei Gleichungen und drei Unbekannten sähe damit wiefolgt aus:

Mathematik II (MI) SS 2012

- 49 -

Page 50: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

3 −2 54 0 −2

x

y

z

=71

1.10.2 Lösungsmengen

Eindeutige Lösbarkeit wird man bei einem LGS insbesondere dann erwarten, wenn dieAnzahl der Gleichungen mit der Anzahl der Variablen übereinstimmt (zwei Gleichungen fürzwei Unbekannte, drei Gleichungen für drei Unbekannte etc.). Wenn man wenigerGleichungen als Unbekannte hat, spricht man von einem unterbestimmten LGS, imgegenteiligen Fall von einem überbestimmtem LGS. Typischerweise hat ein unterbestimmtesLGS mehrere Lösungen, ein überbestimmtes dagegen gar keine. Das bloße Abzählen derGleichungen reicht allerdings nicht aus, wie man an folgenden Beispielen sieht:

3x − 2y + 5z = 74x − 2z = 17x − 2y + 3z = 8

Die dritte Gleichung ist nur die Summe der beiden anderen und damit überflüssig. Man hat esalso eigentlich nur mit zwei Gleichungen zu tun und erhält auch keine eindeutige Lösung.Ändert man bei der dritten Gleichung die rechte Seite, z. B.

3x − 2y + 5z = 74x − 2z = 17x − 2y + 3z = 9

so entsteht sogar ein Widerspruch und das LGS wird unlösbar.

Für die Frage nach Existenz und Anzahl von Lösungen darf man also nicht nur auf dieAnzahl der Gleichungen schauen, sondern muss auch noch ggf. vorhandene Abhängigkeitenberücksichtigen. Letztlich können aber immer nur die folgenden drei Fälle eintreten es gibt gar keine Lösung (LGS unlösbar) es gibt genau eine Lösung (LGS eindeutig lösbar) es gibt unendlich viele Lösungen.

Die Frage nach den Abhängigkeiten zwischen den einzelnen Gleichungen läuft im Prinzipdarauf hinaus, dass man die Zeilen der Koeffizientenmatrix auf lineare Abhängigkeit oderUnabhängigkeit untersuchen muss. Insbesondere für den Fall erhält man ein einfachesn = m

Kriterium:

Ein LGS mit quadratischer Koeffizientenmatrix ist genau dann eindeutigA→ x = →

r

lösbar, wenn gilt.Det A ! 0

Mathematik II (MI) SS 2012

- 50 -

Page 51: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

1.10.3 Lösungsverfahren I: Die Cramersche Regel

Die Cramersche Regel ist ein Verfahren, das nur dann funktioniert, wenn eine quadratischeKoeffizientenmatrix mit vorliegt (also eindeutige Lösbarkeit).Det A ! 0

Cramersche Regel:

Ist ein LGS mit quadratischer Koeffizientenmatrix, , und denA→ x = →

r Det A ! 0Unbekannten , so erhält man die eindeutige Lösung aus

→ x = (x1, x2, ... , xn)

, .x i =Det Ai

Det Ai = 1, 2, ..., n

Die dabei benötigten Hilfsmatrizen erhält man dadurch, dass jeweils die i-te Spalte vonA i

A durch ersetzt wird.→ r

Beispiel:2x − 3y = 9−x + 4y = −7

Es ist also und . Wegen ist die Cramersche RegelA =2 −3

−1 4→ r =

9−7

Det A = 5

anwendbar. Die Hilfsmatrizen erhält man, indem man einmal die erste und einmal die zweite

Spalte von A durch ersetzt:→ r

A1 =9 −3

−7 4u Det A1 = 15

A2 =2 9

−1 −7u Det A2 = − 5

Die Cramersche Regel liefert also die Lösungen und .x = 155 = 3 y = −5

5 = −1

Bemerkung:

Das Auftreten von Determinanten macht klar, dass dieses Verfahren nur für kleine Werte vonn ( , allenfalls noch ) praktisch brauchbar ist. Dagegen ist es für theoretischen = 2 n = 3Herleitungen oft sehr nützlich. Zum Beispiel hatten wir in Abschnitt 1.8.5 gesehen, dass fürinvertierbare Matrizen immer gilt. Mit der Cramerschen Regel kann man jetzt sehrDet A ! 0leicht beweisen, dass das sogar eine hinreichende Bedingung ist, d. h. eine Matrix A ist genau

dann invertierbar, wenn gilt.Det A ! 0

1.10.4 Lösungsverfahren II: Der Gauß-Algorithmus

Das Standardverfahren zur vollständigen Lösung beliebiger (auch beliebig großer!) LGS istdas sogenannte Gauß'sche Eliminationsverfahren (kurz: Gauß-Algorithmus).

Die zugrundeliegende Idee ist sehr einfach. Bereits in der Schulmathematik wird für die dortbehandelten LGS vom Typ "zwei Unbekannte, zwei Gleichungen" meistens ein Eliminations-verfahren verwendet: eine der beiden Gleichungen nach y auflösen, den gefundenen Ausdruckfür y in die andere Gleichung einsetzen man erhält eine Gleichung, die nur noch x enthältuund leicht zu lösen ist.

Mathematik II (MI) SS 2012

- 51 -

Page 52: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Das lässt sich leicht auf ein beliebiges LGS (m Gleichungen, n Unbekannte) verallgemeinern: Löse irgendeine Gleichung nach einer der Unbekannten auf Ersetze diese Unbekannte in allen anderen Gleichungen durch den gefundenen Ausdruck Es verbleibt ein LGS mit Gleichungen und Unbekanntenm − 1 n − 1 Wiederhole diese Schritte bis der Vorgang "abbricht"

Für das Ende des Verfahrens gibt es folgende Möglichkeiten: Man stößt auf einen Widerspruch LGS unlösbaru Die letzte verbleibende Gleichung enthält nur noch eine Unbekannte LGS eindeutigu

lösbar (durch "Rückwärtseinsetzen" ergeben sich aus der letzten Unbekannten auch allezuvor eliminierten!)

Die letzte verbleibende Gleichung enthält noch mehrere Unbekannte LGS besitztuunendlich viele Lösungen (die genaue Beschreibung der Lösungsmenge lässt sich aberrelativ einfach ablesen)

Der Gauß-Algorithmus besteht prinzipiell darin, dass man diese Vorgehensweise formalisiert,d. h. in Manipulationen an der Koeffizientenmatrix (und der rechten Seite) umsetzt. Trotz dereinfachen Idee sind die Details des entstehenden Algorithmus zu umfangreich, um sie hiervollständig zu behandeln. (Unten folgt aber ein einfaches Beispiel.)

Bei sehr großen LGS kann es Probleme mit der numerischen Stabilität geben (unkontrol-liertes Anwachsen von Rundungsfehlern bei "ungünstiger" Koeffizientenmatrix). Man solltedaher – außer in einfachen Fällen – niemals seinen eigenen Gauß-Algorithmus program-mieren, sondern lieber auf entsprechende Software-Pakete zur Matrizen-Numerik zurück-greifen.

Aber auch für die Lösung kleiner LGS von Hand ist der Gauß-Algorithmus nützlich. Vorallem liefert er ein kompaktes und übersichtliches Rechenschema, das wir zumindest aneinem einfachen Beispiel kennenlernen wollen. Wir betrachten das LGS

x +3y −4z = 92x +9y −2z = −64x +6y −z = 3

Das Rechenschema "erweiterte Koeffizientenmatrix" besteht darin, dass man dieKoeffizientenmatrix und die rechte Seite nebeneinander schreibt:

1 3 −4 | 92 9 −2 | −64 6 −1 | 3

Damit hat man alle Daten, die für die Lösungsberechnung erforderlich sind, in möglichstkompakter Weise zusammengefasst. Das Eliminationsverfahren beginnt damit, dass man dasElement in der linken oberen Ecke benutzt, um in allen anderen Zeilen an der ersten Positioneine Null zu erzeugen. Dazu muss man jeweils ein geeignetes Vielfaches der ersten Zeile zuden anderen Zeilen addieren. Im obigen Fall addiert man also das -fache der ersten Zeile(−2)zur zweiten und das -fache der ersten Zeile zur dritten:(−4)

1 3 −4 | 90 3 6 | −240 −6 15 | −33

Mathematik II (MI) SS 2012

- 52 -

Page 53: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

(Man mache sich klar, dass das nichts anderes bedeutet als das Auflösen der ersten Gleichungnach der ersten Variablen und das Ersetzen dieser Variablen in allen übrigen Gleichungen.)

Beim nächsten Schritt benutzt man das nächste Element der Hauptdiagonale, also die 3 in derzweiten Zeile und zweiten Spalte, um unterhalb davon Nullen zu erzeugen. Dazu muss manjetzt offenbar das 2-fache der zweite Zeile zur dritten addieren:

1 3 −4 | 90 3 6 | −240 0 27 | −81

Damit ist der erste Teil des Algorithmus beendet, die Koeffizientenmatrix ist "aufDreiecksgestalt transformiert". Man kann die Lösungen jetzt durch "Rückwärtseinsetzen"ablesen: Die dritte Zeile liefert direkt . Setzt man dies in die zweite Zeile ein, so hatz = −3man , also . Und die erste Zeile liefert dann , also .3y − 18 = −24 y = −2 x − 6 + 12 = 9 x = 3

Bemerkungen:

Es kann passieren, dass das Hauptdiagonalelement, das man zum Eliminieren benutzenmöchte, den Wert Null hat. Dann muss man zunächst ein von Null verschiedenesMatrixelement, das rechts oder unterhalb davon liegt, an diese Position bringen. Dasgeschieht durch eine Zeilen- oder Spaltenvertauschung. Zeilenvertauschungen sind dabeivöllig harmlos, da sie nur die Reihenfolge der gegebenen Gleichungen verändern. Ggf.notwendige Spaltenvertauschungen muss man sich dagegen unbedingt merken, da sie dieReihenfolge der Unbekannten verändern. Das muss beim späteren Ablesen der Lösungendann natürlich berücksichtigt werden!

Es kann vorkommen, dass im Lauf des Verfahrens eine "Nullzeile" entsteht:

$ $ $ | $$ $ $ | $0 0 0 | &

Falls an der mit einem Stern bezeichneten Position ein Wert ungleich Null steht, bedeutetdas einen Widerspruch. Das LGS ist dann unlösbar und man kann sofort abbrechen. Fallsdort aber ebenfalls eine Null steht, so heißt das nur, dass diese Gleichung überflüssig(d. h. von den anderen abhängig) war und einfach ignoriert werden kann.

Im oben durchgerechneten Beispiel lag der Fall der eindeutigen Lösbarkeit vor. Falls manweniger (unabhängige) Gleichungen als Unbekannte hat, ist das LGS unterbestimmt undbesitzt unendlich viele Lösungen. Man kann dann die "überzähligen" Unbekannten alsfreie Variablen betrachten und alle übrigen Unbekannten durch diese ausdrücken (dasgeht wieder mit Rückwärtseinsetzen). Der Gauß-Algorithmus beinhaltet auch ein Rezept,wie man die Lösungsmenge in solchen Fällen einfach und systematisch darstellen kann.Aus Zeitgründen wird darauf hier aber nicht weiter eingegangen (Beispiele eventuell inden Übungen).

1.10.5 Weitere Anwendungen des Gauß-Algorithmus

Wir wollen noch kurz zwei weitere Anwendungen des Gauß-Algorithmus kennenlernen: dieBerechnung inverser Matrizen und die Berechnung von Determinanten.

(A) Inverse Matrizen

Ist A eine quadratische Matrix mit , so existiert bekanntlich die inverse Matrix Det A ! 0 A− 1

mit

Mathematik II (MI) SS 2012

- 53 -

Page 54: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

.A $ A−1 = En

Für eine konkrete Matrix bedeutet das etwa die Lösung folgender Gleichung:3 % 3 −

.2 −3 11 0 −11 1 1

$ ? =1 0 00 1 00 0 1

Dies kann man interpretieren als drei LGS mit derselben Koeffizientenmatrix. Nimmt mandie erste Spalte der Einheitsmatrix als rechte Seite, so erhält man als Lösung die erste Spalteder gesuchten Inversen. Dasselbe LGS mit der zweiten Spalte der Einheitsmatrix als rechteSeite liefert als Lösung die zweite Spalte der Inversen und analog für die dritte Spalte. Da dieKoeffizientenmatrix immer dieselbe ist, kann man alle drei LGS simultan im Rechenschemades Gauß-Algorithmus behandeln:

2 −3 1 | 1 0 01 0 −1 | 0 1 01 1 1 | 0 0 1

ü

2 −3 1 | 1 0 00 3

2 − 32 | − 1

2 1 00 5

212 | − 1

2 0 1ü

2 −3 1 | 1 0 00 3

2 − 32 | − 1

2 1 00 0 3 | 1

3 − 53 1

Statt des üblichen Rückwärtseinsetzen ist es bei der Inversenberechnung sinnvoll, dieKoeffizientenmatrix sogar auf Diagonalgestalt zu bringen, indem man z. B. den rechtenunteren Eintrag (hier die 3) benutzt, um darüber Nullen zu erzeugen usw.:

2 −3 1 | 1 0 00 3

2 − 32 | − 1

2 1 0

0 0 3 | 13 − 5

3 1ü

2 −3 0 | 89

59 − 1

3

0 32 0 | − 1

316

12

0 0 3 | 13 − 5

3 1

ü

2 0 0 | 29

89

23

0 32 0 | − 1

316

12

0 0 3 | 13 − 5

3 1

Hier dividiert man jetzt noch jede Zeile durch das Hauptdiagonalelement und erhält:

1 0 0 | 19

49

13

0 1 0 | − 29

19

13

0 0 1 | 19 − 5

913

Sobald man auf der linken Seite die Einheitsmatrix erreicht hat, ist auf der rechten Seitedirekt die gesuchte Inverse ablesbar, also

.A− 1 = 19

1 4 3−2 1 31 −5 3

(B) Berechnung von Determinanten

Mit Hilfe des Gauß-Algorithmus kann man jetzt auch Determinanten größerer Matrizenschnell und sicher berechnen. Das liegt daran, dass der Gauß-Algorithmus i. w. dieUmformung einer Matrix in eine Dreiecksmatrix liefert. Entscheidend ist dabei, dass dieStandardoperation "Addition des Vielfachen einer Zeile zu einer anderen" den Wert derDeterminante nicht ändert. Für eine Matrix wie

A =

1 2 3 42 3 4 −5

−3 4 5 −64 5 −6 7

gestaltet sich die Berechnung wie folgt:

Mathematik II (MI) SS 2012

- 54 -

Page 55: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

.

1 2 3 42 3 4 −5

−3 4 5 −64 5 −6 7

ü

1 2 3 40 −1 −2 −130 10 14 60 −3 −18 −9

ü

1 2 3 40 −1 −2 −130 0 −6 −1240 0 −12 30

ü

1 2 3 40 −1 −2 −130 0 −6 −1240 0 0 278

Die Determinante ist dann bekanntlich das Produkt der Hauptdiagonalelement:

.Det A = 1 $ (−1) $ (−6) $ 278 = 1668

(Man probiere dasselbe spaßeshalber mal mit Entwickeln nach einer Zeile oder Spalte!)

Bemerkungen:

Zeilen- und Spaltenvertauschungen ändern jeweils das Vorzeichen der Determinante.Falls solche unvermeidlich sind, muss man sie also genau mitzählen. Bei einer ungeradenAnzahl ist das Vorzeichen am Ende zu korrigieren.

Beim Lösen von LGS ist auch das Durchmultiplizieren einer Zeile mit einem konstantenFaktor zulässig. Das ist oft auch sehr nützlich, weil man so Brüche vermeiden undc ! 0sich das Kopfrechnen erleichtern kann. Bei der Determinanten-Berechnung ist so etwaszunächst verboten, da der Wert der Determinante dabei nicht gleich bleibt. (Aus diesemGrund ist auch oben das Wort "andere" fettgedruckt.) Allerdings weiß man genau, wie

sich der Wert dabei ändert: die Multiplikation einer einzelnen Zeile (oder Spalte) miteinem Faktor c führt dazu, dass auch die Determinante mit diesem Faktor multipliziertwird. Wenn man zur Rechenerleichterung solche Multiplikationen vornimmt, muss mansich also die Faktoren merken und am Schluss wieder rausdividieren.

Mathematik II (MI) SS 2012

- 55 -

Page 56: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2 Reelle Analysis I

In der reellen Analysis I geht es um Funktionen ("reellwertige Funktionen einerf : ‘t ‘

Veränderlichen"). Entsprechende Funktionen mehrerer Veränderlicher, also oderf : ‘n t ‘

sogar , gehören in die Analysis II, von der aber auch im dritten Semester nur sehrf : ‘n t ‘m

kleine Ausschnitte behandelt werden.

Hauptthema der Analysis ist die aus der Schulmathematik bekannte Differential- undIntegralrechnung (engl. calculus). Nur die grundlegenden Konzepte von Konvergenz

(Grenzwertberechnungen) und Stetigkeit werden wir etwas genauer betrachten, als es in derSchule meist üblich ist.

2.1 Folgen und Grenzwerte

2.1.1 Folgen

Unter einer Folge (engl. sequence) versteht man in der Mathematik eine mit natürlichenZahlen durchnummerierte (also unendlich lange) Aufzählung mathematischer Objekte. Wirwerden im weiteren nur Folgen reeller Zahlen betrachten, bei denen die Objekte alsoElemente von sind.‘

Beispiel:

$ $ $6449362516941Folgenglied an

$ $ $87654321Nummer ("Index") n

Beachte: Ob der Folgenindex bei 0 oder 1 (oder einer anderen natürlichen Zahl) beginnt, istgrundsätzlich unerheblich.

Da eine Folge aus unendlich vielen Werten besteht, ist es natürlich prinzipiell unmöglich, siedurch explizite Aufzählung aller Elemente zu definieren. Man muss also immer ein Bildungs-

gesetz (Berechnungsformel) für das allgemeine Folgenglied angeben. Die Stelle "..." iman

obigen Beispiel ist so zu verstehen, dass man dem Leser zutraut, das Bildungsgesetz aus denangegebenen Werten selbst richtig zu erraten. (Wenn es sich nicht um eine absichtliche Fallehandelt, ist ja wohl die Folge der Quadratzahlen gemeint.) Eine korrekte Definition dieserFolge wäre

, .an = n2 n c Œ+

Folgen, bei denen die Berechnungsformel für nur vom Folgenindex n abhängt, heißenan

explizit definierte Folgen. Weitere Beispiele sind etwa

oder oder (jeweils für ).an = 1n an = (−1)n an = (1 + 1

n )n n c Œ+

Dagegen spricht man von rekursiv definierten Folgen, wenn im Bildungsgesetz außer n auchnoch Vorgänger-Elemente auftreten (d. h. Folgenglieder mit kleineren Indizes), z. B.:

, , an +1 = 12 an + 1

ana1 = 1 n c Œ+

oder die (vielleicht bekannte) Fibonacci-Folge:

, , , .an +2 = an +1 + an a1 = 1 a2 = 1 n c Œ+

Mathematik II (MI) SS 2012

- 56 -

Page 57: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Typisch für rekursive Folgen ist die Notwendigkeit, hinreichend viele "Startwerte"vorzugeben. Außerdem sind solche Folgen i. a. wesentlich schwieriger behandelbar alsexplizite Folgen.

Grundlegende Definitionen:

Im folgenden sei eine Folge mit .an n c Œ+

(1) heißt "monoton wachsend" (auch: "monoton steigend")an

für alle :w an +1 m an n c Œ+

(2) heißt "monoton fallend"an

für alle :w an +1 [ an n c Œ+

(3) heißt "nach oben beschränkt", wenn es eine Schranke gibt mitan S c ‘ für alle an [ S n c Œ+

(4) heißt "nach unten beschränkt", wenn es eine Schranke gibt mitan S c ‘ für alle an m S n c Œ+

(5) heißt "beschränkt", wenn sie sowohl nach oben als auch nach unten beschränkt ist,an

d. h. wenn es eine Schranke gibt mitS c ‘ für alle an [ S n c Œ+

Beispiele: Man überlege sich die Monotonie- und Beschränktheits-Eigenschaften der Folgen

, , .an = n2 an = 1n an = (−1)n

2.1.2 Grenzwerte von Folgen

Die Werte der Folge nähern sich offenbar mit wachsendem n immer stärker deran = 1n

Null, auch wenn sie diesen Wert nie erreichen. Man sagt

" konvergiert gegen 0" oder "der Grenzwert der Folge ist 0".an an

Übliche Schreibweisen dafür sind

oder oder .nt ∞lim an = 0 liman = 0 an t 0

[Das Symbol lim kommt von "Limes" (= Grenzwert) und wird auch als "Limes" gesprochen,engl. limit.]

Für das konkrete Arbeiten mit Grenzwerten braucht man natürlich eine präzise Definition desKonvergenzbegriffs. Diese lautet wie folgt:

Die Folge konvergiert gegen den Wert , wenn sich zu jedem eine natürlichean a c ‘ > 0Zahl + finden lässt, so dass gilt

.n > + u an − a <

Anschaulich bedeutet das, dass man ein Intervall um den Grenzwert legt und(a − , a + )verlangt, dass von irgendeiner Stelle an alle Folgenglieder innerhalb dieses Intervalls liegen.Und das muss für beliebig kleine Werte von funktionieren!

Mathematik II (MI) SS 2012

- 57 -

Page 58: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Das Gegenteil von Konvergenz ist Divergenz. Jede nicht konvergente Folge ist alsodivergent. Ein wichtiger Sonderfall ist die sogenannte "bestimmte Divergenz" gegenUnendlich:

Die Schreibweise (oder ) bedeutet, dass sich zu jeder (beliebignt∞lim an = ∞ an t ∞

großen) Schranke ein Index + finden lässt, so dass für alle Folgenglieder mit M > 0 n > +

gilt: . (Übliche Sprechweise: " wächst über alle Schranken".)an > M an

Die Definition für lautet natürlich analog.an t −∞

Beispiele:

(1) Für gilt offenbar .an = n2 an t ∞

(2) Für gilt . Falls man aber in dieser Folge z. B. jedes millionstean = 1n an t 0

Folgenglied durch den Wert 1 ersetzt, geht die Konvergenz bereits verloren! (Die"Ausreißer" sind zwar selten, treten aber immer wieder auf, was laut Definition nichtzulässig ist.)

(3) Die Folge ist nicht konvergent, obwohl sie nur zwei verschiedene Wertean = (−1)n

annimmt.(4) Konstante Folgen, d. h. Folgen, die von irgendeiner Stelle an immer denselben Wert

annehmen, sind konvergent:0,1,2,3,3,3,3,3,3, ... t 3

(5) Folgen, die nicht beschränkt sind, können nie konvergent sein. (Das bedeutet aber nochnicht, dass sie im obigen Sinne "bestimmt divergent" gegen sind.)!∞

Für die praktische Überprüfung einer Folge auf Konvergenz oder Divergenz ist dieangegebene Definition oft nicht sehr gut geeignet. Zum einen muss der (vermutliche)Grenzwert bereits vorab bekannt sein, zum anderen kann die Rechnerei mit Beträgen undUngleichungen sehr lästig werden. Wenn es irgend geht, benutzt man daher lieber allgemeineKonvergenzkriterien, von denen wir nur eines anführen:

Aus Monotonie und Beschränktheit folgt Konvergenz.

Genauer sind das zwei Kriterien:- Eine monoton wachsende und nach oben beschränkte Folge ist konvergent.- Eine monoton fallende und nach unten beschränkte Folge ist konvergent

Beispiel: Die Folge ist offensichtlich nach unten beschränkt, da alle Folgenglieder an = 2n

n! sind. Außerdem giltm 0

,an + 1 = 2n +1

(n + 1)! = 2n

n! $2

(n + 1) = an $2

(n + 1) [ an

die Folge ist also monoton fallend und damit konvergent.

Wir kennen bisher kein Verfahren, um den Grenzwert einer vorgegebenen Folge praktisch zuermitteln. Selbst wenn die Konvergenz (wie im obigen Beispiel) bereits gesichert ist, müssteman den Grenzwert zunächst "raten" und dann die Ungleichung aus der Definition nach-rechnen. Ersteres geht oftmals noch ganz gut (im obigen Beispiel ist ziemlichlim an = 0

Mathematik II (MI) SS 2012

- 58 -

Page 59: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

naheliegend), das Nachrechnen der Definition ist dann aber meistens ziemlich mühsam. (Imobigen Beispiel geht es noch vergleichsweise einfach Übungsaufgabe!)u

In der Praxis versucht man daher nach Möglichkeit, das Zurückgehen auf die Definition zuvermeiden und unbekannte Folgen lieber auf bekannte (einfachere) Folgen zurückzuführen.Dazu dienen die nachfogend zusammengestellten Formeln.

Rechenregeln für reelle Zahlenfolgen:

(1) Sind und konvergente Folgen mit den Grenzwerten a bzw. b, so giltan bn

lim(an + bn) = a + b lim(an − bn) = a − b

(falls alle und )lim(an $ bn) = a $ b lim(an / bn) = a / b bn ! 0 b ! 0 (falls alle und )lim((an)bn) = ab an > 0 a > 0

(2) Ist eine Nullfolge (d. h. ) und beschränkt, so ist an lim an = 0 bn lim(an $ bn) = 0.

(3) Ist beschränkt und , so ist an lim bn = ∞ lim(an / bn) = 0.

(4) Gilt und , so gilt auch und .an t∞ bn t∞ (an + bn)t∞ (an $ bn)t∞Dagegen ist für und in diesem Fall keine Aussage möglich.(an − bn) (an /bn)

Bemerkungen: Die Regeln unter (1) besagen, dass die Grenzwertbildung mit den vier Grundrechenarten

und den Potenzoperationen "verträglich" (d. h. vertauschbar) ist. Die letzte der fünf Regeln unter (1) gilt insbesondere auch dann, wenn eine konstantebn

Folge ist, d. h. es ist (falls alle und ). Da c dabei auchlim(anc) = ac an > 0 a > 0

gebrochen sein darf, beinhaltet das auch alle Regeln über Wurzeln, etwa .lim an = a

Man beachte, dass die in (2) und (3) lediglich als beschränkt vorausgesetzten Folgen inder Tat nicht konvergent zu sein brauchen.

Die Formulierung "keine Aussage möglich" unter (4) bedeutet, dass die genannten Folgenim konkreten Einzelfall sowohl konvergent als auch divergent sein können und dass imKonvergenzfall beliebige Grenzwerte auftreten können. (Dasselbe gilt übrigens auch fürden Quotienten zweier Nullfolgen.)

Beispiel: Bei der Folge gehen Zähler und Nenner gegen , so dass zunächstan = n2 + 3n2n2 − 7

keine Aussage möglich ist. Man kann sich aber leicht helfen, indem man den ganzen Bruch

mit erweitert:1n2

an =1 + 3

n

2 − 7n2

Da und Nullfolgen sind, konvergiert der Zähler gegen 1 und der Nenner gegen 2, d. h. 3n

7n2

.lim an = 0, 5

Bemerkung zu rekursiven Folgen:Wie bereits erwähnt, sind rekursive Folgen i. a. wesentlich schwieriger zu behandeln alsexplizite. Man kann versuchen die Rekursion zu "knacken", d. h. die rekursive Berechnungs-formel in eine explizite zu verwandeln, was aber nur in Ausnahmefällen gelingt. Andererseitskann man der Rekursionsformel manchmal sehr leicht ansehen, welche Grenzwerte allenfallsin Frage kommen. Wenn man bei der ganz zu Anfang erwähnten Folge

Mathematik II (MI) SS 2012

- 59 -

Page 60: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

, , an +1 = 12 an + 1

ana1 = 1 n c Œ+

Konvergenz annimmt und auf beiden Seiten der Gleichung den Grenzübergang nt∞vollzieht, so erhält man für den (postulierten) Grenzwert die Bedingung

.a = 12 a + 1

a w a2 = 2

Als Grenzwerte kommen also nur und in Frage. Dass die Folge tatsächlich2 − 2konvergiert, und zwar gegen , bedarf dann allerdings noch eines separaten Beweises!2

2.1.3 Reihen

Unter einer Reihe (engl. series) versteht man in der Mathematik eine "unendliche Summe",etwa

.a1 + a2 + a3 + $ $ $ =∞

n = 1 an

Dabei muss man natürlich zunächst fragen, ob ein solcher Ausdruck überhaupt sinnvoll ist,d. h. ob diese Summe gegen einen definierten (endlichen) Wert konvergiert.

Formal sind solche Reihen nichts neues, da es sich nur um spezielle Folgen handelt. Zu dergegebenen Folge bildet man einfach die "Teilsummenfolge" :(an) (sn)

s1 = a1

s2 = a1 + a2

s3 = a1 + a2 + a3

usw.s4 = a1 + a2 + a3 + a4

Konvergenz der Reihe bedeutet einfach Konvergenz der Folge und der Summenwert der(sn)Reihe ist dann ggf. der Grenzwert .lim sn

Es ist ziemlich offensichtlich, dass eine Reihe nur konvergieren kann, wenn die einzelnenSummanden selbst eine Nullfolge bilden. Das ist aber keine hinreichende Bedingung, wiean

man etwa an der Reihe

1 + 12 + 1

3 + 14 + 1

5 + 16 + $ $ $ =

n = 1

1n

sieht, von der man zeigen kann, dass sie über alle Schranken wächst (also gegen +∞divergiert). Dieselbe Reihe mit alternierenden Vorzeichen

1 − 12 + 1

3 − 14 + 1

5 − 16 ! $ $ $ =

n = 1

(−1)n + 1 1n

ist dagegen konvergent, als Grenzwert ergibt sich . (Für die entsprechenden Herleitungenln 2braucht man aber weitergehende Hilfsmittel, die hier nicht mehr behandelt werden.)

Ein weiteres wichtiges Beispiel ist die "geometrische" Reihe

,1 + q + q2 + q3 + q4 + q5 $ $ $ =n = 0

qn

die genau dann konvergiert, wenn gilt. Der Grenzwert ist dann .q < 1 11 − q

Mathematik II (MI) SS 2012

- 60 -

Page 61: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.2 Stetigkeit

2.2.1 Grenzwerte von Funktionen

Gegeben sei eine Funktion mit . Wir interessieren uns für das Verhalten derf : Dt ‘ D _ ‘

Funktion bei Annäherung an einen Punkt . Genauer heißt das, dass wir das Argument xxo c D

"irgendwie" gegen laufen lassen. Wenn die zugehörigen Funktionswerte dabei ebenfallsxo

auf einen eindeutigen Wert zusteuern, nennt man dies den "Grenzwert von f beio

Annäherung an ", geschriebenxo

.xtxolim f (x) = o

Auf die genaue Definition (mit "Epsilontik" wie bei Grenzwerten von Folgen) gehen wir hiernicht mehr ein. Wir begnügen uns mit der anschaulichen Formulierung, dass für jede Folge,die im Definitionsbereich verläuft und die gegen konvergiert, die Folge der Funktionswertexo

gegen konvergieren muss. (Beweistechnisch ist dieses Kriterium aber natürlich ehero

unpraktisch.)

Für den Grenzwert wurde die Bezeichnung (statt des vielleicht erwarteten ) gewählt, umo yo

klarzumachen, dass dieser Wert zunächst nichts mit einem ggf. existierenden Funktionswertvon f an der Stelle zu tun. In der Tat ist die Frage nach einem Grenzwert oft gerade dannxo

von Bedeutung, wenn ein entsprechender Funktionswert entweder überhaupt nicht definiertist oder einen "ungeeigneten" Wert hat. Wir betrachten etwa die Funktion

f (x) =

x fur x c ‘◊12 fur x = 1

Der Grenzwert dieser Funktion bei ist offenbar 1, obwohl der tatsächliche Funktions-x = 1wert anders definiert wurde. Dagegen hat die folgende Funktion bei keinen Grenzwert:x = 1

Hier könnte man allenfalls einen rechtsseitigen und einen linksseitigen Grenzwert definieren,die aber verschieden sind. Dabei ist es wieder unerheblich, welchen Funktionswert man ander Stelle tatsächlich definiert. (Naheliegend wäre einer der beiden einseitigen Grenz-x = 1werte oder ihr Mittelwert.)

Bemerkung:

Die anfangs gemachte Voraussetzung ist nicht unbedingt erforderlich. Es reicht, wenn xo c D

"erreichbar" ist, d. h. als Grenzwert einer ganz in D verlaufenden Folge auftritt. Ist D etwaxo

ein offenes Intervall, so ist es sinnvoll, nach den Grenzwerten von f in den beiden End-punkten zu fragen ("Fortsetzung von f auf den Abschluss von D"). Dasselbe gilt, wenn xo

eine "Lücke" im Definitionsbereich ist.

Mathematik II (MI) SS 2012

- 61 -

Page 62: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.2.2 Stetigkeit

Wir kommen nun zu dem für die gesamte Analysis grundlegenden Begriff der Stetigkeit einerFunktion:

Eine Funktion , heißt "stetig im Punkt ", wenn der Grenzwert vonf : Dt ‘ D _ ‘ xo c D

f in existiert und mit dem dortigen Funktionswert übereinstimmt:xo

.xtxolim f (x) = f (xo)

Die Funktion heißt "stetig", wenn sie in allen Punkten von D stetig ist.

Wir werden es in Zukunft fast ausschließlich mit Funktionen zu tun haben, die entweder imgesamten Definitionsbereich stetig sind oder bei denen die Stetigkeit nur in isolierten Punktenverletzt ist. Die wichtigsten Beispiele für isolierte Unstetigkeitsstellen sind Sprungstellen undPolstellen (mit oder ohne Zeichenwechsel):

Die heuristische Vorstellung "eine Funktion ist stetig, wenn sich der Funktionsgraph in einemZug zeichnen lässt" reicht daher für die meisten praktischen Fälle aus.

Beispiele:

RechteckschwingungSägezahnschwingung

stetig bis auf isolierte Sprungstellen:

gebrochen-rationale FunktionenTangens-Funktion

stetig bis auf isolierte Polstellen:

LogarithmusfunktionQuadratwurzel-Funktion

stetig auf :D G ‘

PolynomfunktionenExponentialfunktionSinus- und Cosinus-Funktion

stetig auf :D = ‘

Ein etwas exotischeres Beispiel, das sich auch in der Tat kaum noch zeichnen lässt, ist

dagegen die Funktion , die bei einen sogenannten Oszillationspunkt hat.f (x) = sin 1x x = 0

(Aufgabe: Man versuche sich klarzumachen, was da genau passiert!)

Mathematik II (MI) SS 2012

- 62 -

Page 63: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.3 Exponential- und Winkelfunktionen

Die Exponentialfunktion und die Winkelfunktionen , , sind aus der Schul-ex sin x cos x tan x

mathematik bekannt und wurden auch im ersten Semester bereits erneut behandelt. Hierfolgen jetzt einige weitere wichtige Eigenschaften, die sich erst mit Hilfe des Konvergenz-begriffs formulieren lassen.

2.3.1 Die Eulersche Zahl e

Wir wissen, dass die "natürliche" Exponentialfunktion eigentlich nur einf (x) = exp (x) = ex

Sonderfall der "allgemeinen" Exponentialfunktion mit irgendeiner reellen Zahl f (x) = ax

als Basis ist. Andererseits arbeiten Compiler-Bibliotheken und Taschenrechner häufiga > 0bevorzugt (oder ausschließlich) mit der Funktion . Den allgemeinen Fall kann man dannex

immer nach der bekannten Formela x = ex ln a

darauf zurückführen. Das sieht so aus, als ob die natürliche Exponentialfunktion besonderseinfach numerisch zu berechnen ist, obwohl ihre Basis, die sogenannte Eulersche Zahl

e = exp (1) = 2, 71828...

ein eher unhandlicher Wert ist. In der Tat gibt es für e (und daraus folgend für alle Funktions-werte von ) insbesondere zwei wichtige Darstellungen als Grenzwerte.ex

Zum einen ist

e =nt∞lim (1 + 1

n )n

undfür alle .ex =

nt∞lim (1 + x

n )n x c ‘

Das liefert für die Zahl e die Näherungen

(1 + 1)1 = 2

(1 + 12 )2 = 2, 25

(1 + 13 )3 = 2, 370

(1 + 14 )4 = 2, 4414 ...

§

(1 + 110 )10 = 2, 5937 ...

§

(1 + 1100 )100 = 2, 7048 ...

Man sieht, dass die Konvergenz sehr schlecht (d. h. langsam) ist. Für eine brauchbare Anzahlvon Nachkommastellen benötigt man sehr große Werte von n, was die Berechnung derPotenzen sehr aufwendig macht. Für die praktische Berechnung in Taschenrechnern undCompiler-Routinen ist diese Folge also sicher nicht geeignet. Sie liefert aber eine gewisseanschauliche Vorstellung für die Bedeutung der Zahl e (Stichwort "stetige Verzinsung",genaueres dazu evtl. in den Übungen).

Mathematik II (MI) SS 2012

- 63 -

Page 64: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.3.2 Reihenentwicklungen

Für die praktische Berechnung wesentlich geeigneter ist folgende Reihenentwicklung:

e = 1 + 1 + 12! + 1

3! + 14! + 1

5! + $ $ $ =∞

n = 0 1

n!bzw.

für alle .ex = 1 + x + x2

2! + x3

3! + x4

4! + x5

5! + $ $ $ =∞

n = 0 xn

n! x c ‘

Durch die Fakultäten im Nenner konvergieren diese Reihen sehr schnell. Außerdem lässt sichverhältnismäßig einfach ermitteln, wieviele Summanden man für eine gewünschte Ergebnis-genauigkeit jeweils berücksichtigen muss ("Restgliedabschätzung").

Solche Reihen, bei denen in den einzelnen Summanden die aufsteigenden Potenzen einerVariable x auftreten, heißen Potenzreihen. Für den praktischen numerischen Umgang mitkomplizierten Funktionen ist die Kenntnis einer Potenzreihe (mit möglichst guten Konver-genzeigenschaften) von großer Bedeutung. Wie man solche Reihenentwicklungen findet,wird im nächsten Semester behandelt. Hier folgen als Beispiele nur noch die Reihen für Sinusund Cosinus:

für alle .cos x = 1 − x2

2! + x4

4! − x6

6! ! $ $ $ =∞

n =0 (−1)n x 2n

(2n)! x c ‘

für alle .sin x = x − x3

3! + x5

5! − x7

7! ! $ $ $ =∞

n =0 (−1)n x 2n + 1

(2n + 1)! x c ‘

Wegen der Fakultäten im Nenner und der alternierenden Vorzeichen konvergieren dieseReihen sogar noch besser als die e-Reihe.

2.3.3 Die komplexe Exponentialfunktion

Mit Hilfe der angegebenen Reihenentwicklung lässt sich die Exponentialfunktion jetzt formalsehr einfach auf komplexe Argumente erweitern. Wegen

ex + i y = exe i y

betrachten wir zunächst nur rein-imaginäre Argumente:

e i y = 1 + i y +i2y2

2!+

i3y3

3!+

i4y4

4!+

i5y5

5!+ $ $ $

Wegen , , kann man diese Reihe leicht nach Real- und Imaginärteili2 = −1 i3 = −i i4 = 1sortieren:

e i y = 1 −y2

2!+

y4

4!−

y6

6!+ $ $ $ + i ( y −

y3

3!+

y5

5!+ $ $ $)

Durch Vergleich mit den obigen Reihen für Sinus und Cosinus erhält man also

.e i y = cos y + i sin y

Dies ist offenbar eine komplexe Zahl vom Betrag 1, in der komplexen Ebene also ein Punktdes Einheitskreises. Allgemein ist

Mathematik II (MI) SS 2012

- 64 -

Page 65: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

ex + i y = exe i y = ex(cos y + i sin y)

also die komplexe Zahl mit dem Betrag und dem "Argument" y (Polarkoordinaten!).ex

Die seinerzeit behandelte "Moivresche Formel" entpuppt sich jetzt als direkte Folge einesbekannten Rechengesetzes für Potenzen:

.(cos y + i sin y)n = (e i y)n = e i n y = cos n y + i sin n y

Man beachte auch die folgenden Spezialfälle:

e i = cos + i sin = − 1

e2 i = cos 2 + i sin 2 = 1

(Insbesondere die Gleichung wird gelegentlich als die "verblüffendste Formel dere i = −1gesamten Mathematik" bezeichnet, da sie mit Hilfe der imaginären Einheit i einenüberraschenden Zusammenhang zwischen den beiden fundamentalen Konstanten und eherstellt.)

Mathematik II (MI) SS 2012

- 65 -

Page 66: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.4 Ableitungen

2.4.1 Der Begriff der Ableitung

Die "Ableitung" einer Funktion ist das zentrale Thema der Differentialrechnung. (Statt"ableiten" sagt man auch "differenzieren".) Ausgangspunkt ist das "Tangentenproblem", d. h.die Fragestellung, wie man bei einer gegebenen Funktion an einer beliebigen Stelle dief (x) xo

Tangente an den Funktionsgraphen erhält:

Die Steigung dieser Tangente wird dann auch als Steigung des Funktionsgraphen an derStelle bezeichnet. Zur praktischen Berechnung betrachtet man zunächst einen weiterenxo

Punkt "in der Nähe" von , d. h. einen Punkt . Der "Versatz" h kann dabei positiv oderxo xo + h

negativ sein; da wir ihn später gegen Null gehen lassen, sollte man ihn sich aber von vorn-herein als betragsmäßig eher klein vorstellen.

Wir betrachten den sogenannten "Differenzenquotienten", d. h. den Quotienten aus derDifferenz der beiden Funktionswerte und der Differenz der beiden Argumente:

.f (xo + h) − f (xo)

(xo + h) − xo=

f (xo + h) − f (xo)h

Dieser bedeutet anschaulich die Steigung der Sekante durch die beiden betreffenden Punktedes Funktionsgraphen:

Dann lassen wir das h gegen Null gehen und hoffen, dass sich als Grenzlage der Sekante diegesuchte Tangente ergibt. Wenn das funktioniert, ist die Funktion in diesem Punkt "differen-zierbar".

Die formale Definition lautet also:

Mathematik II (MI) SS 2012

- 66 -

Page 67: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Eine Funktion heißt differenzierbar im Punkt , wenn der Grenzwert desf : D d ‘ xo c D

Differenzenquotienten

h d 0lim

f (xo + h) − f (xo)h

existiert.

Dieser Wert heißt dann der Differentialquotient von f an der Stelle oder die (erste)xo

Ableitung von f an der Stelle . Übliche Schreibweisen sind:xo

und .f ∏(xo) d fd x

(xo)

Eine Funktion heißt differenzierbar (ohne weiteren Zusatz), wenn sie in allen Punktenf (x)ihres Definitionsbereichs differenzierbar ist. Die Werte liefern dann in ihrer Gesamtheitf ∏(x)wieder eine Funktion von x. Mit der Sprechweise "die Ableitung von f " ist meistens dieseFunktion als Ganzes gemeint (engl.: derivative of f ).

Bemerkungen: Normalerweise bevorzugt man die kurze Schreibweise . Die ausführlichere Schreib-f ∏(x)

weise mit df und dx ist aber nützlich, wenn die Funktion und/oder die Variable nicht soeinfache Namen haben, sondern selbst schon aus komplizierteren Ausdrücken bestehen(ein in physikalischen und technischen Anwendungen häufiger Fall).

Früher hat man den Differentialquotienten tatsächlich als Quotienten zweier "unendlichkleiner Größen", der sogenannten Differentiale dy und dx interpretiert. Diese (etwasfragwürdige) Betrachtungsweise ist durch den modernen Grenzwertbegriff abgelöstworden. Es gibt aber eine Reihe von Formeln und Verfahren, die sich als formaleManipulationen mit diesen Differentialen besonders einprägsam beschreiben lassen. Fürsolche "Merkregeln" werden sie daher auch heute noch gern benutzt (z. B. beim Lösenvon Differentialgleichungen u. ä.).

Anschaulich liefert die Ableitung ein Maß dafür, wie schnell die Funktion ihre Werte ändert:große Werte der Ableitung bedeuten einen steilen Kurvenverlauf, kleine Werte einen flachen.In der Physik treten erste Ableitungen daher typischerweise bei der Berechnung vonGeschwindigkeiten auf (siehe Abschnitt 2.4.3 (A)).

Eine notwendige Bedingung für Differenzierbarkeit ist Stetigkeit. Ist die Funktion in nichtxo

stetig, so kann sie dort auch nicht differenzierbar sein. Dass die Differenzierbarkeit aber eineecht stärkere Forderung als die Stetigkeit ist, sieht man an der Funktion :f (x) = x

Diese Funktion ist in zwar stetig, aber nicht differenzierbar. Anschaulich sieht man dasx = 0daran, dass der Funktionsgraph dort offenbar keine (eindeutige) Tangente hat. Allgemeinkann man sich merken, dass die Differenzierbarkeit etwas über die "Glattheit" des Funktions-graphen aussagt.

Mathematik II (MI) SS 2012

- 67 -

Page 68: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.4.2 Berechnung von Ableitungen

Um die Ableitung einer Funktion wie etwa zu ermitteln, muss man nach derf (x) = x2

Definition den Grenzwert

hd 0lim

(x + h)2 − x2

h=

hd 0lim 2xh + h2

h=

hd 0lim (2x + h) = 2x

berechnen und erhält also .f ∏(x) = 2x

Dieses Zurückgehen auf die Definition ist in der Praxis aber eigentlich nie nötig, da esallgemeine Regeln gibt, mit denen man fast alle gängigen Funktionen ableiten kann (sofernsie überhaupt differenzierbar sind).

Wir beginnen mit einigen einfachen Grundregeln:

(1) Die Ableitung einer konstanten Funktion ist Null:f (x) = c u f ∏(x) = 0

(2) Die Operation "Ableiten" ist additiv, d. h.f (x) = u (x) + v (x) u f ∏(x) = u ∏(x) + v ∏(x)

(3) Konstante Faktoren bleiben beim Ableiten erhalten:f (x) = c g (x) u f ∏(x) = c g ∏(x)

(4) "Potenzregel":f (x) = x c u f ∏(x) = c x c − 1

Damit können jetzt also schon alle Polynome differenziert werden. Man beachte aber, dassdie Potenzregel nicht nur für ganzzahlig-positive Exponenten gilt. Sie beinhaltet z. B. auchdie Fälle:

f (x) = 1x3 = x− 3 u f ∏(x) = (−3) x−4 = − 3

x4

und

.f (x) = x = x1/2 u f ∏(x) = 12 x−1/2 = 1

2 x

Die Ableitungen spezieller Funktionen kann man in Formelsammlungen nachschlagen, einigeder wichtigsten sollte man aber auch im Kopf haben:

(5) ,f (x) = ex u f ∏(x) = ex f (x) = ln x u f ∏(x) = 1x

(Beachte: die Exponentialfunktion ist ihre eigene Ableitung!)

(6) ,f (x) = sin x u f ∏(x) = cos x f (x) = cos x u f ∏(x) = − sin x

Um auch komplizierter zusammengesetzte Funktionen differenzieren zu können, braucht mannoch Regeln für Produkte und Quotienten von Funktionen, sowie für die Verkettung:

(7) "Produktregel":f (x) = u (x) $ v (x) u f ∏(x) = u ∏(x) $ v (x) + u (x) $ v ∏(x)

Mathematik II (MI) SS 2012

- 68 -

Page 69: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

(8) "Quotientenregel":

f (x) =u (x)v (x) u f ∏(x) =

u ∏(x) $ v (x) − u (x) $ v ∏(x)(v (x))2

(9) "Kettenregel":f (x) = u (v (x)) u f ∏(x) = u ∏(v (x)) $ v ∏(x)

Die Produkt- und Quotientenregel merkt man sich am besten in der "Kurzform" (ohneAngabe der Argumente):

und .(uv) ∏ = u ∏v + uv ∏uv∏

= u ∏v − uv ∏

v2

Die Kettenregel ist die komplizierteste (aber auch eine der wichtigsten) dieser Regeln. Manmerkt sie sich am besten in Form einer "Arbeitsanweisung":(i) Differenziere die äußere Funktion u. Dabei spielt die gesamte innere Funktion diev (x)

Rolle der freien Variablen. Unabhängig davon, wie kompliziert der Ausdruck für ist,v (x)muss man ihn also kurzzeitig wie einen (etwas seltsamen) Variablennamen betrachten.

(ii) Multipliziere mit der Ableitung der inneren Funktion v, die jetzt ganz "normal" (d. h. alsFunktion von x) differenziert wird.

Beispiel: f (x) = cos(x3)Für die "äußere Ableitung" differenziert man den Cosinus und tut dabei so, als wäre derx3

Name der Variablen. Das liefert . Für die "innere Ableitung" ist zu differenzieren,− sin(x3) x3

was liefert. Das Ergebnis lautet also:3x2

.f ∏(x) = − 3x2 sin(x3)

Bemerkungen: Gerade in einfachen Fällen passiert es leicht, dass man die Anwendung der Kettenregel

vergisst, z. B. bei . Die Ableitung der Exponentialfunktion ergibt natürlichf (x) = e3 x

wieder . Das "Nachdifferenzieren" gemäß der Kettenregel liefert aber noch einene3 x

zusätzlichen Faktor 3 (die Ableitung der "inneren Funktion" )!3x

Für Mehrfachverkettungen wie muss man die Kettenregel entsprechendf (x) = sin(e3 x)oft (hier also zweimal) anwenden.

2.4.3 Höhere Ableitungen

Falls die Ableitung einer Funktion selbst wieder differenzierbar ist, so liefert derenf ∏(x) f (x)Ableitung die zweite Ableitung von f, geschrieben

oder oder .f ∏∏(x) f (2)(x) d2

d x2 f (x)

Analog definiert man dritte und höhere Ableitungen.

Um die zweite Ableitung der oben betrachteten Funktion zu ermitteln, mussf (x) = cos(x3)man also das gefundene nochmals differenzieren. Das geht nach der Produktregel mit f ∏

und . Bei der Ableitung des Sinus ist dann wieder die Kettenregelu (x) = −3x2 v (x) = sin(x3)zu beachten:

.f ∏∏(x) = − 6x sin(x3) + (−3x2) cos(x3) 3x2 = − 6x sin(x3) − 9x4 cos(x3)

Mathematik II (MI) SS 2012

- 69 -

Page 70: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.4.4 Anwendungen

(A) Geschwindigkeit und Beschleunigung

Insbesondere in der Physik hat man es oft mit Funktionen zu tun, die einen Bewegungsablaufbeschreiben. Im einfachsten Fall ist eine Funktion, die angibt, welche Strecke eins(t)bewegter Massenpunkt (oder ein fahrendes Auto) bis zum Zeitpunkt t zurückgelegt hat. DieAbleitung liefert dann genau die Momentangeschwindigkeit zum Zeitpunkt t, die zweites ∏(t)Ableitung die Beschleunigung.s ∏∏(t)

(B) äherungsrechnung

Man kann die Grenzwertformel für die Ableitung auch in eine Näherungsgleichungumformulieren:

(für kleine Werte von h)f ∏(x) lf (xo + h) − f (xo)

h

u f (xo + h) l f (xo) + h f ∏(xo)

Auf der rechten Seite steht die Gleichung der Tangentengeraden, die durch geht undf (xo)dort dieselbe Steigung hat wie der Funktionsgraph. Man kann diese Gleichung auch benutzen,um allein aus den Werten von und Näherungswerte für andere Argumente in derf (xo) f ∏(xo)Nähe von zu berechnen.xo

Beispiel: Für ist , also erhält man für kleine Werte von h dief (x) = ex f (0) = f ∏(0) = 1Näherung

.eh l 1 + h

Auch die Qualität solcher Näherungen lässt sich häufig gut abschätzen, da man nachweisenkann, dass der Fehler immer mindestens quadratisch gegen Null geht. (Er liegt also höchstensin der Größenordnung von .)h2

(C) Lokale Extremwerte

In einem Punkt liegt ein lokaler (auch: relativer) Extremwert einer Funktion vor, wennxo f (x)der Funktionswert dort größer bzw. kleiner ist, als in der unmittelbaren Umgebung diesesPunktes. Die folgende Funktion hat also in ein lokales Maximum, obwohl die Funktionxo

anderswo durchaus größere Werte annimmt:

Mathematik II (MI) SS 2012

- 70 -

Page 71: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Anschaulich ist klar, dass an solchen Extremstellen die Tangentengerade horizontal verlaufenmuss, also:

;otwendige Bedingung für lokale Extremstellen: .f ∏(x) = 0

Man beachte aber, dass das nur für solche Extremstellen funktioniert, an denen die Funktiondifferenzierbar ist. Das lokale Minimum der Funktion bei (siehe oben) findetf (x) = x x = 0man mit diesem Verfahren nicht!

Das Nullsetzen der ersten Ableitung liefert also zunächst die Kandidaten für möglicheExtremstellen. Um festzustellen, ob tatsächlich ein Extremwert vorliegt und ob es sich ggf.um ein Minimum oder Maximum handelt, benötigt man (mindestens) noch die zweiteAbleitung:

Hinreichende Bedingung für lokale Extremstellen: und lokales Minimumf ∏(x) = 0 f ∏∏(x) > 0 u und keine Entscheidung möglichf ∏(x) = 0 f ∏∏(x) = 0 u und lokales Maximumf ∏(x) = 0 f ∏∏(x) < 0 u

Wenn auch die zweite Ableitung Null ist, kann sowohl eine Extremstelle als auch einsogenannter "Wendepunkt mit waagerechter Tangente" vorliegen. Für die endgültigeEntscheidung muss man dann noch höhere Ableitungen ausrechnen, und zwar solange biserstmalig ein Wert auftritt. Geschieht das bei einer geraden Ableitung (zweite, vierte,! 0sechste, ...), so liegt ein Extremwert vor, ansonsten nicht.

Das Standardbeispiel für einen Wendepunkt mit waagerechter Tangente ist die Parabel . Für gilt hier in der Tat , aber .f (x) = x3 x = 0 f ∏(0) = f ∏∏(0) = 0 f ∏∏∏(0) = 6 ! 0

Mathematik II (MI) SS 2012

- 71 -

Page 72: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

2.5 Integrale

2.5.1 Stammfunktionen

Ist eine Funktion gegeben, so kann man fragen, ob diese Funktion als Ableitung einerf (x)anderen Funktion auftreten kann. Man versucht also gewissermaßen den Vorgang desAbleitens umzukehren. Dazu wird folgender Begriff definiert:

Ist eine Funktion , gegeben, so heißt jede Funktion mitf : Dt ‘ D _ ‘ F : Dt ‘

(auf ganz D)F ∏(x) = f (x)

eine Stammfunktion von .f (x)

Aufgrund der bekannten Ableitungsregeln ist klar, dass mit auch alle Funktionen F (x) Stammfunktionen von sind. Weitere Möglichkeiten gibt es allerdings nicht.F (x) + c f (x)

Wenn es überhaupt eine Stammfunktion zu gibt, so ist diese also bis auf eine additivef (x)Konstante eindeutig bestimmt.

Die Ermittlung der Stammfunktion(en) einer gegebenen Funktion heißt "Integrieren" derf (x)Funktion f. Das frei wählbare c heißt daher auch "Integrationskonstante". Solange man nur anirgendeiner Stammfunktion interessiert ist, kann man der Einfachheit halber setzen. Inc = 0manchen Anwendungsfällen ist es aber erforderlich, aus der Menge aller Stammfunktionennoch diejenige mit dem "richtigen" c herauszufinden (je nach Aufgabenstellung).

Statt "Stammfunktion" ist auch die Bezeichnung "unbestimmtes Integral" üblich. (Diesezunächst unverständliche Benennung dient nur der Unterscheidung von den weiter untenbehandelten "bestimmten" Integralen.) Für die Angabe von Stammfunktionen wird folgendeSchreibweise benutzt:

.F (x) = ¶ f (x) dx

Das Integralzeichen ist ein stilisiertes "S" (Grund siehe später). Das dx hatte ursprünglich dieBedeutung eines "Differentials" (unendlich kleine Größe), dient heute aber eigentlich nurnoch als "schließende Klammer" hinter dem Integranden. Insbesondere bei kompliziertenAusdrücken für , die vielleicht noch weitere Parameter enthalten, wird durch das dx auchf (x)deutlich gemacht, über welche Variable zu integrieren ist.

2.5.2 Ermittlung von Stammfunktionen

Für einige Funktionen kann man die Stammfunktionen leicht ermitteln, indem man einfachdie entsprechenden Ableitungsregeln von rechts nach links liest. So liefert etwa die Potenz-regel für die Differentiation eine entsprechende Regel für die Integration:

.¶ xn dx = 1n + 1 xn + 1 + c

Auch dies gilt wieder für beliebige (nicht notwendig positiv-ganzzahlige) Exponenten,allerdings offenbar mit der Ausnahme (Division durch Null). Dieser Fall macht abern = −1keine wirklichen Schwierigkeiten, da man weiß

Mathematik II (MI) SS 2012

- 72 -

Page 73: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

.¶ 1x dx = ln x + c

(Das gilt zunächst nur für . Für beliebiges kann man aber benutzen.) x > 0 x ! 0 ln |x|Ebenso bereits bekannt sind folgende Stammfunktionen:

, , .¶ ex dx = ex + c ¶ sin x dx = − cos x + c ¶ cos x dx = sin x + c

Da die Integration (genau wie das Ableiten) additiv ist, kann man mit Hilfe der PotenzregelPolynome problemlos integrieren.

Über diese einfachen Fälle hinaus wird die Berechnung von Stammfunktionen dann aberschnell sehr schwierig. So lassen sich gebrochen rationale Funktionen zwar immer mit demVerfahren der "Partialbruchzerlegung" integrieren, das aber sehr kompliziert und rechen-aufwendig ist. Schon für Produkte (und erst recht für kompliziertere Zusammensetzungen)gibt es überhaupt keine gradlinigen Algorithmen mehr, wie man sie vom Ableiten kennt,sondern nur noch allgemeine "Integrationsverfahren", deren Anwendbarkeit man in jedemEinzelfall ausprobieren muss. Ein typisches Beispiel ist etwa das (vielleicht aus der Schulebekannte) Verfahren der "partiellen Integration":

.¶ u ∏v dx = uv − ¶ u v ∏ dx

(Das ist offenbar entstanden als Umkehrung der Produktregel für Ableitungen.) Man versuchtalso, den Integranden als Produkt von zwei Faktoren zu schreiben, von denen einer einebekannte oder leicht zu ermittelnde Stammfunktion hat. Diesen nennt man , den anderen v.u ∏

Dann schreibt man die rechte Seite hin und hofft, dass das dortige Integral einfacher zu lösenist als das ursprüngliche. Ob das überhaupt funktioniert und wie man die Zerlegung in undu ∏

v am besten vornimmt, muss man in jedem Einzelfall neu ausprobieren.

Außer in den einfachsten Fällen erfolgt die Ermittlung von Stammfunktionen also am bestendurch Nachschlagen in einer Formelsammlung oder durch Online-Anfrage bei entsprechen-den Internet-Seiten (z. B. integrals.wolfram.com).

2.5.3 Bestimmte Integrale

Historisch stand am Beginn der Integralrechnung wieder eine geometrische Fragestellung(ähnlich wie das Tangentenproblem bei der Differentialrechnung), nämlich die Frage nachdem Flächeninhalt krummlinig begrenzter Bereiche. Grundaufgabe ist dabei die Berechnungdes Flächeninhalts, den der Funktionsgraph einer (überall positiven) Funktion in einemIntervall mit der x-Achse einschließt:[a, b]

Dazu zerlegt man diese Fläche in sehr viele sehr schmale vertikale Streifen, deren Flächen-inhalt jeweils etwa Streifenbreite Funktionswert ist. Durch einen Grenzübergang "Streifen-%

breite " versucht man dann, einen sinnvollen Wert für den gesuchten Flächeninhalt zut 0erhalten.

Mathematik II (MI) SS 2012

- 73 -

Page 74: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Wenn man diese Idee hinreichend präzisiert, gelangt man zum Begriff des sogenannten"Riemann-Integrals". Dieses wird üblicherweise (mehr oder weniger heuristisch) auch schonin der Schule behandelt. Auf die genauen technischen Details werden wir allerdings auch hiernicht weiter eingehen. Im Prinzip wird das Intervall in eine gewisse Anzahl gleich-[a, b]großer Teilstücke zerlegt, anschließend werden für diese Zerlegung die sogenannte Unter-und Obersumme gemäß folgender Skizze berechnet:

Dann wird die Zerlegung des Intervalls sukzessive verfeinert, so dass die Streifen immerschmaler werden. Wenn sich dabei Ober- und Untersumme immer weiter annähern undeinem gemeinsamen Grenzwert zustreben, heißt die Funktion "integrierbar auf "[a, b](genauer: "Riemann-integrierbar" oder "R-integrierbar"). Der resultierende Wert heißt das"bestimmte Integral" von f über , geschrieben:[a, b]

.b

a¶ f (x) dx

Man beachte: Der Unterschied zwischen bestimmten und unbestimmten Integralen ist alsoformal am Vorhandensein bzw. Nichtvorhandensein der Grenzen am Integralzeichenerkennbar. Außerdem ist das unbestimmte Integral eine Funktion (Stammfunktion), dasbestimmte Integral dagegen nur ein einzelner Zahlenwert!

Man kann nachweisen, dass eine stetige Funktion immer integrierbar ist. Dief : [a, b]t ‘

Integrierbarkeit ist aber eine schwächere Forderung als die Stetigkeit. Anschaulich isteinigermaßen klar, dass z. B. eine oder mehrere Sprungstellen die Integrierbarkeit nichtbeeinträchtigen.

2.5.4 Der Hauptsatz der Differential- und Integralrechnung

Es ist natürlich kein Zufall, dass für unbestimmte und bestimmte Integrale fast dieselbeNomenklatur und Symbolik benutzt wird. In der Tat kann man Stammfunktionen überbestimmte Integrale berechnen und umgekehrt. Der genaue Zusammenhang ist der Inhalt dessogenannten "Hauptsatzes der Differential- und Integralrechnung".

Dazu betrachten wir wieder eine stetige und damit R-integrierbare Funktion .f : [a, b]t ‘

Für diese berechnen wir jetzt die bestimmten Integrale über Teilintervallen der Form [a, x]mit . Das sind also jeweils Teil-Flächeninhalte folgender Art:a < x [ b

Diese Integrale mit fester unterer Grenze a und variabler oberer Grenze x liefern dann eineFunktion, die sogenannte "Integralfunktion":

Mathematik II (MI) SS 2012

- 74 -

Page 75: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

.I (x) =a

x

¶ f () d

(Da wir den Buchstaben x für die variable obere Grenze benutzen wollen, musste dieIntegrationsvariable irgendeinen anderen Namen bekommen.) Der angekündigte Hauptsatz

der Differential- und Integralrechnung besagt nun, dass diese Funktion differenzierbarI (x)ist und gilt. Die Integralfunktion liefert also eine Stammfunktion für f.I ∏(x) = f (x)

Noch wichtiger ist der umgekehrte Zusammenhang: Ist Stammfunktion einer stetigenF(x)Funktion , so kann man bestimmte Integrale zu f immer wie folgt berechnen:f (x)

.a

b

¶ f (x) dx = F (b) − F (a)

Das Berechnungsverfahren besteht also aus zwei Schritten: Ermitteln einer Stammfunktionund Einsetzen der Grenzen. Die übliche Schreibweise dafür ist

.a

b

¶ f (x) dx = [F (x)]ab = F (b) − F (a)

Für die Berechnung der Fläche unter der ersten Halbschwingung der Sinusfunktion sähe dasetwa wie folgt aus:

.0

¶ sin x dx = [− cos x]0 = − cos − (− cos 0) = 1 + 1 = 2

Bemerkungen: Wenn die Funktion f eine oder mehrere Sprungstellen hat, ist sie zwar immer noch

R-integrierbar, ihre Integralfunktion macht aber an den Sprungstellen jeweils einen Knickund ist dort dann nicht mehr differenzierbar (und damit keine Stammfunktion imeigentlichen Sinne). Die Beschränkung auf stetige Funktionen ist für den Hauptsatz alsonicht zu umgehen. Praktisch kann man in solchen Fällen aber natürlich die Integrale"stückweise" berechnen (d. h. für die Teilintervalle zwischen den Sprungstellen) und dannzusammensetzen.

Wenn die Funktion nicht auf dem ganzen Integrationsintervall positiv ist, sondernf (x)die x-Achse einmal oder mehrmals schneidet, so liefert die Berechnung über die Stamm-funktion einen Wert, in den die Flächen oberhalb der x-Achse positiv eingehen, dieFlächen unterhalb dagegen negativ. Im folgenden Beispiel würde das Integral über [a, b]also die Differenz der Flächeninhalte und liefern:F1 F2

(Am obigen Beispiel der Sinusfunktion kann man leicht sehen, dass das bestimmteIntegral über eine komplette Schwingung den Wert Null ergibt.) Für den echten

Mathematik II (MI) SS 2012

- 75 -

Page 76: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

geometrischen Flächeninhalt muss man also die Integrale über und zunächst[a, c] [c, b]separat berechnen und dann ihre Absolutbeträge addieren. In vielen anderen Bereichen istdieses vorzeichen-sensitive Verhalten aber gerade erwünscht. In der Physik werden z. B.Arbeits- oder Energiewerte oft über Integrale ermittelt. Dabei müssen aufgenommene undabgegebene Energie tatsächlich gegeneinander aufgerechnet werden.

2.5.5 Vermischte Bemerkungen (Ausklang)

(A) Das Lebesgue-Integral

In vielen Anwendungsbereichen (z. B. bei der Fouriertransformation) benutzt man statt desRiemann-Integrals lieber das Lebesgue-Integral (kurz L-Integral), dessen Definition allerdingskomplizierter und auch weniger anschaulich ist. Es wird vor allem deswegen bevorzugt, weiles eine einheitlichere und abgerundetere Theorie ermöglicht.

Das L-Integral ist eine echte Erweiterung des R-Integrals, d. h. alle R-integrierbarenFunktionen sind auch L-integrierbar und die Werte stimmen überein. Die Klasse derL-integrierbaren Funktionen ist aber echt größer, da das L-Integral kurz gesagt mehrUnstetigkeiten verkraftet.

(B) Integrationen in der Physik

Eine typische physikalische Anwendung für einfache Integrationen ist der freie Fall. DieErdbeschleunigung an der Erdoberfläche ist (nahezu) eine Konstante: . Dies istg = 9, 81 m/s2

die erste Ableitung der Funktion , die die Geschwindigkeit beim freien Fall (in Abhängig-v (t)keit von der Zeit t ) beschreibt, und daher die zweite Ableitung der Funktion , die dens(t)zurückgelegten Weg s beschreibt. Die Funktionen v und s lassen sich also durch Integrationermitteln:

.v (t) = ¶ g dt = g t + vo

Die Integrationskonstante wurde hier nicht c sondern genannt, da es sich um die Anfangs-vo

geschwindigkeit handelt. Beim freien Fall im engeren Sinne wäre zu setzen, während vo = 0 einen senkrechten Wurf bedeutet. Für den zurückgelegten Weg erhält manvo ! 0

.s(t) = ¶( g t + vo) dt = 12 gt2 + vo t + ho

Die Integrationskonstante bedeutet jetzt die Anfangshöhe, aus der das Objekt fallenho

gelassen (oder senkrecht nach oben oder unten geworfen) wird. Hieraus könnte man jetztz. B. berechnen, zu welchem Zeitpunkt t das Objekt unten aufschlägt. (Dazu ist zus(t) = 0setzen, was eine quadratische Gleichung für t liefert.)

Diese Vorgehensweise, dass man physikalische Gesetze aus Informationen über die Ablei-tungen der beteiligten Funktionen durch Integration ermittelt, kommt in der Physik häufigvorher. Meistens ist es aber nicht mit einfachen Integrationen getan, sondern man musssogenannte Differentialgleichungen lösen, die sowohl die gesuchte Funktion f als auch ihreAbleitungen enthalten, z. B.:

.f ∏∏(x) + a f ∏(x) + b f (x) = 0

(Diese "Schwingungsgleichung" tritt bei vielen Schwingungs- und Wellenvorgängen auf.)Das Lösen solcher Differentialgleichungen wird ebenfalls als "Integrieren" bezeichnet.

Mathematik II (MI) SS 2012

- 76 -

Page 77: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

(C) Uneigentliche Integrale

Unter Umständen können auch Flächen, die ins Unendliche reichen, noch einen endlichenFlächeninhalt haben, z. B.:

Dafür ist das R-Integral zunächst nicht definiert, man kann solche Flächen aber ggf. als"uneigentliche Integrale", d. h. als Grenzwerte normaler R-Integrale berechnen:

0

1

¶ 1x

dx =at 0lim

a

1

¶ 1x

dx =at 0lim 2 x

a

1=

at 0lim (2 − 2 a ) = 2

1

¶ 1x2 dx =

bt∞lim

1

b

¶ 1x2 dx =

bt∞lim − 1

x 1

b

=bt∞lim (− 1

b− (−1)) = 1

(Vom Lebesgue-Integral werden viele solche Fälle von vornherein mit abgedeckt, diekonkrete Berechnung wird dadurch aber nicht einfacher.)

(D) Die Gaußsche Glockenkurve

Wir haben gesehen, dass die Ermittlung von Stammfunktionen i. a. deutlich schwieriger istals die Berechnung von Ableitungen. Es gibt sogar Fälle, in denen eine Stammfunktion zwarexistiert, diese sich aber nicht durch bekannte Funktionen ausdrücken lässt. Das ist z. B.schon bei den Funktionen

, ,f (x) = sin xx f (x) = cos x

x f (x) = ex

x

der Fall. Die zugehörigen Stammfunktionen lassen sich nicht durch bekannte elementareFunktionen (Exponential- und Winkelfunktionen o. ä.) ausdrücken. Man kann allerdingsPotenzreihenentwicklungen dafür angeben und die Funktionen tabellieren.

Das wichtigste Beispiel einer solchen "nicht elementar integrierbaren" Funktion ist aber die"Glockenkurve":

f (x) = e−x2

Mathematik II (MI) SS 2012

- 77 -

Page 78: Skript Mathematik: Lineare Algebra und analytische Geometrie für Medieninformatiker

Diese wird üblicherweise in der skalierten Form

f (x) = 12

e−12 x2

benutzt ("Gaußsche Glockenkurve", siehe den alten 10-DM-Schein). In Wahrscheinlich-keitstheorie und Statistik spielt diese Funktion als "Dichte der standardisierten Normal-verteilung" eine zentrale Rolle. Durch die Skalierung wird erreicht, dass das uneigentlicheIntegral von bis (also die gesamte Fläche unter der Kurve) genau den Wert 1 hat. (Da−∞ +∞keine explizit angebbare Stammfunktion verfügbar ist, bekommt man das aber nur miteinigen Tricks heraus.) Die zugehörige Integralfunktion

(x) =−∞

x

¶ 12

e−12

2d

ist in fast allen Standardwerken und Formelsammlungen zur Wahrscheinlichkeitstheorietabelliert ("Verteilungsfunktion der standardisierten Normalverteilung").

Die Bedeutung der Normalverteilung liegt darin, dass sie als mathematische Modellierung fürviele reale Situationen geeignet ist. Immer wenn eine beobachtete Größe ein einigermaßen"glockenkurvenähnliches" Verhalten zeigt, kann man die statistischen Kenngrößen Mittelwert

und Streuung berechnen und die entsprechende Normalverteilung als Näherung benutzen.Rechnerisch lässt sich das dann immer auf die "standardisierte Normalverteilung" zurück-führen (Mittelwert 0, Streuung 1).

Man beachte aber, dass die Normalverteilung trotz ihrer fast universellen Anwendbarkeitkein Naturgesetz ist, sondern nur ein mathematisches Modell. Die Qualität der darausabgeleiteten Schlussfolgerungen (Prognosen) hängt immer davon ab, wie gut das Modell dieRealität trifft! (Unkritische Anwendung der Normalverteilung führt leider oft zu ziemlichunsinnigen Ergebnissen, für die dann aber nicht selten trotzdem mathematische Unfehlbarkeitbeansprucht wird.)

Mathematik II (MI) SS 2012

- 78 -