1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (18 - Bäume: Durchlaufreihenfolgen,...

Vorlesung Informatik 2

Algorithmen und Datenstrukturen

(18 - Bäume: Durchlaufreihenfolgen, Analyse nat. Bäume)

Prof. Th. Ottmann

Binärbäume zur Speicherung von Mengen von Schlüsseln (in den inneren

Knoten der Bäume), so dass die Operationen

• Suchen (find)

• Einfügen (insert)

• Entfernen (remove, delete)

unterstützt werden.

Suchbaumeigenschaft: Die Schlüssel im linken Teilbaum eines Knotens p

sind alle kleiner als der Schlüssel von p, und dieser ist wiederum

kleiner als sämtliche Schlüssel im rechten Teilbaum von p.

Implementierung:

Binäre Suchbäume

Natürliche Bäume

• Baum-Struktur hängt von Einfügereihenfolge in anfangs leeren Baum ab

• Höhe kann linear zunehmen, sie kann aber auch in O(log n) sein, genau

log2(n+1)

Einfügen 5

Durchlaufreihenfolgen in Bäumen

Durchlaufreihenfolgen zum Besuchen der Knoten des Baums

• zur Ausgabe

• zur Berechnung von Summe, Durchschnitt, Anzahl der Schlüssel . . .

• zur Änderung der Struktur

Wichtigste Durchlaufreihenfolgen:

1. Hauptreihenfolge = Preorder = WLRbesuche erst Wurzel, dann rekursiv linken und rechten Teil-Baum falls vorhanden

2. Nebenreihenfolge = Postorder = LRW

3. Symmetrische Reihenfolge = Inorder = LWR

4. die Spiegelbild-Varianten von 1-3

Hauptreihenfolge (Preorder)

Ausgehend von der Wurzel p eines Baums ist die Hauptreihenfolge wie

folgt rekursiv definiert:

Durchlaufen aller Knoten eines Binärbaumes mit Wurzel p in Hauptreihenfolge:Besuche p, durchlaufe den linken Teilbaum von p in Hauptreihenfolge,durchlaufe den rechten Teilbaum von p in Hauptreihenfolge.

Hauptreihenfolge Programm

// Hauptreihenfolge; WLRvoid preOrder (){ preOrder (root); System.out.println ();}void preOrder (SearchNode n){ if (n == null) return; System.out.print (n.content+" "); preOrder (n.left); preOrder (n.right);}// Nebenreihenfolge; LRWvoid postOrder (){ postOrder (root); System.out.println ();}// ...

Symmetrische Reihenfolge (Inorder)

Die Durchlaufreihenfolge ist: erst linker Teilbaum, dann Wurzel, dann rechter

Teilbaum:

// Symmetrische; LWRvoid inOrder (){ inOrder (root); System.out.println ();}void inOrder (SearchNode n){ if (n == null) return;

inOrder (n.left);

System.out.print (n.content+" ");

inOrder (n.right);}// Nebenreihenfolge; LRW// ...

Die anderen Durchlaufreihenfolgen werden analog implementiert.

Beispiel

Preorder:

17, 11, 7, 14, 12, 22

Postorder:

7, 12, 14, 11, 22, 17

Inorder:

7, 11, 12, 14, 17, 22

Nichtrekursive Varianten mit gefädelten Bäumen

Rekursion kann vermieden werden, wenn man anstelle der

null-Referenzen sogenannte Fädelungszeiger auf die Vorgänger

bzw. Nachfolger verwendet.

Wurzel

Binärbäume zur Speicherung von Mengen von Schlüsseln (in den inneren

Knoten der Bäume), so dass die Operationen

• Suchen (find)

• Einfügen (insert)

• Entfernen (remove, delete)

unterstützt werden.

Suchbaumeigenschaft: Die Schlüssel im linken Teilbaum eines Knotens p

sind alle kleiner als der Schlüssel von p, und dieser ist wiederum

kleiner als sämtliche Schlüssel im rechten Teilbaum von p.

Implementierung:

Binäre Suchbäume

Natürliche Bäume

• Baum-Struktur hängt von Einfügereihenfolge in anfangs leeren Baum ab

• Höhe kann linear zunehmen, sie kann aber auch in O(log n) sein, genau

log2(n+1)

Einfügen 5

Beispiel für Suchen, Einfügen, Entfernen

Sortieren mit natürlichen Suchbäumen

Idee: Bau für die Eingabefolge einen natürlichen Suchbaum auf und gib die

Schlüssel in symmetrischer Reihenfolge (Inorder) aus.

Bemerkung: Abhängig von der Eingabereihenfolge kann der Suchbaum

degenerieren.

Komplexität: Abhängig von der internen Pfadlänge

Schlechtester Fall: Sortierte Eingabe: (n2) Schritte.

Bester Fall: Es entsteht ein vollständiger Suchbaum mit minimal

möglicher Höhe von etwa log n. n mal Einfügen und Ausgeben ist daher in

Zeit O(n log n) möglich.

Mittlerer Fall: ?

Analyse natürlicher Suchbäume

Zwei alternative Vorgehensweisen zur Bestimmung der internen Pfadlänge:

1. Random-Tree-Analyse, d.h. Mittelwert über alle möglichen Permutationen

der (in den anfangs leeren Baum) einzufügenden Schlüssel.

2. Gestaltanalyse, d.h. Mittelwert über alle strukturell möglichen Bäume mit n

Schlüsseln.

Unterschied des Erwartungswertes für die interne Pfadlänge:

1. 1.386 n log2n – 0.846 n + O(log n)

2. nn + O(n)

Ursache für den Unterschied

Bei der Random-Tree-Analyse werden ausgeglichene Bäume häufiger

gezählt.

3,2,1 3,1,2 1,3,2 3,2,1 2,1,3 und 2,3,1

Interne Pfadlänge

Interne Pfadlänge: Maß zu Beurteilung der Güte eines Suchbaumes.

Rekursive Definition:

1. Ist t der leere Baum, so ist

I(t) = 0.

2. Für einen Baum mit Wurzel t, linkem Teilbaum tl und rechtem

Teilbaum tr gilt:

I(t) := I(tl) + I(tr)+ Zahl der Knoten von t.

Offensichtlich gilt:p

P innerer Knoten von t

pTiefe 1)()(

Durchschnittliche Suchpfadlänge

Für einen Baum t ist die durchschnittliche Suchpfadlänge definiert durch:

D(t) = I(t)/n, n = Anzahl innerer Knoten in t

Frage: Wie groß ist D(t) im

• besten• schlechtesten• mittleren Fall

für einen Baum t mit n inneren Knoten?

Interne Pfadlänge: Bester Fall

Es ensteht ein vollständiger Binärbaum

Interne Pfadlänge: Schlechtester Fall

Zufällige Bäume

• Seien oBdA die Schlüssel {1,…,n} einzufügen.

• Sei ferner s1,…, sn eine zufällige Permutation dieser Schlüssel.

• Somit ist die Wahrscheinlichkeit P(s1 = k), dass s1 gerade den

Wert k hat, genau 1/n.

• Wenn k der erste Schlüssel ist, wird k zur Wurzel.

• Dann enthalten der linke Teilbaum k – 1 Elemente (nämlich die

Schlüssel 1,…,k - 1) und der rechte Teilbaum n – k Elemente (d.h. die

Schlüssel k + 1,…,n).

Erwartete interne Pfadlänge

EI(n) : Erwartungswert für die interne Pfadlänge eines zufällig

erzeugten binären Suchbaums mit n Knoten

Offensichtlich gilt:

Behauptung: EI(n) 1.386n log2n - 0.846n + O(logn).

knEIkEIn

nknEIkEIn

))()1((1

Beweis (1)

und daher

Aus den beiden letzten Gleichungen folgt

2)1()1(

)(*2)1()1(*)1(

kEInEIn

kEInnEIn

12)()2()1()1(

)(*212)(*)1()1(

nnEInnEIn

nEInnEInnEIn

Beweis (2)

Durch vollständige Induktion über n kann man zeigen, dass für alle n 1 gilt:

ist die n -te harmonische Zahl, die wie folgt

Abgeschätzt werden kann:

Dabei ist die so genannte Eulersche Konstante.

1ln 2nn

...5772.0

nHnnEI n 3)1(2)(

Beweis (3)

Damit ist

Und daher

)1(21ln2*)23(ln2)(n

nnnnnEI

...ln2

)23(log386.1

...ln2

)23(log*log

...ln2

)23(log*log

...ln2

)23(ln2)(

Beobachtungen

• Suchen, Einfügen und Entfernen eines Schlüssels ist bei einem

zufällig erzeugten binären Suchbaum mit n Schlüsseln im Mittel in

O(log2 n) Schritten möglich.

• Im schlechtesten Fall kann der Aufwand jedoch Ω(n) betragen.

• Man kann nachweisen, dass der mittlere Abstand eines Knotens von

der Wurzel in einem zufällig erzeugten Baum nur etwa 40% über

dem Optimum liegt.

• Die Einschränkung auf den symmetrischen Nachfolger

verschlechtert jedoch das Verhalten.

• Führt man in einem zufällig erzeugten Suchbaum mit n Schlüsseln n2

Update-Operationen durch, so ist der Erwartungswert für die

durschnittliche Suchpfadlänge lediglich Θ(n).

Typischer Binärbaum für eine zufällige Schlüsselsequenz

Resultierender Binärbaum nach n2 Updates

Strukturelle Analyse von Binärbäumen

Frage: Wie groß ist die durchschnittliche Suchpfadlänge eines Binärbaumes mit N

inneren Knoten, wenn man bei der Durchschnittsbildung jeden strukturell

möglichen Binärbaum mit N inneren Knoten genau einmal zählt?

Antwort: Sei

IN = gesamte interne Pfadlänge aller strukturell verschiedenen Binärbäume mit N

inneren Knoten

BN = Anzahl aller strukturell verschiedenen Bäume mit N inneren Knoten

Dann ist IN/BN =

Anzahl strukturell verschiedener Binärbäume

Gesamte interne Pfadlänge aller Bäume mit N Knoten

• Für jeden Baum t mit linkem Teilbaum tl und rechtem Teilbaum tr gilt:

Zusammenfassung

Die durchschnittliche Suchpfadlänge in einem Baum mit N inneren Knoten (gemittelt

über alle strukturell möglichen Bäume mit N inneren Knoten) ist:

1/N IN/BN

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (18 - Bäume: Durchlaufreihenfolgen,...

Documents

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 - B-Bäume) Prof. Th. Ottmann

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (05 – Elementare Datenstrukturen) Prof. Th. Ottmann

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (12 Hashverfahren: Allgemeiner Rahmen) Prof. Th. Ottmann

WS 2006-07 Prof. Dr. Th. Ottmann Algorithmentheorie 09 - Suche in Texten Suffix - Bäume

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 5 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät

Line Segment Intersection Computational Geometry, WS 2007/08 Lecture 3 – Supplementary Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut

Bäume - Hochschule Furtwangen · 2006 Jiri Spale, Algorithmen und Datenstrukturen - Bäume 4 Baum: Grundbegriffe #2 • Knotensorten Vorgänger = Vater Nachfolger = Sohn = Kind Wurzel

WS03/041 Suche in Texten: Suffix-Bäume Prof. Dr. S. Albers Prof. Dr. Th. Ottmann

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 19 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 13 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 14 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (13 – Offenes Hashing) Prof. Th. Ottmann

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (19 - Balancierte Bäume, AVL-Bäume) Prof. Th. Ottmann

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (23 –Persistente und vergessliche Datenstrukturen) Prof. Th. Ottmann

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (22 - Graphen) Prof. Th. Ottmann

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 6 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 - B-Bäume)

Vorlesung Informatik 2 Algorithmen und Datenstrukturen (04 – Entwurfsverfahren) Prof. Th. Ottmann

1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 - Bäume: Durchlaufreihenfolgen, Analyse nat. Bäume) Prof. Th. Ottmann

Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 1 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät