Grundlagen der Algorithmen und Datenstrukturen Kapitel 3.1-3.2

Post on 12-Jan-2016

32 views 1 download

Tags:

description

Grundlagen der Algorithmen und Datenstrukturen Kapitel 3.1-3.2. Prof. Dr. Christian Scheideler. TexPoint fonts used in EMF. Read the TexPoint manual before you delete this box.: A A A A. Was passiert mit den Studienbeiträgen?. www.in.tum.de/studium/studienbeitraege.html - PowerPoint PPT Presentation

Transcript of Grundlagen der Algorithmen und Datenstrukturen Kapitel 3.1-3.2

Grundlagen der Algorithmen und Datenstrukturen

Kapitel 3.1-3.2

Prof. Dr. Christian Scheideler

Was passiert mit den Studienbeiträgen?

www.in.tum.de/studium/studienbeitraege.html

Ihr könnt aktiv bei der Verwendung der Studienbeiträge mitgestalten.Möglichkeiten sich aktiv einzubringen sind beispielsweise dieEinreichung von Vorschlägen für Maßnahmen (siehe Website), oderdas Engagement in der Fachschaft, welche Eure Interessen vertritt.Eure Mithilfe ist gefragt!

Für weitere Fragen, Anregungen oder Kritik wendet Euch bitte anJochen Reich (Qualitätsmanagement Fakultät für Informatik), HerrnProf. Dr. Matthes (Studiendekan) oder Eure Fachschaft.

Grundlegende Laufzeitanalyse

Eingabe(z.B. unsortierte Liste)

Algorithmus

(z.B. Bubblesort)

Ausgabe(z.B. sortierte Liste)

Eingabe(z.B. Such-Operationen)

Datenstrukturoperationen

(z.B. Move-to-Front)

Ausgabe(z.B. Such-Liste)

Kapitel 3

Kapitel 3

Thema: Repräsentation von Sequenzen als Felder und verkettete Listen

• Was ist eine Sequenz?• 3.1-3.2: Repräsentation als Feld und

amortisierte Analyse• 3.3: Repräsentation als verkettete Liste• 3.4: Stapel (Stacks) und Schlangen

(Queues)

Sequenzen

Sequenz: s = <e0,…,en-1>

Arten, auf Element zuzugreifen:• Feldrepräsentation: absoluter Zugriff über s[i]

• Listenrepräsentation: relativer Zugriff über Nachfolger und/oder Vorgänger

s[0]: e0 s[1] s[2] s[3] s[4] s[5] ….

e0 e1

Nachf.

Vorg.e2

Nachf.

Vorg.e3

Nachf.

Vorg.

Nachf.

Vorg.

….s

Sequenz als Feld

Operationen:• s[¢]: Index-Operation• <e0,…,en>.pushBack(e) = <e0,…,en,e>

• <e0,…,en>.popBack = <e0,…,en-1>

• Size(<e0,…,en-1>) = n

e0 e1 e2 … en e ….

e0 e1 e2 … en-1 ….

Sequenz als Feld

Problem:

• Im vornherein nicht bekannt, wieviele Elemente das Feld enthalten wird

• Nur Primitiv für Allokation von statischen Feldern gegeben(s := allocate Array[0..w] of Element)

Lösung: Datenstruktur für dynamisches Feld

3.1 Dynamisches Feld

Erste Idee:

• Jedesmal, wenn Feld s nicht mehr ausreicht (n>w+1), generiere neues Feld der Größe w+1+c für ein festes c.

s[0] s[1] s[2] s[3] s[w]….

s[0] s[1] s[2] s[3] s[w]…. s[w+1] s[w+c]….

Neues allocate und Umkopieren

Dynamisches Feld

Zeitaufwand für Erweiterung ist O(w+c):

Zeitaufwand für n pushBack Operationen:• Aufwand von O(w+c) je c Operationen• Gesamtaufwand: O(i=1

n/c c¢ i) = O(n2)

s[0] s[1] s[2] s[3] s[w]….

s[0] s[1] s[2] s[3] s[w]…. s[w+1] s[w+c]….

Neues allocate und Umkopieren

Dynamisches Feld

Bessere Idee:• Jedesmal, wenn Feld s nicht mehr ausreicht

(n>w), generiere neues Feld der doppelten Größe 2w.

• Jedesmal, wenn Feld s zu groß ist (n<w/4), generiere neues Feld der halben Größe w/2.

s[0] s[1] s[2] s[3] s[w-1]….

s[0] s[1] s[2] s[3] s[w]…. s[w-1] s[2w-1]….

Dynamisches Feld

Implementierung als Klasse UArray mit

• Operator[i: IN]: Element

• Function size(): IN

• Procedure pushBack(e: Element)

• Procedure popBack()

• Procedure reallocate(w´: IN)

Dynamisches Feld

Variablen in Klasse UArray:

• = 2: IR+ Wachstumsfaktor

• = 4: IR+ max. Speicheroverhead

• w=1: IN momentane Feldgröße

• n=0: IN momentane # Elemente

• b: Array[0..w-1] of Element

b[0] b[1] b[2] b[3] b[w-1]….

Dynamisches Feld

Operator [i:IN]: Element

assert 0<=i<n

return b[i]

Function size(): IN

return n

Dynamisches Feld

Procedure pushBack(e: Element)

if n=w then

reallocate(n)

b[n]:=e

n:=n+1

0 1 2 3b

0 1 2 3b

0 1 2 eb 3

n=w=4:

Dynamisches Feld

Procedure popBack()

assert n>0

n:=n-1

if n<=w and n>0 then

reallocate(n)

0 1 2 4b

0 1 2b 3

3

n=5, w=16:

Dynamisches Feld

Procedure reallocate(w´: IN)

w:=w´

b´:=allocate Array[0..w-1] of Element

for i:=0 to n-1 do

b´[i]:=b[i]

dispose b

b:=b´

Umkopieren}

Dynamisches Feld

Lemma 3.1: Betrachte ein anfangs leeres dynamisches Feld s. Jede Folge =<1,…,n> von pushBack und popBack Operationen kann auf s in Zeit O(n) bearbeitet werden.

• Erste Idee: Laufzeit O(n2)• Nur durchschnittlich konstante Laufzeit pro

Operation(Fachbegriff für „durchschnittlich“: amortisiert)

Dynamisches Feld - Analyse

• Feldverdopplung:

• Feldhalbierung:

• Von – Nächste Verdopplung: >= n pushBack Ops– Nächste Halbierung: >= n/2 popBack Ops

0 1 2 3b 0 1 2 3b

0 1 2 4b 3

0 1 2 3b

Dynamisches Feld - Analyse

• Von – Nächste Verdopplung: >= n pushBack Ops– Nächste Halbierung: >= n/2 popBack Ops

• Idee: verrechne reallocate-Kosten mit pushBack/popBack Kosten (ohne realloc)– Kosten für pushBack/popBack: O(1)– Kosten für reallocate(n): O(n)

0 1 2 3b

Dynamisches Feld - Analyse

• Idee: verrechne reallocate-Kosten mit pushBack/popBack Kosten– Kosten für pushBack/popBack: O(1)– Kosten für reallocate(n): O(n)

• Formale Verrechnung: Zeugenzuordnung

pushB pushB pushB pushB pushB + realloc

Reallokation bei n Elementen: bezeugt durch letzte n/2 pushBack Operationen

Dynamisches Feld - Analyse

• Formale Verrechnung: Zeugenzuordnung

• Dann jede push/popBack Op nur 1x Zeuge

pushB pushB pushB pushB pushB + realloc

popB popB popB popB popB + realloc

Reallokation bei n Elementen: bezeugt durch letzte n/2 pushBack Operationen

Reallokation bei n Elementen: bezeugt durch letzte n popBack Operationen

Dynamisches Feld - Analyse

• Idee: verrechne reallocate-Kosten mit pushBack/popBack Kosten– Kosten für pushBack/popBack: O(1)– Kosten für reallocate(n): O(n)

• Konkret: – (n) Zeugen pro reallocate(n)– verteile O(n) Aufwand gleichmäßig auf

Zeugen

• Gesamtaufwand: O(m) bei m Operationen

Dynamisches Feld - Analyse

Alternative zur Zeugenmethode:Kontenmethode

Kontenmethode: Spiel mit Zeittokens

• Günstige Operationen zahlen Tokens ein

• Teure Operationen entnehmen Tokens

• Tokenkonto darf nie negativ werden!

Dynamisches Feld - Analyse

Kontenmethode: Spiel mit Zeittokens

• Günstige Operationen zahlen Tokens ein! pro pushBack 2 Tokens! pro popBack 1 Token

• Teure Operationen entnehmen Tokens! pro reallocate(n) –n Tokens

• Tokenkonto darf nie negativ werden!! erfüllt über Zeugenargument

Dynamisches Feld - Analyse

Tokenlaufzeit:• Ausführung von push/popBack kostet 1 Token! Tokenkosten für pushBack: 1+2 = 3! Tokenkosten für popBack: 1+1 = 2

• Ausführung von reallocate(n) kostet n Tokens! Tokenkosten für reallocate(n): n-n=0

Gesamtlaufzeit = O(Summe der Tokenlaufzeiten)

pushB pushB pushB pushB reallocate

3.2 Amortisierte Analyse

• S: Zustandsraum einer Datenstruktur

• F: beliebige Folge von Operationen Op1, Op2, Op3,…,Opn

• s0: Anfangszustand der Datenstruktur

• Zeitaufwand T(F) = i=1n TOpi

(si-1)

s0Op1 s1

Op2 s2Op3 sn

Opn….

Amortisierte Analyse

• Zeitaufwand T(F) = i=1n TOpi

(si-1)

• Eine Familie von Funktionen AX(s), eine pro Operation X, heißt Familie amortisier-ter Zeitschranken falls für jede Sequenz F von Operationen gilt

T(F) <= A(F) := c + i=1n AOpi

(si-1)

für eine Konstante c unabhängig von F

Amortisierte Analyse

• Triviale Wahl von AX(s):AX(s) := TX(s)

• Dynamisches Feld (Zeittoken gen. groß):ApushBack(s):=3, ApopBack(s):=2, Arellocate(s):=0

• alternative Wahl von AX(s):über Potential S! IR>=0

! vereinfacht Beweisführung

Beispiel: Dynamisches Feld

0 1 2 3b

0 1 2 3b

0 1 2 3b

4

4 5

0 1 2 3b 4 5 6

0 1 2 3b 4 5 6 7

0 1 2 4b 3 5 6 7

s)=0

s)=2

s)=4

s)=6

s)=8

s)=0

reallocate+

pushBack

0 1 2 4b 3 5 6 7 8 s)=2

reallocate+

pushBack

Beispiel: Dynamisches Feld

0 1 2 3b s)=0

0 1 2b s)=2

0 1b s)=4

0 1b

popBack+

reallocate s)=0

Generelle Formel für (s): (ws: Feldgröße von s, ns: Anzahl Einträge)

s) = 2|ws/2 – ns|

Potential ist nicht gleich Konto!

0 1 2 3b s)=0

0 1 2b s)=2

0 1 2 3b s)=0pushBack

popBack

0 1 2 3b Konto(s)=0

0 1 2b

0 1 2 3bpushBack

popBackKonto(s)=1

Konto(s)=3

Warum Potential?

Theorem 3.3: Sei S der Zustandsraum einer Datenstruktur, sei s0 der Anfangszustand und sei :S ! IR>=0 eine nichtnegative Funktion. Für eine Operation X und einen Zustand s mit s ! s´ definiere

AX(s´) := (s´) - (s) + TX(s).

Dann sind die Funktionen AX(s) eine Familie amortisierter Zeitschranken.

X

Beispiel: Dynamisches Feld

Generelle Formel für (s): (ws: Feldgröße von s, ns: Anzahl Einträge)

s) = 2|ws/2 – ns|

Theorem 3.3:• nicht negativ, (s0)=1• ApushB(s) = + TpushB(s) <= 2+1 = 3• ApopB(s) = + TpopB(s) <= 2+1 = 3 • Arealloc(s) = + Trealloc(s) <= (0-ns)+ns = 0

wobei = (s´)-(s) für s ! s´

Beispiel: Dynamisches Feld

Beweis für Arealloc(s) <= 0:

• Fall 1:

• Fall 2:

0 1b 0 1 2 3b2 3

s)=ns s´)=0

0 1b 0 1b

s)=2ns s´)=0

Amortisierte Analyse

Die Potentialmethode universal!

Theorem 3.4: Sei BX(s) eine Familie amortisierte Zeitschranken. Dann gibt es eine Potentialfunktion , so dass AX(s) <= BX(s) für alle Zustände s und alle Operationen X gilt, wobei AX(s) definiert ist wie in Theorem 3.3.

Problem: finde geeignetes Potential!

Wenn erstmal gefunden, dann Rest einfach.

Nächste Woche

• Weiter mit Kapitel 3.3: Verkettete Listen