2012-06-25 - MapReduce auf Azure

47

description

Der Map-Reduce Algorithmus begegnet uns bei vielen NoSQL Datenbanken. Wann immer große Datenmengen aggregiert werden, ist er das Mittel der Wahl. In einem Crashkurs wird die Theorie erläutert und gezeigt, wie in Dokumenten bei MongoDB, RavenDB und Hadoop gesucht wird. Mithilfe des MapReduce Modells von Hadoop werden Probleme wie das Durchzählen von Daten, Logfile-Analysen und Graphenanalysen demonstriert. Als Programmiersprache wird C# eingesetzt.

Transcript of 2012-06-25 - MapReduce auf Azure

Page 1: 2012-06-25 - MapReduce auf Azure
Page 2: 2012-06-25 - MapReduce auf Azure
Page 3: 2012-06-25 - MapReduce auf Azure
Page 4: 2012-06-25 - MapReduce auf Azure
Page 5: 2012-06-25 - MapReduce auf Azure
Page 6: 2012-06-25 - MapReduce auf Azure
Page 7: 2012-06-25 - MapReduce auf Azure

0067011990999991950051507004...9999999N9+00001+99999999999... 0043011990999991950051512004...9999999N9+00221+99999999999... 0043011990999991950051518004...9999999N9-00111+99999999999... 0043012650999991949032412004...0500001N9+01111+99999999999... 0043012650999991949032418004...0500001N9+00781+99999999999...

(1950, 0) (1950, 22) (1950, -11) (1949, 111) (1949, 78)

(key, value)

Page 8: 2012-06-25 - MapReduce auf Azure

(1950, 0) (1950, 22) (1950, -11) (1949, 111) (1949, 78)

(1949, [111, 78]) . (1950, [0, 22, -11])

Page 9: 2012-06-25 - MapReduce auf Azure

(1949, 111) (1950, 22)

(1949, [111, 78]) . (1950, [0, 22, -11])

Page 10: 2012-06-25 - MapReduce auf Azure
Page 11: 2012-06-25 - MapReduce auf Azure

(1949, 111) (1949, 78) (1950, 0) (1950, 20) (1950, 10)

(1950, 25) (1950, 15) (1950, 0)

(1949, 111) (1950, 20)

(1950, 25)

(1949, [111]) . (1950, [20, 25])

Page 12: 2012-06-25 - MapReduce auf Azure
Page 13: 2012-06-25 - MapReduce auf Azure
Page 14: 2012-06-25 - MapReduce auf Azure
Page 15: 2012-06-25 - MapReduce auf Azure
Page 16: 2012-06-25 - MapReduce auf Azure
Page 17: 2012-06-25 - MapReduce auf Azure
Page 18: 2012-06-25 - MapReduce auf Azure

js> runJar('apps/hadoop-streaming.jar', '-files "asv://server/Mapper.exe, asv://server/Reducer.exe" -mapper "Mapper.exe" -reducer "Reducer.exe" -input "inputFile" -output "outputFile"')

Page 19: 2012-06-25 - MapReduce auf Azure
Page 20: 2012-06-25 - MapReduce auf Azure
Page 21: 2012-06-25 - MapReduce auf Azure
Page 22: 2012-06-25 - MapReduce auf Azure
Page 23: 2012-06-25 - MapReduce auf Azure
Page 24: 2012-06-25 - MapReduce auf Azure
Page 25: 2012-06-25 - MapReduce auf Azure
Page 26: 2012-06-25 - MapReduce auf Azure

141.8.147.14 - - [22/Jun/2013:00:00:35 +0200] ↓ "GET /catalog/images/footbag_freaks08freestyle2_medium.jpg ↓ HTTP/1.1" 200 4379 "-" ↓ "Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots)"

IP Address, Date, Request, Code, Size, Country, Referer, UserAgent 141.8.147.14, […] , Mozilla/5.0

{ "IP Address" : "141.8.147.14", "Date" : "[22/Jun/2013:00:00:35 +0200]", "Request" : "GET /catalog/images/footbag_freaks08freestyle2_medium.jpg HTTP/1.1", "Code" : 200, "Size" : 4379, "Country" : "Germany", "Referer" : "-", "UserAgent" : "Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots)" }

Page 27: 2012-06-25 - MapReduce auf Azure
Page 28: 2012-06-25 - MapReduce auf Azure
Page 29: 2012-06-25 - MapReduce auf Azure
Page 30: 2012-06-25 - MapReduce auf Azure
Page 31: 2012-06-25 - MapReduce auf Azure
Page 32: 2012-06-25 - MapReduce auf Azure
Page 33: 2012-06-25 - MapReduce auf Azure
Page 34: 2012-06-25 - MapReduce auf Azure
Page 35: 2012-06-25 - MapReduce auf Azure
Page 36: 2012-06-25 - MapReduce auf Azure
Page 37: 2012-06-25 - MapReduce auf Azure
Page 38: 2012-06-25 - MapReduce auf Azure
Page 39: 2012-06-25 - MapReduce auf Azure
Page 40: 2012-06-25 - MapReduce auf Azure
Page 41: 2012-06-25 - MapReduce auf Azure
Page 42: 2012-06-25 - MapReduce auf Azure
Page 43: 2012-06-25 - MapReduce auf Azure
Page 44: 2012-06-25 - MapReduce auf Azure

http://highlyscalable.wordpress.com/2012/02/01/mapreduce-patterns/

Page 45: 2012-06-25 - MapReduce auf Azure
Page 46: 2012-06-25 - MapReduce auf Azure
Page 47: 2012-06-25 - MapReduce auf Azure