MapReduce a Splunk
Click here to load reader
-
Upload
kamil-brzak -
Category
Documents
-
view
5 -
download
0
description
Transcript of MapReduce a Splunk
-
Jak funguje MapReduce Kamil Brzk
Indexer 3
Indexer 2Raw data
Splunk um Big Data Big Data milujeme Splunk milujeme Chceme Splunk
Splunk um Big Data
Big Data milujeme
Splunk milujeme
Chceme Splunk
Splunk, 1 Um, 1 Big, 1 Data, 1
Big, 1 Data, 1 Milujeme, 1
Splunk, 1 Milujeme, 1
Chceme, 1 Splunk, 1
INPUT SPLITTING MAPPING
Splunk, 1 Splunk, 1 Splunk, 1
Um, 1
Big, 1 Big, 1
Data, 1 Data, 1
Milujeme, 1 Milujeme, 1
Chceme, 1
SHUFFLING&
SORTING
Splunk, 3
Um, 1
Big, 2
Data, 2
Milujeme, 2
Chceme, 2
REDUCE
Splunk, 3 Um, 1 Big, 2 Data, 2 Milujeme, 2 Chceme, 2
OUTPUT
Zadn poadavku na MapReduce
vstupnch dat (nap. textov soubory)
Rozdlen vstupnch dat na logick bloky
pro nsledn soubn zpracovn
(nap. z kadho dku textovho souboru vytvo
zznam)
INPUT READER
Kvli urychlen je na kad logick blok
aplikovna samostatn funkce Map (nap. rozdl soubn dky/
zznamy na jednotliv slova) -
jinmi slovy za kad pivo nape rku
DISTRIBUTED FILE SYSTEM
(STABLE STORAGE)
MULTIPLE MAP FUNCTION
MULTIPLE PARTITION FUNCTION
(REDUCERS)
COMPARISON FUNCTION
MULTIPLE REDUCE FUNCTION
Nsledn dochz k soubnmu setdn (a
promchn/vmn mezi vpoetnmi uzly
clusteru)
Pot se setou stejn slova...
...a vygeneruje seznam slov s jejich
potem
OUTPUT WRITER(STABLE STORAGE)
Splunk indexRozdlen dat na tzv.
chunky
Ekvivalent pkazu search ve Splunku
MapReduce nad kadm chunkemZpis vsledku
vyhledvn