MapReduce a Splunk

1

Click here to load reader

description

Princip fungovani MapReduce a ilustrace do Splunku.

Transcript of MapReduce a Splunk

  • Jak funguje MapReduce Kamil Brzk

    Indexer 3

    Indexer 2Raw data

    Splunk um Big Data Big Data milujeme Splunk milujeme Chceme Splunk

    Splunk um Big Data

    Big Data milujeme

    Splunk milujeme

    Chceme Splunk

    Splunk, 1 Um, 1 Big, 1 Data, 1

    Big, 1 Data, 1 Milujeme, 1

    Splunk, 1 Milujeme, 1

    Chceme, 1 Splunk, 1

    INPUT SPLITTING MAPPING

    Splunk, 1 Splunk, 1 Splunk, 1

    Um, 1

    Big, 1 Big, 1

    Data, 1 Data, 1

    Milujeme, 1 Milujeme, 1

    Chceme, 1

    SHUFFLING&

    SORTING

    Splunk, 3

    Um, 1

    Big, 2

    Data, 2

    Milujeme, 2

    Chceme, 2

    REDUCE

    Splunk, 3 Um, 1 Big, 2 Data, 2 Milujeme, 2 Chceme, 2

    OUTPUT

    Zadn poadavku na MapReduce

    vstupnch dat (nap. textov soubory)

    Rozdlen vstupnch dat na logick bloky

    pro nsledn soubn zpracovn

    (nap. z kadho dku textovho souboru vytvo

    zznam)

    INPUT READER

    Kvli urychlen je na kad logick blok

    aplikovna samostatn funkce Map (nap. rozdl soubn dky/

    zznamy na jednotliv slova) -

    jinmi slovy za kad pivo nape rku

    DISTRIBUTED FILE SYSTEM

    (STABLE STORAGE)

    MULTIPLE MAP FUNCTION

    MULTIPLE PARTITION FUNCTION

    (REDUCERS)

    COMPARISON FUNCTION

    MULTIPLE REDUCE FUNCTION

    Nsledn dochz k soubnmu setdn (a

    promchn/vmn mezi vpoetnmi uzly

    clusteru)

    Pot se setou stejn slova...

    ...a vygeneruje seznam slov s jejich

    potem

    OUTPUT WRITER(STABLE STORAGE)

    Splunk indexRozdlen dat na tzv.

    chunky

    Ekvivalent pkazu search ve Splunku

    MapReduce nad kadm chunkemZpis vsledku

    vyhledvn