Predavanje br. 1 iz predmeta Skladištenje podataka
Transcript of Predavanje br. 1 iz predmeta Skladištenje podataka
![Page 1: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/1.jpg)
Skladištenje podataka
Prof.dr.sc. Dražena Gašpar
24.10.2016.
![Page 2: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/2.jpg)
Sadržaj
• Uvod i definiranje pojmova• Izvori podataka• Osnove i geneza skladišta podataka• Arhitektura skladišta podataka• Pro iš avanje podataka – ETL• Dimenzijsko modeliranje
![Page 3: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/3.jpg)
Literatura
• Inmon, W.H.: Building the Data Warehouse – 4th Edition, Wiley Inc. USA, 2005.
• Inmon, W.H., Strauss, D., Neushloss,G.: DW2.0 – The Architecture for the Next Generation of Data Warehousing, 2008.
• Kimball,R., Ross,M.: The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, Wiley
• Kimball,R., Ross,M., Thornthwaite,W., Mundy,J., Becker,B.: The Data Warehouse Lifecycle Toolkit, Wiley Inc. USA, 2008
![Page 4: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/4.jpg)
OCJENJIVANJE• Priprema za svako predavanje na zadanu temu
+• Projekt - implementacija – od problema do skladišta podataka i izvješ a
Dimenzijskimodel
ETL, Data mart, Izvješ a (min 5)
Aktivnost na nastavi
max. 20 bodovamax. 60 bodova max. 20 bodova
![Page 5: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/5.jpg)
PROJEKT: Implementacija – od problema do skladišta podataka i izvješ a
• Definirati i opisati problem (dijagrami: use case, aktivnosti i klasa)• Napraviti bazu podataka (relacijsku) u Access-u• Razviti dimenzijski model podataka• Pomo u ETL alata provesti ETL proceshttp://butleranalytics.com/5-free-open-source-etl-tools/• Formirati kocku pomo u CubeIt alata• Napraviti najmanje 8-10 razli itih izvješ a koriste i dimenzijske
operatore
![Page 6: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/6.jpg)
Evolucija digitalne pohrane podataka
![Page 7: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/7.jpg)
Evolucija digitalne pohrane podataka
![Page 8: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/8.jpg)
Evolucija digitalne pohrane podataka
![Page 9: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/9.jpg)
ZAŠTO
baze podataka nisu dovoljne
??
![Page 10: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/10.jpg)
Podatkovna eksplozija• Kvantiteta podataka, i onih koji su potrebni i
digitaliziranih je enormno pove ana• Donositelji odluka trebaju pristup sve ve em broju
podataka i izvora podataka • IT tj. pohranjivanje podataka omogu ava izniman
porast digitalno pohranjenih podataka (relativno jeftino)
• Na jednoj strani su ogromne koli ine podataka, dok s druge strane postoji stalni nedostatak kvalitetnih podataka
![Page 11: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/11.jpg)
www.internetlivestats.com
![Page 12: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/12.jpg)
ZAŠTO skladištenje podataka
??
![Page 13: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/13.jpg)
13
Istraživa i, Farmeri i Turisti
Istraživa i: Pronalaze nepoznate i neo ekivane informacije skrivene u detaljnim podacima
Farmeri: Sakupljaju informacije Kroz poznate pristupe
Turisti: Pretražuju informacije dobivene of farmera
![Page 14: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/14.jpg)
Definicija Inmon-a
Skladište podataka je predmetno orijentirani, integrirani, relativno stabilni i vremenski orijentirani skup podataka u funkciji potpore odlu ivanja menadžera.
![Page 15: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/15.jpg)
2 osnovna tipa podataka
Primitivni/Operativni podaci Izvedeni/DSS podaci
Aplikacijski orijentirani Predmetno orijentirani
Detaljni Sumarni, redefinirani
Mogu se mijenjati Ne mogu se mijenjati
Izvršavanje je kontinuirano Izvršavanje je heuristi ko
Zahtjevi za obradu su unaprijed poznati
Zahtjevi za obradu nisu unaprijed poznati
Transakcijski orijentirani Analiti ki orijentirani
Visoka raspoloživost Raspoloživost nije kriti na
![Page 16: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/16.jpg)
2 osnovna tipa podataka
Primitivni/Operativni podaci Izvedeni/DSS podaci
Cjelovitost održavanja Održavanje po podskupovima
Neredundantni Redundancija kao životna istina
Struktura stati na, sadržaj promjenjiv Fleksibilna struktura
Obrade koriste manju koli inu podataka
Obrade koriste ogromne koli ine podataka
Podržavaju dnevne operacije Podržavaju potrebe menadžera
Odnose se na kra i vremenski period(naj eš e jednu godinu)
Nemaju vremensku ograni enost, prate povijest podataka u poduze u
![Page 17: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/17.jpg)
Mjerne jedinice - DW
• Terabytes -- 10^12 bytes:
• Petabytes -- 10^15 bytes:
• Exabytes -- 10^18 bytes:
• Zettabytes -- 10^21 bytes:
• Zottabytes -- 10^24 bytes:
Walmart -- 24 Terabytes
Geographic Information Systems
National Medical Records
Weather images
Intelligence Agency Videos
![Page 18: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/18.jpg)
18
• OLTP sustavi “vode” poslovanje
• Skladište podataka omogu ava inteligentnije poslovanje
![Page 19: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/19.jpg)
Za sljede e predavanje
• Datum: 07.11.2016.
1. Tema: Izvori podataka i arhitekture DW – priprema za diskusiju
2. Pripremiti prezentaciju svog projekta i izvora podatka u trajanju od 5min max:- minimalno 1 vanjski izvor- podaci iz baze podataka
![Page 20: Predavanje br. 1 iz predmeta Skladištenje podataka](https://reader034.fdocuments.us/reader034/viewer/2022051302/588da45e1a28ab44218ba7d0/html5/thumbnails/20.jpg)
PITANJA