Siad Curs 5 Olap
-
Upload
cristina-tefanov -
Category
Documents
-
view
232 -
download
0
Transcript of Siad Curs 5 Olap
-
7/28/2019 Siad Curs 5 Olap
1/28
3. SIAD BAZAT PE DATE
SIAD bazat pe date:
OLTP vs. OLAP Motoda de proiectare multidimensionala
Aplicatii back-end
Aplicatii front-end
-
7/28/2019 Siad Curs 5 Olap
2/28
Business Inteligence
Termenul de Business Inteligence acoper un ansamblu de
aplicaii i de tehnologii care asigur colectarea,
conservarea, analiza i interpretarea datelor complexe,
interpretare care ajut decidenii n luarea deciziilor, datele
fiind analizate dup mai multe dimensiuni
Termenul deBusiness Inteligencereprezint acele sistemecare ajut ntreprinderile s neleag care este situaia
actual punnd n eviden cauzele, i s previzionezeefectele viitoare ale deciziilor actuale.
-
7/28/2019 Siad Curs 5 Olap
3/28
Arhitectura SIAD bazat pe date
.EXTRACIA
INTEGRAR
E
CONSTRUCI
A
SG
EXPLOATAREA
non
expertR
EORGA
NIZAR
E
INTEROGAR
E
MD2
MD3
MD1
Depozitul dedate
S1
S2
S3
experi
- interogri- analize OLAP- data mining
-
7/28/2019 Siad Curs 5 Olap
4/28
Arhitectura SIAD bazat pe date
Sursele de date sunt numeroase, variate i autonome. Ele pot fi interne (bazele de producie) sau externe (internet, bazele de parteneri etc.)ntreprinderii.
Sistemele decizionale comportdou tipuri de spaii de stocare care sunt
depozitele de date i magaziile de date.Un depozit de date regrupeaz ntr-un format omogen date utile pentruasistarea deciziei provenind din surse interne (baze deproducie) si/sauexterne (baze de parteneri, internet etc.).
O magazie de date este o extragere de informaie dintr-un depozit de dateconstituit anterior, iorganizat de o manieradecvat astfel nct s
permit o analizrapid avnd ca scop asistarea lurii de decizii.Instrumentele de analiz permit s se manipuleze datele urmrind axelede analiz. Informaia este vizualizat prin intermediul interfeeiinteractive i funcionalededicatdecidenilorcare de obicei nu suntinformaticieni (directori, efi de servicii etc.)
-
7/28/2019 Siad Curs 5 Olap
5/28
Depozitul de date
Bill Inmon n cartea sa de referin Using the DataWarehouse [1994] definete depozitul de date ca ocolecie de date integrate, orientate subiect, nonvolatile,istorice, organizate ca suport pentru procesul de asistare adeciziei
-
7/28/2019 Siad Curs 5 Olap
6/28
OLTP (On-line Transactional
Processing)OLTP (On-line Transactional Processing) : Mediu de tratare a informaiei n care rspunsul trebuie dat
de o manierconsistenti ntr-un timp acceptabil. n acest
cadru modelul de date trebuie s asigure o minimizare aredundanelor n scopul prezervrii fiabilitii i coereneisistemului. Conceptul de integritate este o noiune cheientr-un astfel de mediu, ea reprezentnd un ansamblu deconstrngeri aplicate actualizrii bazei de date, permindastfel o cretere a coerenei acesteia.
Originea scopului de minimizare a informaiei decurge nprincipal din faptul c sistemele tranzacionaleefectueazactualizarea on-line eventual de-a lungul unui ansamblude aplicaii carepartajeazacelai model de date.
-
7/28/2019 Siad Curs 5 Olap
7/28
OLTP (On-line Transactional
Processing) ntr-un sistem tranzacional, concepia este orientat spre
proces, iar modelul de date trebuie s susin aceastorientare.
Interogrile sunt ntotdeauna previzibile. Din punctul de vedere al utilizatorului modelul de date este ntotalitate transparent; el fiind accesat n mod indirect prinintermediul aplicaiilor de obicei de tip pachet (aplicaiiinformatice predefinite) puse la dispoziia lor.
n acest context, datele sunt n general accesate prin chei, maiales prin chei primare.
-
7/28/2019 Siad Curs 5 Olap
8/28
OLAP (On-line Analytical Processing)
OLAP (On-line Analytical Processing) : Caracterizeaz arhitectura necesar implementrii unui
sistem informatic decizional. Se opune OLTP. Termenul OLAP desemneaz instrumentele de analiz care
se sprijin pe baze de date multidimensionale. Informaiile sunt puse la dispoziia utilizatorului dar
actualizarea lor nu se mai face on-line. Singureleactualizri efectuate n depozitul de date vor veni dinsistemele operationale prin intermediul procesului dencrcare.
-
7/28/2019 Siad Curs 5 Olap
9/28
OLAP (On-line Analytical Processing)
Odat efectuat procesul de achiziie de date, problemaintegritii datelor din depozitul de date nu va mai putea fi
pus n discuie. Astfel devine evident introducerearedundanelor, ns acestea trebuie coordonate, bine
gestionate n procesul de alimentare.
O altcaracteristic a sistemelor decizionale este aceea cutilizatorul caut n mod frecvent s pun n relaieelemente care apriori nu au fost corelate.
-
7/28/2019 Siad Curs 5 Olap
10/28
OLAP (On-line Analytical Processing)
Spre deosebire de sistemele tranzacionale, sistemele decizionalepachet (predefinite) sunt foarte rare, aceasta datorit faptului cun depozit de date are ca scop srspundcerinelorutilizatorilorn termeni de informaiii nu n termeni de tranzacii.
O altcaracteristic a unui sistem decizional este c de cele maimulte ori acesta trebuie spermit implementarea unui model dedate integrat avnd ca obiectiv transversabilitatea la nivel dentreprindere. Acest model se constituie de cele mai multe ori
ntr-o manier incremental, pe msura realizrii succesive deproiecte decizionale la nivelul ntreprinderii. n acest cadru,modelul de date va evolua de o manierconstantiregulat.
-
7/28/2019 Siad Curs 5 Olap
11/28
Modelarea Depozitelor de date
Studiile au identificat cinci axe care s permit calificarea
unui model de date decizional, iar acestea sunt [Le datawarehouse J.-M. Franco 1997] :
Primul obiectiveste asigurarea lizibilitii din punct devedere al utilizatorului final;
Al doilea i al treilea obiectivse refer la performane:
performane legate de ncrcarea depozitului de date;
performane legate de execuia interogrilor;
-
7/28/2019 Siad Curs 5 Olap
12/28
Modelarea Depozitelor de date
. Al patrulea obiectivse refer la administrareadepozituluiuna din dificultile ntlnite de multentreprinderi nu este aceea de a construi depozitul de dateci aceea de a-i asigura funcionarea;
Un ultim obiectiv este evolutivitatea ce permite cadezvoltarea unui depozit de date s se fac de o manier
incremental.
-
7/28/2019 Siad Curs 5 Olap
13/28
Modelarea Depozitelor de date
Modelele de date normalizate se caracterizeaz printr-o semanticslab din punct de vedere decizional. De obicei informaiileinteresante pentru utilizatori nu se regsesc n mod direct, eletrebuind s fie extrapolate, prin recalcularea dinamic la fiecareinterogare. Performanele obinute vor fi mediocre i chiarinacceptabile.
-
7/28/2019 Siad Curs 5 Olap
14/28
-
7/28/2019 Siad Curs 5 Olap
15/28
Modelarea dimensional a depozitului
de date Definiie :
Modelarea multidimensional const n a
considera un subiect de analiz ca un punct
ntr-un spaiu cu mai multe dimensiuni.
Datele sunt organizate n maniera de a pune
n eviden subiectul analizat i diferitele
perspective de analiz.
-
7/28/2019 Siad Curs 5 Olap
16/28
Modelarea conceptual a depozitului
de date
Conceptual, aceast modelare multidimensional
d natere conceptelor de fapti dimensiune[Kimball 1996]
-
7/28/2019 Siad Curs 5 Olap
17/28
Conceptul de fapt
Subiectul de analiz este reprezentat prin conceptul de fapt.Definiie : Faptelemodeleaz subiectul de analiz. O fapt reprezint msura
activitii determinat la intersecia tuturor informaiilor referitoare laactivitate.
Reprezentarea grafic la nivel conceptual a unei tabele de fapte se faceastfel:
Fig. Reprezentarea grafic a tabelei de fapte
Vnzri
CantitateValoare
Tabela defapte
Msuri ale activitii
-
7/28/2019 Siad Curs 5 Olap
18/28
Conceptul de dimensiune
Subiectul de analiz, adic fapta este analizat deseori urmrind
diferite perspective. Aceste perspective corespund uneicategorii utilizate pentru a caracteriza msurile activitiianalizate [Marcel 1998]. Aceste perspective le denumim ncontinuare dimensiuni.
-
7/28/2019 Siad Curs 5 Olap
19/28
Conceptul de dimensiuneDefiniie : Dimensiuneamodeleaz o perspectiv de analiz. O
dimensiune se compune din parametrii corespunzndinformaiilor care fac s varieze msurile activitii.
Reprezentarea grafic la nivel conceptual a unei dimensiunise face astfel:
Timp
IDTimp
ZiLun
TrimestruSemestru
An
Este mai fin
-
7/28/2019 Siad Curs 5 Olap
20/28
Ierarhia
Definiie :Ierarhiaorganizeaz parametrii unei dimensiuni dup o
relaie de tip este mai fin n conformitate cu nivelul lorde detaliu.
O dimensiune normal sa nu conina nicio ierarhie sau poatecontine una sau mai multe ierarhii naturale.
-
7/28/2019 Siad Curs 5 Olap
21/28
Modelul Star
Plecnd de la procesul analizat i perspectivele deanaliz a acestuia, este posibil s se stabileasc ostructur simpl care s corespund necesitilormodelrii multidimensionale.
Aceast structur este constituit din fapta(subiectul de analiza) care este aezat central idimensiuni.
Acest model reprezint din punct de vedere vizualo stea, vorbim astfel de modelul stea (star schema[Kimball 1996]).
-
7/28/2019 Siad Curs 5 Olap
22/28
Modelul Star
. TimpIDTimp
Zi
LunTrimestruSemestru
An
Vnzri
Cantitate
Valoare
Magazin
IDMagazin
Denumiremagazin
LocalitateJude
Regiuneara
Produs
IDProdus
Denumire prod.
Marc prod.Subcategorie
prodCategorie prod
Raion
-
7/28/2019 Siad Curs 5 Olap
23/28
Modelul Snow-flake
n modelarea entitate-asociere o relaie de tipul 1-nntre atributele aceleiai tabele oblig automat la
crearea unei noi tabele. n cadrul dimensiunilorexistena ierarhiilor, din punct de vedere alabordrii clasice oblig la crearea de noi tabele.
Normalizarea dimensiunilor va crea subdimensiuni
dnd natere la un nou tip de model de datedenumit fulg de nea (snow-flake).
-
7/28/2019 Siad Curs 5 Olap
24/28
Modelul Snow-flake
.Timp
IDTimp
Zi
LunTrimestruSemestru
An
Vnzri
CantitateValoare
Magazin
IDMagazinDenumiremagazin
Produs
IDProdus
Denumire prod.
Marc prod.Subcategorie
prodCategorie prod
Raion
Adres
IDLocalitateJude
Regiuneara
-
7/28/2019 Siad Curs 5 Olap
25/28
Modelul Multi-star
O alt tehnic de modelare, derivat din cele doutipuri de model amintite anterior este modelareamulti-star (constelaie).
Aceasta se caracterizeaz prin fuzionarea mai multormodele stari/sau snow-flake care utilizeazdimensiuni comune.
Deci un model n constelaie cuprinde mai multefapte i dimensiuni care pot fi partajate de dousau mai multe tabele de fapte sau doar de osingur tabel de fapte.
-
7/28/2019 Siad Curs 5 Olap
26/28
Modelul Multi-star
.
Serviciu
IDServiciu
Denumire serv.Subcategorie
serv.Categorie serv.
Vnzri serv
Valoare serv.
Magazin
IDMagazin
Denumiremagazin
LocalitateJude
Regiuneara
Timp
IDTimp
ZiLun
TrimestruSemestru
An
Vnzri prod.
CantitateValoare prod.
Produs
IDProdus
Denumire prod.Marc prod.Subcategorie
prodCategorie prod
Raion
-
7/28/2019 Siad Curs 5 Olap
27/28
Modelarea logic
La nivel logic mai multe posibiliti sunt disponibile pentru modelareamultidimensional. Exist posibilitatea s se utilizeze:
un sistem de gestiune de baze de date (SGBD) relaional; un SGBD orientat obiect.
Abordarea cea mai des utilizat const n a utiliza sisteme de gestiune abazelor de date relaionale. Modelul multidimensional este transpus demaniera urmtoare:
Fiecare fapt corespunde unei tabele, denumit tabel de fapte Fiecare dimensiune corespunde unei tabele, denumite tabel de
dimensiuni Tabela de fapte este constituit din atributele ce reprezint msurile
activitii i atributele chei externe ale fiecrei tabele de dimensiuni.
Tabelele de dimensiuni conin parametrii i cheia primar care permites se fac legtura cu tabela de fapte
-
7/28/2019 Siad Curs 5 Olap
28/28
Modelarea logic
Vnzri (IDProdus, IDMagazin, IDTimp,Cantitate, Valoare)
Timp (IDTimp, Zi , Lun, Trimestru, Semestru,An)
Magazin (IDMagazin, DenMagazin, Localitate,Jude Regiune, ar)
Produs (IDProdus, Denumire prod., Marc prod.,Subcategorie prod., Categorie prod., Raion)