Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

download Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

of 57

Transcript of Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    1/57

    Introducere

    Cap 1. Concepte de baz privind depozitelor de date1.1._Depozite de date-delimitri conceptuale

    1.2._Data warehousing1.3._Obiectivele Data Warehouse

    Cap 2. Arhitectura depozitelor de date2.1Arhitectura simplificat a depozitelor de date2.2 Arhitectura depozitelor de date pe trei niveluri2.3 Tipuri de depozite de date

    Cap 3. Proiectarea i realizarea depozitelor de date3.1 Analiza economic pentru proiectarea unui depozit3.2 Viziuni de proiectare a unui depozit de date

    3.3 Procesul de proiectare a unui depozit de date3.4 Depozite de date versus baze de date operaionale

    Cap 4. Modele de date multidimensionale4.1De la tabele i foi de calcul la cubul de date4.2Stele, fulgi de zapadi constelaiile de fapte

    Cap 5. Software folosit n Data Warehousing5.1Instrumente de extragere i transformare a datelor5.2Instrumente de accesare i utilizare a depozitului de date

    Cap 6. Studiu de caz-implementare n SQL Server 20056.1Clasificare6.2Funciunile unui CRM6.3Modelarea i proiectarea sistemului CRM Pro Manager

    6.3.1Modelarea fluxului de date6.3.2Modelarea datelor sistemului

    6.4Proiectarea ieirilor6.5Proiectarea intrrilori a interfeei6.6Proiectarea bazei de date6.7Implementarea sistemului6.8Funciunea aplicaiei6.9Ieirile i rapoartele sistemului6.10Sistemul de asisten

    Cap 7. Concluzii i propuneri

    Referine bibliografice

    Anexe

    33

    46

    779

    10

    111111

    1213

    161618

    212122

    24263030303340424647

    505355

    56

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    2/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    2 | p a g i n a

    INTRODUCERE

    Conform unor studii recente, depozitele de date au devenit, la sfritul anilor

    1990 una din cele mai importante dezvoltri din domeniul sistemelor informaionale.Palo Alto Management Group previziona nc din 1998 c piaa data warehouse vaajunge la 113.5 miliarde USD n 2002, incluznd aici vnzrile de sisteme datawarehouse, software adecvat i servicii. Industria data warehouse s-a dezvoltatcontinuu n termeni de investiii, produse disponibile i proiecte elaborate. Seapreciaz c aproximativ 90% din companiile multinaionale au implementatedepozite de date sau lucreaz la dezvoltarea unor proiecte data warehouse. Depozitelede date sunt produsul mediului economic i al tehnologiilor avansate. Pe de o parte,mediul economic este tot mai competitiv, global i complex i solicit informaiielaborate pentru sprijinirea deciziilor strategice iar, pe de alt parte, evoluiiletehnologiilor informaionale ofer soluii eficiente de gestionare a unor volume maride date integrate, de ordinul terabytes-ilor, asigurnd niveluri de sintez/detaliereadecvate. Astfel evoluiile performante din hardware cum sunt sistemele de procesrimasive paralele (Massive Parallel Processing - MPP), sistemele de multiprocesaresimetric (symetric multi-processing-SPM), sistemele tip baze de date paralele fac

    posibile ncrcarea, ntreinerea i accesul la baze de date de dimensiuni uriae.Aplicaiile data warehouse sunt n msur s asigure i un timp mediu de rspunsextrem de scurt pentru categorii extinse de utilizatori.

    Depozitele de date (data warehouse) furnizeaz arhitecturi i instrumente utileconducerii executive (business executives) prin organizarea sistematic, nelegerea i

    utilizarea datelor n luarea deciziilor strategice. Un mare numr de organizaiiconsider c sistemele data warehouse dispun de instrumente valoroase n mediuleconomic de astzi, mediu competitiv i n rapid evoluie. n ultimii ani multe firmeau cheltuit milioane de dolari cu realizarea de depozite de date. Mult lume i dseama c n condiiile competiiei sporite din fiecare industrie, depozitele de date suntarmele care trebuie marketingului, reprezentnd calea de a pstra clienii. Primeledomenii care au adoptat tehnologia depozitelor de date au fost telecomunicaiile,

    bncile i comerul cu amnuntul. Ulterior depozitele de date au ptruns i n altedomenii cum ar fi industria farmaceutic, sistemul sanitar, asigurri, transporturi etc.Studiile statistice arat c telecomunicaiile i sistemul bancar se menin n topntruct aloc cel puin 15% din bugetul IT pentru proiecte referitoare la depozite de

    date. Un proiect data warehouse reprezint ns o investiie riscant i scump.Costurile tipice pentru dezvoltarea unui depozit de date ntr-un interval de 3-6 luni sesitueaz ntre 0.8 i 2 milioane USD. Ponderea echipamentelor se situeaz ntre 1/2 i2/3 din costul total al proiectului. O soluie pentru firmele mici i mijlocii esterecurgerea la data marts pentru care costurile se situeaz sub 100 000 USD ntr-uninterval adesea sub 90 de zile . Uneori investiiile n depozite de date nu se finalizeazcu succes. Motivaiile cele mai des ntlnite pentru eecul unor data warehouse includsusinerea insuficient din partea conducerii organizaiei, insuficiena fondurilor i

    politicile organizaionale defectuoase.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    3/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    3 | p a g i n a

    1. CONCEPTE DE BAZ PRIVIND DEPOZITELOR DE DATE

    1.1. DEPOZITE DE DATE - DELIMITRI CONCEPTUALE

    Depozitele de date (data warehouse) au fost definite n foarte multe modurinct este destul de dificil de formulat o definiie riguroas. n sens larg, un depozit dedate reprezint o baz de date care este ntreinut separat de bazele de dateoperaionale ale organizaiei. Datele din sistemele surs sunt extrase, curite,transformate i stocate n depozite specialen scopul sprijinirii proceselor decizionale.Depozitele de date sprijin procesarea informaiilor furniznd o platform solid deconsolidare a datelor istorice pentru analiz. Un depozit de date este o sum de dateconsistent din punct de vedere semantic care servete la o implementare fizic a unuimodel de date pentru sprijinirea deciziei i stocheaz informaii pe care o organizaiele solicit n luarea deciziilor strategice. n concordan cu W. H. Inmon, liderul nconstruirea sistemelor data warehouse, un depozit de date este o colecie de dateorientate pe subiecte, integrate, istorice i nevolatile destinat sprijinirii procesului deluare a deciziilor manageriale. n sintez, definiia prezentat mai sus exprimcaracteristicile majore ale depozitelor de date:

    orientare pe subiecte; integrare; caracter istoric; persistena datelor.

    Orientarea pe subiecte. Sistemele operaionale tradiionale erau focalizate pe datele

    cerute de compartimentele funcionale ale ntreprinderii. Odat cu reingineriaproceselor (Business Process Reengineering - BPR) ntreprinderile ncep s axeze pecerinele decizionale ale echipelor de conducere. Sistemele operaionale moderne suntorientate pe cerinele ntregului proces tranzacional i sprijin execuia proceselor dela nceput pn la sfrit. Un depozit de date merge dincolo de informaiiletradiionale prin focalizarea pe subiecte ale activitii ntreprinderii cum ar fi: clieni,vnzri, profituri etc. Aceste subiecte necesit informaii din diverse surse pentru afurniza o imagine complet a domeniului. n loc de a se concentra pe procesareaoperaiilori tranzaciilor zilnice dintr-o organizaie, un depozit de date se focalizeaz

    pe modelarea i analiza datelor pentru luarea deciziilor. Din acest motiv, depozitele dedate ofer, n mod tipic, o viziune simpl i concis relativ la un subiect specific

    excluznd datele care nu sunt utile n procesul de sprijinire a deciziei.

    Integrarea. Un depozit de date este, n mod uzual, construit prin integrarea unormultiple surse heterogene: baze de date relaionale, fiiere, nregistrri privindtranzacii online. Tehnicile de curire a datelor (data cleaning) i de integrare suntaplicate pentru a asigura concordana n conveniile de atribuire a numelor, decodificare a structurilor, de atribuire a valorilor.a.m.d.

    Caracterul istoric. Datele sunt stocate pentru a furniza informaii n perspectivistoric (de exemplu, 5-10 ani n urm). Astfel decidenii pot consulta valorilesuccesive ale acelorai date pentru a determina evoluia n timp i a calcula anumiiindicatori.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    4/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    4 | p a g i n a

    Persistena datelor. Datele dintr-un depozit sunt permanente i nu pot fi modificate.O actualizare a depozitului de date, ca urmare a modificrilor efectuate n datele surs,nsemn adugare de date noi fr a modifica sau terge datele existente. Un depozitde date este ntotdeauna memorat separat din punct de vedere fizic de dateletransformate din alte aplicaii. Datorit acestei separri, un depozit de date nu necesit

    mecanisme de procesare a concurenei. n mod uzual solicit numai dou operaiuni naccesarea datelor: ncrcarea iniial a datelor i accesul la date. Alte definiii aledepozitelor de date surprind, cu unele nuanri, aceleai elemente eseniale:

    Un depozit de date conine un volum foarte mare de date. Unele dintre acestedate provin din sursele operaionale ale organizaiei, altele pot proveni dinsurse externe;

    Depozitul de date este organizat astfel nct s faciliteze folosirea datelor nscopuri decizionale;

    Depozitul de date furnizeaz instrumente prin intermediul crora utilizatoriifinali pot accesa rapid datele.

    n continuare prezentm cteva definiii reprezentative din literatura de specialitate. nviziunea lui Barry Devlin, un depozit de date nseamn o stocare a datelor unitar,complet i consistent obinut dintr-o varietate de surse, disponibil utilizatorilorfinali ntr-un mod uor perceptibil i utilizabil n contextul afacerii. DupRalph

    Kimballdepozitul de date ofer acces la datele organizaionale; datele coninute suntconsistente; datele pot fi separate i combinate n funcie de fiecare dimensiune sauaspect al afacerii. Depozitul de date include, de asemenea, un set de instrumente

    pentru interogare, analizi prezentare a informaiilor; reprezint locul n caresuntpublicate datele folosite; calitatea datelor coninute n depozit reprezinto premispentru reingineria afacerii.Sam Anahory subliniaz finalitatea depozitelor de date

    preciznd c un depozit de date include datele ... i procesele manageriale ... care facinformaiile disponibile, permind managerilor s ia decizii corect fundamentate.

    De asemenea, o serie de firme i-au adus contribuia n definirea, dezvoltarea i popularizarea tehnologiilor data warehouseIBM, Software AG, Oracle, Microsoft,Prism Solutions etc. De exemplu, Software AGdefinete depozitul de date capunctul central pentru difuzarea informaiilor ctre utilizatorii finali pentru sprijinireadeciziilori pentru acoperirea cerinelor informaionale ale conducerii. IBM a propusun termen propriu pentru depozitele de date: Information Warehouse. Dup uniiautori, viziunea IBM se refer mai degrab la conectivitatea global a diverselor sursede date, fiind un fel de "middleware generalizat" bazat pe arhitectura proprie DRDA -

    Distributed Relational Database Architecture. De altfel, n literatura de specialitate sefolosesc i simultan cei doi termeni pentru depozite de date: Data Warehouse iInformation Warehouse. Dup Efraim Turban, scopul unui "data (or information)warehouse este de a realiza un fond de date (data repository) care s fac accesibiledatele operaionale ntr-o form acceptabil pentru asistarea deciziilor i pentru alteaplicaii.

    1.2. DATA WAREHOUSING

    n legtur cu depozitele de date o noiune frecvent utilizat este cea de "data

    warehousing" care desemneaz procesul de construire i utilizare a depozitelor de date(data warehouse). Construirea unui depozit de date necesit integrarea datelor,

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    5/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    5 | p a g i n a

    curirea datelor (data cleaning) i consolidarea datelor. Utilizarea unui depozit dedate necesit adesea o colecie de tehnologii de asistare a deciziilor. Acestea permitmanagerilori specialitilor (de exemplu, analiti, consilieri etc.) s utilizeze depozitul

    pentru a obine rapid i convenabil datele necesare i s ia deciziile bazate peinformaiile din depozit. Ali autori utilizeaz termenul de data warehousing" pentru

    a referi numai procesul de construire a depozitului de date, n timp de termenul dewarehouse DBMS" este utilizat pentru a referi conducerea i utilizarea depozitului dedate. n privina utilizrii datelor din depozitele de date trebuie precizat c multeorganizaii utilizeaz aceste informaii pentru sprijinirea lurii deciziilor n diferitedomenii de activitate cum ar fi:

    sporirea focalizrii pe clieni care include analize ale vnzrilor (preferine,periodicitate, cicluri bugetare, apetit pentru cumprare etc.);

    reorientarea produciei i gestionarea portofoliului de produse, comparndperformanele vnzrilor pe trimestre, ani, zone geografice, n ordinea celormai bune strategii de producie;

    analiza operaiilori cutarea surselor de profit; gestionarea relaiilor cu clienii; gestionarea costului activelor corporale.

    Data warehousing este, de asemenea, foarte util din punct de vedere al integrriisurselor de date heterogene. Multe organizaii colecteaz, n mod obinuit, diferitetipuri de date i ntrein baze de date mari din surse de informaii multiple, heterogene,autonome i distributive. Integrarea acestor date i obinerea unui acces eficient la eleeste lucrul cel mai dorit. Multe eforturi au fost depuse n industria bazelor de date i ncomunitile de cercetare pentru ndeplinirea acestui scop. n concepia bazelor dedate tradiionale integrarea bazelor de date heterogene este realizat de wrappers" i

    integratori (integrators) sau mediatori (mediators) asupra bazelor de date multiple (ex.IBM Data Joiner, Informix Data Blade). Cnd o interogare este pus unui site client,un dicionar de metadate este utilizat la transformarea interogrii n interogricorespunztoare site-urilor heterogene implicate. Aceste interogri sunt atunci mapatei transmise proceselor locale de interogare. Rezultatele primite de la diferite site-urisunt integrate n rspunsul global.

    Aceast concepie de interogare necesit procese complexe de filtrare i integrare careconcureaz la resursele de procesare. Este ineficient i potenial scump pentruinterogri frecvente, n special pentru interogri ce solicit agregri. Datawarehousing furnizeaz o interesant alternativ la conceptul tradiional de integrare a

    bazelor de date heterogene descrise mai sus. Data warehousing folosete conceptulupdate-driven" n care informaiile din surse multiple, heterogene sunt interogate navans i stocate n depozitul de date pentru integrare directi analiz. Spre deosebirede bazele de date cu procesare on-line, depozitele de date nu con in informaiile celemai proaspete. Cu toate acestea, un depozit de date determin o nalt performan

    prin integrarea bazelor de date heterogene ntruct datele sunt copiate, preprocesate,integrate, adnotate, nsumate i restructurate ntr-o colecie semantic de date(semantic data store). n plus procesul de interogare din depozitul de date nuinterfereaz cu procesele din sursele locale. De altfel, depozitele de date pot stoca iintegra informaii istorice i sprijin interogri multidimensionale complexe.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    6/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    6 | p a g i n a

    1.3. OBIECTIVELE DATA WAREHOUSE

    n sintez, scopurile unui depozit de date sunt urmtoarele: S furnizeze utilizatorilor accesul sporit la date; S furnizeze o singur versiune a adevrului; S nregistreze cu acuratee trecutul; S jongleze" cu nivelurile de acces sintez/detaliu la date; S separe prelucrrile de nivel operaional i analitic;

    Acces sporit la date pentru utilizatori. Depozitul de date furnizeaz accesul ladatele integrate ale ntreprinderii, anterior blocat prin ci neprietenoase. Utilizatorii

    pot acum s stabileasc, cu un minim de efort, o conexiune garantat la depozitul dedate prin intermediul unui microcalculator. Securitatea este ntrit prin thewarehouse front-end application", prin serverul bazei de date sau prin ambele.

    O singur versiune a adevrului. Datele din depozitele de date sunt consistente i aucalitatea asigurat nainte de a fi puse la dispoziia utilizatorilor finali. n msura ncare se se utilizeaz o surs comun de date, depozitele de date pun capt dezbaterilor

    privind veridicitatea datelor utilizate sau citate n edinele de lucru. Depozitul de datencepe s fie resursa comun de date pentru nivelurile decizionale din organizaii.Menionm c o singur versiune a adevrului" este adesea posibil numai dupmulte discuii i dezbateri asupra termenilor utilizai n organizaie. De exemplu,termenul de client ru platnic" poate avea mai multe nelesuri: client care nu pltetela timp, client care nu pltete dect parial, client care nu pltete niciodat etc. Ar

    putea fi stabilit i o alt accepiune: clieni care au datorii mai vechi de o lun. nmod sigur aceste accepiuni au influen asupra proceselor decizionale i asupra

    pertinenei deciziilor.

    nregistrarea cu acuratee a trecutului. Multe date primite de manageri nu suntsemnificative dac nu sunt comparate cu datele anterioare. De exemplu, rapoartelecare compar performanele actuale ale companiei cu cele din anul precedent suntcomune. Rapoartele care arat performanele companiei pentru fiecare lun din ultimiitrei ani pot fi foarte interesante pentru decideni. Sistemele operaionale nu vor putea

    permite acest gen de informaii. Un depozit de date va fi utilizat pentru nregistrareacu acuratee a trecutului, prsind sistemele OLPT libere pentru a realiza focalizarea

    pe corecta nregistrare curent a tranzaciilor. Datele istorice sunt ncrcate i integratecu alte date n depozit pentru un acces rapid.

    Acces combinat sintez/detaliu la date. Rapoartele dinamice i instrumentele deinterogare OLAP (de exemplu, releveele din programele de calcul tabelar, drill up,drill down) permit utilizatorilor s vizualizeze informaiile din depozitul de date subdiferite unghiuri i la diferite niveluri de detaliere. Aceste disponibiliti oferite dedepozitele de date reduc timpul i efortul necesar pentru colectarea, formatarea ifiltrarea informaiilor plecnd de la date.

    Separarea prelucrrilor de nivel operaional i analitic. Procesele decizionale iprocesele operaionale sunt totalmente divergente arhitectural. ncercarea de a s reunin acelai sistem informaiile decizionale i operaionale determin ca ntreinerea

    sistemului s devin o problem. Pornind de la procesele operaionale depozitul dedate furnizeaz o arhitectur separat pentru implementarea deciziilor.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    7/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    7 | p a g i n a

    2. ARHITECTURA DEPOZITELOR DE DATE

    2.1. ARHITECTURA SIMPLIFICAT A DEPOZITELOR DE DATE

    Esena unui depozit de date const ntr-o baz de date de dimensiuni foartemari coninnd informaiile pe care le pot folosi utilizatorii finali (clieni, furnizori,companii de publicitate etc.). Arhitectura simplificat a unui depozit de date este

    prezentat n figura de mi jos. n depozitul de date ntlnim mai multe tipuri de datecare corespund diferitelor cerine informaionale ale utilizatorilor: date detaliate, dateagregate, metadate. Metadatele descriu datele coninute n depozitul de date i moduln care ele sunt obinute i stocate. Prin metadate se precizeaz structura datelor,

    proveniena lor, regulile de transformare, de agregare i de calcul. Metadatele joac unrol esenial n alimentarea depozitului cu date. Ele sunt utilizate n toate etapele dencrcare a datelor i sunt consultate i actualizate pe parcursul ntregului ciclu devia al depozitului. Includerea datelor agregate n depozit, dei determin o cretere aredundanei datelor, este necesar deoarece n acest fel se poate asigura un timp mediude rspuns ct mai redus. Sursele de date pentru depozite sunt: bazele de dateoperaionale curente, bazele de date vechi arhivate precum i bazele de date externe.Construirea depozitului de date presupune parcurgerea urmtoarelor etape:

    1.Un proces de extragere a datelor din bazele de date operaionale sau dinsurse externe urmat de copierea lor n depozitul de date. Acest procestrebuie, cel mai adesea, s transforme datele n structura i formatulintern al depozitului;

    2.Un proces de curire a datelor, pentru a exista certitudinea c datele

    sunt corecte i pot fi utilizate pentru luarea deciziilor;3.Un proces dencrcare a datelor corecte n depozitul de date;

    Figura 2.1. Arhitectura de principiu a unui depozit

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    8/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    8 | p a g i n a

    4.Un proces de creare a oricror agregri ale datelor: totaluriprecalculate, subtotaluri, valori medii etc. care se preconizeaz c vorfi cerute i folosite de utilizatori. Aceste agregri sunt stocate ndepozitul de date mpreun cu datele importate din sursele interne iexterne;

    Depozitele de date sunt destinate managerilor, analitilori specialitilor angrenai nluarea deciziilor strategice privind dezvoltarea i viitorul organizaiilor. Pentru aceastaei au nevoie de instrumente performante de accesare i utilizare a datelor din depozite,instrumente asigurate prin software-ul asociat depozitului de date. Pe de o parte,regsim instrumente necesare utilizatorilor care au nevoie de acces rapid de informaii

    punctuale care includ un limbaj de interogare gen SQL sau generatoare de rapoarte(Report Writers) ce transpun informaiile n formate adecvate. Pe de alt parte, suntintrumente specializate pentru asistarea deciziilor care transform informaiile nforma cerut de decideni (grafice, diagrame, organigrame) sau ofer posibilitateaanalizei tendinelor, corelaiilor i interpretarea acestora. n aceast categorie se

    ncadreaz instrumentele OLAP i Datamining. Instrumentele OLAP se bazeaz pereprezentarea multidimensional a datelor (cubul de date) i permite analizainteractivi rapid a datelor prin operaiuni de tip roll-up, drill-down, slice, dice etc.Utilizatorul poate obine rezultate imediate parcurgnd dinamic dimensiunile cubuluide date lucrnd cu niveluri diferite de sintez/ detaliere. Instrumentele de tip datamining asigur transformarea datelor n cunotine, de aceea mult lume considertermenul data mining sinonim cu termenul de Knowledge Discovery in Databases(KDD). Se utilizeaz tehnici ale analizei statistice sau de inteligen artificial care

    permit descoperirea de corelaii, reguli, cunotine utile sprijinirii deciziilor. ntreagagam de instrumente software asociate depozitelor de date este prezentat n figuranr.2 n partea stng snut evideniate componentele din partea de back-end(instrumente de extragere i transformare) iar n partea dreapt componentele din

    partea de front-end (instrumente de extragere i accesare a datelor).

    Figura 2.2. Componentele software ale depozitelor de date

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    9/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    9 | p a g i n a

    2.2. ARHITECTURA DEPOZITELOR DE DATE PE TREI NIVELURI

    Nivelul de jos (bottom-tier) este constituit din serverul DD i este, n multecazuri, un sistem baze de date relaionale. Datele din bazele de date operaionale i dinsursele externe (cum ar fi informaii relative la profilul clientului furnizate de

    consultani externi, rezultatele unor sondaje) sunt extrase utiliznd programe deaplicaii tip interfaa cunoscute sub numele de gateways". Un gateway este sprijinitde SGBD-ul de bazi permite programelor client s genereze cod SQL pentru a fiexecutat de server. Exemplele gateways includ ODBC (Open Database Connection) iOLE-DB (Open Linking and Embedding for Databases) la Microsoft i JDBC (JavaDatabase Connection). n acest mod datele sunt extrase, curite, transformate incrcate n depozitul de date. De asemenea, trebuie luat n considerare imodalitatea de mprosptare a datelor din depozit, pe msura trecerii timpului. Dac,de exemplu, dimensiunea timp are n structur luna, trimestru, an nseamn c lasfritul fiecrei luni, a fiecrui trimestru sau a fiecrui an datele din sistemuloperaional trebuie s mprospteze depozitul de date.

    Figura 2.3.Arhitectura Data warehouse cu trei niveluri

    Baze de date operaionale Surse

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    10/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    10 | p a g i n a

    Nivelul mediu (middle tier) bazat pe un server OLAP care este implementat n modobinuit, utiliznd fie un model relaional OLAP (ROLAP) fie un modelmultidimensional OLAP (MOLAP). Modelul ROLAP este o extensie a unui SGBDRcare mapeaz operaiunile pe date multidimensionale la operaiunile relaionalestandard. Modelul MOLAP este dedicat i implementeaz direct descrierea datelori

    a operaiilor multidimenionale.

    Nivelul superior (top tier) este nivelul client care conine instrumente pentrugenerarea interogrilori a rapoartelor, instrumente de analizi/sau instrumente datamining (de exemplu, analiza trendului, predicii etc.)

    2.3. TIPURI DE DEPOZITE DE DATE

    Din punct de vedere al ariei de cuprindere, se ntlnesc trei modele de depozitede date: depozite de ntreprindere (entreprise warehouse), data mart i depozite

    virtuale de date. Un depozit de ntreprindere (Entreprise Warehouse) colecteaztoate informaiile despre subiecte care privesc ntreaga organizaie. El furnizeaz unvolum extins de date. De regul conine date detaliate dari date agregate, iar ca ordinde mrime pornete de la civa gigabytes pn la sute de gigabytes, terabytes sau maimult. Un depozit de date de ntreprindere poate fi implementat pe tradiionalelemainframes, pe superservere UNIX sau pe platforme cu arhitecturi paralele. Necesitcheltuieli mai mari pentru modelare i ani de zile pentru proiectare i realizare.

    Un data mart conine un subset al volumului de date din organizaie, specific unuigrup de utilizatori. Domeniul este limitat la subiecte specifice. De exemplu, un datamart pentru marketing limiteaz subiectele la clieni, articole, vnzri. Dateleconinute n data mart sunt de obicei agregate. Data marts sunt, n mod curent,implementate pe servere departamentale mai ieftine care se bazeaz pe UNIX sauWindows/NT. Ciclul de implementare al unui data mart este mai curnd msurat nsptmni dect n luni sau ani. Ca atare, un data mart poate fi considerat unsubansamblu al unui depozit de date mai uor de construit i ntreinut i mai puinscump. Un depozit virtual (Virtual warehouse) este un set viziuni (views) asupra

    bazelor de date operaionale. Pentru eficiena procesrii interogrilor numai unele dinviziunile de agregare pot fi materializate. Un depozit virtual este uor de construit darnecesit capaciti suplimentare pe serverele de baze de date.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    11/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    11 | p a g i n a

    3. PROIECTAREA I REALIZAREA DEPOZITELOR DE DATE

    3.1. ANALIZA ECONOMIC PENTRU PROIECTAREA UNUI DEPOZIT

    Proiectarea unui depozit de date presupune aplicarea unei scheme de analizeconomic pentru a determina msura n care depozitul de date este necesar ieficient. n primul rnd, trebuie ca depozitul de date s furnizeze avantajecompetitive prezentnd informaii relevante pe baza crora putem msura

    performanele i putem face ajustrile critice pentru a ctiga n faa competitorilor. nal doilea rnd, un depozit de date poate determina creterea productivitii dinmoment ce permite obinerea rapidi eficient de informaii care descriu cu acurateeorganizaia. n al treilea rnd, un depozit de date faciliteaz gestiunea relaiilor cuclienii din moment ce furnizeaz o viziune consistent despre clieni i produsentlnite pe toate liniile de afaceri, pe toate departamentele i pe toate pieele. n final,un depozit de date determin reducerea costurilor prin reliefarea tendinelor,direciilori excepiilor pe perioade lungi de timp. Pentru proiectarea unui depozit dedate este necesar nelegerea i analiza proceselor economice din domeniu iconstruirea unei scheme de analiz economic. Construirea unui sistem informaionalcomplex i vast poate fi comparat cu ridicarea unei cldiri mari i complexe, pentrucare proprietarul, arhitectul i constructorul au diferite viziuni. Aceste viziuni suntcombinate ntr-o schem complex care reprezint perspectiva top-down, perspectiva

    proprietarului sau, la fel de bine, perspectiva bottom-up sau viziunea celui careimplementeaz sistemul informaional.

    3.2. VIZIUNI DE PROIECTARE A UNUI DEPOZIT DE DATE

    Proiectarea unui depozit de date poate lua n considerare viziuni diferite:viziunea top-down, viziunea datelor surs (data source view), viziunea depozitelor dedate i viziunea business query.Viziunea top-down permite selectarea informaiilorrelevante necesare n depozitul de date. Aceste informaii reprezint un sprijindecizional n activitatea curent. Viziunea datelor surs(data source view) expriminformaiile culese, stocate i gestionate de sistemele operaionale. Aceste informaii

    pot fi documentate pe niveluri variate de detaliere i acuratee, de la tabele individualede date surs la tabele de date integrate. Datele surs sunt adesea modelate prin

    tehnicile tradiionale de modelare a datelor cum sunt diagramele E-A (Entitate -Asociaie) sau instrumentele CASE. Viziunea depozitelor de date are n vederetabelele de fapte i tabelele dimensiune. Reprezint informaiile care sunt stocate ndepozitele de date, incluznd contorizri i totaluri precalculate, ca i informaii

    privitoare la sursa, data calendaristic, origine adugate pentru a furniza contextulistoric. Viziunea business query ofer o perspectiv din punct de vedere alutilizatorului final. Construirea i utilizarea unui depozit de date este o sarcincomplex din moment ce necesit abiliti de afaceri, abiliti tehnologice imanageriale. Abilitile de afaceri necesare construirii unui depozit de date se refer lanelegerea modului n care sistemele stocheaz i gestioneaz datele, la modul defuncionare a instrumentelor de extragere care transfer datele din sistemul

    operaional n depozite de date, la modul cum se construiete software-ul pentrumprosptarea depozitului prin preluarea datelor din sistemele operaionale. Utilizarea

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    12/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    12 | p a g i n a

    unor depozite de date implic nelegerea semnificaiei datelor coninute, ca inelegerea i traducerea cerinelor informaionale n interogri care pot fi satisfcutede depozitele de date. Referitor la abilitile tehnologice, analitii datelor trebuie sneleag cum se obin informaii cantitative i fapte derivate bazate pe concluzii de lainformaiile istorice din depozitele de date. Aceste ndemnri includ abilitatea de a

    descoperi modele i tendine, de a extrapola trendul bazndu-se pe date istorice, de avedea anomaliile sau paradigmele i de a prezenta recomandri manageriale concrete bazate pe asemenea analize. Abilitile de gestiune a programelor permitintermedierea interfeei cu productorii, vnztorii i utilizatorii finali n privinadistribuirii rezultatelor rapid i la costuri acceptabile.

    3.3. PROCESUL DE PROIECTARE A UNUI DEPOZIT DE DATE

    Un depozit de date poate fi proiectat i construit utiliznd abordarea top-down,abordarea bottom-up sau combinaii ale acestora. Abordarea top-down pornete cu

    proiectarea i planificarea complet. Se utilizeaz n cazul cnd tehnologia estematuri bine cunoscuti problemele economice care trebuie rezolvate sunt clare i

    bine nelese. Abordarea bottom-up pornete cu experimente i prototipuri. Aceastaeste utilizat la nceputul stadiului de modelare i de dezvoltare tehnologic. Ea

    permite unei organizaii s mearg nainte cu cheltuieli considerabil mai mici i sevalueze beneficiile tehnologiei nainte de a face angajamente semnificative n aceastdirecie.n abordarea combinat, o organizaie poate exploata caracterul planificat istrategic al abordrii top-down att timp ct reinem avantajele implementrii rapide ioportune a aplicaiilor dup abordarea bottom-up. Din punct de vedere al ingineriei

    programrii, proiectarea i construirea unui depozit de date const n urmtorii pai: planificare, studiul cerinelor, analiza problemei, proiectarea depozitului, integrareadatelori testarea i, n final, utilizarea depozitului de date. Sistemele software mari

    pot fi dezvoltate utiliznd dou metodologii: metoda n cascad sau metoda n spiral.Metoda n cascad execut o analiz structurati sistematic la fiecare pas nainte dea trece la urmtorul. Metoda n spiral implic generarea rapid de sisteme funcionaledin ce n ce mai complete, la intervale scurte, ntre dou versiuni succesive. Acestlucru constituie un atu important pentru dezvoltarea depozitelor de date, n special

    pentru data marts pentru c intervalul de realizare este scurt, modificrile pot fi fcuterapid i noile proiecte i tehnologii pot fi adaptate n mod rapid. n general, procesulde proiectare a depozitului const n urmtorii pai:

    1. Alegerea procesului economic de modelat, de exemplu: stocuri, vnzri

    etc. Dac procesul economic este organizaional i implic colecii deobiecte complexe i multiple modelul tip depozit de date trebuierealizat. Dac procesul este departamental i focalizat pe analiza unuisingur domeniu va fi ales modelul data marts.

    2. Alegerea nivelului de granularitate. Nivelul de granularitate este nivelulde date fundamental, atomic care va fi folosit pentru reprezentareadatelor n tabelul de fapte pentru fiecare proces.

    3. Alegerea dimensiunilor care vor fi aplicate la fiecare nregistrare dintabelul de fapte. Dimensiunile tipice sunt: timp, articol, client, furnizor,depozit, tip tranzacii i stare.

    4. Alegerea msurilor (valorilor) care vor popula fiecare nregistrare din

    tabelul de fapte. Valorile tipice sunt numerice: de exemplu, vnzri_leii cantitatevndut.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    13/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    13 | p a g i n a

    Din moment ce construirea unui depozit de date este o sarcin dificil i pe termenlung, ocaziile de implementare trebuie clar definite. Scopurile unei implementriiniiale ale unui depozit de date ar trebui s fie specifice, realizabile i msurabile.Aceasta implic determinarea timpului i bugetului alocat, a subsetului din organizaiecare trebuie modelat, a numrului de surse de date selectate, a numrului i a tipurilor

    de departamente utilizatoare. Odat ce depozitul de date este proiectat i construit,dezvoltarea iniial a depozitului include instalarea iniial, planificarea derulriidepozitului de date, instruirea i orientarea. Actualizarea platformelor i ntreinerealor trebuie de asemenea, luate n considerare. Administrarea depozitului de dateinclude mprosptarea datelor, sincronizarea datelor surs, planificarea reacoperirilor,gestiunea controlului pentru acces i securitate, extinderea depozitului de date. Sferamanagementului include controlarea numrului i ariei de interogri, dimensiuni,rapoarte, limitarea mrimii depozitului de date sau limitarea bugetului i resurselor.Sunt disponibile categorii variate de instrumente de proiectare a depozitelor de date.Instrumentele de dezvoltare a depozitelor de date furnizeaz funcii de definire ieditare a depozitului de metadate (scheme, scripturi, reguli), interogri, rapoarte de

    ieire etc.. Instrumentele de analiz i planificare studiaz impactul schimbrilor imbuntirea performanelor cnd se schimb intervalele de timp.

    3.4. DEPOZITE DE DATE VERSUS BAZE DE DATE OPERAIONALE

    O comparaie ntre bazele de date i depozitele de date este n msur s ofereo imagime coerent privind rolul depozitelor de date n organizaii precum iraporturile cu alte tipuri de sisteme informatice. Att bazele de date ct i depozitelede date conin mari cantiti de date structurate care pot fi consultate rapid datoritstructurilor de acces optimizate i se bazeaz, n majoritatea cazurilor, pe tehnologiirelaionale. Totui ele nu au fost proiectate pornind de la aceleai obiective i sedifereniaz prin numeroase aspecte. Sistemele de gestiune a bazelor de date suntadecvate aplicaiilor curente de gestiune i servesc la crearea i ntreinerea sistemelorde baze de date operaionale. Aceste sisteme cunoscute sub denumirea de sistemeOLTP (On-Line Transaction Processing) au ca obiectiv execuia on-line a tranzaciilori a proceselor de interogare. Ele ncorporeaz toate operaiile zilnice dintr-oorganizaie cum ar fi: aprovizionri, stocuri, producie, decontri, pli, contabilitate.Sistemele depozite de date, pe de alt parte, servesc utilizatorii sau specialitii ndomeniul analizei datelori lurii deciziilor. Aceste sisteme pot organiza i prezentadatele n formate variate n ordinea solicitrilor de la diferii utilizatori. Aceste sisteme

    sunt cunoscute sub numele de sisteme OLAP (On-Line Analytical Processing).Bazele de date din sistemele operaionale conin date curente, detaliate care trebuieactualizate i interogate rapid, n condiii de deplin securitate, constituind suportulsistemelor informaionale de prelucrare a tranzaciilor (TPS). Depozitele de date suntconcepute special pentru sprijinirea lurii deciziilor. Ele au ca obiectiv regrupareadatelor, agregarea i sintetizarea lor, organizarea i coordonarea informaiilor

    provenind din surse diferite, integrarea i stocarea acestora pentru a da decidenilor oimagine adecvat care s permit regsirea i analiza eficace a informaiilor necesare.Interogrile obinuite ntr-un depozit de date sunt mai complexe i mai variate dectcele din sistemele de gestiune a bazelor de date. Ele se aplic asupra unor volume

    foarte mari de date i presupun calcule complexe (analiza tendinei, medii, dispersiietc.) care necesit adesea agregri (group by). Deosebirile majore ntre OLTP i

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    14/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    14 | p a g i n a

    OLAP sunt sintetizate n tabelul de mai jos i iau n considerare urmtoarele trsturi:utilizatorii i orientarea sistemului, caracterul datelor coninute, nivelul de sintez,unitatea de lucru, schemele de acces, numrul de nregistrri accesate, mrimea

    bazelor de date, sistemul de evaluare etc.

    Nr. crt. Trsturi OLTP OLAP1. Destinaia Procese operaionale Procese informaionale2. Orientarea sistemului Tranzacii Analize

    Utilizatori Funcionari, Specialiti, manageri,3. administratori BD,

    profesioniti BDexecutivi, analiti

    4. Funcii Operaii zilnice Cerine informaionale pe termenlung, asistarea deciziei

    5. Instrumente folosite nproiectare

    Diagrame E-A Star/ snowflake

    Nr. crt. Trsturi OLTP OLAP6. Caracterul datelor Curente, noutate garantat Istorice, precizie meninut n timp7. Nivelul de sintez Primitive, detaliere ridicat Sintetizare, consolidare8. Unitatea de lucru Scurt, tranzacii simple Interogri complexe9. Scheme de acces Read/write Aproape ntotdeauna Read10. Focalizare Culegere date Furnizare informaii11. Numr de nregistrri

    accesateZeci Milioane

    12. Numr de utilizatori Mii Sute13. Mrimea bazelor de date 100 MB - GB 100 GB - TB14. Prioriti Performane ridicate,

    disponibilitate ridicatFlexibilitate ridicat, autonomieutilizatori finali

    15. Sistem de evaluare Tranzacii culese Interogri culese, timp de rspuns

    Tabelu1 3.1. Comparaie ntre sistemele OLTP i OLAP

    Un sistem OLTP este orientat pe client (customer oriented) i este utilizat pentru procesarea tranzaciilor i interogrilor. Un sistem OLAP este orientat spre pia(market-oriented) i este utilizat de manageri, analiti i specialiti. Din punct devedere al datelor coninute un OLTP gestioneaz date curente care, n mod obinuit,sunt destul de detaliate pentru a fi uor utilizate n luarea deciziilor curente. Un sistemOLAP gestioneaz volume mari de date istorice furniznd faciliti pentru sintetizarei agregare precum i pentru stocarea i gestionarea informaiilor cu diferite niveluride granularitate. Aceste aspecte fac ca datele s fie uor utilizate de ctre decideni,mai ales n domeniile tactic i strategic. De asemenea, un sistem OLTP este focalizatn principal pe datele curente dintr-o ntreprindere sau dintr-un departament fr areferi date istorice sau date din alte organizaii. n contrast, un sistem OLAP cuprindedate istorice i date care provin de la diferite organizaii, integrnd informaii dinsurse heterogene. n sistemele OLTP unitile de acces sunt, n principal, tranzaciileatomice. Aceste sisteme necesit mecanisme de control al concurenei i dereacoperire. Accesul la sistemele OLAP este cel mai adesea de tip read-only, cu toateacestea este posibil realizarea de interogri complexe. De ce nu se execut procesrianalitice on-line (OLAP) direct pe bazele de date existente mai degrab dect a cheltuitimp i resurse pentru a construi separat un depozit de date? Este o ntrebare

    pertinent iar rspunsul poate explica i fundamenta investiia ntr-un depozit de date.Argumentul forte pentru aceast separare este promovarea performanei ridicate nambele sisteme. O baz de date operaional este proiectati adaptat pornind de lasarcini i activiti cunoscute cum ar fi indexarea, utilizarea cheile primare, cutarea

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    15/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    15 | p a g i n a

    unor nregistrri specifice, optimizarea interogrilor. Pe de alt parte, interogrile unuidepozit de date sunt adesea complexe. Ele implic calcule asupra unor grupuri mari dedate cu totalizri pe diferite niveluri ce pot necesita utilizarea de metode speciale deorganizare a datelor, de acces i implementare bazate pe viziuni multidimensionale.Procesnd interogrile OLAP ntr-o baz de date operaional s-ar degrada substanial

    performanele sarcinilor operaionale. De altfel, o baz de date operaional sprijinprocesarea concurent a tranzaciilor multiple. Controlul concurenei i mecanismelede reacoperire sunt necesare pentru a asigura consistena i robusteea tranzaciilor. Ointerogare OLAP are nevoie adesea de acces read-only la nregistrri pentrusumarizare i agregare. Controlul concurenei i mecanismele de reacoperire, dacsunt aplicate pentru operaiunile OLAP pot primejdui execuia tranzaciilorconcurente i astfel s reduc substanial consistena unui sistem OLTP. n final,separarea dintre BD operaionale i depozitele de date se bazeaz pe structuri,coninut, utilizatori i date diferite. Luarea deciziilor necesit date istorice pe cnd

    bazele de date operaionale nu conin, n mod obinuit, date istorice. n acest context,datele operaionale, dei abundente, sunt, n mod obinuit, departe de a fi complete

    pentru luarea deciziilor. Asistarea deciziei solicit consolidarea datelor (totalizri iagregri) din diferite surse, rezultnd date de nalt calitate, curate i integrate. ncontrast, bazele de date operaionale conin numai date neprelucrate (primare)detaliate, cum sunt tranzaciile care trebuie consolidate naintea analizelor.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    16/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    16 | p a g i n a

    4. MODELE DE DATE MULTIDIMENSIONALE

    4.1. DE LA TABELE I FOI DE CALCUL LA CUBUL DE DATE

    Cubul de date permite modelarea i vizualizarea datelor n dimensiunimultiple. El este definit prin dimensiuni i fapte. n termeni generali, dimensiunileexprim perspectivele n care o anumit organizaie dorete s pstreze nregistrrile

    privitoare la tranzaciile desfurate. De exemplu, firma ALFA SA poate crea undepozit de date pentru vnzri care conine nregistrrile lund n considerareurmtoarele dimensiuni: timp, articol, ramur i zon. Aceste dimensiuni permitmemorarea vnzrilor lunare pe articole, ramuri i zone. Fiecare dimensiune poateavea un tabel asociat, numit tabel dimensiune, care descrie dimensiunile. De exemplu,un tabel dimensiune pentru articol poate conine atributele: nume-articol, marca, tip.Tabelele dimensiune pot fi specificate de utilizatori sau de experi sau pot fi generaten mod automat i adaptate n funcie de distribuia datelor.Un modelmultidimensional de date este organizat n jurul unei teme centrale, vnzri, deexemplu. Aceast tem este reprezentat de tabelul de fapte. Faptul are o msurnumeric. El exprim msurile prin care dorim s analizm relaiile ntre dimensiuni.De exemplu, faptele din depozitul de date vnzri includ: vnzri n lei (vnzri-lei)cantitate-vndut (numrul de uniti vndute), total vnzri planificate. Tabelul defapte conine numele faptelor sau msurile precum i cheile pentru fiecare din tabeledimensiune aflate n legtur.

    Pentru clarificri figurile urmtoare ne vor pune n eviden cum lucreaz schemele

    multidimensionale. Dei, n mod obinuit, ne bazm pe cuburi 3D, n depozitele dedate cubul este n-dimensional. Pentru o mai bun nelegere a cubului de date i amodelului multidimensional de date pornim de la un exemplu de cub de date 2D care

    poate fi, n principiu, un tabel sau o foaie de calcul privind vnzrile unei firme. nparticular, este vorba de datele despre vnzrile firmei ALFA SA pe articole vndutetrimestrial n municipiul Vaslui, dup cum se vede n Tabelul 4.1. n reprezentarea2D, vnzrile din Vaslui sunt expuse lund n considerare dimensiunea timp(organizat pe trimestre) i dimensiunea articol (organizat pe tipuri de articolevndute). Valorile sunt afiate n milioane lei. Presupunem acum c dorimvizualizarea datelor despre vnzri cu o a treia dimensiune: zona. Cele trei dimensiunisunt: timp, articol i zon (V, T, N, I).

    _______Zona = "V"Trimestre Articole

    Service Calculatoare Telefoane Protecie1 605 825 14 4002 680 952 31 5123 812 1023 30 5014 927 1058 38 580

    Tabelul 4.1. Viziune 2D privind vnzrile firmei ALFA SA

    Varianta 3D este prezentat n Tabelul 4.2. Datele 3D sunt reprezentate ca serii de

    tabele 2D. Conceptual, putem reprezenta aceleai date n formatul cub de date 3D canFigura 4.1. Un cub de date este un set de date organizat i sumarizat ntr-o structur

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    17/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    17 | p a g i n a

    multidimensional printr-un set de dimensiuni i msuri. Cubul de date furnizeaz unmecanism facil pentru interogarea datelor cu un timp de rspuns foarte scurt. Fiecarecub are o schem reprezentat de setul de tabele din depozitul de date. Tabelul centraleste tabelul de fapte i este sursa de msuri din cub, iar tabelele dimensiune suntsursele de dimensiuni. Presupunem acum c dorim s vizualizm vnzrile adugnd

    a patra dimensiune, cum ar fi furnizorii. Vizualizarea n 4D devine interesant. Totuiputem vedea cubul 4D ca serii de cuburi 3D ca n Figura nr. 4. Dac vom continua aaputem afia orice n-D date ca serii de (n-1)D cuburi.

    Tabelul 4.2. Viziune 3D privind vnzrile firmei ALFA SA

    Figura 4.1. Cub 3D reprezentnd datele din Tabelul 3

    Zona = "I" Zona = "N" Zona = "T" Zona = "V"Articole Articole Articole Articole

    Trimestre

    Service

    Calculatoare

    Telefoane

    Protec

    ie

    Service

    Calculatoare

    Telefoane

    Protec

    ie

    Service

    Calculatoare

    Telefoane

    Protec

    ie

    Service

    Calculatoare

    Telefoane

    Protec

    ie

    1 85 88 89 62 108 968 38 872 81 74 43 59 60 825 14 404 2 3 7 8 6 1 5 0

    2 49 89 64 69 113 102 41 925 89 76 52 68 68 952 31 513 0 8 0 4 4 9 2 0 2

    3 95 92 59 78 103 104 45 100 94 79 58 72 81 102 30 502 4 9 4 8 2 0 5 8 2 3 1

    4 65 99 63 87 114 109 54 984 97 86 59 78 92 105 38 589 2 0 2 1 8 4 4 7 8 0

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    18/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    18 | p a g i n a

    Figura 4.2.Exemplu deCub 4D

    4.2. STELE, FULGI DE ZPADI CONSTELAIILE DE FAPTE

    Modelul de date entitate-asociaie (E-A) este curent utilizat n proiectareabazelor de date relaionale. Schema bazei de date const ntr-un set de entiti i derelaii ntre ele. Ca model de date acesta este corespunztor reprezentrii on-line atranzaciilor. Totui un depozit de date, necesit o schem concis, orientat pesubiecte care faciliteaz analiza on-line a datelor. Cel mai popular model pentrudepozitele de date este modelul multidimensional. Acesta poate fi n form de stea(star schema), de fulg de zpad (snow-flake schema) sau de constelaie (constellationschema).

    Schema stea. Schema stea este cel mai comun model de date, n care depozitul de

    date conine un tabel central voluminos (tabelul de fapte) i un set de tabelensoitoare (tabelele dimensiune) pentru fiecare dimensiune. Tabelul de faptecuprinde, fr redundane, cea mai mare parte a datelor. Graful asociat semn cu ostea n care tabelele dimensiune sunt afiate radial njurul tabelului de fapte central.

    Exemplul 1. Un exemplu de schem stea este prezentat nFigura 4.3. Vnzrile suntconsiderate cu 4 dimensiuni numite timp, articol, ramuri zon. Schema cuprinde untabel central pentru vnzri care conine chei pentru fiecare din cele 4 dimensiuninaintea celor dou msuri: vnzri-lei i cantitate-vndut. Precizm c n aceastschem stea fiecare dimensiune este reprezentat printr-un singur tabel i fiecare tabelconine un set de atribute. De exemplu, tabelul zona conine atributele Cheie-zona,localitate, jude , cod-potal, ara. Aceast definiie poate introduce o anumitredundana. De exemplu, Negreti i Brlad sunt ambele din judeul Vaslui.nregistrrile pentru aceste localiti vor conine: ... Negreti, Vaslui, ... Romnia; ...Brlad, Vaslui, ... Romnia.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    19/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    19 | p a g i n a

    Figura 4.3. Schema stea a unui depozit de date pentru vnzri

    Schema fulg de zpad" (snowflake). Modelul snowflake este o variant amodelului stea, unde o parte din tabelele dimensiune sunt normalizate. De aceea,datele sunt mprite n tabele suplimentare. Rezult o schem reprezentat ntr-ungraf similar unui fulg de zpad. Diferena major ntre modelul fulg de zpad" imodelul stea este c tabelele dimensiune din modelul fulg de zpad" pot fi pstraten forma normalizat ceea ce determin o redundan redus. Asemenea tabele suntuor de ntreinut i se economisete spaiu de stocare, deoarece un tabel dimensiune

    mare poate deveni enorm cnd structura dimensional este inclus n coloane. Totuiaceast economie de spaiu este neglijabil n comparaie cu volumul foarte mare dedate din tabelul de fapte. Mai mult, structura fulg de zpad poate reduceeficacitatea browsing-ului" cnd mai multe ,join-uri" trebuie executate la ointerogare. De aceea, schema fulg de zpad este mai puin rspndit fa de schemastea n proiectarea depozitelor de date.

    Exemplul 2. Un exemplu de schem fulg de zpad" pentru vnzrile firmei ALFASA este prezentat n Figura 4.4. Aici tabelul de fapte vnzri este identic cu cel dinschema stea din Figura 4.3. Principala diferen ntre cele dou scheme const ndefinirea tabelelor dimensiune. Dintr-un singur tabel dimensiune pentru articol din

    schema stea, n schema fulg de zpad" rezult dou tabele: unul nou pentru articol ialtul pentru furnizor. Atributul cheie_furnizor din furnizori face legtura cu tabelularticol. n mod similar, tabelul dimensiune zona poate fi normalizat n dou noitabele: zona i localitatea. Atributul cheie-localitate face legtura ntre cele dou table.

    Normalizarea poate continua.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    20/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    20 | p a g i n a

    Figura 4.4. Schema stea a unui depozit de date pentru vnzri

    n modelul multidimensional datele sunt organizate n multiple dimensiuni, iar fiecaredimensiune conine mai multe niveluri de abstractizare definite prin ierarhii. Aceastorganizare furnizeaz utilizatorilor flexibilitate n vizualizarea datelor din diferite

    perspective. Operaiunile OLAP asupra cubului de date ofer o flexibilitate sporit pentru a materializa diferite viziuni (views), permind interogri i analizeinteractive. Din acest motiv OLAP furnizeaz un mediu utilizator prietenos pentruanaliza interactiv a datelor: Drill-up (roll-up); Drill-down; Dice; Slice; Pivot (rotate).

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    21/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    21 | p a g i n a

    5. SOFTWARE FOLOSIT IN DATA WAREHOUSING

    5.1. INSTRUMENTE DE EXTRAGERE I TRANSFORMARE A DATELOR

    Ca parte a procesului de extragere i transformare, echipa de dezvoltare vaavea nevoie de instrumente care s poat extrage, transforma, integra, curi i ncrcadatele din sistemele surs n una sau mai multe baze de date ale depozitului. Echipadata warehouse are mai multe opiuni privind instrumentele de extragere a datelor,ns alegerea depinde n principal de urmtorii factori:

    Bazele de date i platforma sistemului surs; Funcionaliti de extragere i duplicare existente; Intervalele de timp n care sistemele operaionale sunt disponobile.

    Bazele de datei platforma sistemului surs

    . Instrumentele de extragere

    itransformare nu pot accesa toate tipurile de surse de date i toate tipurile de platforme

    de operare. Atta timp ct nu exist disponibiliti pentru investiii n componentemiddleware, opiunile sunt limitate la acele instrumente care sunt compatibile cusistemele surs din ntreprindere.

    Funcionaliti de extragere i duplicare existente. Sistemele surs pot avea dejaposibiliti de extragere i duplicare ncorporate, fie prin aplicaiile folosite, fie prinmotorul bazei de date. Disponibilitatea acestor funcionaliti pot reduce dificultilelegate de procesul de extragere a datelor.

    Intervalele de timp n care sistemele operaionale sunt disponobile. Unelemecanisme de extragere sunt mai rapide i mai eficiente dect altele. Ferestrele detimp din sistemele operaionale determin timpul disponibil pentru procesul deextragere i acest aspect poate limita opiunile echipei de dezvoltare n ce privetealegerea instrumentelor de extragere. n practic se ntlnesc dou metode de baz

    pentru extragerea datelor din sistemele operaionale: Extragerea n mas; Replicarea.

    n metoda extragerii n mas (bulk extractions) ntregul depozit de date estemprosptat periodic prin extragerea datelor din sistemele surs. Toate datele necesare

    sunt extrase din sistemele surs iar depozitul de date este reconstruit complet. Aceasttehnic implic mari costuri legate de transmiterea datelor n reea, n schimb oferavantajul unei ntreineri comode a depozitului de date.

    Metoda replicrii ia n considerare doar datele noi din sistemele surs. n acest cazsunt extrase doar datele noi sau datele care au suferit modificri de la ultima extrageredin sistemele surs. Aceast metod este eficient din punctul de vedere al volumuluide date care se vehiculeaz n reea, dar necesit aplicaii complexe care s gestionezeschimbrile intervenite. Instrumentele de transformare transform datele extrase ntr-un format adecvat care este necesar pentru a putea fi stocate n depozitul de date.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    22/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    22 | p a g i n a

    Majoritatea instrumentelor de transformare ofer urmtoarele capabiliti: Partiionarea i consolidarea cmpurilor; Standardizarea; Deduplicarea.

    Partiionarea i consolidarea cmpurilor. Anumite secvene de date suntimplementate ntr-un singur cmp fizic din sistemul surs, ceea ce duce la necesitatea

    partiionrii lor n mai multe cmpuri n depozitul de date. n acelai timp, pot ficazuri n care mai multe cmpuri din sistemele surs trebuie consolidate astfel nctdatele s fie stocate n depozit ntr-un singur cmp.

    Standardizarea. Standardele i conveniile pentru abrevieri, formate de date, tipuri dedate etc sunt aplicate secvenelor individuale de date pentru a crete uniformitateaconinutului.

    Deduplicarea. Se definesc reguli pentru a identifica nregistrri duplicat. Cnd sedescoper un duplicat, dou sau mai multe nregistrri sunt comasate pentru a forma osingur nregistrare n depozitul de date.

    SISTEM SURS TIPUL TRANSFORMRII DEPOZIT DE DATECmpul AdresaStr. Unirii Nr. 123, MunicipiulIai, 6600, Romnia

    Partiionare cmpuri Nr. Str. 123Strada: UniriiLocalitate: IaiTip localitate: MunicipiuCod Potal: 6600Tara: Romnia

    Sistem A, Funcie:Manager general

    Sistem B, Funcie:Director general

    Consolidare cmpuri Funcie:Manager sau Director general

    Data comenzii:21 Nov. 2002Data comenzii:01-09-02

    Standardizare Data comenzii:21 Noiembrie 2002Data comenzii:01 Septembrie 2002

    Sistem A, Numeangajat:Popescu I. VasileSistem B, Numeangajat:Popescu Vasile

    Deduplicare Nume angajat:Popescu I. Vasile

    Tabelul 5.1.Exemple de transformri de date

    5.2. INSTRUMENTE DE ACCESARE I UTILIZARE A DEPOZITULUI

    Cele mai cunoscute sunt instrumentele OLAP (Online Analytical Processing)care permit utilizatorilor s realizeze interogri ad-hoc asupra depozitului de date.Suita instrumentelor OLAP se mparte deocamdat n dou categorii principale:MOLAP i ROLAP. Instrumentele MOLAP ofer faciliti analitice pentru baze dedate multidimensionale i au un timp de rspuns foarte mic datorit structurii eficiente

    de stocare a datelor. Aceste instrumente oferi funcionaliti privind realizarea de

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    23/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    23 | p a g i n a

    previziuni i diverse calcule statistice.Instrumentele ROLAP ofer faciliti analiticepentru bazele de date relaionale.Exemple de instrumente OLAP:

    Essbase OLAP (Arbor Software); Powerplay (Cognos); R/OLAP/XL (Intranet Business Systems).

    Instrumentele pentru realizarea rapoartelor permit utilizatorilor s producrapoarte sofisticate pe baza datelor din depozitul de date. Exist la ora actual doucategorii principale de instrumente pentru producerea rapoartelor:

    Generatoare de rapoarte; Servere de rapoarte.

    Generatoarele de rapoartepermit utilizatorilor s creeze rapoarte parametrizate carepot fi lansate n execuie ori de cte ori este nevoie. Aceste generatoare necesit unefort iniial de programare pentru definirea modelului de raport, iar odat ce modelulcorect definit generarea raportului presupune doar apelarea. Serverele de rapoartesunt similare cu generatoarele de rapoarte, dar au capabiliti suplimentare care permitutilizatorilor s gestioneze momentele de producere a rapoartelor. Aceast opiuneeste foarte util atunci cnd echipa de dezvoltare a depozitului de date prefer caoperaiunea de generare a rapoartelor s se desfoare noaptea, dup ce depozitul dedate a fost ncrcat. Programnd generarea rapoartelor pentru perioade de timp n care

    personalul nu lucreaz, depozitul de date va putea fi astfel folosit pentru realizareainterogrilor ad-hoc. Unele servere de rapoarte pot avea i funcionaliti legate dedistribuirea rapoartelor; de exemplu, un server de rapoarte poate trimite prin e-mailnoile rapoarte generate sau le poate include ntr-o pagin web care s poat fi accesat

    prin intranetul ntreprinderii.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    24/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    24 | p a g i n a

    6. STUDIU DE CAZ: CUSTOMER RELATIONSHIP MANAGEMENT

    Este aproape imposibil s deschizi o publicaie IT actuali s nu te loveti de

    acronimul CRM (Customer Relationship Management). Iar cum coninutul acoperitde acest termen este ct se poate de divers, ntrebarea fundamental se ridic imediat:Ce este, de fapt, CRM? Din pcate, rspunsul nu este deloc simplu, dei exist oliteratur abundent pe aceast tem, disponibil n Internet sau n librrii. Principaladificultate o reprezint caracterul interdisciplinar al domeniului, care ine att demanagement ct i de tehnologie. Urmarea fireasc este c sub o plaj att de largncape o diversitate nucitoare de produse i servicii, ncepnd de la agende de biroui centrale telefonice pn la cele mai sofisticate sisteme de data mining. Ceea ce,desigur, nu poate dect s sporeasc confuzia, aa c domeniul este un adevrat

    paradis al firmelor de consultan. Ca i n multe alte domenii, este greu de stabilit nce msur tehnologia a influenat modelul de business i n ce msur schimbareamodelului economic a cerut o tehnologie care s susin noua abordare. Cert este c seconstat o tranziie de la un model de management centrat pe produs spre un modelcentrat pe client. Motivele acestei tranziii sunt multiple. Deregularizarea iglobalizarea au nlturat n mare msur barierele comerciale, astfel nct companiileacioneaz pe o pia n care abundena de produse este fr precedent. Devine din cen ce mai improbabil ca un produs s se impun pe o pia tot mai dinamic, n careconcurenii i adapteaz extrem de rapid ofert. Aflat n faa unei diversiti de

    produse comparabile din perspectiva calitii i preului, uneori greu de difereniat,clientul tinde s aprecieze din ce n ce mai mult serviciile conexe produsului (att celedinainte de vnzare, ct i cele ulterioare) precum i calitatea relaiei cu productorul

    sau vnztorul. ntr-o lume pe care producia de mas nu a ncetat s odepersonalizeze, clientul devine din ce n ce mai sensibil la o abordare personalizat.

    Din perspectiva vnztorului, lucrurile se pot exprima i n cifre. Un studiu publicatde PIMS arat c, n medie, un client nemulumit va povesti experiena negativ unuinumr de 7 -10 persoane, n timp ce un client mul umit va recomanda compania unuinumr de 3 - 4 cunoscui. Aceast diferen este fundamental. De aici deriv irezultatele altor studii: o cretere a ratei de pstrare a clienilor cu doar 5% poateaduce profituri suplimentare de pn la 125%, n funcie de profilul companiei. Pe dealt parte, analizele relev c este mult mai ieftin s pstrezi un client dect s atragiunul nou. n fine, merit amintit aici vechea regul a lui Pareto: 80/20 (n acest

    context: 20% dintre clieni i aduc 80% din vnzri). Concluzia este c e mai uor s produci dect s vinzi ce ai produs, iar cheia problemei o reprezint loialitateaclienilor. Modelul centrat pe client implic o strategie unitar, promovat de la celmai nalt nivel de management, care pune accentul pe calitatea relaiilor cu clienii.1

    Definire i clasificare. Unele articole afirm c CRM este de fapt o tentativ de aimplementa la o scar mult mai mare modelul prvliei tradiionale de cartier (mom-and-pop department store). Acest model este extrem de elocvent i merit dezvoltat

    puin. Proprietarii prvliei i asigur loialitatea clienilor n primul rnd pe bazarelaiei personale cu acetia i a ncrederii reciproce pe care aceast relaie o induce.Proprietarul i cunoate personal pe fiecare n parte, le cunoate situaia social i

    1 http://www.intraweb.ro/txt/Articole/Domenii/CRM/show

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    25/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    25 | p a g i n a

    familial, le cunoate preferinele i obiceiurile, cunoate istoria cumprturilorrecente i intuiete nevoile i posibilitile acestora. De asemenea, proprietarii

    prvliei cunosc "demografia" cartierului, tiu cnd are loc o nunt, un botez sau onmormntare i care sunt modelele tradiionale de achiziii n astfel de mprejurri,afl cnd cineva s-a mutat n zon (un potenial client) sau cnd cineva a plecat. Pe

    baza acestor cunotine, proprietarul prvliei adopt tehnica de vnzare cea maipotrivit, ncepnd cu tonul conversaiei formale de rigoare, trecnd prin prezentareaunei oferte specifice pentru clientul respectiv, alturi de recomandri i informaii

    privind produsele noi, i pn la ncheierea propriu-zis a vnzrii, prin mijloace deplat agreate de cumprtor. Cu siguran c acest model idilic nu este aplicabil lamodul direct unui lan de supermarket-uri sau unei companii aeriene, dar ideea este cmijloacele informatice actuale permit memorarea i gestionarea eficient ainformaiilor despre clieni, ceea ce ar putea ajuta la o mai relaie mai eficient, dacnu cu fiecare client n parte, mcar cu acei clieni care sunt mai "valoroi" (valoarea

    pe termen lung a clientului - customer lifetime value - este o metric folosit adesea nprocesul de segmentare a bazei de clieni). De pild, un lan de magazine poate oferi

    carduri speciale clienilor care fac cumprturi repetate sau peste o anumit valoare,carduri care pot atrage reduceri de pre. n schimb, vnztorul obine date deidentificare a clientului, pe baza crora se pot apoi agrega informaii despre fiecarevnzare n parte, n oricare magazin, precum i informaii despre orice alte interaciuni(de pild reclamaii, cereri de suport tehnic sau service, etc.) Pe baza acestorinformaii, care constituie o "imagine a clientului" din perspectiva companiei, se potdeduce multe aspecte specifice, ceea ce va permite vnztorului s-i personalizezeoferta n funcie de obiceiurile, preferinele i posibilitile clientului. n plus, analizestatistice coroborate cu date demografice pot furniza informaii globale cu valoarestrategic, care pot permite managementului s observe evoluia de ansamblu aafacerii i s ia decizii n concordan cu acestea. De pild se pot identifica categoriilesocio-profesionale sau grupele de vrst cele mai active din punctul de vedere alvnzrilor, ceea ce va permite campanii de marketing mai precis orientate, cu costurimai mici i eficien sporit. n fine, "imaginea clientului" permite i aplicarea unortehnici de marketing direct (one-to-one), cum ar fi furnizarea prin e-mail a unor

    prezentri de produse susceptibile de a fi de interes pentru clientul respectiv. Neputem imagina cu uurin scenarii pentru diverse alte domenii (de altfel, domeniulcomerului cu amnuntul nu este printre cele tipice pentru CRM).

    De asemenea, exist domenii n care relaia cu clientul are anumite particulariti careimpun o abordare specific, cum ar fi centrele de asisten (help-desk), comerul prin

    ageni de vnzri n teren, companiile de vnzri prin pot sau prin Internet. n final,nu doar companiile comerciale au nevoie de relaii de calitate cu clienii. Exist multeorganizaii administrative sau cu caracter social care au adoptat tehnologii CRM

    pentru a rspunde mai bine cerinelori pentru a reduce cheltuielile. Gartner Group: CRM este o strategie de business destinat s optimizeze

    profitabilitatea ntreprinderii pe baza sporirii satisfaciei clientului. Pentru a pune n practic aceast strategie, o organizaie trebuie s-i ajustezecomportamentul i s implementeze procese i tehnologii care s sprijineinteraciunea controlat cu clienii, prin toate canalele de comunicare.

    CRMguru.com: CRM este o strategie de business prin care se selecteazi segestioneaz clienii n vederea optimizrii valorii acestora pe termen lung.

    CRM necesit o cultur managerial centrat pe client, care s susin proceseeficiente de marketing, vnzri i service. Aplicaiile CRM pot contribui la

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    26/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    26 | p a g i n a

    eficientizarea relaiilor cu clienii, n condiiile n care organizaia dispune deconducerea, strategia i cultura potrivit.

    Paul Greenberg: CRM este un sistem complet care (1) furnizeaz un mijloci o metod de a mbunti experiena unui client particular astfel nct acestas rmn un client fidel; (2) furnizeaz mijloace att tehnologice ct i

    funcionale pentru a identifica, captura i reine clienii; (3) furnizeaz oimagine unitar a clientului n cadrul ntregii organizaii.

    Larry Tuck: CRM [este o strategie care] extinde conceptul de vnzare de laun act discret, realizat de un vnztor, la un proces continuu care implicntregul personal al unei companii. Este arta/tiina de a colecta i de a utilizainformaiile despre client pentru a consolida loialitatea acestuia i a-i sporivaloarea pe termen lung. Este imposibil de conceput acest proces fr a lua ncalcul tehnologia, dar este important de reinut c relaia cu clientul, relaiauman, este principala for.

    Pentru a pune o oarecare ordine conceptual n aceast multitudine de cerine i defuncionaliti care se pretind unui sistem CRM, se recurge adesea la o diviziunesimilar cu cea de tip front office - back office practicat n ERP. Astfel, funciileoperative legate de interaciunea cu clientul sunt reunite sub genericul CRM tactic, ntimp ce activitile preponderent analitice se ncadreaz n ceea ce se cheamCRM

    strategic. n principiu, latura tactic furnizeaz laturii strategice datele primarecolectate din interaciunea cu clienii, iar latura strategic furnizeaz laturii tacticeinformaii rezultate din procesele analitice. Aceast diviziune nu se suprapune pestestructura organizaional. De pild, unele activiti ale departamentului de marketingsunt de ordin strategic (de pild conceperea i administrarea unei campanii) pe cndunele sunt mai degrab de ordin tactic (de pild realizarea efectiv a unor aciuni

    cuprinse ntr-o campanie). Pe de alt

    parte,i componentele tipice ale unui sisteminformatic de tip CRM ntretaie n mod obinuit demarcaiile formale ntre

    departamente. n fine, mai merit subliniat faptul c din punctul de vedere altehnologiei (mai cu seam software), soluiile CRM nu au nici ansa omogenitii(cerinele sunt extrem de diferite, se mbin diverse instrumente specifice), nici ansacompletitudinii (dei exist pe pia "suite CRM", analitii sunt de acord c nici unanu poate pretinde c acoper toate cerinele) i nici ansa generalitii (n mareamajoritate a cazurilor, implementarea implic mult "customizare"). n cele din urm,implementarea unei soluii CRM este un fel de puzzle, n care alegerea pieselorcomponente, adaptarea lor la cerinele specifice i integrarea lor cu cele existentereprezint partea tehnologic.

    6.1. CLASIFICARE

    CRM tactic. Centrul de apel (call center) este componenta central ninteraciunea dintre clieni i organizaie. Termenul evoc n principal telefonia, darsemnificaia actual cuprinde toate canalele prin care clientul intr n contact cuorganizaia, motiv pentru care unii prefer termeni care s evite confuzia: centru decomunicare sau centru de contact. Oricum s-ar numi, ideea este c indiferent dac estevorba de un apel telefonic, de un mesaj e-mail, de o interaciune prin site-ul Web, de oscrisoare clasic, de un fax, etc., aici se face identificarea clientului, redirecionarea

    (dac este cazul) spre persoana sau serviciul potrivit i se memoreaz o "urm" ainteraciunii. Identificarea este primul pas i se bazeaz informaiile de contact ale

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    27/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    27 | p a g i n a

    clienilor. Tehnologiile implicate sunt diverse. Se distinge n primul rnd CTI(Computer Telephony Integration), care permite de pild identificarea clientului pe

    baza numrului apelant. Diverse metode automate se pot aplica i pentru celelaltecanale. Oricum (chiari prin identificare interactiv), important este ca agentul umans dispun ct mai rapid de profilul clientului i ca interaciunea s lase o urm n

    sistem (la modul minimal: marca de timp, canalul de intrare, agentul i, dac e cazul,rezumatul interaciunii). Redirecionarea poate beneficia la rndul ei de tehnologiispecifice. n cazul centrelor de apel de tip help desk, dup identificare, agentul uman

    poate fi asistat de calculator n stabilirea problemei, prin parcurgerea unui arbore desituaii tipice. Dac se ajunge la nodurile terminale e OK, agentul poate oferiinformaia solicitat, altfel programul identific automat un rol care corespundesituaiei (de pild tehnicianul cu specializarea necesar sau agentul de vnzri

    potrivit). Rutarea apelului spre un agent uman care corespunde rolului se face sincroncu profilul clientului i cu problematica identificat pn la momentul apelului.ncheierea interaciunii este urmat de completarea (parial automat) a "urmei".Canalele asincrone pot beneficia i ele de automatizri, ncepnd cu identificarea (de

    pild pe baza adresei de e-mail), rspunsuri automate (unele bazate pe metodesofisticate de "nelegere" automat) i, desigur, mecanismul de workflow prin care seasigur circulaia mesajului pn la rezolvare, ntr-un interval de timp stabilit. Site-ulWeb al organizaiei joac un rol tot mai important n interaciunea cu clienii, fiindconsiderat adesea parte integrant a centrului de apel. O practic uzual esteidentificarea la log-ini personalizarea interfeei n funcie de profilul clientului.

    De asemenea, site-ul Web este un instrument util pentru a culege informaii utiledespre client (chiari prin memorarea paginilor vizitate). Adesea site-ul Web servetei ca centru de suport sau servicii client cu "autoservire", ofer sesiuni chat(tratate deregul ntr-o manier similar cu apelurile telefonice), funcii de tip call back. Uneori,centrul de apel este folosit i ca mijloc de comunicare dinspre organizaie spre client.De pild anumite oferte speciale pot fi ataate clienilor selectai spre a le fi furnizatedac clientul acceseaz centrul de apel ntr-un interval de timp (tendina este dereduce "agresivitatea" implicit a mesajului). Gestiunea forei de vnzri (Sales Force

    Automation - SFA) este desemneaz o clas de aplicaii care, istoric vorbind, precedeconceptul de CRM, fiind apoi integrate n aceast categorie. Iniial erau aplicaiiautonome utilizate de agenii de vnzri i, totodat, de managementuldepartamentului de vnzri pentru coordonarea activitii agenilor. Integrarea nCRM a nsemnat un salt calitativ, deoarece vnztorii dispun n acest context deinformaii mai detaliate despre clieni, agregate din surse diverse (de pild din

    interaciunile cu departamentul de servicii pentru clieni, din analizele realizate dedepartamentul de marketing, etc.).

    La rndul lor, aplicaiile SFA furnizeaz acum date utile n profilul clientului, datecare sunt valorificate de marketing, pentru service i asisten tehnic, etc. O aplicaieSFA se bazeaz pe un planificator de activiti (activity scheduler) care funcioneazatt n regim individual, pentru fiecare agent, ct i la nivel de grup. Pe lng

    posibilitatea de a-i planifica interaciunile cu clienii, agenii pot s-i coordonezeaciunile att n cadrul departamentului, ct i n conexiune cu departamentele demarketing sau de service i asisten tehnic. Planificatorul dispune de obicei de

    posibiliti de nlnuire a activitilor (de exemplu dac un agent trimite unui client

    informaii despre un produs sau un serviciu, planificatorul leag aceast aciune de unapel telefonic care trebuie dat peste o sptmn), poate s semnaleze neconcordane

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    28/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    28 | p a g i n a

    ntre ageni pe baza unor reguli (de pild, la planificarea unui ntlniri cu un client,semnaleaz faptul c un alt agent a contactat sau va contacta acelai client), permitedistribuirea sarcinilor (nsoite de notificri prin e-mail). Aplicaiile de SFA trebuie sofere i informaii la zi despre produsele i serviciile oferite spre vnzare, mpreun cuschemele de calcul al preurilor i discount-urilor, despre aciunile promoionale i

    chiar despre stocuri i lanul de aprovizionare (de altfel aceste aplicaii sunt adeseaconexe).

    n final, adesea aplicaiile SFA dispun de elemente de mobilitate, astfel nct s poatfi folosite pe teren, cu ajutorul diverselor calculatoare portabile. Aceasta implic

    posibiliti de conectare de la distan, autonomie, sincronizare cu datele centrale iaa mai departe. n funcie de profilul organizaiei, n zona "tactic" se mai pot ntlniaplicaii specifice, ca de exemplu cele pentru service i suport tehnic, aplicaii pentruexpediie i distribuie, aplicaii de aprovizionare ( supply chain management).Important este c toate aceste aplicaii utilizeaz n comun datele despre clieni i suntcuprinse n acelai sistem de workflow management.

    CRM strategic. Administrarea activitii de marketing (marketingautomation) cuprinde de fapt o ntreag gam de aplicaii. Dar, nainte de aplicaii,automatizarea marketingului este un proces care const din proiectarea i executareacampaniilor de marketing, urmat de msurarea rezultatelor campaniilor, folosindaplicaii care susin selectarea i segmentarea bazei de clieni, urmresc contactele cuclienii i eventual evalueaz rezultatele contactelor pentru a determina grupuri intmai adecvate pentru viitoarele campanii. Dac excludem de aici prile deadministrare a proiectelor (care nu impun softuri specifice CRM), de planificare aactivitilor (similare sau chiar comune cu cele de la vnzri), sistemul de workflowmanagement la nivelul companiei (care este o component integratoare), precum iurmrirea contactelor (proces prezentat pentru centrele de apel), rmnem cu osingur categorie specific acestui nivel: aplicaiile de administrare a campaniilor demarketing (campaign management - CM). Produsele din clasa CM cuprind n modnormal funcionaliti de planificare specifice, care de regul se bazeaz pe un set detipare sau abloane (templates) care sunt apoi rafinate n funcie de necesiti, astfelnct o mare parte din determinarea etapelor i stabilirea bugetelor corespunztoaresunt predefinite n concordan modelele care s-au dovedit cele mai potriviteorganizaiei.

    Desigur, planificarea campaniilor de bazeaz pe analiza bazei de clieni, dar o

    caracteristic valoroas este posibilitatea de a adapta planificarea i execuia n funciede rezultate pariale (de pild stabilirea unor prioriti noi pentru canalele care sedovedesc cele mai eficiente). Posibilitatea de personalizare a masajului precum i aofertelor promoionale n funcie de segmentare sau chiar de istoria relaiei la nivel declient este o cerin din ce n ce mai important, iar un rol important n aceast

    personalizare l joac nsui clientul, cruia i se ofer adesea posibilitatea de a alegecanalul preferat, de a permite sau nu oferte pe diverse grupe de produse sau de a opta

    pentru o "temporizare" specific (de pild nu mai des de odat pe sptmn).Posibilitile de personalizare permit, de pild, difuzarea de newsletters asamblatedinamic pe baza profilului clientului sau configurarea dinamic a sitului Web nfuncie de vizitator.

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    29/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    29 | p a g i n a

    Viziunea complet asupra datelor clienilor permite evitarea difuzrii de mesajeredundante (cum ar fi abordarea repetat pe diferite canale) sau contradictorii (de

    pild o anumit ofert venind de la agentul de vnzri i o alta de la marketing). Deasemenea, integrarea (att la nivelul informaiilor pentru clieni, ct i prin workflow)

    permite coordonarea campaniei de marketing cu activitatea de vnzri (de pild

    oportunitile sau ofertele speciale pentru anumite segmente sunt imediat disponibileagenilor de vnzri) sau cu serviciile pentru clieni. De asemenea, reaciile clienilor(activi sau poteniali) pot fi centralizate i analizate indiferent de canalul pe care vin(prin mesaje e-mail, prin agenii de vnzri n teren, etc.). Funcionalitile legate deanaliza rezultatelor se bazeaz pe posibilitile de a realiza interogri pe seturi limitatede date, de a manevra liste, de a aplica metode statistice i diverse metrici specifice,

    precum i de a adapta n mod dinamic metodele de segmentare i stabilire a grupurilorint. Pe baza acestor rezultate se adapteaz dinamic campaniile n desfurare sau seconcep viitoarele campanii.

    Dincolo de facilitile analitice la nivelul activitii de marketing, de regul mai exist

    un nivel, destinat managementului organizaiei. Este nivelul strategic cel mai nalt,care trebuie s beneficieze de o viziune integratoare, care s cuprind - alturi deinformaiile actuale i istorice legate de clieni - i informaiile provenind din celelaltedepartamente, cum ar fi cele financiar-contabile sau cele de producie, dezvoltare etc.De asemenea, posibilitile de analiz strategic sporesc odat cu integrarea unor dateexterne (cum ar fi cele demografice sau cele provenind din studii de pia). Tendinaultimului deceniu este ca aceste date s fie integrate n "depozite de date" (datawarehouse), adic baze de date special concepute pentru analiz multidimensional,alimentate cu date din sistemele operaionale sau din surse externe i pre-procesate

    prin metode specifice (de pild agregare i sumarizare). Rolul depozitelor de dateeste de a permite realizarea unor analize prin instrumente OLAP (On Line Analytical

    Processing). Aceste instrumente permit analize bazate pe diverse dimensiuni imetrici, concretizate n aa-numitele "cuburi de date" (datacubes), care pot fi priviten diverse perspective. De pild, o perspectiv posibil se poate baza pe dimensiunile

    produs, canal de distribuie, client i timp, ceea ce permite studierea evoluieivnzrilor n funcie de clasa de produse, canalul de distribuie i o anumitsegmentare a bazei de clieni. Analiza se poate focaliza prin creterea nivelului dedetaliere (procedeu denumit drill-down). De pild de la o viziune pe trimestre se poatetrece la una pe luni sau sptmni, de la clase de produse se poate trece la produseindividuale.

    De asemenea, se pot aplica procedee statistice (de pild se pot face comparaii ntremediile vnzrilor pentru un anumit segment de clieni n diverse zone geografice).De asemenea, se poate spori nivelul de generalitate al analizare, se pot schimbametricile (de pild volumul vnzrilor exprimat cantitativ sau valoric) sau structurarea(de pild, se poate merge pe o segmentare a bazei de clieni dup valoare lor petermen lung sau dup grupe de vrst, sex, nivel de pregtire etc). Acest nivelstrategic superior nu este specific CRM i nu se bazeaz pe tehnologii specifice, darnu poate fi omis dintr-o prezentare general deoarece, pn la urm, aici de nchidecercul. Aici se studiaz tendinele, aici se identific oportunitile de afaceri, aici sestabilesc politicile. De pild, managementul poate decide adaptarea gamei de produse

    pentru a corespunde mai bine cerinelor clienilor, poate decide direciile n care

    trebuie s insiste marketingul, poate decide o politic de recrutare i instruire apersonalului astfel nct s corespund exigenelor unei politici manageriale orientat

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    30/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    30 | p a g i n a

    spre client. Nu n ultimul rnd, decide liniile directoare ale adoptrii tehnologiilor cares susin aceast politic.

    6.2. FUNCIUNILE UNUI CRM

    CRM este o filozofie de business, descriind o stategie de plasare a clientului ncentrul proceselor, al activitilor i al culturii unei organizaii. Stategia comutfocusarea de pe ciclul de via a produsului ctre ciclul de via a clientului i ncearcs lungeasc perioada de activitate a acestuia cu organizaia, dezvoltnd produse iservicii care s extind relaia cu clientul dincolo de aspectele tranzacionale curente.

    Dintre funciunile unui CRM, amintim urmtoarele: gestionarea relaiei i interaciunii ntr-o abordare orientat spre client; asigurarea meninerii clienilori managementul activ al relaiei cu acetia; creterea profitabilitii pe client; gestiunea activ a portofoliilor de clieni i a plngerilor; managementul devoltrii produselori proceselor; asigurarea loialitii clienilor; semnalarea imediat a oportunitilor de afaceri/cross-selling; monitorizarea rezultatelor campaniilori a schimbrilor n produse/preuri; automatizarea i managementul corespunztor al noilor clieni i linii de

    business;2

    6.3. MODELAREA I PROIECTAREA SISTEMULUI CRM PRO MANAGER

    O component esenial n cadrul unui sistem informaional o constituieprelucrrile. Aceast component are rolul de a transforma datele n informaiirespective datele sau informaiile n cunotine. n general procesele de prelucrare suntcompuse din: activiti, aciuni, faze, operaii i evenimente. Pentru a rezolva cerineleutilizatorilor i ale altor entiti din sistem, analistul trebuie s neleag i sreprezinte fluxurile de date i procesele de transformare ale acestora. Descrierea

    preliminar a prelucrrilor sistemului i ale fluxurilor de date i informaii ntreacestea, n cadrul analizei sistemului informaional, se realizeaz cu ajutorulmodelelor conceptuale ale prelucrrilor. Acestea reflect conexiunile i structurainformaional general a prelucrrilor din sistemul analizat.

    6.3.1. MODELAREA FLUXULUI DE DATE

    Modelarea prelucrrilor reprezint o tehnic de organizare i documentare atuturor proceselor de culegere, prelucrare, stocare i transmitere a datelor n interiorulsau exteriorul sistemului analizat precum i a politicilor i procedurilor careguverneaz aceste procese. Modelarea conceptual nu are ca obiectiv descrierea unordetalii privind mijloacele concrete de prelucrare i stocare fizic a datelor. Un rolimportant n construcia modelelor pentru prelucrrile sistemului, l are activitatea dedescompunere a prelucrrilor. Tehnica utilizat pentru descompunerea proceselor de

    prelucrare este cunoscut sub denumirea de decompoziie.

    2 E-Finance nr. 88, 15 dec. 2007 - 15 ian. 2008

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    31/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    31 | p a g i n a

    Diagrama de decompoziie. Decompoziia reprezint activitatea prin care un sistemeste descompus n subsistemele, procesele sau subprocesele sale componente. Cel maiutilizat instrument n decompoziia sistemului l reprezint diagrama de decompoziie.Diagrama de decompoziie este o reprezentare ierarhic a componentelor isubcomponentelor sistemului. n cadrul procesului de colectare, are loc strngerea

    tuturor datelor care vor sta la baza formrii cunotinelor. Prin procesul de prelucraredatelor, acestea iau forma informaiilor, informaii ce prin interpretare devincunotine. n cadrul procesului de transmitere, cunotinele acumulate vor fi puse ladispoziia managerului, pentru a servi ca suport n procesul decizional, aa cumrezult din figura 2.1. Tehnica de decompoziie are ca rezultat doar descompunereafuncional a proceselor de prelucrare, fr a scoate n eviden fluxurile de datedintre acestea i condiiile tehnice de realizare. Din aceast cauz decopoziia esteintegrat n procesul de modelare conceptual a prelucrrilor.

    Figura 6.1. Diagrama de decompoziie

    Diagrama de context i diagrama de nivel zero. n analiza sistemelorinformaionale cel mai utilizat instrument de reprezentare a modelului prelucrrilorsunt diagramele fluxurilor de date (DFD). Aceste diagrame constituie tehnici deanaliz structurat a sistemului i au un rol important att n procesul de identificare idefinire a cerinelor sistemului ct i n procesul de reverse engineering. Diagramafluxului de date este un instrument de reprezentare grafic a fluxurilor de date,

    proceselor de prelucrare i a locurilor de stocare ale acestora n cadrul sistemuluianalizat. Tehnica diagramelor fluxurilor de date scoate n eviden intrrile,

    prelucrrile i ieirile de date din cadrul sistemului analizat sau proiectat, aa cumapar n tabelul 2.1.

    Element DFD Tip elementClieni

    Entiti externeMarketingManagementComand

    Fluxuri de dateFacturComentariu websiteInterogare date colectateRaport date prelucrateRaport final date prelucrate

  • 8/3/2019 Abordari de Tip Data Warehousing Implement Are in MS SQL Server 2005

    32/57

    Abordri de tip Data Warehousing-Implementare n Microsoft SQL Server 2005

    32 | p a g i n a

    Fi comenziLocuri de stocareSituaie vnzri

    StatisticColectare date

    PrelucrriPrelucrare dateInterpretare date

    Transmiteredate

    Tabelul 6.1. Coninutul DFD

    Entitatea extern, reprezint emitentul sau receptorul datelor din exteriorulsistemului analizat. Aceast entitate poate fi o alt diviziune organizatoric,clienii, o persoan sau o aplicaie informatic.

    Fluxul de date reprezint dire