Msc(C) Alfonso Borré Sarmiento

24
www.EvencoCCC.com

Transcript of Msc(C) Alfonso Borré Sarmiento

www.EvencoCCC.com

CreaciCreacióón de un n de un sistema de soporte sistema de soporte

a la toma de a la toma de decisionesdecisiones

Msc(cMsc(c) Alfonso Borr) Alfonso Borréé [email protected]@yahoo.es

AgendaAgendaAntecedentesModelamiento dimensionalEjemplo de construcción de una bodega de datos

AntecedentesAntecedentesLa informaciLa informacióón es la clave para obtener n es la clave para obtener una ventaja competitiva en el mundo de los una ventaja competitiva en el mundo de los negocios negocios

Los gerentes y tomadores de decisiones Los gerentes y tomadores de decisiones requieren de un acceso rrequieren de un acceso ráápido y fpido y fáácil a cil a informaciinformacióón n úútil y valiosa de la empresa til y valiosa de la empresa

●● TenemosTenemos montamontaññasas de de datosdatos en en estaestacompacompañíñíaa y no y no podemospodemos accesarlosaccesarlos

Sistemas transaccionales Sistemas transaccionales (OLTP)(OLTP)

●● Son aquellas aplicaciones que Son aquellas aplicaciones que resuelven las necesidades de resuelven las necesidades de funcionamiento de la empresafuncionamiento de la empresa

●● En este tipo de aplicaciones los En este tipo de aplicaciones los conceptos mconceptos máás importantes son la s importantes son la actualizaciactualizacióón y el tiempo de respuestan y el tiempo de respuesta((insertinsert, , updateupdate, , deletedelete))

Problemas de los sistemas Problemas de los sistemas transaccionalestransaccionales

● Es difícil separar el procesamiento de la consulta.

● No fueron diseñados para soportar consultas masivas con datos agregados (sumatorias, conteos, promedios)

● Proliferación de islas de información● Mantienen historia de pocos años

Tipos de usuarioTipos de usuario

Alta dirección

Dirección intermedia

Nivel operativo

Cuadro de mando

Olap, query ad hoc

Informes preformateados

Data warehouse Data warehouse (Bodega de (Bodega de datosdatos))

●● Es una colecciEs una coleccióón de datos orientados n de datos orientados al tema, integrados, no volal tema, integrados, no voláátiles e tiles e historiados, organizados para el apoyo historiados, organizados para el apoyo de un proceso de ayuda a la deciside un proceso de ayuda a la decisióónn””. . BillBill InmonInmon --UsingUsing de Data de Data WarehouseWarehouse..

DatamartDatamart●● Es un almacEs un almacéén de datos histn de datos históóricos ricos

relativos a un departamento de una relativos a un departamento de una organizaciorganizacióón, asn, asíí que puede ser que puede ser simplemente una copia de parte de un simplemente una copia de parte de un DataWarehouseDataWarehouse para uso para uso departamental.departamental.

CarCarááctercteríísticassticas de una de una bodega de datosbodega de datos

IntegraciIntegracióónn HistoriaHistoria Datos no Datos no volvoláátilestiles

BODEGA DE BODEGA DE DATOSDATOS

●● Predomina la consultaPredomina la consulta●● La actividad mLa actividad máás importante es s importante es

el anel anáálisis y la decisilisis y la decisióón n estratestratéégicagica

●● Datos en distintos niveles de Datos en distintos niveles de detalle y agregacidetalle y agregacióónn

●● Importancia del dato histImportancia del dato históóricorico●● Usuarios de perfiles estratUsuarios de perfiles estratéégicos gicos

y ty táácticoscticos●● DiseDiseññados para realizar ados para realizar

consultas masivas de datos consultas masivas de datos agregadosagregados

Sistema transaccional y Sistema transaccional y datawarehousedatawarehouse

●● SISTEMA TRANSACCIONALSISTEMA TRANSACCIONAL

●● Predomina la actualizaciPredomina la actualizacióónn●● La actividad mLa actividad máás importante es s importante es

de tipo operativo, dde tipo operativo, díía a da a dííaa

●● Datos en general Datos en general desagregadosdesagregados

●● Importancia del dato actual Importancia del dato actual ●● Usuarios de perfiles tUsuarios de perfiles tááctico y ctico y

operativooperativo●● No fueron diseNo fueron diseññados para ados para

realizar consultas masivas de realizar consultas masivas de datos agregados datos agregados

BODEGA DE DATOSBODEGA DE DATOS

●● Integra diferentes fuentes de Integra diferentes fuentes de datosdatos

●● Muestra el patrMuestra el patróón histn históórico de las rico de las sillas vacsillas vacíías por vuelo para ajustar as por vuelo para ajustar agendas en un futuroagendas en un futuro

Sistema transaccional y Sistema transaccional y datawarehousedatawarehouse

●● SISTEMA SISTEMA TRANSACCIONALTRANSACCIONAL

●● EstEstáá disediseññado para soportar ado para soportar una aplicaciuna aplicacióón especn especííficafica

●● Muestra cuales sillas estMuestra cuales sillas estáán n disponibles en una aeroldisponibles en una aerolíínea nea para que un agente de viajes para que un agente de viajes realice reservacionesrealice reservaciones

●● Tableros de control (Tableros de control (dashboardsdashboards) :) : Reportes analReportes analííticos:ticos:

●● Reportes producciReportes produccióón:n:

Sistemas para la toma de Sistemas para la toma de decisionesdecisiones

AgendaAgendaAntecedentesModelamiento multidimensionalEjemplo de construcción de una bodega de datos

ModelamientoModelamiento multidimensionalmultidimensional

● Se basa en modelar los requerimientos de análisis de los usuarios vistos como eventos relevantes.

● Cada evento es cuantificado usando un conjunto de medidas y criterios de agrupación o visualización

ModelamientoModelamiento multidimensionalmultidimensional● El modelamiento se basa en dos componentes : tablas

de hechos (fact tables) y dimensiones.

● Un hecho es el foco de interés en el proceso de toma de decisiones, típicamente modela un conjunto de eventos del mundo real.

● Una medida es una propiedad de un hecho y describe aspectos cuantitativos de interés para el análisis. Las medidas son usadas para llevar a cabo cálculos.

● Una dimensión es una propiedad de un hecho con un dominio finito y describe una de sus coordenadas de análisis. El conjunto de dimensiones de un hecho determina la granularidad o nivel de detalle.

MetodologMetodologíía de disea de diseññoo1. Elija los hechos de interés2. Por cada hecho construya un árbol de

atributos que capture las dependencias funcionales expresada en el esquema

3. Escoja dimensiones y medidas4. Cree el esquema multidimensional

● Estrella (Star) : Estucturadesnormalizada en la cual todas las dimensiones están directamente relacionadas a la fact table.

● Copo de nieve (Snowflake) : En esta estructura por lo menos una dimensión debe usar una tabla intermedia para conectarse con la facttable.

Tipos de esquema Tipos de esquema multidimensionalesmultidimensionales

Modelo relacionalModelo relacional

AgendaAgendaAntecedentesModelamiento multidimensionalEjemplo de construcción de una bodega de datos

Requerimientos Requerimientos ● Número de inscripciones por colegios● Total de inscripciones por facultad y

programa● Total de inscritos por departamento y

municipio● Total de inscritos por jornada por periodo

académico● Inscripciones distribuidas por género y edad● Total de inscritos por programa por año

IdentificaciIdentificacióón de n de dimensiones y medidasdimensiones y medidas

Dimensiones : Medidas :

1. Inscritos 1. Total de inscritos

2. Tiempo3. Programa4. Periodo académico5. Edad6. Jornada

Modelo dimensionalModelo dimensional

ETL (ExtracciETL (Extraccióón, n, transformacitransformacióón y carga)n y carga)

● Es el trabajo de recolectar, transformar y cargar los datos desde diferentes y múltiples fuentes a una base de atosestructurada para el ánalisis.

● Puede ocupar hasta el 70% del tiempo proyecto.