Datawarehouse y Datamining

20
HERRAMIENTAS DE BUSINESS INTELLIGENCE DATAWAREHOUSING Y DATAMINING

description

zxcxthyhtrhrt

Transcript of Datawarehouse y Datamining

  • HERRAMIENTAS DE BUSINESS INTELLIGENCE

    DATAWAREHOUSING Y DATAMINING

  • QU ES BUSINESS INTELLIGENCE?* Conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anisis de datos existentes en una organizacin.

    * Abarca la comprensin del funcionamiento actual de la empresa, y la anticipacin de acontecimientos futuros, con el objetivo de ofrecer conocimientos para respaldar las decisiones empresariales.

  • QU ES BUSINESS INTELLIGENCE?

    * Las herramientas de inteligencia se basan en la utilizacin de un sistema de informacin de inteligencia que se forma con distintos datos extrados de la produccin, informacin relacionada con la empresa y datos del entorno y el contexto.

    * Mediante las herramientas y tcnicas (extraer, cargar y transformar), se extraen los datos de distintas fuentes, se depuran y preparan para luego cargarlos en un almacn de datos

  • DATAWAREHOUSE* Es un gran almacn de datos para consultar

    * Es un repositorio de datos de muy fcil acceso, alimentado de numerosas fuentes, transformadas en grupos de informacin sobre temas especficos de negocios, para permitir nuevas consultas, anlisis, toma de y decisiones.

    * Tiene gran capacidad de almacenamiento, pues los datos pueden ser de grandes periodos de tiempo.

  • DATAWAREHOUSE-Emplea el concepto de Metadatos (datos que describen otros datos). Por ejemplo, en una biblioteca se usan fichas que especifican autores, ttulos, casas editoriales y lugares para buscar libros. As, los metadatos ayudan a ubicar datos.

    -Cumple el principio de arquitectura fundamental que es separar los sistemas transaccionales de los informacionales en dos entornos de manera que el anlisis de los datos existentes no intefiera con el procesamiento y registro de nuevos datos.

  • Un DWH tiene varias caractersticas:

    Es una coleccin de datos orientada a un tema , integrada, variable en el tiempo y que sea tl para la toma de decisiones.

    Es integrado porque agrupa a todos los sistemas operacionales en un sistema de informacin con formatos y cdigos consistentes.

  • Un DWH tiene varias caractersticas:

    Es variante en el tiempo porque los datos se organizan y almacenan en jerarquass en el tiempo, lo que permite anlisis comparativos de estados actuales y de perodos anteriores.

  • Etapas en la construccin de un DWHCaptura de los datos de las fuentes seleccionadas (extraer de otras fuentes -excel, documentos, etc- datos al DWH)

    2. Tratamiento, conversin y transformacin de los datos (operaciones de limpieza, homogeneizacin, etc) En esta etapa se considera lo siguiente

  • Etapas en la construccin de un DWH-Detectar y corregir errores (duplicados, eliminar valores sin sentido)

    -Consistencia del uso de valores (codificacin igual de los valores por ejemplo DD/M/AAAA)

    -Tratamiento de la ausencia de valores (por default)

    -Codificar campos (ej. Pasar de fechas de nacimiento a intervalos de edades)

    -Reestructurar y aadir nuevos campos (enriquecer el sistema)

  • Herramientas para explotacin del DatawarehouseQueries and reporting: generacin de consultas y reportes de las bases de datos relacionales que generan informes predefinidos a partir de campos calculados

  • Herramientas para explotacin del DatawarehouseAnlisis multidimensional (OLAP online analytical processing)

    Facilitan el anlisis de datos a travs de dimensiones y jerarquas, uutilizando consultas rpidas predefinidas

  • Herramientas para explotacin del DatawarehouseHerramientas de datamining: tcnicas avanzadas que permiten detectar y modelizar relaciones entre los datos y obtener informacin no evidente como patrones de consumo, prediccin del comportamiento de los clientes, asociaciones de productos.

  • Herramientas de dataminingEstadsticas: regresin, anlisis multivariable, anlisis cluster

    Simblicas: rboles de decisin, reglas

    Tcnicas de inteligencia artificial: redes neuronales, algoritmos

  • Metodologa de un proceso de dataminingMuestreo: seleccin de muestra de datos para reducir costos y tiempos.

    Exploracin: determinar tendencias principales, rango de variables, frecuencia de valores

    Modificacin: transformacin y filtrado de variables para adecuarse a los requisitos del problema o cuestin que se quiere analizar

  • Metodologa de un proceso de datamining

    Modelizacin del comportamiento: empleando redes neuronales, rboles, etc.

    Evaluacin: comprobacin de la validez del modelo obtenido.

    Presentacin grfica de los resultados

  • Herramientas de datamining y datawarehouse

    OracleIBMKNIME SPSS Clementine (software) SAS Enterprise Miner RapidMiner Weka KXEN Orange

  • BENEFICIOSCon los sistemas de datawarehousing y datamining los directivos pueden disponer de la informacin necesaria en poco tiempo y con validez y dedicarse a su anlisis.

    Permiten conocer el comportamiento de los clientes logrando la eficacia en operaciones de marketing y comunicaciones.

    Se pueden detectar tendencias y previsiones de cara al futuro.

  • En definitiva, una solucin BI completa permite:

    Observar qu est ocurriendo?

    Comprender por qu ocurre?

    Predecir qu ocurrira?

    Colaborar qu debera hacer el equipo?

    Decidir qu camino se debe se

    ********************