Estadi Stica I - Capi Tulo 2

36
Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc. Chap 2-1 Capítulo 2 Presentación de Datos en Tablas y Gráficos Estadística I

description

Muy buena presentacion

Transcript of Estadi Stica I - Capi Tulo 2

Page 1: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc. Chap 2-1

Capítulo 2

Presentación de Datos en Tablas y Gráficos

Estadística I

Page 2: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-2

Los datos categóricos son presentados en tablas y gráficos

Datos

Categóricos

Graficando los datos

Gráfico de pastel

Diagrama de Pareto

Gráfico de barras

Tabulando los datos

Tabla de resumen

Page 3: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-3

Organizando los datos categóricos: Tabla de Resumen

§  La tabla de resumen indica la frecuencia, cantidad o porcentaje de objetos en un conjunto de categorías para observar las diferencias que hay entre ellas.

§  Una tabla de resumen lista las categorías en una columna y la frecuencia, cantidad o porcentaje en una columna o columnas independientes.

Preferencia Bancaria? Percent ATM 16% Llamada Telefónica 2% Autobanco 17% Sucursal 41% Internet 24%

Page 4: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-4

Organizando los datos categóricos: Gráfico de Barras

§  En una gráfica de barras, cada barra muestra una categoría, su longitud representa la cantidad, frecuencia o porcentaje de los valores que caen en cada categoría.

0% 10% 20% 30% 40% 50%

ATM

Llamada Telefónica

Autobanco

Sucursal

Internet

Preferencia Bancaria

Page 5: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-5

Organizando datos categóricos: Gráfico de Pastel

§  La gráfica de pastel es un círculo que se divide en partes para representar las categorías. El tamaño de cada rebanada varía de acuerdo con el porcentaje de cada categoría.

16% 2%

17%

41%

24%

Preferencia Bancaria

ATM

Llamada Telefónica

Autobanco

Sucursal

Internet

Page 6: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-6

Organizando datos categóricos: Diagrama de Pareto

n  Las respuestas categorizadas se trazan en orden descendente de acuerdo con sus frecuencias.

n  Se combinan con la línea de porcentaje acumulado en la misma gráfica.

n  El diagrama de Pareto permite separar a lo “poco vital” de lo “mucho trivial”, lo que nos permite enfocarnos en las categorías importantes.

Page 7: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-7

Organizando datos categóricos: Diagrama de Pareto

Pareto Chart For Banking Preference

0%

20%

40%

60%

80%

100%

In personat branch

Internet Drive-through

service atbranch

ATM Automatedor live

telephone

% in

eac

h ca

tego

ry(b

ar g

raph

)

0%

20%

40%

60%

80%

100%

Cum

ulat

ive

%(li

ne g

raph

)

Page 8: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-8

Tablas y Gráficos para datos numéricos

Datos Numéricos

Arreglo Ordenado

Diagrama de Tallo y Hojas Histograma Polígono Ojiva

Distribuciones de Frecuencia y

Distribuciones Acumulativas

Page 9: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-9

Arreglo Ordenado

§  Un arreglo ordenado es una secuencia de datos ordenados del menor al mayor valor.

§  Muestra el rango (del valor min al valor max) §  Ayuda a identificar valores atípicos (observaciones poco comunes)

Edad de los estudiantes encuestados en la universidad

Asisten por la mañana

16 17 17 18 18 18 19 19 20 20 21 22 22 25 27 32 38 42 Asisten por la noche

18 18 19 19 20 21 23 28 32 33 41 45

Page 10: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-10

Diagrama de Tallo y Hojas

n  Permite ver cómo se distribuyen y dónde están las concentraciones de datos. METODO:

Separa los datos en dígitos principales o primarios (los tallos) y en dígitos secundarios (las hojas).

Page 11: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-11

Diagrama de Tallo y Hojas

§  Organiza los datos en grupos (llamados tallos), para que los valores dentro de cada grupo (hojas) ramifiquen hacia la derecha de cada fila.

Tallo Hojas

1 67788899

2 0012257

3 28

4 2

Edad de los estudiantes

Mañana Noche

Tallo Hojas

1 8899

2 0138

3 23

4 15

Edad de los estudiantes encuestados en la universidad

Asisten por la mañana

16 17 17 18 18 18

19 19 20 20 21 22

22 25 27 32 38 42

Asisten por la noche

18 18 19 19 20 21

23 28 32 33 41 45

Page 12: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-12

Distribución de Frecuencia

§  Una distribución de frecuencias es una tabla de resumen en la que los datos están organizados en clases o grupos numéricamente ordenados.

§  Se debe prestar atención al seleccionar el número apropiado de

agrupaciones o clases para la tabla, determinando una amplitud conveniente de las clases y estableciendo los límites de cada una para evitar el traslape.

§  El número de clases usadas depende del número de valores. Un mayor número de valores permite un mayor número de clases.

§  En general, la distribución de frecuencias debería tener por lo menos 5 clases, pero no más de 15.

§  Para determinar la amplitud de un intervalo de clase, se divide el rango (el valor mayor menos el valor menor) de los datos entre el número de clases que se desea.

Page 13: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-13

Distribución de Frecuencia

Un fabricante de insuladores aleatoriamente selecciona 20 días de invierno y registra la temperatura diaria mas alta.

24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Page 14: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-14

Distribución de Frecuencia

§  Ordenar los datos en orden ascendente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

§  Determine el rango: 58 - 12 = 46 §  Seleccione el número de clases: 5 (5-15) §  Calcule el intervalo de clase (amplitud): 10 (46/5 redondear al

entero mayor) §  Determine los límites de clase:

§  Clase 1: 10 a menos de 20 §  Clase 2: 20 a menos de 30 §  Clase 3: 30 a menos de 40 §  Clase 4: 40 a menos de 50 §  Clase 5: 50 a menos de 60

§  Calcule los puntos medios de cada clase: 15, 25, 35, 45, 55 §  Contar las observaciones y asignarlas a las clases

correspondientes.

Page 15: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-15

Distribución de Frecuencia

Clase Frecuencia

10 a menos de 20 3 .15 15 20 a menos de 30 6 .30 30 30 a menos de 40 5 .25 25 40 a menos de 50 4 .20 20 50 a menos de 60 2 .10 10 Total 20 1.00 100

Frecuencia Relativa Porcentaje

Datos en orden ascendente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Page 16: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-16

Frecuencia Acumulada

Clase

10 a menos de 20 3 15 3 15 20 a menos de 30 6 30 9 45 30 a menos de 40 5 25 14 70 40 a menos de 50 4 20 18 90 50 a menos de 60 2 10 20 100

Total 20 100

Porcentaje Porcentaje Acumulado

Datos en orden ascendente: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Frecuencia Frecuencia Acumulada

Page 17: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-17

Por qué utilizar una Distribución de Frecuencia?

n  Resume la información de una manera mas útil.

n  Permite una rápida interpretación visual de los datos.

n  Permite determinar las características mas importantes de un conjunto de datos, donde estan concentrados y como están agrupados.

Page 18: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-18

Distribuciones de Frecuencia

n  Si el conjunto de datos no contiene muchos valores, un conjunto de límites de clase refleja una imagen diferente de la que da otro conjunto de límites.

n  Usted obtendrá cambios en la concentración de los datos al elegir límites de clase inferiores y superiores diferentes.

n  Conforme aumenta el tamaño de la muestra, las alteraciones en la selección de los límites de clase afectan cada vez menos la concentración de los datos.

n  Cuando comparamos dos o más grupos que difieren en el tamaño de su muestra, se debe usar una distribución de frecuencias relativa o una distribución de porcentaje.

Page 19: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-19

El Histograma

§  Un gráfico de barras verticales de los datos de una distribución de frecuencias se llama histograma.

§  En un histograma no existen espacios entre las barras adyacentes.

§  Los límites de clase (o puntos medios de clase) se muestran

en el eje horizontal.

§  El eje vertical representa la frecuencia o porcentaje de los valores por intervalo de clase.

§  La altura de las barras representa la frecuencia, frecuencia relativa o porcentaje.

Page 20: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-20

El Histograma

Clase Frecuencia

10 but less than 20 3 .15 15 20 but less than 30 6 .30 30 30 but less than 40 5 .25 25 40 but less than 50 4 .20 20 50 but less than 60 2 .10 10 Total 20 1.00 100

Frecuencia Relativa Porcentaje

0 1 2 3 4 5 6 7

5 15 25 35 45 55 More

Frec

uenc

ia

Histograma: Temperatura Diaria

Page 21: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-21

Polígono

§  El polígono de porcentaje se crea al hacer que el punto medio de cada clase represente los datos de esa clase y después se conecta la secuencia de puntos medios con sus respectivos porcentajes de clase.

§  El polígono de porcentaje acumulado, u ojiva, muestra la

variable de interés a lo largo del eje X, y los porcentajes acumulados a lo largo del eje Y.

§  Es difícil y confuso realizar múltiples histogramas en la misma gráfica cuando comparamos dos o más conjuntos de datos. Cuando hay dos o más grupos, es conveniente utilizar un polígono de porcentaje.

Page 22: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-22

Frequency Polygon: Daily High Temperature

01234567

5 15 25 35 45 55 65

Frequency

Polígono de Frecuencias

Class Midpoints

Clase

10 but less than 20 15 3 20 but less than 30 25 6 30 but less than 40 35 5 40 but less than 50 45 4 50 but less than 60 55 2

Frecuencia Punto

Medio

Page 23: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-23

Ojiva (Polígono de % Acumulado)

Clase

10 but less than 20 10 15 20 but less than 30 20 45 30 but less than 40 30 70 40 but less than 50 40 90 50 but less than 60 50 100

% menor que límite

inferior

Límite inferior

Ogive: Daily High Temperature

0

20

40

60

80

100

10 20 30 40 50 60Cu

mu

lati

ve P

erce

nta

ge

Lower Class Boundary

Page 24: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-24

Tablas de Clasificación

n  Se utilizan para estudiar características que pueden existir entre dos o mas variables categóricas.

n  Pueden presentarse en: n  Forma Tabular -- Tablas de contingencia n  Forma Gráfica -- Gráfico de barras agrupadas

Page 25: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-25

Tablas de Contingencia

§  Una tabla de clasificación (o contingencia) cruzada presenta los resultados de dos variables cate- góricas. Las respuestas en conjunto se clasifican de tal manera que las categorías de una variable se localizan en las filas, y las categorías de la otra variable se localizan en las columnas.

§  Los valores localizados en las intersecciones de las filas y las

columnas se llaman celdas. §  Una forma útil de mostrar los resultados de datos de

clasificación cruzada es realizar una gráfica de barras agrupadas.

Page 26: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-26

Tabla de Contingencia

Importancia de la marca

Hombre Mujer Total

Mucha 450 300 750

Igual o poca 3300 3450 6750

Total 3750 3750 7500

Se realizó una encuesta para estudiar la importancia de la marca en los consumidores. Los resultados se clasificaron por género:

Page 27: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-27

Gráfico de Barras Agrupadas

0 500 1000 1500 2000 2500 3000 3500 4000

Mucha

Poca o igual

Número de Respuestas

Res

pues

ta

Importancia de la Marca

Mujer

Hombre

Page 28: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-28

Diagramas de Dispersión

§  Se utilizan para analizar datos en forma de pares ordenados que corresponden a dos variables numéricas.

§  Coloque una variable en el eje horizontal X y la otra variable

en el eje vertical Y. §  Sirve para examinar las posibles relaciones entre dos

variables numéricas.

Page 29: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-29

Diagrama de Dispersión

Volumen por día

Costo por día

23 125

26 140

29 146

33 160

38 167

42 170

50 188

55 195

60 200

0

50

100

150

200

250

20 25 30 35 40 45 50 55 60 65

Cos

to p

or D

ía

Volumen por Día

Costo por Día vs. Volumen de Producción

Page 30: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-30

n  El diagrama de series de tiempo se usa para estudiar patrones en las variables a través del tiempo.

n  Cada valor se traza como un punto de dos dimensiones.

n  Un diagrama de series de tiempo muestra el periodo de tiempo en el eje horizontal X y la variable de interés en el eje vertical Y.

Series de Tiempo

Page 31: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-31

Series de Tiempo

Number of Franchises, 1996-2004

0204060

80100120

1994 1996 1998 2000 2002 2004 2006

Year

Num

ber o

f Fr

anch

ises

Año #

Franquicias

1996 43 1997 54 1998 60 1999 73 2000 82 2001 95 2002 107 2003 99 2004 95

Page 32: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-32

Principios para Gráficos Excelentes

§  No debe distorsionar la información. §  No debe contener adornos innecesarios. §  La escala del eje vertical debe comenzar en cero. §  Todos los ejes deben tener el nombre de la variable que

representan. §  El gráfico debe tener un título. §  Se debe utilizar el gráfico mas simple para representar un

conjunto de datos.

Page 33: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-33

Gráficos Inadecuados

1960: $1.00

1970: $1.60

1980: $3.10

1990: $3.80

Salario Mínimo

Mala Presentación

Salario Mínimo

0

2

4

1960 1970 1980 1990

$

ü Buena Presentación

Page 34: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-34

Gráficos Inadecuados

Estudiantes que obtuvieron A

Estudiantes que obtuvieron A

Mala Presentación

0

200

300

9no 10mo 11mo 12mo

Frec.

10%

30%

9no 10mo 11mo 12mo

ü

100

20%

0%

%

Buena Presentación

Page 35: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-35

Gráficos Inadecuados

Buena Presentación

Ventas Trimestrales

Ventas Trimestrales

Mala Presentación

0

25

50

Q1 Q2 Q3 Q4

$

0

100

200

Q1 Q2 Q3 Q4

$

ü

Page 36: Estadi Stica I - Capi Tulo 2

Basic Business Statistics, 11e © 2009 Prentice-Hall, Inc.. Chap 2-36

Gráficos Inadecuados

Ventas Mensuales

36

39

42

45

E F M A M J

$

Gráfico de la ventas en los primeros 6 meses

Ventas Mensuales

0

39 42 45

E F M A M J

$

36

ü Buena Presentación Mala Presentación