Sesion (2013) Medidas de TC

92
ESTADISTICA PARA LA INGENIERIA Tendencia Central Media Mediana Moda Cuartiles Media Ponderada Medidas para resumen numérico de los datos Variación Varianza Desviación Estándar Coeficiente de Variación Rango Tendencia Central Cuartiles Varianza Chap 3-1 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Transcript of Sesion (2013) Medidas de TC

Page 1: Sesion (2013) Medidas de TC

ESTADISTICA PARA LA INGENIERIA

Tendencia Central

Media

Mediana

Moda

Cuartiles

Media Ponderada

Medidas para resumen

numérico de los datos

Variación

Varianza

Desviación Estándar

Coeficiente de

Variación Rango

Tendencia Central

Cuartiles

Varianza

Chap 3-1 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 2: Sesion (2013) Medidas de TC

“No comeré la media, ni la mediana, ni siquiera el primer decil.”

Chap 3-2 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Los métodos de representación gráfica proporcionan un punto de partida para el análisis de los datos. Sin

embargo, también es necesario estar familiarizado con medidas descriptivas que proveen un resumen sencillo de

un conjunto de datos.

Page 3: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-3

INTRODUCCION

En este capitulo analizaremos los métodos para representar los datos con un solo valor numérico.

Page 4: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-4

OBJETIVOS

El objetivo en este capitulo es: •Describir los datos a través de medidas de tendencia central y de dispersión. •Utilizar la computadora para obtener una representación grafica de los datos con un diagrama de caja.

Page 5: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-5

INDICE

•Medidas de tendencia central. •Cuartiles. •Medidas de Variación - Variación

Page 6: Sesion (2013) Medidas de TC

Existen 2 grandes categorías de medidas que

resumen numéricamente los datos:

Las medidas de tendencia central o de

posición

Las medidas de variabilidad o de dispersión.

Chap 3-6 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 7: Sesion (2013) Medidas de TC

Las medidas de tendencia central describen la localización central de un conjunto de observaciones numéricas

Chap 3-7 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 8: Sesion (2013) Medidas de TC

Las medidas de variación describen la dispersión o el grado de homogeneidad/heterogeneidad de un conjunto de datos

Chap 3-8 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 9: Sesion (2013) Medidas de TC

Tendencia Central

Media

Mediana

Moda

Cuartiles

Media

Ponderada

Medidas para resumen

numérico de los datos

Variación

Varianza

Desviación Estándar

Coeficiente

de Variación Rango

Chap 3-9 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 10: Sesion (2013) Medidas de TC

Medidas de Tendencia Central

n

x

x

n

i

i 1

Tendencia Central

Media Mediana Moda

Media Ponderada

Chap 3-10 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 11: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-11

Medidas de Tendencia Central

Son aquellas que determinan los valores centrales de los datos de un experimento. Existen varios tipos de medidas de tendencia central, aquí estudiaremos la media, la mediana y la moda.

Fuente: Matus, R.; Hernández, Martha; García, E.. Estadística.

México: Instituto Politécnico Nacional, 2010. p 2. Copyright © 2010. Instituto Politécnico Nacional. All rights reserved.

Page 12: Sesion (2013) Medidas de TC

Media (Media Aritmética)

La media aritmética es el valor que se obtiene al dividir

la suma total entre el número de datos.

Para n valores x1, x2,..., xn, la media es:

1 1 2

n

i

i n

XX X X

Xn n

Chap 3-12 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 13: Sesion (2013) Medidas de TC

Media (Media Aritmética)

Es la medida de tendencia central mas utilizada

Afectada por valores extremos (Outliers)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Media = 5 Media = 6

Chap 3-13 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 14: Sesion (2013) Medidas de TC

Mediana

Es una medida robusta de la tendencia central No es afectada por valores extremos

En un conjunto de datos ordenado, la mediana es: El valor central, si n es impar El promedio de los 2 valores centrales, si n es par

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14

Mediana = 5 Mediana = 5

Chap 3-14 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 15: Sesion (2013) Medidas de TC

Moda

Es una medida de tendencia central

Es el valor que ocurre con mayor frecuencia

No es afectado por valores extremos

Es utilizado tanto para datos numéricos como datos categóricos

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6

Sin Moda Chap 3-15 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 16: Sesion (2013) Medidas de TC

Moda

La moda puede no existir (ejemplo anterior) o pueden existir varias modas:

Chap 3-16 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 17: Sesion (2013) Medidas de TC

Media Ponderada

En ciertas circunstancias no todas las observaciones tienen igual peso. En general si se tienen observaciones con valores diferentes x1, x2, …, xn con sus respectivos pesos w1, w2, …,wn, la media ponderada se calcula:

Chap 3-17 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 18: Sesion (2013) Medidas de TC

Media Ponderada

Ejemplo: Notas MCI: 16, 18, 17, 14

50% nota prueba, 30% nota trabajo, 10% nota practica

1, 10% nota práctica 2

Promedio final:

= (5x16 + 3x18 + 17x1 + 14x1)/10

= (80 + 54 + 17 + 14)/10 = 16.5

WX

Chap 3-18 © 2013 Ing. José Luis Tupac Yupanqui A.

Page 19: Sesion (2013) Medidas de TC

La Forma de la Distribución

Determina las posiciones relativas de la media, la mediana, y la moda para un conjunto de valores de datos.

Chap 3-19 © 2013 Ing. José Luis Tupac Yupanqui A.

O Distribución Positivamente

Sesgada

O Distribución Negativamente

Sesgada

Page 20: Sesion (2013) Medidas de TC

El Sesgo

Es la tendencia de la distribución a acumularse a la derecha o a la izquierda .

Chap 3-20 © 2013 Ing. José Luis Tupac Yupanqui A.

Page 21: Sesion (2013) Medidas de TC

Distribuciones

Chap 3-21 © 2013 Ing. José Luis Tupac Yupanqui A.

Distribución simétrica

Distribución positivamente sesgada

Distribución negativamente sesgada

Page 22: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-22

Page 23: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-23

¿Cuánto es la Moda:?

Page 24: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-24

¿Cuánto es la Moda:?

Page 25: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-25

Fuente: BCRP, SBS, Reuters y Datatec.

Elaboración: Gerencia de Información y Análisis Económico - Subgerencia de Estadísticas Macroeconómicas.

Page 26: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-26

Fuente: BCRP, SBS, Reuters y Datatec.

Elaboración: Gerencia de Información y Análisis Económico - Subgerencia de Estadísticas Macroeconómicas.

Calcular: La moda, media y mediana del Tipo de Cambio tanto en la compra y venta para el año de su elección.

Page 27: Sesion (2013) Medidas de TC

Divide a los datos ordenados en 4 cuartos

Posición del i-ésimo cuartil

El segundo cuartil es la mediana de los datos.

25% 25% 25% 25%

1Q 2Q 3Q

1

4i

i nQ

Chap 3-27 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Cuartiles

Page 28: Sesion (2013) Medidas de TC

Ejemplo: Determinar el primer cuartil del siguiente

conjunto de nueve datos ordenados

5.132

1512

5.24

)19(1

1

1

Q

QdePosición

11 12 15 16 16 17 18 21 22

Chap 3-28 © 2013 Ing. José Luis Tupac Yupanqui A.

Cuartiles

Page 29: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-29

Page 30: Sesion (2013) Medidas de TC

Medidas de Variación

La variabilidad es inherente y estará siempre presente en todo:

• Entre productos,

• personas,

• servicios,

• procesos,

• naturaleza,

• etc.

Lo importante es intentar descubrir:

¿Qué indica esta variabilidad sobre los procesos?

¿Cuáles son las fuentes de variabilidad?

¿Cuál es la comprensión que se tiene sobre los conceptos de probabilidad y estadística para entender, estudiar y controlar la variabilidad?

Chap 3-30 © 2013 Ing. José Luis Tupac Yupanqui A.

Page 31: Sesion (2013) Medidas de TC

Medidas de Variación

Sin entender la variabilidad puede suceder:

• Dificultad en separar causas comunes de causas especiales

• La comprensión del proceso es difícil

• El gerenciamiento del proceso es ineficaz

• La mejoría de la calidad es lenta

• No hay como reducir ni dimensionar las pérdidas

• El aprendizaje es lento

Sin medición no hay observación y ni posibilidad de evaluar el desempeño de los procesos en relación a:

• Exigencias de los clientes

• No se percibe donde están las oportunidades y amenazas

• No existen datos

Sin datos todos creen saber lo que está sucediendo, no hay análisis estadístico y la mejora no acontece

Chap 3-31 © 2013 Ing. José Luis Tupac Yupanqui A.

Page 32: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-32

8 14 11 9 10 12 13 Onzas

A C

B

Peso declarado en el equipaje

Media de B = Media de C

[Dispersión de B]>[Dispersión de C] Frecuencia

12 onz

Page 33: Sesion (2013) Medidas de TC

Medidas de Variación

Medidas de Variación

Varianza Desviación

Estándar

Coeficiente de

Variación

Rango

Rango Intercuartil

Chap 3-33 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 34: Sesion (2013) Medidas de TC

Medidas de Variación o Dispersión

Chap 3-34 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Una medida de ubicación, como la media o la mediana, sólo describe el centro de la información. Desde este punto de vista, es valiosa, pero no nos indica nada acerca de la extensión de los datos. Por ejemplo, si en la guía del lugar dice que el río que está más adelante tiene una profundidad promedio de 3 pies, ¿estaría dispuesto a cruzarlo a pie sin contar con información adicional? Tal vez no. Seguramente querrá saber algo acerca de la variación en la profundidad. ¿La profundidad máxima del río es 3.25 pies y la mínima es 2.75 pies? Si es así, tal vez se aventure a cruzarlo. ¿Qué sucedería si supiera que la profundidad del río varía entre 0.50 y 5.5 pies? Quizá su decisión sería no cruzar. Antes de tomar una decisión sobre cruzar el río o no, querrá información sobre la profundidad típica y la dispersión en la profundidad del río.

Page 35: Sesion (2013) Medidas de TC

Medidas de Variación o Dispersión

Chap 3-35 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

•Un valor menor para una medida de dispersión indica que los datos están agrupados de manera estrecha, digamos, alrededor de la media aritmética. Por tanto, la media se considera representativa de la información. •Por el contrario, una medida de dispersión alta indica que la media no es confiable. •Vea la siguiente grafica:

Page 36: Sesion (2013) Medidas de TC

Medidas de Variación o Dispersión

Chap 3-36 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Los 100 empleados de Hammond Iron Works, Inc., una compañía fabricante de acero, está organizada en un histograma basado en el número de años de trabajar para la compañía. La media es 4.9 años, pero la extensión de los datos es de 6 meses a 16.8 años. La media de 4.9 años no es muy representativa de todos los empleados.

Page 37: Sesion (2013) Medidas de TC

Medidas de Variación o Dispersión

Chap 3-37 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

•Una segunda razón para estudiar la dispersión de un conjunto de datos es comparar la extensión en dos o más distribuciones. •Por ejemplo, supongamos que la nueva computadora PDM/3 está armada en Baton Rouge y también en Tucson. •La producción media aritmética por hora tanto en la planta de Baton Rouge como en la de Tucson es 50. •Con base en las dos medias, podríamos llegar a la conclusión de que las distribuciones de las producciones por hora son idénticas. •Sin embargo, los registros de producción durante 9 horas en ambas plantas revelan que esta conclusión no es correcta (vea la siguiente gráfica). •La producción de Baton Rouge varía de 48 a 52 ensamblajes por hora. La producción en la planta de Tucson es más errática, pues va de 40 a 60 por hora. Por tanto, la producción por hora para Baton Rouge se agrupa cerca de la media de 50; la producción por hora para Tucson es más dispersa.

Page 38: Sesion (2013) Medidas de TC

Medidas de Variación o Dispersión

Chap 3-38 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Producción de computadoras por hora en las plantas de Baton Rouge y Tucson

Page 39: Sesion (2013) Medidas de TC

Rango

Chap 3-39 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

La medida de dispersión más sencilla es el rango. Éste es la diferencia entre los valores más alto y más bajo en el conjunto de datos. En la forma de una ecuación:

El rango se utiliza con mucha frecuencia en las aplicaciones de control de procesos estadísticos (CPE) porque es muy fácil de calcular y entender.

Consulte la Gráfica Anterior. Encuentre el rango en el número de computadoras que se producen cada hora en las plantas de Baton Rouge y Tucson. Interprete los dos rangos.

Page 40: Sesion (2013) Medidas de TC

Rango

Chap 3-40 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Producción de computadoras por hora en las plantas de Baton Rouge y Tucson

El rango de la producción de computadoras por hora en la planta de Baton Rouge es 4, calculado por la diferencia entre la producción por hora más alta de 52 y la más baja de 48. El rango en la producción por hora para la planta de Tucson es 20 computadoras, calculado al restar 60 - 40. Por tanto, llegamos a la conclusión de que: (1) hay menos dispersión en la producción por hora en la planta de Baton Rouge que en la de Tucson porque el rango de 4 computadoras es menor que el rango de 20 computadoras y (2) la producción se agrupa de manera más estrecha alrededor de la media de 50 en la planta de Baton Rouge que en la de Tucson

Page 41: Sesion (2013) Medidas de TC

Rango

Medida de variación

Diferencia entre el valor máximo y mínimo de un

conjunto de datos

7 8 9 10 11 12

Rango = 12 - 7 = 5

7 8 9 10 11 12

Rango = 12 - 7 = 5

Rango = Xmax - Xmin

Chap 3-41 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 42: Sesion (2013) Medidas de TC

Rango

Ventajas:

Es fácil de calcular y sus unidades son las mismas que las de la variable.

Desventajas:

No utiliza todas las observaciones (sólo dos de ellas)

Se puede ver muy afectada por alguna observación extrema

El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye.

Ignora como los datos están distribuidos

Chap 3-42 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 43: Sesion (2013) Medidas de TC

Rango Intercuartil

Medida de variación

Diferencia entre el tercer y primer cuartil

No es afectado por valores extremos

Ejemplo:

Pos. Q1= (11+1)/4=3

Pos. Q3= 3(11+1)/4=9

RIC = Q3 – Q1

Datos ordenados: 11 12 13 16 16 16 17 17 17 18 20

RIC = Q3 – Q1=17-13= 4

Q1 Q3

Chap 3-43 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 44: Sesion (2013) Medidas de TC

Desviación Media

Chap 3-44 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

•Un defecto del rango es que se basa sólo en dos valores, el más alto y el más bajo; no toma en cuenta todos los valores. •La desviación media sí lo hace. Mide la cantidad media por la cual los valores en una población o muestra varían de su media. •En términos de una definición:

DESVIACIÓN MEDIA. La media aritmética de los valores absolutos de las desviaciones de la media aritmética.

Page 45: Sesion (2013) Medidas de TC

Desviación Media

Chap 3-45 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

En términos de una fórmula: la desviación media, abreviada MD, se calcula para una muestra como sigue:

DESVIACIÓN MEDIA

donde: es el valor de cada observación. es la media aritmética de los valores. es el número de observaciones en la muestra. indica el valor absoluto.

n

xxDM

Page 46: Sesion (2013) Medidas de TC

Ejemplo

Desviación Media

Chap 3-46 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Determine la desviación media e interprete los resultados. La desviación media es la media de las cantidades donde las observaciones individuales difieren de la media aritmética. Para calcular la desviación media de un conjunto de datos, empezamos por encontrar la media aritmética.

El número medio de capuchinos vendidos es 1Ó2, calculado así: (103 + 97-+ 101 + 106 + 103)/5.

A continuación, encontramos la cantidad en la cual cada observación difiere de la media.

El número de capuchinos vendidos en la tienda Starbucks del aeropuerto de Orange County entre las 4 y las 7 P . M . en una muestra de 5 días el año pasado fue: 103, 97, 101, 106 y 103.

Page 47: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-47

Luego, sumamos estas diferencias, ignorando los signos y dividimos la suma entre el número de observaciones. El resultado es la cantidad media en que las observaciones difieren de la media. Un valor bajo para la desviación media indica que los datos están agrupados cerca de la media, mientras que un valor alto para la desviación media indica una mayor dispersión en la información. Éstos son los detalles de los cálculos realizados con la fórmula:

n

xxDM

Page 48: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-48

n

xxDM

Page 49: Sesion (2013) Medidas de TC

Varianza

Medida importante de la variación

Muestra la variabilidad de los datos alrededor de la

media

La varianza de n datos x1 x2 … xn es:

1

)(1

2

2

n

xx

S

n

i

i

Chap 3-49 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

N

xn

i

i

1

2

2

)(

Varianza para una Muestra Varianza para una Población

Page 50: Sesion (2013) Medidas de TC

Chap 3-50 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Ejemplo

Varianza

Page 51: Sesion (2013) Medidas de TC

Desviación Estándar

Chap 3-51 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

•Por lo general, la desviación estándar se utiliza como una medida para comparar la extensión en dos o más grupos de observaciones. •Por ejemplo, la desviación estándar de las cantidades quincenales invertidas en el plan de reparto de utilidades de Dupree Paint Company se calcula en $7.51. •Supongamos que estos empleados se encuentran en Georgia. Si la desviación estándar para un grupo de empleados en Texas es $10.47, y las medias son casi iguales, quiere decir que las cantidades invertidas por los empleados de Georgia no son tan dispersas como aquellas que se invierten en Texas (porque $7.51 < $10.47). •Ya que las cantidades invertidas por los empleados de Georgia se agrupan de manera más estrecha alrededor de la media, la media para los empleados de Georgia es una medida más confiable que aquella para el grupo de Texas.

Page 52: Sesion (2013) Medidas de TC

Desviación Estándar

Es la medida de variabilidad mas importante

Muestra la variación alrededor de la media

Se expresa en las mismas unidades de los datos

originales

Chap 3-52 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Varianza para una Muestra Varianza para una Población

2Ss 2

Page 53: Sesion (2013) Medidas de TC

Datos 3, 3, 4, 4, 5 (metros)

Chap 3-53 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Eje

rcic

io 1

Page 54: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-54

Eje

rcic

io 2

Page 55: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-55

Eje

rcic

io 2

Page 56: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-56

Eje

rcic

io 3

Los pesos de los contenedores enviados a Irlanda son (en miles de libras):

95 103 105 110 104 105 112 90 a) ¿Cuál es el rango de los pesos? b) Calcule el peso medio aritmético. c) Calcule la desviación media de los pesos.

Page 57: Sesion (2013) Medidas de TC

1) Durante la venta del fin de semana pasado en Electronic Super Store, estuvieron trabajan do cinco representantes de servicios al cliente. Los números de HDTV que vendieron estos representantes son: 5, 8, 4, 10 y 3.

2) El Departamento de Estadística de Western State University ofrece ocho secciones de es tadística básica. Los siguientes son los números de estudiantes inscritos en estas seccio nes: 34, 46, 52, 29, 41, 38, 36 y 28.

3) Dave's Automatic Door instala puertas automáticas en las cocheras. La siguiente lista indi ca el número de minutos que se necesitan para instalar una muestra de 10 puertas: 28, 32, 24, 46, 44, 40, 54, 38, 32 y 42.

4) Una muestra de ocho compañías en la industria aeroespacial participaron en una encuesta sobre la recuperación de la inversión que tuvieron el año pasado. Los resultados son (en porcentajes): 10.6, 12.6, 14.8, 18.2, 12.0, 14.8, 12.2 y 15.6.

5) Diez expertos calificaron el sabor de una pizza sushi recién creada preparada con atún, arroz y algas marinas, en una escala de 1 a 50. Las calificaciones fueron: 34, 35, 41, 28, 26, 29, 32, 36, 38 y 40.

6) Una muestra de los archivos de personal de ocho empleados de Acmé Carpet Cleaners, Inc., reveló que durante un periodo de seis meses, perdieron los siguientes días debido a enfermedades: 2, 0, 6, 3, 10, 4, 1 y 2.

Para los siguientes ejercicios calcule: (a) el rango de los pesos, (b) la media aritmética y (c) la desviación media, e interprete el rango y la desviación media.

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-57

Pro

pu

esto

s

Page 58: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-58

Eje

rcic

io 4

Page 59: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-59

Eje

rcic

io 5

La oficina en Filadelfia de Price Waterhouse Coopers LLP contrató cinco aprendices de contador en este año. Sus salarios mensuales iniciales fueron: $3 536, $3 173, $3 448, $3 121 y $3 622. (a) Calcule la media de la población. (b) Calcule la varianza de la población. (c) Calcule la desviación estándar de la población. (d) La oficina en Pittsburgh contrató a seis aprendices. El salario

mensual medio fue de $3 550, y la desviación estándar $250. Compare ambos grupos.

Page 60: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-60

Pro

pu

esto

s

1) Considere estos cinco valores como una población: 8, 3, 7, 3 y 4. a. Determine la media de la población. b. Determine la varianza.

2) Considere estos seis valores como una población: 13, 3, 8, 10, 8 y 6. a. Determine la media de la población. b. Determine la varianza.

3) El informe anual de Dennis Industries menciona estas ganancias primarias por acción co mún durante los últimos 5 años: $2.68, $1.03, $2.26, $4.30 y $3.58. Si suponemos que és tos son los valores poblacionales, a. ¿Cuáles son las ganancias medias aritméticas primarias por

acción común? b. ¿Cuál es la varianza?

4) Haciendo referencia al Ejercicio 39, el informe anual de Denis Industries también presenta estas ganancias sobre el capital accionario durante el mismo periodo de cinco años (en por centajes): 13.2, 5.0, 10.2, 17.5 y 12.9.

a. ¿Cuál es la ganancia media aritmética? b. ¿Cuál es la varianza?

De

svia

ció

n E

stá

nd

ar d

e la

Po

bla

ció

n

Page 61: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-61

Pro

pu

esto

s

5) Plywood, Inc., reportó estas ganancias sobre el capital accionario durante los últimos 5 años: 4.3, 4.9, 7.2, 6.7 y 11.6. Considere éstos como valores poblacionales.

a. Calcule el rango, la media aritmética, la varianza y la desviación estándar. b. Compare las ganancias sobre el capital accionario de Plywood, Inc. con aquellas de Den nis Industries que mencionamos en el Ejercicio 40.

6) Los ingresos anuales de los cinco vicepresidentes de TMV Industries son: $125 000; $128 000; $122 000; $133 000, y $140 000. Considere este grupo como una población. a. ¿Cuál es el rango? b. ¿Cuál es el ingreso medio aritmético? c. ¿Cuál es la varianza de la población? ¿La desviación

estándar? d. También se estudiaron los ingresos anuales de los

funcionarios de otra empresa similar a TMV Industries. La media fue $129 000 y la desviación estándar $8 612. Compare las medias y las dispersiones de ambas compañías.

De

svia

ció

n E

stá

nd

ar d

e la

Po

bla

ció

n

Page 62: Sesion (2013) Medidas de TC

Coeficiente de Variación

Medida relativa de variación

Se expresa en porcentaje (%)

Muestra la variación en unidades de media

Se utiliza para comparar 2 ó mas conjuntos de datos

medidos en métricas diferentes o diferentes unidades de

medida.

100%S

CVX

Chap 3-62 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 63: Sesion (2013) Medidas de TC

Ejemplo (cotización del dólar)

Año Mes

Perú

(soles)

Chile

(pesos)

Enero 3.401 524

Febrero 3.289 526

Marzo 3.335 529

Abril 3.334 517

Mayo 3.280 521

Junio 3.261 542

Julio 3.244 541

Agosto 3.231 539

Septiembre 3.242 539

Octubre 3.236 531

Noviembre 3.218 528

2006

Diciembre 3.209 528

Enero 3.193 541 2007

Febrero 3.192 547

Chap 3-63 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 64: Sesion (2013) Medidas de TC

Ejemplo (cotización del dólar)

Año Mes

Perú

(soles)

Chile

(pesos)

Enero 3.401 524

Febrero 3.289 526

Marzo 3.335 529

Abril 3.334 517

Mayo 3.280 521

Junio 3.261 542

Julio 3.244 541

Agosto 3.231 539

Septiembre 3.242 539

Octubre 3.236 531

Noviembre 3.218 528

2006

Diciembre 3.209 528

Enero 3.193 541 2007

Febrero 3.192 547

PerúX =3.26soles

S Peru = 0.061soles

CVPerú = (0.061/3.262)x 100= 1.9%

=532.29 pesos

SChile = 9.044 pesos

CVChile= (9.044/532.288)x 100= 1.7%

ChileX

Chap 3-64 © 2013 Ing. José Luis Tupac Yupanqui A.

Page 65: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-65

Ejemplo de Variación

A. RESIDUOS SÓLIDOS

5.1 MUNICIPALIDADES QUE INFORMARON SOBRE LA CANTIDAD PROMEDIO DIARIO DE BASURA RECOLECTADA,

SEGÚN DEPARTAMENTO, 2010

(Toneladas métricas)

Departamento

Munici-

palidades

informantes

Total 1,834

Amazonas 84

Áncash 166

Apurímac 80

Arequipa 109

Ayacucho 111

Cajamarca 127

Callao 1/ 6

Cusco 108

Huancavelica 94

Huánuco 76

Ica 43

Junín 123

La Libertad 83

Lambayeque 38

Lima 171

Loreto 51

Madre de Dios 11

Moquegua 20

Pasco 28

Piura 64

Puno 109

San Martín 77

Tacna 27

Tumbes 13

Ucayali 15

Lima Metropolitana 2/ 49

Región Lima 3/ 128

Page 66: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-66

Medidas de Variación

Varianza Desviación

Estándar

Coeficiente de

Variación

Rango

Rango Intercuartil

Ejemplo de Variación

Page 67: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-67

Medidas de Variación

Varianza Desviación

Estándar

Coeficiente de

Variación

Rango

Rango Intercuartil

Ejemplo de Variación

Page 68: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-68

Medidas de Variación

Varianza Desviación

Estándar

Coeficiente de

Variación

Rango

Rango Intercuartil

Ejemplo de Variación

Page 69: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-69

Medidas de Variación

Varianza Desviación

Estándar

Coeficiente de

Variación

Rango

Rango Intercuartil

Ejemplo de Variación

Page 70: Sesion (2013) Medidas de TC

© 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-70

Medidas de Variación

Varianza Desviación

Estándar

Coeficiente de

Variación

Rango

Rango Intercuartil

Ejemplo de Variación

Page 71: Sesion (2013) Medidas de TC

Relación entre Media, Mediana y Moda

Media = Mediana =Moda Media < Mediana < Moda Moda < Mediana < Media

Asimétrica a la derecha

Asimétrica a la

izquierda Simétrica

En general, para la mayoría de las distribuciones se cumple:

Chap 3-71 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 72: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-72

TEOREMA DE CHEBYSHEV

•En las secciones anteriores hemos estudiado medidas de tendencia central (media, moda y mediana), y medidas de dispersión (varianza y desviación estándar). •También estudiamos el grado de asimetría (sesgo) de una distribución y su curtosis (altura). •Es decir, ya podemos describir, en términos generales, el comportamiento de un conjunto de valores que estemos estudiando.

Page 73: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-73

TEOREMA DE CHEBYSHEV

•Retomando el concepto de desviación estándar, diremos que una de las aplicaciones que tiene es que podemos utilizarlo para conocer aproximadamente cuántas de las puntuaciones se agrupan en ciertos intervalos de la serie formados por la suma y la resta de una, dos o tres veces el valor de la desviación estándar con respecto al valor medio. •Para esto es que estudiaremos el Teorema de Tchebyshev.

Page 74: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-74

TEOREMA DE CHEBYSHEV

Ya señalamos que una desviación estándar baja para un conjunto de valores indica que éstos se localizan cerca de la media. Por el contrario, una desviación estándar muy alta revela que las observaciones se encuentran dispersas en relación con la media. El matemático ruso P. L. Chebyshev (1821 -1894) desarrolló un teorema que nos permite determinar la proporción mínima de los valores que se encuentran en un número específico de desviaciones estándar de la media. Por ejemplo, según el teorema de Chebyshev, por lo menos tres de cuatro valores, o 75%, deben estar entre la media más dos desviaciones estándar y la media menos dos desviaciones estándar. Esta relación se aplica sin importar la forma de la distribución.

Además, por lo menos ocho de nueve valores, u 88.9%, estarán entre más tres desviaciones estándar y menos tres desviaciones estándar de la media. Por lo menos 24 de 25 valores, o 96%, estarán entre más y menos cinco desviaciones estándar de la media. El teorema de Chebyshev establece:

Page 75: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-75

Para cualquier grupo de observaciones (muestra o

población), la proporción de los valores que se encuentra dentro de k desviaciones estándar de la media es por lo menos donde k es cualquier

constante mayor que 1.

Page 76: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-76

TEOREMA DE CHEBYSHEV

Aunque el Teorema de Tchebyshev es de naturaleza general y se puede aplicar a cualquier clase de distribución de valores, si los datos fueran simétricos y acampañados, es decir, de tipo normal, exactamente 68.26% de todas las observaciones estarían contenidas dentro de distancias de ±1 desviación estándar alrededor de la media, mientras que 95.44, 99.73 y 99.99% de las observaciones estarían incluidas, respectivamente, dentro de distancias de ±2, ±3, ±4 desviaciones estándar alrededor de la media; gráficamente se ve de la siguiente forma:

Page 77: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-77

Los resultados del porcentaje de puntuaciones que se concentran en torno a la media, para cualquier tipo de distribución y para distribuciones de tipo normal los podemos resumir en la siguiente tabla:

Page 78: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-78

Page 79: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-79

Ejercicio 1

Page 80: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-80

TEOREMA DE CHEBYSHEV

La cantidad media aritmética quincenal con la que contribuyen los empleados de Dupree Paint al plan de participación de utilidades de la compañía fue $51.54 y la desviación estándar es $7.51. ¿Qué porcentaje de las contribuciones se encuentra entre más 3.5 desviaciones estándar y menos 3.5 desviaciones estándar de la media?

1001

12

xR

=

Alrededor de 92%

Page 81: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-81

Page 82: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-82

Estado Viviendas Estado Viviendas Estado Viviendas Estado Viviendas Estado Viviendas

AL 17,2 HI 7,3 MA 39,2 NM 11,8 SD 2,5

AK 4,0 ID 4,3 MI 37,6 NY 61,9 TN 38,1

AZ 71,8 IL 38,7 MN 28,6 NC 70,7 TX 143,1

AR 9,9 IN 23,0 MS 8,8 ND 2,6 UT 16,5

CA 271,4 IA 5,2 MO 27,2 OH 33,0 VT 4,1

CO 32,8 KS 13,3 MT 2,0 OK 10,7 VA 64,1

CT 24,5 KY 13,8 NE 5,0 OR 11,3 WA 35,5

DE 4,6 LA 18,8 NV 14,0 PA 43,6 WV 1,5

FL 202,6 ME 8,1 NH 17,8 RI 5,4 WI 20,2

GA 73,1 MD 42,1 NJ 55,0 SC 32,8 WY 1,2

(a) Datos básicos (Viviendas comenzadas a construir, en miles)

Page 83: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-83

(a) Datos básicos (Viviendas comenzadas a construir, en miles)

Page 84: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-84

(a) Datos básicos (Viviendas comenzadas a construir, en miles)

•Con el Teorema de ChebyShev encontramos el porcentaje de valores que debe caer dentro de R=2 y R=3 desviaciones estándar de la media.

•Por Ejemplo, si R=2, este porcentaje debe ser 75%, expresado de otro modo, debemos encontrar que al menos el 75% de los estados tienen una cantidad de viviendas comenzadas a construir que cae en el intervalo descrito como 34.9+-2(49.3).

Page 85: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-85

El Teorema de ChebyShev afirma que al menos [1-(1/k2)]*100% de los valores de los datos caerán dentro de K desviaciones estándar de la media (Cuando K es mayor que 1 y para cualquier forma de la Distribución). Para los datos de vivienda s comenzadas a construir en 50 estados , el porcentaje de estados dentro de cada intervalo excede por mucho el porcentaje mínimo especificado por el teorema.

Page 86: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-86

Page 87: Sesion (2013) Medidas de TC

Diagrama de Caja

Para su construcción se usan 5 estadísticas: Mínimo, Máximo, Q1, Q2 = Mediana y Q3

4 6 8 10 12

X max X

min 1Q 3Q2Q

Chap 3-87 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 88: Sesion (2013) Medidas de TC

Forma de la Distribución y Diagrama de Caja

Asimétrica a la derecha Asimétrica a la izquierda Simétrica

1Q 1Q 1Q2Q 2Q 2Q3Q3Q3Q

Chap 3-88 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 89: Sesion (2013) Medidas de TC

Cuidados en el análisis descriptivo de los datos y problemas éticos

El análisis de los datos es objetivo

Por lo tanto deben reportarse las medidas resumen que mejor

reflejen las características de los datos

La interpretación es Subjetiva

Ella debe ser hecha de una manera clara, imparcial y simple

Problemas éticos

Deben documentarse tanto los resultados buenos como los malos

La presentación debe ser imparcial, objetiva y clara

Los resultados no deben utilizarse inadecuadamente,

distorsionando los hechos

Chap 3-89 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 90: Sesion (2013) Medidas de TC

30/04/2013 © 2013 Ing. José Luis Tupac Yupanqui A. Chap 3-90

PERU: TASAS DE CRECIMIENTO GEOMETRICO MEDIO ANUAL SEGUN DEPARTAMENTOS, 1995-2015

Fuente: http://www.inei.gob.pe/biblioineipub/bancopub/Est/Lib0005/CAP-52.htm

Page 91: Sesion (2013) Medidas de TC

Resumen

Además de resumirse mediante tablas de distribución de

frecuencias y representarse gráficamente, los datos

originales se pueden describir en forma estadística a

través de medidas de tendencia central y de dispersión.

Chap 3-91 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013

Page 92: Sesion (2013) Medidas de TC

Control de Lectura Nº 02

Copias. Pág. 70 a la Pág. 90 Introducción a la Estadística para Negocios

Quinta Edición, Ronald M. Weiers

Chap 3-92 © 2013 Ing. José Luis Tupac Yupanqui A. 30/04/2013