Estadstica descriptiva-1230745228674108-2

35
ESTAD ESTAD Í Í STICA STICA DESCRIPTIVA DESCRIPTIVA Jose Gonzales Villanueva Jose Gonzales Villanueva Profesor de Matem Profesor de Matem á á tica tica [email protected] [email protected] www.mate www.mate - - clavero.blogspot.com clavero.blogspot.com LICEO NAVAL CAPIT LICEO NAVAL CAPIT Á Á N DE CORBETA N DE CORBETA MANUEL CLAVERO MANUEL CLAVERO

Transcript of Estadstica descriptiva-1230745228674108-2

Page 1: Estadstica descriptiva-1230745228674108-2

ESTADESTADÍÍSTICA STICA DESCRIPTIVADESCRIPTIVAJose Gonzales VillanuevaJose Gonzales VillanuevaProfesor de MatemProfesor de Matemááticatica

[email protected][email protected]

www.matewww.mate--clavero.blogspot.comclavero.blogspot.com

LICEO NAVAL CAPITLICEO NAVAL CAPITÁÁN DE CORBETA N DE CORBETA MANUEL CLAVEROMANUEL CLAVERO

Page 2: Estadstica descriptiva-1230745228674108-2

¿¿Por quPor quéé hay que conocer la hay que conocer la EstadEstadíística y quistica y quiéénes la utilizan?nes la utilizan?

• Está presente en todas las áreas del saber humano. Lo utilizan médicos, banqueros, deportistas, amas de casa.

• Es una herramienta fundamental en la investigación.

• Permite realizar una buena toma de decisiones.

Page 3: Estadstica descriptiva-1230745228674108-2

DefiniciDefinicióónn• La Estadística es una ciencia con base

matemática que utiliza instrumentos para recoger datos, presentarlos, ordenarlos y analizarlos para obtener información útil que permita inferir conclusiones y garantice una buena toma de decisiones.

Page 4: Estadstica descriptiva-1230745228674108-2

SubdivisiSubdivisióón de la Estadn de la Estadíísticastica

ESTADÍSTICA

ESTADÍSTICADESCRIPTIVA

ESTADÍSTICAINFERENCIA

TEORÍA DEDECISIONES

Page 5: Estadstica descriptiva-1230745228674108-2

TTéérminos usados en rminos usados en EstadEstadíísticastica

Page 6: Estadstica descriptiva-1230745228674108-2

OrganizaciOrganizacióón y Presentacin y Presentacióón n de datosde datos

• Cuando se realiza la recopilación , se obtiene una gran cantidad de datos.

DATOS

•Clasificados

•Ordenados

•Presentados

deben

ser

•Comprensión

•Descripción

•Análisis

Tablas

y

Gráficos

para

facilitar

en

Page 7: Estadstica descriptiva-1230745228674108-2

PresentaciPresentacióón de datos n de datos no agrupadosno agrupados

• Ejemplo 1: Los sueldos mensuales de 60 empleados de la empresa Metro de Ventanilla, son los siguientes

450580634364470660471501530450

382645507625480518380462500574

340

430

650

560

460

537

376

587

607

600

560

400

492

428

526

393

67

432

500

466

512382560558440

591550409618570

528321470407453

565424613335440

Datos no agrupados

Page 8: Estadstica descriptiva-1230745228674108-2

32h

35G

31F

30E

36D

32C

34B

30A

Nº de alumnos

Sección

• Ejemplo 2: Número de alumnos de tercer grado de secundaria matriculados el presente año 2008 en cada sección

Datos agrupados en una tabla sin intervalos

PresentaciPresentacióón de datos n de datos agrupadosagrupados

Page 9: Estadstica descriptiva-1230745228674108-2

15[1,90 - 2,00>

14[1,80 - 1,90>

15[1,70 - 1,80>

15[1,60 - 1,70>

16[1,50 - 1,60>

18[1,40 - 1,50>

14[1,30 - 1,40>

15[1,20 - 1,30>

15[1,10 - 1,20>

13[1,00 - 1,10>

FrecuenciaEstatura (cm.)

• Ejemplo 3: Distribución de 150 habitantes de la unidad vecinal Santa Rosa según estatura

Datos agrupados en una tabla con intervalos

PresentaciPresentacióón de datos n de datos agrupadosagrupados

Page 10: Estadstica descriptiva-1230745228674108-2

ConstrucciConstruccióón de una n de una distribucidistribucióón de frecuenciasn de frecuencias

1. Nos fijamos en el número de datos (n)

2. Buscamos el dato mínimo y máximo y calculamos el rango (r)

r = máx. - mín.

3. Determinamos el número de intervalos (m) m = 1 + 3,3 log(n)

4. Verificamos la amplitud del intervalo (c)c = r/m

Page 11: Estadstica descriptiva-1230745228674108-2

• Ejemplo 4: La siguiente tabla muestra los gastos semanales de 80 trabajadores de una compañía agrupados en intervalos

ConstrucciConstruccióón de una n de una distribucidistribucióón de frecuenciasn de frecuencias

100180Total

1006.2510.0625805650[700 - 800>

93.7522.50.93750.2257518550[500 - 600>

71.2521.250.71250.21255717450[400 - 500>

50350.50.354028350[300 - 400>

158.750.150.0875127250[200 - 300>

6.256.250.06250.062555150[100 -200>

Hi x 100%hi x 100%HihiFifixi[Li - Ls>

Frecuencia relativa

acumulada porcentual

Frecuencia relativa

porcentual

Frecuencia relativa

acumulada

Frecuencia relativa

Frecuencia absoluta

acumulada

Frecuencia absoluta

Marca de clase Intervalos

Page 12: Estadstica descriptiva-1230745228674108-2

GrGrááficos Estadficos EstadíísticossticosHistograma Polígono

Pastel Barras

Page 13: Estadstica descriptiva-1230745228674108-2

ReducciReduccióón de Datosn de DatosMedidas deMedidas deResumenResumen

De Posición o

Tendencia Central

De Dispersión o

Variabilidad

De Deformacióno

Asimetría

Rango

Varianza

Desviación Estándar

De Apuntamientoo

Kurtosis

Media

Mediana

Moda

Simetría

Asimetría Positiva

Asimetría Negativa

Platikúrtica

Mesokúrtica

Leptokúrtica

Page 14: Estadstica descriptiva-1230745228674108-2

¡¡¡¡¡¡ Ganaste un viaje !!!Ganaste un viaje !!!

Playa BávaroPunta Cana

República Dominicana

Playa Tambor Punta ArenasCosta Rica

Page 15: Estadstica descriptiva-1230745228674108-2

GrGrááfico de temperaturas fico de temperaturas registradas el aregistradas el añño 2008o 2008

152230333535302530222420Playa Bavaro

101525203538323025202015Playa Tambor

DicNovOctSepAgoJulJunMayAbrMarFebEne

0

5

10

15

20

25

30

35

40

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

Tem

pera

tura

(ºC

)

Playa Tambor Playa Bavaro

Page 16: Estadstica descriptiva-1230745228674108-2

Surge la preguntaSurge la pregunta

¿Qué playa es más calurosa?

Page 17: Estadstica descriptiva-1230745228674108-2

NNºº de personas que visitan mensualmente de personas que visitan mensualmente el Parque de las Leyendasel Parque de las Leyendas

142510Noviembre154757Mayo

254611Setiembre102435Marzo

245615Agosto187234Febrero

132534Diciembre243518Junio

182568Octubre123543Abril

325415Julio154250Enero

Nº de personas

MesNº de personas

Mes

Page 18: Estadstica descriptiva-1230745228674108-2

Medidas de PosiciMedidas de Posicióón o n o Tendencia CentralTendencia Central

• Son valores numéricos en torno a los cuales se agrupan los valores de una variable estadística.

Page 19: Estadstica descriptiva-1230745228674108-2

La Media (X)La Media (X)

el valor de la variable que indicael promedio de todos los datos

trabajados

PARA DATOS NO AGRUPADOS

PARA DATOSAGRUPADOS

nXXX

n

XX n21

n

1ii +++==

∑= ...

es

Se calcula

nf Xf Xf X

n

f XX nn2211

n

1iii +++==

∑= ...

Donde:n : es el número de datos trabajadosX1,X2,…: En los Datos No Agrupados son los valores de la variable y en los

Datos Agrupados son la marca de clase del intervalo 1, intervalo 2, …f : es la frecuencia absoluta.

Page 20: Estadstica descriptiva-1230745228674108-2

Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados

Sean los puntajes obtenidos en 5 exámenes de Aritmética:

15 ; 12 ; 13 ; 15 ; 20Determinar la nota media

155

752015131215 ==++++=5

X

Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados

Dada la siguiente tabla de distribución de frecuencias, calcular la media aritmética

134625

37057478-70

26446670-62

17435862-54

15035054-46

25264246-38

13643438-30

xi x fifixiLs>-[Li

84,5325

1346 ==X

Page 21: Estadstica descriptiva-1230745228674108-2

Donde:Li : es el límite inferior del intervalo medianon : es el número de datos trabajadosF : es la frecuencia absoluta acumulada del intervalo anterior al intervalo

medianof : es la frecuencia absoluta del intervalo medianoC : es el tamaño de la amplitud del intervalo

La Mediana (Me)La Mediana (Me)

el valor de la variable que divideal total de observaciones en dos

partes de igual tamaño

PARA DATOS NO AGRUPADOS

PARA DATOSAGRUPADOS

Ordenando de menor a mayor y eligiendo el central. Si no hubiese un dato central, entonces será igual a la media de los dos

valores centralesC

f

F 2

n

L Me i ×

−+=

es

Se calcula

Page 22: Estadstica descriptiva-1230745228674108-2

Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados

Sean los puntajes obtenidos en 5 exámenes de Aritmética:

15 ; 12 ; 13 ; 15 ; 20Determinar la mediana

Ordenar datos:

12 ; 13 ; 15 ; 15 ; 20

Me = 15 25

2557478-70

2046670-62

1635862-54

1335054-46

1064246-38

443438-30

FifixiLs>-[Li

Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados

Dada la siguiente tabla de distribución de frecuencias, calcular la mediana

10

46

12.5

F =

Li =

n / 2 =

52.67Me =

8C =

3f =

Datos

Page 23: Estadstica descriptiva-1230745228674108-2

Donde:Li : es el límite inferior del intervalo modald1 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)

del intervalo inmediato anterior.d2 : es la diferencia de la frecuencia (fi) del intervalo modal y la frecuencia (fi)

del intervalo inmediato posterior.C : es el tamaño de la amplitud del intervalo

La Moda (La Moda (MoMo))

el dato que más se repite o la mayor frecuencia de un

conjunto de datos

PARA DATOS NO AGRUPADOS

PARA DATOSAGRUPADOS

Se toma el dato que más se repiteSi fuesen dos valores diferentes,se habla de bimodal, de ser tres,

sería trimodal

C d d

d L Mo

21

1i ×

++=

es

Se calcula

Page 24: Estadstica descriptiva-1230745228674108-2

Ejemplo 1Ejemplo 1Para Datos No AgrupadosPara Datos No Agrupados

Sean los puntajes obtenidos en 5 exámenes de Aritmética:

15 ; 12 ; 13 ; 15 ; 20Determinar la moda

Conteo:

12 � 1 vez13 � 1 vez15 � 2 veces20 � 1 vez

Mo = 15

25

57478-70

46670-62

35862-54

35054-46

64246-38

43438-30

fixiLs>-[Li

Ejemplo 2Ejemplo 2Para Datos AgrupadosPara Datos Agrupados

Dada la siguiente tabla de distribución de frecuencias, calcular la mediana

3d2 =3fi+1 =

8

4

6

C =

fi-1 =

fMo =

41.20Mo =

2d1 =

38Li =

Datos

Page 25: Estadstica descriptiva-1230745228674108-2

COMPARACICOMPARACIÓÓN DE MEDIA, N DE MEDIA, MEDIANA Y MODAMEDIANA Y MODA

Pueden haber muchas modas o ninguna

Requiere de un ordenamiento previo de datos que sería difícil sin un ordenador

Se ve influenciada por los valores extremos

Desventajas

Es la que más fácilmente se determina, puesto que la podemos obtener por inspección

Cuando la distribución es casi simétrica se puede utilizar:Moda = 3Me- 2X

No toma en cuenta los valores extremos

Es útil cuando la tabla de frecuencias no presenta los valores del extremo inferior del 1er intervalo y del extremo superior del ultimo intervalo

Toma en cuenta todos los valores de la variable

Es fácil de interpretarVentajas

ModaMedianaMedia

Page 26: Estadstica descriptiva-1230745228674108-2

Ejemplo Demostrativo 1Ejemplo Demostrativo 1Usando la hoja de calculo de Excel halle las tres MTC estudiadas para los siguientes datos:

12, 141, 11, 14, 12, 10, 10, 12, 11, 14

121224,7ModaMedianaMedia

Vemos que:La media se ve afectada por el valor extremo 141.

Page 27: Estadstica descriptiva-1230745228674108-2

Ejemplo Demostrativo 2Ejemplo Demostrativo 2Usando la hoja de calculo de Excel halle las tres MTC estudiadas para los siguientes datos:

12, 15, 11, 14, 13, 10, 20, 17

amodal13,514ModaMedianaMedia

Vemos que:Al no haber ningún valor que se repita, no hay moda , por lo tanto el sistema es amodal

Page 28: Estadstica descriptiva-1230745228674108-2

Posiciones relativas de la Posiciones relativas de la Media, la Mediana y la Moda. Media, la Mediana y la Moda.

En casos en que la distribución de frecuencias es poco asimétrica se cumple la siguiente relación empírica

Media – Moda = 3(media- mediana)

De acuerdo a la simetría o asimetría de la distribución de frecuencias se cumple lo siguiente

Page 29: Estadstica descriptiva-1230745228674108-2

EjemploEjemplo

Page 30: Estadstica descriptiva-1230745228674108-2

Ejemplo demostrativo 1Ejemplo demostrativo 1En un estudio sobre comprensión de lectura en inglés hecho a 100 personas la menor nota fue de 40 puntos y la mayor, de 180. Para la distribución de frecuencias se usaron siete intervalos de igual longitud y las frecuencias de los intervalos fueron respectivamente: 19, 20, 25, 15, 10, 6 y 5.

1.Construye la distribución de frecuencias con sus intervalos, marcas de clase y frecuencias.2.Calcula la media, la mediana y la moda de las notas3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana y la moda

Page 31: Estadstica descriptiva-1230745228674108-2

1. Distribuci1. Distribucióón de frecuenciasn de frecuencias

8910.000.890.108910130140-1205

7915.000.790.157915110120-1004

6425.000.640.25642590100-803

100.001.00100

1005.001.000.051005170180-1607

956.000.950.06956150160-1406

3920.000.390.2039207080-602

1919.000.190.1919195060-401

Hi x 100%hi x 100%HihiFifixiLs>-[LiNº

Frecuencia relativa

acumulada porcentual

Frecuencia relativa

porcentual

Frecuencia relativa

acumulada

Frecuencia relativa

Frecuencia absoluta

acumulada

Frecuencia absoluta

Marca de clase Intervalos 7

Page 32: Estadstica descriptiva-1230745228674108-2

2. Medidas de tendencia central2. Medidas de tendencia central

9300

850

900

1300

1650

2250

1400

950

xi x fi

20C =

25f =

39F =

80Li =

50n / 2 =

Datos

20C =

80Li =

10d2 =

5d1 =

15fi+1 =

20fi-1 =

25fMo =

Datos

93S / n =

Media (x)

88.80Me =

Mediana (Me)

86.67Mo =

Moda (Mo)

Page 33: Estadstica descriptiva-1230745228674108-2

3. Histograma3. Histograma

Page 34: Estadstica descriptiva-1230745228674108-2

Ahora tuAhora tuLos gastos semanales de 65 amas de casa oscilan entre 60 y 300 soles. Agrupando los datos en 8 intervalos de igual amplitud se tienen las siguientes frecuencias: 2, 3, 5, 7, 12, 15, 13, 8

1.Construye la distribución de frecuencias con sus intervalos, marcas de clase y frecuencias.2.Calcula la media, la mediana y la moda de las notas3.Dibuja el HISTOGRAMA y ubica en él la media, la mediana y la moda

Page 35: Estadstica descriptiva-1230745228674108-2

FFáábula bula El El ááguila y guila y las gallinaslas gallinas