Estadistica distribucion_de_frecuencias

35
Distribuciones de Frecuencias 1. Agrupación de datos 2. Frecuencias y distribuciones

Transcript of Estadistica distribucion_de_frecuencias

Distribuciones de

Frecuencias

1. Agrupación de datos

2. Frecuencias y distribuciones

Distribución de frecuencias

Cuando se realiza una investigación se obtiene

un conglomerado de datos que deben ser

organizados en un orden, arreglo o secuencia

lógica.

Al ordenarse y clasificarse los datos

obtenidos, se realiza una “distribución de

frecuencias”.

Datos crudos (sin agrupar)

Hombre, mujer, mujer, mujer, hombre, hombre, mujer, mujer,

hombre, hombre, hombre, hombre, hombre, mujer, mujer,

hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer,

mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre,

hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer,

mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre,

mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer,

mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer,

mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre,

hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer,

mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre,

mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer,

mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer,

mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre,

hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer,

mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre,

mujer, mujer, hombre, hombre, hombre, hombre, hombre

Raw Data

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25,

21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31,

35, 22, 32, 21, 32, 25, 34, 33, 24, 25, 36, 34, 24, 33, 26, 23, 35, 32,

23, 24, 31, 24, 35, 34, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29,

32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 32, 25, 34,

33, 24, 25, 36, 34, 24, 33, 26, 23, 35, 32, 23, 24, 31, 24, 35, 34, 36,

27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21,

27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35,

22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22,

23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22,

35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,

26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26,

26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27,

31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29,

32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21

Datos crudos (sin agrupar)

Ordenación de los datos

Es una colocación de los datos numéricos en orden de mayor a menor (o viceversa). La diferencia entre el mayor y el menor de los números se llama “rango” o “recorrido” de datos.

Cualitativos Orden alfabético

Escribir, primero el que más se repite, luego el que sigue y así sucesivamente

Cuantitativos Forma creciente (menor al mayor)

Forma decreciente (mayor al menor)

Ordenación de datos

Crudos:

Hombre, mujer, mujer, mujer, hombre, hombre,

mujer, mujer, hombre, hombre, hombre,

hombre, hombre, mujer, mujer, hombre,

hombre, mujer, mujer, hombre

Ordenados:

hombre, hombre, hombre, hombre, hombre,

hombre, hombre, hombre, hombre, hombre,

hombre, mujer, mujer, mujer, mujer, mujer,

mujer, mujer, mujer, mujer

Ordenación de datos

Crudos:

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,

26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25,

33, 23, 29, 32, 23

Ordenados:

21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27,

27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36,

36, 36, 38, 39, 39

Agrupación de datos

Cuando la muestra es de menos de 20,

entonces estos datos son analizados sin

necesidad de formar clases con ellos y a

esto es a lo que se le llama tratamiento de

datos no agrupados.

Anterior diapositiva.

Datos no agrupados

Edad Frecuencia

21 2

22 1

23 3

24 1

25 2

26 1

27 3

28 1

29 1

31 1

32 1

33 1

35 3

36 3

38 1

39 2

Una tabla

con 16

renglones

¡No es

muy

práctica!

Agrupación de datos

Cuando la muestra consta de 20 o más

datos, lo aconsejable es agrupar los datos

en clases y a partir de éstas determinar

las características de la muestra.

Pasos para

Datos nominales y ordinales

1. Ordenar los datos.

Determinar en qué orden quedarán las categorías.

2. Determinar las frecuencias de cada clase.

3. Determinar la Frecuencia Relativa.

En caso de escala ordinal, se puede obtener Frecuencia Acumulada y Relativa Acumulada.

La frecuencia puede ser

absoluta (f), número que indica la cantidad de

veces que la variable toma un cierto valor, o

relativa (fr), división entre la frecuencia

absoluta y el número total de observaciones

Datos agrupados (nominal)

Género FrecuenciaFrecuencia

Relativa

Hombre 11 0.52

Mujer 10 0.48

Datos agrupados (ordinal)

Escolarid

adF Fr

Frecuencia

Acumulada

Primaria 15 0.41 15

Secundaria 12 0.32 27

Preparatoria 10 0.27 37

Ejemplo:

Datos:• Nominal: Hombres y mujeres en el salón.

• Ordinal: Nivel de acuerdo con “escuelas de tiempo

completo” (De acuerdo, Indeciso/a, Desacuerdo).

Ordenar datos

Frecuencia absoluta

Frecuencia Relativa Ordinal: Frecuencia Acumulada y Relativa Acumulada

Armar tabla.

Agrupación de datos

Datos cuantitativos

Deben formarse clases de igual tamaño (tamaño de clase: C)

Recomendación: El total de grupos o clases no debe ser menor a 5 ni mayor a 15 (ó 20).

Frecuencias y distribuciones

La distribución de frecuencias simple es una

tabla que se construye con base en los

siguientes datos: clase o variable (valores

numéricos) en orden descendente o

ascendente, marcas de clase y frecuencia.

Clase Marca de clase Frecuencia

0-2 1 5

3-5 4 3

6-8 7 2

9-11 10 4

Frecuencias y distribuciones

¿Por qué del 2 se va al 3?

¿Por qué no inicia el renglón dos, con el número

2?

Clase Marca de clase Frecuencia

0-2 1 5

3-5 3 3

6-8 5 2

9-11 7 4

¿Cuando NO necesitamos

armar “clases”?

Ordenación de datos

Crudos:

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,

26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25,

33, 23, 29, 32, 23

Ordenados:

21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27,

27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36,

36, 36, 38, 39, 39

¿Cómo armar una distribución de frecuencias de estos datos?

Pasos para

Datos cuantitativos

2c < n. -------- Ejemplo: n = 15

• 21 = 2 ----------------------- ¿ 2 < 15 ? Si

• 22 = 2x2 = 4 --------------- ¿ 4 < 15 ? Si

• 23 = 2x2x2 = 8 ------------ ¿ 8 < 15 ? Si

• 24 = 2x2x2x2 = 16 ------- ¿ 16 < 15 ? No!

• Por lo tanto, C = 3

Nota: los dos métodos pueden dar distintos

resultados.

Regla: 2c < n, por lo general dará un resultado

menor. Usarlo cuando n > 50

Pasos para

Datos cuantitativos

Pasos para

Datos cuantitativos

Pasos para

Datos cuantitativos

No.

ClaseLímites Límites reales

Marca

de clase

(X)F FA Fr FrA

1 1 – 3 0.5 – 3.5 2 4 4 0.333 0.333

2 4 – 6 3.5 – 6.5 5 6 10 0.50 0.833

3 7 – 9 6.5 – 9.5 8 2 12 0.166 1

Frecuencias

Frecuencias

Acumuladas

Frecuencias

Relativas

Frecuencias

Relativas

Acumuladas

Inferior

Superior

Total de

datos (n)

Ejemplo

Ordenar datos

Crudos:

36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24,

26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25,

33, 23, 29, 32, 23

Ordenados:

21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27,

27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36,

36, 36, 38, 39, 39

No.

Clas

eLímites

Límites

reales

Marca

de

clase

(X)

F FA Fr FrA

1 21-24 20.5-24.5 22.5 7 7 0.26 0.26

2 25-28 24.5-28.5 26.5 7 14 0.26 0.52

3 29-32 28.5-32.5 30.5 3 17 0.11 0.63

4 33-36 32.5-36.5 34.5 7 24 0.26 0.89

5 37-40 36.5-40.5 38.5 3 27 0.11 1.00

Usando método 1 (para la cantidad de clases, raíz de n)

No.

Clas

eLímites

Límites

reales

Marca

de

clase

(X)

F FA Fr FrA

1 21-25 20.5-25.5 23 9 9 0.33 0.33

2 26-30 25.5-30.5 28 6 15 0.22 0.56

3 31-35 30.5-35.5 33 6 21 0.22 0.78

4 36-40 35.5-40.5 38 6 27 0.22 1.00

Usando método 2 (para la cantidad de clases, 2c < n)

Ejercicio: Cantidad de horas de

estudio a la semanaCrudos:

6, 5, 3, 1, 8, 5, 12, 10, 1, 2, 3, 2, 4, 2, 4, 6,

3, 2, 5, 4

Ordenados:

1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6,

8, 10, 12

No.

Clas

eLímites

Límites

reales

Marca

de

clase

(X)

F FA Fr FrA

1 1 – 3 0.5 – 3.5 2 9 9 0.45 0.45

2 4 – 6 3.5 – 6.5 5 8 17 0.40 0.85

3 7 – 9 6.5 – 9.5 8 1 18 0.05 0.90

4 10 – 12 9.5 – 12.5 11 2 20 0.10 1.00

Usando métodos 1 y 2 (para la cantidad de clases)

Otros ejercicios en el salón

Datos:

Cantidad de personas que viven en la misma

casa.

Cantidad de horas que pasa en la

computadora a la semana.

Aplicar pasos.

Hoja de ejercicios

Conceptos 1/3

Clase: cada renglón de una distribución de frecuencia, es un grupo de datos.

Intervalo: rango de datos incluido en cada clase.

Límites de clase, superior e inferior: límites extremos de cada clase.

Límites Reales de clase (o fronteras de clase): se obtienen sumando el límite superior de un intervalo de clase con el límite inferior de la clase siguiente y dividiéndolos entre dos.

Marca de clase: punto medio de cada clase y se obtiene sumando los límites de clase y dividiéndolos entre dos.

Conceptos 2/3

Tamaño de clase: la diferencia entre los límites reales de clase,

ó

la diferencia entre los límites de clase más una unidad (la misma que se esté trabajando) ó

la diferencia entre las marcas de clase.

Frecuencias acumuladas.- la suma de cada frecuencia con la frecuencia de todas las clases superiores.

Conceptos 3/3

Frecuencias relativas: Dividiendo cada frecuencia entre el número total de observaciones (o multiplicándolas por 100 para tenerlas en forma de porcentaje).

Frecuencias relativas acumuladas: La suma de cada frecuencia relativa con las frecuencias relativas de todas las clases superiores. También se pueden obtener dividiendo cada

frecuencia acumulada entre el total de frecuencias por 100.

Rango: Dato más alto menos dato más bajo.

Distribución de frecuencias.