Estadistica descriptiva
-
Upload
luis-eduardo-gomez-aray -
Category
Documents
-
view
27 -
download
2
description
Transcript of Estadistica descriptiva
“Tabulación y Gráficas Estadísticas”
Informe Nro. 02
Sección: Virtual
Realizado Por:
Prof. José Díaz Gómez Aray, Luis E.
C.I Nro. 24.876.436
Maturín, Mayo 2.015
TABULACIÓN Y GRÁFICAS ESTADÍSTICAS
DISTRIBUCIÓN DE FRECUENCIAS
Las distribuciones de frecuencias son tablas en que se dispone las
modalidades de la variable por filas. En las columnas se dispone el número
de ocurrencias por cada valor, porcentajes, etc. La finalidad de las
agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos. Estas pueden ser:
FRECUENCIA ABSOLUTA (fi): Es el número de veces que se repite
un determinado valor de la variable. Se designa por fi.
PROPIEDAD: la suma de todas las frecuencias absolutas es igual al
total de observaciones (n).
FRECUENCIA ACUMULADA (Fi): Las frecuencias acumuladas de una
distribución de frecuencias son aquellas que se obtienen de las sumas
sucesivas de las fi que integran cada una de las filas de una distribución de
frecuencia, esto se logra cuando la acumulación de las frecuencias se realiza
tomando en cuenta la primera fila hasta alcanzar la última. Las frecuencias
acumuladas se designan con las letras Fi.
PROPIEDAD: La última frecuencia acumulada absoluta es igual al total
de observaciones.
FRECUENCIA RELATIVA (hi ó ni): Es aquella que resulta de dividir
cada una de las frecuencias absolutas entre el número total de datos. Las
frecuencias relativas se designan con las letras hi. Se calcula:
PROPIEDAD: la suma de todas las frecuencias relativas es igual a la
unidad.
FRECUENCIA RELATIVA ACUMULADA (Hi): Es aquella que resulta
de dividir cada una de las frecuencias acumuladas entre número total de
datos. Se designa con las letras Hi.
PROPIEDAD: La última frecuencia relativa acumulada es la unidad.
Ejemplo:
El gobierno desea averiguar si el número medio de hijos por familia ha
descendido respecto de la década anterior. Para ello ha encuestado a 50
familias respecto al número de hijos, y ha obtenido los siguientes datos:
0,0,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,3,3,3,
3,4,4,4,4,4,4,5,6.
INTERVALO DE CLASE
Los intervalos de clase se emplean si las variables toman un número
grande de valores o la variable es continua.
Es la semisuma del límite inferior y superior de una clase, tal como lo
indica la siguiente formula:
Ejemplo: Consideremos el siguiente grupo de datos:
18,35,22,41,35,68,30,30,30,46,42,32,30,16,28,35,35,35,44,44,44,39,44,
61,55,32,32,28,28,29,25,25,28,54,53,35,60,35,35,35,34,22,44,17,16,46,46,
27,25,46,47,46,35,39,59,32,32,28,35,27,31,30,32,61,35,54,57,35,56,44,58,
41,42,44,30,40,46,46,50,49,50,36,41,29.
La distribución de frecuencias es:
La reducción de datos mediante el
agrupamiento en frecuencias no facilita su
interpretación: La tabla es demasiado grande. Para
reducir el tamaño de la tabla agrupamos los valores
en intervalos de clase, y las frecuencias son las de
los conjuntos de valores incluidos en dichos
intervalos:
DISTRIBUCIÓN DE FRECUENCIAS RELATIVAS
Una distribución de frecuencia relativa describe los porcentajes del
número total de observaciones correspondiente a cada categoría. Esta no
nos indica cuál es el número de observaciones en cada categoría, sino cuál
es el porcentaje de observaciones en cada categoría.
Ejemplo:
Distribución de frecuencia relativa de matrículas por género en una
escuela primaria:
Porcentaje del total matriculado (1998)
Género hi
Niños 79,7 %
Niñas 20,3 %
DIAGRAMA DE TALLO Y HOJAS
Es un formato para presentar datos cuantitativos de manera gráfica,
que permite obtener simultáneamente una distribución de frecuencias de la
variable y su representación gráfica. Para construirlo basta separar en cada
dato el último dígito de la derecha (que constituye la hoja) del bloque de
cifras restantes (que formará el tallo).
Ejemplo:
La siguiente tabla representa el porcentaje de algodón en un material
utilizado para la fabricación de camisas para caballeros.
Datos del porcentaje de algodón
33.1 35.3 34.2 33.6 33.6 33.1 37.6 33.6
34.5 34.7 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.0 34.7 34.1 34.6 35.9 34.6 34.7
36.3 35.4 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.2 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.8 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.1 34.9 36.4 34.1 33.5 34.5 32.7
32.6 33.6 33.8 34.2 34.6 34.7 35.8 37.8El diagrama de tallos y hojas para los anteriores datos seria el
siguiente:
Diagrama de tallo y hojas de porcentaje de algodón N = 64 Unidad de
hoja = 0.10 (el número 1 después del punto significa que se usa una sola
cifra decimal).
fi Tallo Hojas
6 32 156789
18 33 114566666688
(21) 34 011122355666667777779
25 35 00111234456789
11 36 234888
5 37 13689
POLÍGONO DE FRECUENCIAS
Es un recurso gráfico para ilustrar el comportamiento de los datos. Este
se construye sobre el sistema de coordenadas cartesianas, Se crea a partir
de Histogramas de frecuencia, los histogramas emplean columnas verticales
para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo
los puntos más altos de cada una de las columnas del Histograma.
Ejemplo:
Intervalo fi Fi Xi
El polígono es solo la línea negra que une el centro de cada barra del
histograma. Sólo se ha dejado el histograma para una mayor comprensión
del concepto que se desea ilustrar.
DIFERENCIA ENTRE DATOS AGRUPADOS Y NO AGRUPADOS
Los datos no agrupados son aquellos que no están contabilizados ni
clasificados solamente ordenados.
Los datos agrupados son aquellos que después de un proceso quedan
en forma ordenada, contabilizada y clasificada.
HISTOGRAMA
Un Histograma es la representación gráfica de una tabla de frecuencias.
El histograma puede ser: de frecuencias absolutas, de frecuencias relativas,
de frecuencias absolutas acumuladas y de frecuencias relativas acumuladas.
Más profundamente, el histograma de frecuencias es una
representación visual de los datos en donde se evidencian
fundamentalmente tres características: forma, acumulación o tendencia
posicional y dispersión o variabilidad.
Ejemplo:
OJIVA
La ojiva es la distribución de frecuencias, es decir, que en ella se
permite ver cuántas observaciones se encuentran por encima o debajo de
ciertos valores, en lugar de solo exhibir los números asignados a cada
intervalo. Es una gráfica similar al polígono de frecuencias, pero esta se
obtiene de aplicar parcialmente la misma técnica a una distribución
acumulativa y de igual manera que estas, existen las ojivas “mayor que” y las
ojivas “menor que”.
Existen dos diferencias fundamentales entre las ojivas y los polígonos
de frecuencias (y por esto la aplicación de la técnica es parcial):
Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor
que" sucede con el extremo izquierdo; para la ojiva "menor que", con el
derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan
las fronteras de clase. Para el caso de la ojiva mayor que es la frontera
menor; para la ojiva menor que, la mayor.
Ejemplo: Precios de platos en 50 restaurantes
Intervalo fi Fi
CASOS PRÁCTICOS SOBRE DISTRIBUCIÓN DE FRECUENCIAS
PRÁCTICA
1.- En un paquete de cereal se supone que hay 200 pasas. Una muestra de
60 paquetes producidos ayer mostró los siguientes números de pasas por
paquetes.
200 205 198 197 200 195
193 201 202 199 200 197
198 202 201 200 205 200
203 200 204 205 196 199
196 201 206 191 200 200
202 198 202 199 204 206
200 203 198 202 206 202
196 193 206 205 206 197
203 204 200 207 199 200
201 195 204 199 193 198
Los datos de manera ordenada serían así:
191 193 193 193 195 195
196 196 196 197 197 197
198 198 198 198 198 199
199 199 199 199 200 200
200 200 200 200 200 200
200 200 200 201 201 201
201 202 202 202 202 202
202 203 203 203 204 204
204 204 205 205 205 205
206 206 206 206 206 207
Li = 191; Ls = 207
IC = ATR / K K = 1 + 3.322 log (n)
ATR = Ls – Li + 1; ATR = 207 – 191 + 1 = 17; K = 1 + 3.322log
(60) = 6.90
IC = 17/ 6.90 = 2.5 => 3.
IC Xi fi hi Fi Hi
191 - 193 192 4 0.07 4 0.07
194 – 196 195 5 0.08 9 0.15
197 – 199 198 13 0.22 22 0.37
200 – 202 201 21 0.35 43 0.72
203 – 205 204 11 0.18 54 0.90
206 - 208 207 6 0.1 60 1
HISTOGRAMA (FRECUENCIA RELATIVA)
191-193 194-196 197-199 200-202 203-205 206-2080
0.050.1
0.150.2
0.250.3
0.350.4
Histograma Frecuencia RelativaCantidad de Pasas por Caja de Cereal
Intervalo de Clase
Frec
uenc
ia R
elati
va (h
i)
OJIVA (FRECUENCIA ACUMULADA)
191 - 193 194 – 196 197 – 199 200 – 202 203 – 205 206 - 2080
10203040506070
Ojiva Frecuencia AcumuladaCantidad de Pasas por Caja de Cereal
Intervalo de clase
Frec
uenc
ia A
cum
ulad
a (F
I)
POLÍGONO DE FRECUENCIA
Se pide:
Distribución de frecuencia.
Frecuencia absoluta
Frecuencia relativa.
Frecuencia acumulada.
Frecuencia relativa acumulada.
Represente gráficamente: polígono de frecuencia, Histograma
(frecuencia relativa) y Ojiva (frecuencia acumulada).
http://aldanalisis.blogspot.com/2014/02/distribucion-y-tablas-de-
frecuencia.html
http://www.estadisticaparatodos.es/taller/graficas/tallos_hojas.html
http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/
cont_113_13.html
http://aldanalisis.blogspot.com/2014/04/histogramas-poligonos-de-
frecuencia-y.html
http://www.cca.org.mx/cca/cursos/estadistica/html/m7/
distribuciones_frecuencias_relativas.htm
https://wwwyyy.files.wordpress.com/2008/08/estadistica-
generalteoria.pdf
http://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.html
http://www.ditutor.com/estadistica/distribuci
%C3%B3n_frecuencias.html
http://es.slideshare.net/pbacelis/datos-agrupados-y-no
http://www.cca.org.mx/cca/cursos/estadistica/html/m7/
que_es_distribucion.htm
http://poligonosyojivas.blogspot.com/
http://lbanegas.com/lecciones/capitulo02/capitulo0203.html
https://exceltotal.com/como-hacer-un-histograma-en-excel/
http://www.ditutor.com/estadistica/intervalo_clase.html