Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7....
Transcript of Estadística y Gestión de Datos ://eygdd.files.wordpress.com/2008/07/eygdd-apunte... · 2008. 7....
EYGDD *.* - Curso Completo
Estadıstica y Gestion de Datoshttp://eygdd.wordpress.com
Prof. Milton A. Ramırez [email protected]
Instituto Profesional AIEPEscuela de Negocios y Tecnologıa
Primavera de 2008
EYGDD *.* - Curso Completo
Part I
Preliminar
EYGDD *.* - Curso Completo
Estadıstica
Definicion
Estadıstica
Caracterısticas Generales
La Estadıstica es una rama de la Matematica que se refiere a larecoleccion, agrupacion, clasificacion, estudio e interpretacion de los datosobtenidos en un estudio determinado.
La Estadıstica se subdivide en dos ramas que pasaremos a revisar a
continuacion:
Estadıstica Descriptiva.Inferencia Estadıstica.
EYGDD *.* - Curso Completo
Estadıstica
Campo de Aplicacion
Campo de Aplicacion
A ver
Ciencias de la Salud.
Nutricion.
Computacion.
Meteorologıa.
Demografıa.
Deporte.
Sociologıa.
Educacion del Transito.
etc.
EYGDD *.* - Curso Completo
Estadıstica
Estadıstica Descriptiva
Estadıstica Descriptiva
Que es
La Estadıstica Descriptiva se define como un conjunto de tecnicas y metodoscuyo proposito es describir alguna caracterıstica de interes en base a lainformacion contenida en una muestra.
La metodologıa que se emplea para recabar informacion de interes en nuestros
estudios contempla las siguientes etapas:
1 Seleccion y determinacion de la muestra (saber con certeza sobre quetratara el estudio).
2 Obtencion de los datos.3 Clasificacion y organizacion de los datos recogidos en la etapa anterior.4 Estudio descriptivo de los datos a traves de tabulaciones y calculo de
estadıgrados tanto de tendencia central como de dispersion.5 Representacion Grafica de los datos.6 Conclusiones.
Con estos elementos nos vamos a entretener durante este semestre.
EYGDD *.* - Curso Completo
Estadıstica
Inferencia Estadıstica
Inferencia Estadıstica
Nada mas que por cultura general
La Inferencia Estadıstica se dedica a la generacion de modelosmatematicos que permitan hacer predicciones o inferencias respecto alcomportamiento estadıstico de una poblacion a partir de los datosrecogidos en una muestra.
En este ambito lo que se hace es tratar de deducir cuales serıan losparametros estadısticos de una poblacion en base a una ciertaprobabilidad de exito o de fracaso (segun como se mire).
Otras aristas del estudio se refieren al establecimiento de ciertas hipotesis,a partir de las cuales podemos obtener respuestas sı o no con un ciertomargen de error prefijado.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Poblacion
Poblacion
Que es
La poblacion estadıstica corresponde al conjunto de elementos dereferencia sobre el cual se realizaran las observaciones.
Tambien se le conoce como universo o colectivo.
El tamano de una poblacion corresponde a la cantidad de elementos queesta posee, y su valor lo representaremos mediante el sımbolo N. Por logeneral, N es un numero grande.
Por ejemplo
La poblacion de todas las mujeres chilenas nacidas a la fecha.
La poblacion del parque automotriz en Sudamerica.
La poblacion de todas las personas del mundo que sean mayores de 18anos.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Muestra
Muestra
Que es
Corresponde a una parte de la poblacion (subconjunto).
El tamano de la muestra se denota con el sımbolo n, y se cumple quen < N
Por ejemplo
Si la poblacion fuera igual a todas las mujeres chilenas nacidas a la fecha,una posible muestra serıan las mujeres que estan embarazadas
Si la poblacion fuera el parque automotriz en Sudamerica, una muestraserıa los vehıculos que tienen placa patente de la ciudad de Buenos Aires.
Si la poblacion fuera igual a todas las personas del mundo que seanmayores de 18 anos, una posible muestra serıan todas las personas quetengan dos hijos y sean mayores de 50 anos.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Variable
Variable
Veamos
Las variables representan las caracterısticas de los casos, entes u objetosque forman la poblacion.
Distinguiremos dos tipos de variables:
X Cualitativas (cualidades)X Cuantitativas (cantidades)
Se diferencian entre sı porque a una no se le puede atribuir valoresnumericos y a la otra sı.
A continuacion pasaremos a revisarlas.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Variable
Variables Cualitativas
Cualitativa, cualidad
Son aquellas que no toman valores numericos y solo describen cualidades.
Por ejemplo
Raza.
Color de pelo.
Estado civil.
Sexo.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Variable
Variables Cuantitativas
Cuantitativa, cantidad
Son aquellas a las cuales podemos asignarles un valor numerico.
Se clasifican en:
Variables cuantitativas discretas.Variables cuantitativas continuas.
Ejemplos
Estatura.
Edad.
Potencia del motor de un automovil.
Cantidad de DVDs que hay en un videoclub.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Variable
Variables Cuantitativas Discretas
Discreto, conteo
Son variables cuantitativas que suelen emplearse para hacer conteos oenumeraciones.
Toman valores enteros (sin decimales).
Ejemplos
Cantidad de alumnos presentes en una sala.
Cantidad de alumnos ausentes en una sala.
Cantidad de manzanas que caben en un kilo.
Numero de clientes que espera ser atendido en la caja de unsupermercado.
EYGDD *.* - Curso Completo
Conceptos Fundamentales
Variable
Variables Cuantitativas Continuas
Continuo, medicion
Son aquellas variables cuantitativas que puede tomar cualquier valor enun intervalo dado.
Pensemos en cosas que puedan ser traducidas a numeros decimales.
Ejemplos
Peso corporal (es posible que uno pueda pesar 80.7 kilos)
Estatura (se puede medir 1.82 metros)
Tiempo de espera (podrıa ser de 1 hora con 27 minutos, donde en estecaso los minutos serıan los decimales)
EYGDD *.* - Curso Completo
Part II
Frecuencia
EYGDD *.* - Curso Completo
Introduccion
Introduccion al concepto de Frecuencia
La frecuencia es uno de los terminos mas usados en estadıstica.
Esta constituye un elemento esencial a la hora de analisis datosmuestrales.
Es un concepto relacionado con la cantidad de veces que se repite undeterminado valor en una variable (cualitativa o cuantitativa).
Existen diversos tipos de frecuencias:
X frecuencia absolutaX frecuencia relativaX frecuencia relativa porcentual
EYGDD *.* - Curso Completo
Introduccion
Frecuencia Absoluta
Frecuencia Absoluta
Es el numero de veces que se repite un valor particular de cierta variable.
Si la variable en cuestion toma un numero k de valores, la frecuencia sedenota con el sımbolo fi donde i es un ındice que puede tomar valoresentre 1 y k.
EYGDD *.* - Curso Completo
Introduccion
Frecuencia Absoluta
Frecuencia Relativa
Es denotada por f ri y se define como el cuociente entre la frecuencia
absoluta y el numero de observaciones.
Esto es:
f ri =
fin
i = 1, . . . , k.
EYGDD *.* - Curso Completo
Introduccion
Frecuencia Absoluta
Frecuencia Relativa Porcentual
Se denota por f ri % y se define como:
f ri % = f r
i × 100, i = 1, . . . , k.
Ademas, como f ri = fi
nla expresion anterior se puede escribir como
f ri % =
fin× 100 i = 1, . . . , k.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencia segun el tipo de Variable
Para calcular la frecuencia se debe tener presente el tipo de variable quese desea analizar, pues a partir de dicho analisis se realiza la agrupacionde datos respectivos.
Recordemos que los tipos de variable que existen son:
X cualitativaX cuantitativa discretaX cuantitativa continua
Lo que veremos a continuacion es justamente como hacer los calculos decada tipo de frecuencia a traves de ejemplos que ayudaran a clarificar losconceptos que vimos anteriormente.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Calculo de Frecuencias para Variables Cualitativas
Vamos viendo
La presentacion de datos cualitativos suele hacerse indicando los atributosconsiderados y sus frecuencias de aparicion.
Ejemplo
Supongase que los datos siguientes representan las marcas extranjeras deautomoviles preferidas en una muestra de 40 personas.
A C C J C F B F J A C C J F A B F F A CJ J B F C J C J C B A F C J J C J A F C
En donde A significa aleman, C coreano, J japones, F frances y Bbrasileno.
Se pide representar los datos en una tabla que contenga las frecuenciasabsolutas y relativas e interpretar algunas de ellas.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
En primer lugar, definamos la variable con la que estamos trabajando.Sea X :“Variable cualitativa o atributo que representa la marca extranjerade automovil preferida.”
En este caso la muestra consta de n = 40 observaciones.
Por lo tanto: la suma de las frecuencias debe ser igual a 40.
Para tabular los datos en una tabla de frecuencias, se coloca en laprimera columna los valores de i , donde i varıa entre 1 y k, donde kcorresponde al numero de valores que toma la variable. En este casok = 5 ya que tenemos los valores X = A, X = C , X = J, X = F y X = B.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
En la columna siguiente se presentan los valores que toma la variable.Como se trata de una variable cualitativa, ella representa una cualidad ypor lo tanto se denota con una letra en un orden arbitrario, como porejemplo, A, C, J, F y B para mantener la notacion original del ejercicio.
En la tercera columna se colocan las frecuencias absolutas de cada uno delos valores que toma la variable, la que se obtiene contando el numero deveces que aparece una respectiva cualidad en la muestra.
Finalmente en la ultima columna se presenta la frecuencia relativa la quese obtiene la dividir la frecuencia absoluta por el numero total deobservaciones (n = 40), es decir: f r
i = fin.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
Luego, la tabla de frecuencias queda de la siguiente manera:
i Marca Frecuencia(fi) Frec. Relativa(f ri )
1 A 6 6/40 = 3/20
2 C 12 12/40 = 3/10
3 J 10 10/40 = 1/4
4 F 8 8/40 = 1/5
5 B 4 4/40 = 1/10
Total 40 1
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
Interpretemos algunos valores particulares de la tabla:
X f1 representa el total de veces que el valor A se repite en la muestra.Como el valor X = A se repite 6 veces y como a la A le asignamosarbitrariamente el valor i = 1 se tiene que f1 = 6. Lo mismo ocurrecon el resto de los valores.
X Veamos el caso de f r4 , es decir la frecuencia relativa del cuarto valor
que toma la variable. Que f r4 = 3
10significa que un quinto de las
preferencias de la gente se la lleva los vehıculos de nacionalidadfrancesa.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Solucion
X f r2 = 1
10significa que los tres decimos de la gente prefiere los automoviles
coreanos.
X f r4 % significa interpretar la frecuencia porcentual del cuarto valor quetome la variable. La expresion para calcularlo es
f r4 % = f r
4 × 100
=1
5× 100
= 20
Esto significa que el 20% de las preferencias de la gente se las llevan losautomoviles de origen frances. J
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Discretas
Calculo de Frecuencias para Variables CuantitativasDiscretas
Veamos
Para presentar los datos cuantitativos discretos se indica el numeroconsiderado y su frecuencia de aparicion.
Es similar al caso cualitativo.
Ejemplo
Supongase que los datos siguientes representan el numero de vehıculosque llega a una estacion de servicio en 30 perıodos de 5 minutos.
3 4 3 2 1 1 0 0 3 4 5 5 4 4 33 2 3 4 1 1 1 2 0 2 1 3 2 3 1
Agrupense los datos en una tabla que contenga las frecuencias y lasfrecuencias relativas.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Discretas
Ejemplo (Cont.)
Solucion
Sea X : “Variable que denota el numero de vehıculos que llega a unaestacion de servicio en un intervalo de tiempo de 5 minutos”.
Al igual que en el problema anterior, la construccion de la tabla defrecuencias se realiza de la siguiente forma: La primera columnarepresenta los valores de i , donde i = 1, . . . , k, con k = numero devalores que toma la variable. Para este ejemplo k = 6.
En la columna siguiente se colocan los valores que toma la variable (0, 1,2, 3, 4 y 5). En la tercera columna las frecuencias absolutas para cadauno de los valores de la variable, la que se obtiene al contar el numero deveces que aparece cada valor en la muestra.
Finalmente en la ultima columna se presenta la frecuencia relativa la quese obtiene: f r
i = fin
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Discretas
Ejemplo (Cont.)
Solucion
La tabla de frecuencias queda de la siguiente manera:
i xi Frecuencia(fi) Frec. Relativa(f ri )
1 0 3 3/30 = 1/10
2 1 7 7/30
3 2 5 5/30 = 1/6
4 3 8 8/30 = 4/15
5 4 5 5/30 = 1/6
6 5 2 2/30 = 1/15
Total 30 1
X f4 = 8 significa que en 8 periodos de 5 minutos llegaron exactamente 3vehıculos.
X f r5 = 1
6significa que en la sexta parte de los vehıculos que se consideraron
llegaron exactamente 4 vehıculos. J
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Calculo de Frecuencias para Variables CuantitativasContinuas
Veamos
En este caso cuando se dispone de cierto numero de valores referidos a unavariable continua, es conveniente agruparlos en intervalos de clase o categorıas.
Para seleccionar el numero k de intervalos de clases, o simplemente el numero k
de clases, existen diversas formas.
1 Una de ellas es considerar tal numero k de clases no menor de 5 ni mayorde 15. No menor de 5 para evitar la perdida de informacion que seproducirıa al reunir en una clase un grupo de datos muy diferentes; y, nomayor de 15 para de esta forma tener un facil manejo y con el propositode asegurar una compactacion de la informacion.
2 Otra forma de seleccionar el numero de k de clases es empleando la Reglade Sturges, en donde k = 1 + 3.3× log n, siendo n el tamano de lamuestra.
En general, las clases se eligen de modo que la amplitud de cada una de ellassea igual para todas las categorıas o intervalos de clases.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Calculo de Frecuencias para Variables CuantitativasContinuas
Veamos
Antes de ver un ejemplo es necesario definir el concepto de Marca de Clase. Sedenota por mi y corresponde al punto medio del intervalo de clase. Ella es larepresentante de la clase pues se atribuye el valor de la frecuenciacorrespondiente a dicha clase.
Ejemplo
Supongase que los datos a continuacion representan el precio aproximado de lalibra de cobre, en centavos de dolar para una muestra de 30 dıas, los que hansido ordenados convenientemente.
70 71 71 72 73 73 73 75 76 76 77 78 78 78 7878 79 79 80 81 81 82 83 84 84 84 84 87 89 91
Se pide agrupar los datos en una tabla de frecuencias.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Solucion
A continuacion se presenta paso a paso la forma de realizar una tabla de
frecuencias para una variable cuantitativa continua:
1 Se determina el rango o recorrido r , el que se define como ladiferencia entre los valores maximo y mınimo de la variablepresentes en la muestra.
2 Se determina el numero k de clases o categorıas, empleando Reglade Sturges.
3 Se obtiene la amplitud o tamano a del intervalo, dividiendo el rangopor el numero de clases.
4 Se seleccionan los lımites de clase que definen los intervalos, demanera que las clases sean de la misma magnitud y que cadaobservacion se clasifique sin ambiguedad en una sola clase.
5 Se cuenta el numero de observaciones en cada clase, es decir, sedeterminan las frecuencias absolutas de cada clase.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 1 - Valor del Rango
El rango o recorrido lo obtenemos de la siguiente manera:
r = xmax − xmin = 91− 70 = 21
xmax corresponde al maximo valor observable de la variable X (91) y xmin
al mınimo valor de X (70).
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 2 - Numero de Clases
Como el valor de n = 30, aplicando la Regla de Sturges se llega a que
k = 1 + 3.3× log n
= 1 + 3.3× log 30
= 5.87 ≈ 6
Cabe destacar que el valor de k tiene que ser un numero entero (sindecimales).
El sımbolo ≈ significa aproximado o aproximadamente. Entonces5.87 ≈ 6 se lee 5.87 es aproximadamente 6.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 3 - Amplitud o Tamano del Intervalo
Se calcula dividiendo el rango por el numero de clases.
Si a denota la amplitud del intervalo entonces
a =r
k
=21
6= 3.5 ≈ 4
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
En primer lugar obtenemos el primer intervalo de clase, cuyo lımiteaparente inferior es igual al mınimo valor que toma la variable en lamuestra. En este caso este lımite inferior vale xmin = 70.
Para obtener el lımite aparente superior del primer intervalo de clase,sumamos al lımite aparente inferior la amplitud menos 1. En este casoserıa xmin + (a− 1) = 70 + 4− 1 = 73.
Por lo tanto, nuestro primer intervalo (o clase) aparente es [70, 73[.
Por notacion, [70, 73[ se interpreta como el intervalo que contiene a todosaquellos numeros que sean mayores o iguales que 70 y menores que 73.Esta explicacion es valida para todos los intervalos que construyamos,salvo que hay que reemplazar por los valores numericos que correspondan.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Ojo
En este caso restamos una unidad, pero si la amplitud del intervalo declase se hubiese presentado con un decimal hubiesemos tenido que restar0.1.
Si se hubiese presentado con dos decimales tendrıamos que haber restado0.01.
Con tres decimales restamos 0.001 y ası sucesivamente.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Tengamos presente que tenemos que construir un total de 6 intervalos, yaque k = 6 por la regla de Sturges.
Determinemos el lımite inferior del segundo intervalo. Este es igual allımite aparente inferior del intervalo anterior mas la amplitud. Es decir70 + 4 = 74.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso73 + 4 = 77.
Con esto, nuestro segundo intervalo (o clase) aparente es [74, 77[.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del tercer intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir74 + 4 = 78.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso77 + 4 = 81.
Con esto, nuestro tercer intervalo (o clase) aparente es [78, 81[.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del cuarto intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir78 + 4 = 82.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso81 + 4 = 85.
Con esto, nuestro cuarto intervalo (o clase) aparente es [82, 85[.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del quinto intervalo. Este es igual al lımiteaparente inferior del intervalo anterior mas la amplitud. Es decir82 + 4 = 86.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso85 + 4 = 89.
Con esto, nuestro quinto intervalo (o clase) aparente es [86, 89[.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Determinemos el lımite inferior del sexto y ultimo intervalo. Este es igualal lımite aparente inferior del intervalo anterior mas la amplitud. Es decir86 + 4 = 90.
El lımite superior aparente del intervalo se obtiene sumando el lımitesuperior aparente del intervalo anterior con la amplitud. En este caso89 + 4 = 93.
Con esto, nuestro sexto intervalo (o clase) aparente es [90, 93[.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Una vez que se obtienen los intervalos o clases aparentes, se tienen queconstruir los intervalos o clases reales.
Esto se debe a que existe una diferencia numerica entre el lımite inferioraparente de un intervalo con el lımite superior aparente de otro intervalo,lo que le quita el caracter de continuo a la variable X :“Variable quedescribe el precio diario aproximado de la libra de cobre en centavos dedolar”.
Determinando las clases reales, recobramos lo continuo de X .
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - Lımites de cada Clase o Intervalo
Para la formacion de los intervalos de clase real, a cada uno de los lımitesinferiores de las clases aparentes se le debe restar 0.5, en caso que losdatos estan presentados sin decimales.
En nuestro caso, como los datos los tenemos sin decimales, tendremosque el lımite real inferior asociado con el primer intervalo sera igual a70− 0.5 = 69.5.
De igual forma, para obtener el lımite real superior de cada intervalo declase se debe sumar 0.5, en caso que los datos vengan sin decimales.
En este caso, el lımite real superior asociado con el primer intervalo esigual a 73 + 0.5 = 73.5.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Ojo
Si los datos se presentan con un decimal, para obtener el lımite realinferior de cada intervalo de clase se debe restar 0.05 al lımite aparenteinferior.
Si estan presentados con dos decimales se debe restar 0.005.
Si estan con 3 decimales, restaremos 0.0005 y ası sucesivamente.
Para el caso de los lımites reales superiores en vez de restar, sumamos 0.5o 0.05 o 0.005 segun como se presenten los datos.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 5 - Conteo de la Frecuencia Absoluta de cada ClaseLa tabla de frecuencias nos queda de la siguiente forma:
i Clase Aparente Clase Real fi f ri mi
1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5
2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5
3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5
4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5
5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5
6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5
Total 30 1
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Observacion
Se entiende por lımite de clase a los numeros que aparecen en losextremos de cada clase, con lo cual los lımites de la izquierda y de laderecha corresponden a los lımites de clase inferior y superiorrespectivamente.
Al respecto tambien se definen los lımites de clase aparentes oaproximados y los lımites reales o verdaderos de clase.
En los lımites aparentes se consideran los valores tal como aparecen en lamuestra, esto es, tal como fueron aproximados, ya sea al numero enteromas proximo.
En el caso de los lımites reales , estos se determinan de tal modo quereflejen la forma como fueron redondeados los datos, por lo que estossiempre contienen como mınimo un decimal que termina en cinco.
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Algunas Interpretaciones
X f2 = 4 significa que durante cuatro dıas el precio aproximado de la librade cobre fluctuo entre los 74 y 77 centavos de dolar. (Revisando lasclases aparentes).
X Viendo las clases reales, podrıamos decir que f2 = 4 durante 4 dıas lalibra de cobre tuvo un precio mayor o igual que los 73.5 centavos de dolary menor que 77.5 centavos de dolar.
X f r6 = 1
30significa que en la treintava parte de las observaciones el valor
diario del precio de la libra de cobre vario entre los 90 y 93 centavos dedolar.
X En terminos porcentuales, se ve que en el f r6 % = 1
30× 100 = 3.33 por
ciento de las observaciones, el valor diario del precio de la libra de cobreoscilo entre los 90 y 93 centavos de dolar. J
EYGDD *.* - Curso Completo
Calculo de Frecuencia segun el tipo de Variable
Calculo de Frecuencias para Variables Cuantitativas Continuas
Palabras al cierre. . .
Observacion
En caso que la muestra contenga una gran variedad de datos numericosque en principio se puedan clasificar de discretos deberemos trabajarloscomo si fueran continuos y agruparlos en clases para ası evitar que latabla de frecuencia quede demasiado grande.
Se recomienda que la cantidad total de valores que pueda asumir lavariable no exceda el valor de k = 10.
EYGDD *.* - Curso Completo
Introduccion
Introduccion a los Graficos
La representacion grafica de los datos es un complemento que permiteapreciar visualmente como se presenta la informacion.
Existe una gran variedad de graficos para representar los datos, lo quenaturalmente depende del tipo de variable que se esta estudiando.
EYGDD *.* - Curso Completo
Introduccion
Tipos de Grafico segun la clasificacion de la variable enestudio
Dependiendo si la variable que estamos analizando es cualitativa,cuantitativa discreta o cuantitativa continua, tendremos los siguientestipos de grafico:
Tipo de Variable Grafico(s) Asociado(s)Cualitativa Torta, Barra.
Cuantitativa Discreta Varas.
Cuantitativa Continua Histograma, Polıgono de frecuencias, Ojiva.
EYGDD *.* - Curso Completo
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta
A cada frecuencia porcentual se le asocia un angulo de la circunferencia.
Si f ri % representa la frecuencia porcentual asociada con el i−esimo valor
de la variable cualitativa, entonces los grados que le corresponden en elgrafico quedan determinados por la expresion
αo
i =f ri %
100%× 360o
EYGDD *.* - Curso Completo
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta (Cont.)
Por ejemplo
Consideremos la tabla de frecuencias del ejemplo de la nacionalidad deauto extranjero preferido por la gente:
i Marca Frecuencia(fi) Frec. Relativa(f ri ) f r
i %
1 A 6 6/40 = 3/20 15
2 C 12 12/40 = 3/10 30
3 J 10 10/40 = 1/4 25
4 F 8 8/40 = 1/5 20
5 B 4 4/40 = 1/10 10
Total 40 1 100
EYGDD *.* - Curso Completo
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta (Cont.)
Por ejemplo, para i = 3 (es decir, X = J) le hacemos corresponder
αo
3 =f r3 %
100%× 360o = 25
100× 360o = 90o.
Para i = 5 tendremos αo
5 =f r5 %
100%× 360o = 10
100× 360o = 36o y ası
sucesivamente.
El grafico que resulta se muestra en la siguiente lamina.
EYGDD *.* - Curso Completo
Graficos para variables Cualitativas
Grafico de Torta (o Sectorial)
Grafico de Torta (Cont.)
EYGDD *.* - Curso Completo
Graficos para variables Cualitativas
Grafico de Barras
Grafico de Barras
Esta formado por una serie de rectangulos cuyas bases estan sobre el ejehorizontal y cuyas alturas son proporcionales a las frecuencias.
Las dimensiones de las bases de los rectangulos son arbitrarias pero debenser iguales.
Los rectangulos no tienen frontera vertical comun, pero por convenciontienen que estar a una misma distancia.
EYGDD *.* - Curso Completo
Graficos para variables Cualitativas
Grafico de Barras
Grafico de Barras (Cont.)Ejemplo
Consideremos nuevamente las preferencias por marcas extranjeras devehıculos, de acuerdo a un sondeo realizado a 40 personas queparticiparon de una muestra.
El grafico de barras es el siguiente:
EYGDD *.* - Curso Completo
Grafico para Variable Cuantitativa Discreta
Grafico de Varas
Grafico de Varas
Consiste en una serie de segmentos de recta situadas sobre el ejehorizontal y cuyas longitudes son proporcionales a las frecuencias.
Los segmentos de recta tienen forma de varas. De ahı el nombre.
EYGDD *.* - Curso Completo
Grafico para Variable Cuantitativa Discreta
Grafico de Varas
Grafico de Varas (Cont.)Ejemplo
Consideremos la variable X :“Numero de vehıculos que llega a una estacion deservicio en intervalos de 5 minutos” que esta asociada con el ejemplo deconstruccion de tablas de frecuencia para variables cuantitativas discretas. Sugrafico de varas es el siguiente:
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Histograma
Histograma
El Histograma representa datos que se encuentran agrupados en clases ocategorıas.
Consiste en una serie de rectangulos con fronteras verticales comunes, endonde las bases de los rectangulos son iguales a las amplitudes o anchurasde clase y las alturas son proporcionales a las frecuencias.
Se “parece” a un grafico de barras con la diferencia que los rectangulosvan unidos entre sı.
Por ejemplo
Consideremos el ejemplo dado para el caso de creacion de tablas defrecuencias en variables cuantitativas continuas que estaba relacionadocon la variacion del precio de la libra de cobre, expresada en centavos dedolar.
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Histograma
Histograma (Cont.)
El histograma asociado con el ejemplo anterior es el que se muestra acontinuacion:
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Polıgono de Frecuencias
Polıgono de Frecuencias
Proporciona una representacion suavizada de un conjunto de valores.
Para construir este grafico, hay que unir los puntos medios situados sobrelos techos de rectangulos del histograma, en donde tales puntos medioscorresponden a las marcas de clase.
El polıgono de frecuencias se completa agregando dos segmentos derecta: uno antes de la primera clase y el otro despues de la ultima claseasignandoles artificialmente el valor cero en cada tipo de frecuencia. Estodebido a que “antes” y “despues” de recogidos los datos no se registraronobservaciones con esos valores.
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Polıgono de Frecuencias
Polıgono de FrecuenciasEjemplo
Considerando el mismo ejemplo de la variacion del precio de la libra de cobre encentavos de dolar, el polıgono de frecuencias serıa el siguiente:
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva
La Ojiva representa las frecuencias acumuladas y ademas proporciona unadescripcion visual de como se acumulan los valores de la variable.
Los puntos que unen cada uno de los segmentos de recta que forman elpolıgono son aquellos que tienen como coordenadas el lımite real superiorde clase en la abscisa y el valor de la frecuencia acumulada en laordenada (que tambien puede ser la frecuencia relativa acumulada o lafrecuencia porcentual acumulada).
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva(Cont.)Ejemplo
Construyamos una nueva columna a la tabla de frecuencias del ejemplo de lalibra de cobre donde registremos los valores de la frecuencia acumulada:
i Clase Aparente Clase Real fi f ri mi Frec. Acum.
1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5 7
2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5 11
3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5 21
4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5 27
5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5 29
6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5 30
Total 30 1
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva(Cont.)Ejemplo (Cont.)
De esta manera, el grafico de ojiva es el siguiente:
EYGDD *.* - Curso Completo
Graficos para Variables Cuantitativas Continuas
Ojiva
Ojiva (Cont.)
Algunas observaciones
La gracia que tiene este tipo de grafico es que permite ver cuantasobservaciones son menores o iguales a un cierto valor especificado.
Por ejemplo, a partir de la ojiva exhibida en la lamina anterior quedurante 21 dıas el valor del precio de la libra de cobre fue aumentandohasta alcanzar un valor aproximado de 81.5 centavos de dolar.
EYGDD *.* - Curso Completo
Part IV
Estadıgrafos
EYGDD *.* - Curso Completo
Generalidades
Introduccion
En la primera parte del curso aprendimos a tabular los datos procedentesde una muestra a traves de lo que denominamos tablas de frecuencia, lascuales tenıan su particular forma de construccion dependiendo del tipo devariable en estudio.
Posterior a ello se procedio a hacer graficos, cuya unica finalidad erapresentar de un modo amigable y resumido la informacion contenida en latabla, facilitando con ello la lectura de los datos procedentes de lamuestra.
EYGDD *.* - Curso Completo
Generalidades
Introduccion (Cont.)
En esta etapa del curso seguiremos describiendo la informacion de una
muestra de una manera mas fina, tratando de responder a las siguientes
preguntas:
1 ¿Alrededor de que valor se agrupan los datos?2 En el caso que efectivamente se agrupen alrededor de un valor
dado:
¿como lo hacen?¿muy concentrados?¿muy dispersos?
Para ello, el concepto de estadıgrafo sera de vital importancia.
EYGDD *.* - Curso Completo
Generalidades
Estadıgrafos
Los estadıgrafos son medidas descriptivas que resumen los datos en formacuantitativa.
Estos pueden ser de dos clases:
1 Estadıgrafos de posicion o de tendencia central:
1 Media aritmetica.2 Mediana.3 Moda.4 Percentiles, deciles, quintiles, cuartiles.
2 Estadıgrafos de variabilidad o de dispersion de los datos:
1 Rango.2 Varianza.3 Desviacion estandar (o desviacion tıpica).4 Coeficiente de Variacion.
EYGDD *.* - Curso Completo
Generalidades
Estadıgrafos (Cont.)
Observacion
El calculo de cada estadıgrafo va a depender del tipo de variable queestemos considerando.
En la siguiente tabla se muestra si es posible o no obtener el estadıgrafopara los diferentes tipos de variable:
Estadıgrafo Variable Cualitativa Variable CuantitativaMedia Aritmetica χ X
Mediana χ XModa X X
Percentiles χ XRango χ X
Varianza χ XDesviacion Estandar χ XCoef. de Variacion χ X
EYGDD *.* - Curso Completo
Generalidades
Caracterizacion de los elementos de una muestra
Vamos a formalizar la notacion que hemos estado empleando paradesignar los elementos que conforman una muestra.
En forma somera hemos denotado por n al tamano de esta y por xmax ypor xmin al valor maximo y mınimo presente en ella, respectivamente.
Ahora veremos como individualizar al resto de los elementos que lacomponen.
Para ello emplearemos la notacion de subındice, donde si X representa auna variable asociada a una muestra de tamano n, entonces el valor decada observacion la denotaremos por xi , i = 1, n.
EYGDD *.* - Curso Completo
Generalidades
Caracterizacion de los elementos de una muestra (Cont.)
Por ejemplo
Consideremos la siguiente muestra que representa la edad de un grupo de10 personas:
5 10 34 23 12 19 21 27 54 37
Podemos decir entonces que n = 10, xmax = 54 y que xmin = 5.
Ademas: x1 = 5, x2 = 10, x3 = 34, x4 = 23, x5 = 12, x6 = 19, x7 =21, x8 = 27, x9 = 54, x10 = 37.
Esto quiere decir que la primera edad observada fue de 5 anos, la segundafue igual a 10 anos, la quinta edad fue de 12 y ası sucesivamente.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media Aritmetica
La medida de tendencia central de mayor uso teorico y practico es lamedia aritmetica, que tambien suele llamarse promedio o simplementemedia.
En caso que estemos en presencia una variable cuantitativa discreta, lamedia aritmetica del conjunto de valores es igual a la suma de todos losdatos dividida por el tamano de la muestra.
En caso que la muestra este relacionada con una variable cuantitativacontinua, deberemos considerar en el calculo del promedio los valores delas marcas de cada intervalo.
El promedio lo simbolizaremos por X .
La media aritmetica la vamos a presentar con una cifra decimal extra enrelacion a como vengan presentados los datos de la muestra. Si porejemplo los valores muestrales tienen un decimal, el promedio lodejaremos con 2 decimales y ası sucesivamente.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media AritmeticaCaso de Variables Cuantitativas Discretas
Si tenemos una variable cuantitativa discreta que toma un total de kvalores de la forma x1, x2, . . . , xk cuyas frecuencias absolutas denotamospor f1, f2, . . . , fk , la media esta dada por la suma de los productos entrelos diferentes k valores observados y su respectiva frecuencia absoluta,dividido por el total de la muestra.
Formalmente:
X =x1f1 + x2f2 + · · ·+ xk fk
f1 + f2 + · · ·+ fk
=
k∑i=1
xi fi
k∑i=1
fi
=
k∑i=1
xi fi
n
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media Aritmetica
Caso de Variables Cuantitativas Discretas: X =
k∑i=1
xi fi
n
Por ejemplo
Sea X : “Variable que denota el numero de vehıculos que llega a unaestacion de servicio en un intervalo de 5 minutos”.
Los datos estan reflejados en la siguiente tabla de distribucion defrecuencias:
i Valor = xi fi xi × fi1 0 3 0× 3 = 0
2 1 7 1× 7 = 7
3 2 5 2× 5 = 10
4 3 8 3× 8 = 24
5 4 5 4× 5 = 20
6 5 2 5× 2 = 10
Total 30 71
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media Aritmetica
Caso de Variables Cuantitativas Discretas: X =
k∑i=1
xi fi
n
Por ejemplo (cont.)
Es decir:k∑
i=1
xi fi = 71.
Como k = 6, n = 30 yk∑
i=1
xi fi se concluye que X =71
30= 2.4
Esto significa que en los 30 intervalos de tiempo que se consideraron,cada 5 minutos entraron 2.4 autos a la estacion de servicio. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media AritmeticaCaso de Variables Cuantitativas Continuas
En caso que tener una variable cuantitativa continua donde sus datosesten agrupados en k clases o categorıas y cuyas frecuencias de aparicionlas denotemos por fi , i = 1, k y cuyas marcas de clase por mi , i = 1, n,entonces la media aritmetica viene dada por la siguiente expresion:
X =m1f1 + m2f2 + · · ·+ mk fk
f1 + f2 + · · ·+ fk
=
k∑i=1
mi fi
k∑i=1
fi
=
k∑i=1
mi fi
n
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media Aritmetica
Caso de Variables Cuantitativas Continuas: X =
k∑i=1
mi fi
n
Por ejemplo
Los datos que a continuacion se presentan tabulados representan el precioaproximado de la libra de cobre, en centavos de dolar para una muestrade 30 dıas, los que han sido ordenados convenientemente:
i Int. Clase Real fi mi mi × fi1 [69.5, 73.5[ 7 71.5 71.5× 7 = 500.5
2 [73.5, 77.5[ 4 75.5 75.5× 4 = 302
3 [77.5, 81.5[ 10 79.5 79.5× 10 = 795
4 [81.5, 85.5[ 6 83.5 83.5× 6 = 501
5 [85.5, 89.5[ 2 87.5 87.5× 2 = 175
6 [89.5, 93.5[ 1 91.5 91.5× 1 = 91.5
Total 30 2365
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media Aritmetica
Caso de Variables Cuantitativas Continuas: X =
k∑i=1
mi fi
n
Por ejemplo
Como k = 6, n = 30 yk∑
i=1
mi fi = 2365 se concluye que X = 236530
= 78.8
Esto significa que el promedio del valor de la libra de cobre expresada encentavos de dolar es de 78.8. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Promedio o Media Aritmetica
Promedio o Media Aritmetica
Observacion
La media se interpreta como aquel valor en donde los demas valorestienden a agruparse en torno a el.
La media de un conjunto de datos es como el “punto de equilibrio” deellos, haciendo una analogıa con el concepto fısico de centro de gravedadpara una distribucion de masas.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
Mediana
La mediana es un estadıgrafo cuyo proposito es el dividir la distribucionde frecuencias en dos partes iguales, de tal manera que pasa adesempenar el rol del termino central de la muestra.
Para ello es obligatorio que el conjunto de datos que componen lamuestra esten ordenados.
Da lo mismo si los datos se ordenan de menor a mayor o de mayor amenor. Para unificar criterios lo haremos de menor a mayor.
La denotaremos por Me.
Es posible que el valor que tome la mediana no este dentro de la muestrainicial.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana para Variables Cuantitativas Discretas
Cuando la variable en juego es cuantitativa discreta se distinguen 2 casos:n es par o n es impar.
Si suponemos que la muestra inicial la hemos ordenado y sus valores los
denotamos genericamente por x1, x2, . . . , xn entonces:
1 Si n es par: Me =x( n
2 )+ x( n
2+1)
2, es decir, el promedio aritmetico
de los dos terminos centrales de la muestra.2 Si n es impar: Me = x( n+1
2 )
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana en el caso de Variables Cuantitativas Discretas: Me =
x( n
2 )+x
( n2
+1)2
si n es parMe = x( n+1
2 ) si n es impar
Por ejemplo
Consideremos la siguiente muestra correspondiente al numero deduraznos en mal estado presentes en 6 cajas: 0,5,3,1,8,2.
Para hallar la mediana de la muestra, debemos ordenar los valores. Deeste modo obtenemos: 0,1,2,3,5,8.
Si definimos por X a la variable relacionada con el total de duraznos enmal estado presentes en cada caja, entonces los elementos de la muestraseran x1 = 0, x2 = 1; x3 = 2, x4 = 3, x5 = 5 y x6 = 8.
Por otro lado: n = 6 y por lo tanto deberemos aplicar la formula valida
para muestras de tamano par. Esta nos dice que Me =x( n
2 )+x
( n2
+1)2
.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana en el caso de Variables Cuantitativas Discretas: Me =
x( n
2 )+x
( n2
+1)2
si n es parMe = x( n+1
2 ) si n es impar
Por ejemplo (Cont.)
Recordando que x1 = 0, x2 = 1; x3 = 2, x4 = 3, x5 = 5 y x6 = 8 tendremosque x( n
2 )= x( 6
2 )= x3 = 2. Por otro lado x( n
2+1) = x( 6
2+1) = x4 = 3.
Luego: Me =x( n
2 )+ x( n
2+1)
2=
x3 + x4
2=
2 + 3
2=
5
2= 2.5
Esto significa que el 50% del total de las cajas consideradas en la muestratienen menos de 2.5 duraznos en mal estado y que el 50% restantesobrepasa esa cantidad. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana en el caso de Variables Cuantitativas Discretas: Me =
x( n
2 )+x
( n2
+1)2
si n es parMe = x( n+1
2 ) si n es impar
Otro ejemplo
Supongamos que ahora tenemos 7 cajas con duraznos donde la cantidad defruta en mal estado en cada caja es 0,2,3,6,7,7,9.
Esto es: x1 = 0, x2 = 2, x3 = 3, x4 = 6, x5 = 7, x6 = 7 y x7 = 9.
Claramente los datos estan ordenados en forma creciente y n = 7 es impar.
Luego, para hallar la mediana aplicaremos la formula para muestras de tamanoimpar.
Lo que hay que hacer es encontrar el valor que ocupa la posicionx( n+1
2 ) = x( 7+12 ) = x4 = 6.
Luego: Me = x4 = 6.
Esto quiere decir la mitad de las cajas contienen menos de 6 duraznos en malestado y que mas de la mitad sobrepasa ese valor. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana para Variables Cuantitativas Continuas
En este caso es necesario contar con la columna que contenga las frecuenciasacumuladas de cada intervalo (de clase o real da lo mismo).
La frecuencia absoluta de cada intervalo la denotaremos por Fi , i = 1, k.
Sean:
1 LIj : lımite inferior del primer intervalo tal que Fj ≥ n2. Diremos que ese
intervalo contiene a la mediana.2 j : ındice asociado con el intervalo que contiene la mediana.3 fj : frecuencia absoluta del intervalo que contiene a la mediana.4 F(j−1): frecuencia acumulada del intervalo anterior al de la mediana.
5 a: amplitud del intervalo que contiene a la mediana. Recordemos quea = r
ko bien a = ls − li donde ls y li denotan los lımites superior e inferior
del intervalo, respectivamente.
De esta manera, la expresion analıtica para calcular el valor de la mediana paradatos agrupados es
Me = LIj +
(n2− F(j−1)
Fj − F(j−1)
)× a
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana para Variables Cuantitativas Continuas: Me = LIj +
( n2−F(j−1)
Fj−F(j−1)
)× a
Por ejemplo
Consideremos la tabla de frecuencias del precio de la libra de cobre expresada encentavos de dolar. A dicha tabla le agregaremos la columna de las frecuenciasacumuladas, que las denotaremos por Fi :
i Int. Clase Real fi mi Fi
1 [69.5, 73.5[ 7 71.5 72 [73.5, 77.5[ 4 75.5 113 [77.5, 81.5[ 10 79.5 214 [81.5, 85.5[ 6 83.5 275 [85.5, 89.5[ 2 87.5 296 [89.5, 93.5[ 1 91.5 30
Total 30
El tamano de la muestra n = 30. Luegon
2= 15. El intervalo cuya frecuencia
absoluta acumulada es inmediatamente superior a 15 es [77.5, 81.5[ ya que 21es el primer valor de las frecuencias absolutas acumuladas que es mayor o iguala 15.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Mediana
MedianaMediana para Variables Cuantitativas Continuas: Me = LIj +
( n2−F(j−1)
Fj−F(j−1)
)× a
Ejemplo (Cont.)
Mirando la tabla se observa que este intervalo ocupa la posicion asociada con elındice 3. Luego, el valor de j = 3.
Por otro lado:
LIj = LI3 = 77.5F(j−1) = F(3−1) = F2 = 11Fj = F3 = 21a = 81.5− 77.5 = 4
Luego:
Me = LIj +
(n2− F(j−1)
Fj − F(j−1)
)×a = 77.5+
(15− 11
21− 11
)×4 = 77.5+
4
10×4 = 79.1
Esto significa que en menos de la mitad de los valores observados, el precio de lalibra de cobre no sobrepaso los 79.1 centavos de dolar. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Moda
ModaModa en Variables Cualitativas y Cuantitativas Discretas
La moda corresponde al valor de la variable que ocupa la mayorfrecuencia absoluta.
Para el caso de variables cualitativas y cuantitativas discretas, basta conobservar la tabla de frecuencias y ver cual es el valor que tiene la mayorfrecuencia absoluta.
La denotaremos por Mo.
Si existe empate entre diferentes valores con las frecuencias absolutasmayores, diremos que la muestra no tiene moda.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Moda
ModaModa en Variables Cualitativas
Por ejemplo
Consideremos la nacionalidad de auto preferida por la gente en unamuestra que consto de 40 personas. En este caso A significa aleman, Ccoreano, J japones, F frances y B brasileno.
La tabla de frecuencias se muestra a continuacion:
i Marca fi1 A 6
2 C 12
3 J 10
4 F 8
5 B 4
Total 40
La mayor frecuencia absoluta es igual a 12. Luego, los automoviles debandera coreana son los preferidos por la gente que participo en laencuesta. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Moda
ModaModa en Variables Cuantitativas Discretas
Por ejemplo
Recordando el ejemplo del numero de automoviles que llegan a la estacionde servicio en 30 intervalos de 5 minutos y su tabla de frecuencias:
i Valor = xi fi1 0 3
2 1 7
3 2 5
4 3 8
5 4 5
6 5 2
Total 30
Por simple inspeccion se tiene que la maxima cantidad de vehıculos quellegaron a la estacion de servicio en un intervalo de 5 minutos es igual a8. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Moda
ModaModa en Variables Cuantitativas Continuas
Se construye la tabla de distribucion de frecuencias y se ubica el intervalo quecontenga la mayor frecuencia absoluta. Sea LIj el lımite inferior de ese intervalo.
Si denotamos por fj a la frecuencia absoluta de ese intervalo, entonces:
f(j−1) correspondera a la frecuencia del intervalo anterior al que contienela moda.fj+1 sera la frecuencia absoluta del intervalo que viene inmediatamente acontinuacion del intervalo modal.
Sean ademas:
∆1 = fj − f(j−1)
∆2 = fj − fj+1
Entonces:
Mo = LIj +
(∆1
∆1 + ∆2
)× a
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Moda
ModaModa en Variables Cuantitativas Continuas: Mo = LIj +
(∆1
∆1+∆2
)× a
Por ejemplo
Determinemos la moda del ejemplo del precio de la libra de cobre. Recordemosla tabla de frecuencias relacionada a ese problema:
i Int. Clase Real fi mi Fi
1 [69.5, 73.5[ 7 71.5 72 [73.5, 77.5[ 4 75.5 113 [77.5, 81.5[ 10 79.5 214 [81.5, 85.5[ 6 83.5 275 [85.5, 89.5[ 2 87.5 296 [89.5, 93.5[ 1 91.5 30
Total 30
El intervalo de clase que tiene la mayor frecuencia absoluta (10) es [77.5, 81.5[.
El lımite inferior de este intervalo es igual a 77.5 y esta asociado con el ındice 3.Luego j = 3 y en consecuencia LIj = LI3 = 77.5. La amplitud a del intervalo es81.5− 77.5 = 4.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Moda
ModaModa en Variables Cuantitativas Continuas: Mo = LIj +
(∆1
∆1+∆2
)× a
Ejemplo (Cont.)
Ademas:
fj = f3 = 10f(j−1) = f(3−1) = f2 = 4.f(j+1) = f(3+1) = f4 = 6
Esto nos conduce a que
∆1 = fj − f(j−1) = f3 − f2 = 10− 4 = 6∆2 = fj − f(j+1) = f3 − f4 = 10− 6 = 4
Por lo tanto:
Mo = LIj +
(∆1
∆1 + ∆2
)× a = 77.5 +
6
6 + 4× 4 = 77.5 +
6
10× 4 = 79.9,
lo que significa que el valor del precio de la libra de cobre que mas serepitio en la muestra fue de 79.9 centavos de dolar. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Estadıgrafos de PosicionIntroduccion
Tambien conocidos como estadıgrafos de posicion, son aquellos que daninformacion acerca del orden en la estructura de la muestra.
De comienzos del curso conocemos dos: el valor maximo y el mınimo.
A contar de ahora asumiremos que la muestra de datos se encuentraordenada en orden creciente. Esto es: x1 ≤ x2 ≤ · · · ≤ xn.
De esta manera: xmin = x1 y xmax = xn.
Centraremos nuestra atencion en describir algunos valores de localizacionque permiten dividir la muestra en varias partes iguales con el objetivo deir viendo como se concentran los datos que se alojan en ella.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
EstadıgrafosPercentil
Los percentiles son numeros que dividen a la muestra en 100 partesiguales.
En total tenemos 99 percentiles y denotaremos por Pk al percentil deorden k, con k = 1, 99.
El percentil Pk divide a la muestra en dos partes:
una a la izquierda de Pk que contiene al k% inferior de lasobservaciones.una a la derecha de Pk que contiene al (100− k)% de lasobservaciones.
Entre dos percentiles consecutivos esta contenido un 1% de la muestra.
El calculo de cada percentil se hara dependiendo del tipo de variable queeste en juego.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de PercentilesVariable Cuantitativa Discreta
Sea Lk la posicion del percentil que andamos buscando.
Explıcitamente: Lk =n × k
100Entonces:
Pk =
xdLke , si Lk no es un numero entero
xLk + xdL(k+1)e
2, si Lk es entero
Por notacion: dLke corresponde al numero entero que es inmediatamentemayor que Lk .
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de PercentilesVariable Cuantitativa Continua
Al igual que en el calculo de la mediana, requerimos contar con la columnacorrespondiente a la frecuencia acumulada de cada intervalo.
La frecuencia absoluta de cada intervalo la denotaremos por Fi , i = 1, k.
Si buscamos el percentil de orden m, definamos:
1 LIj : lımite inferior del primer intervalo tal que Fj ≥ m×n100
. Diremos que eseintervalo contiene al percentil que andamos buscando.
2 j : ındice asociado con el intervalo que contiene al percentil.3 fj : frecuencia absoluta del intervalo que contiene al percentil.4 F(j−1): frecuencia acumulada del intervalo anterior al percentil.
5 a: amplitud del intervalo que contiene al percentil. Recordemos quea = r
k.
De esta manera, la expresion analıtica para calcular el percentil de orden m es
Pm = LIj +
(m×n100
− F(j−1)
Fj − F(j−1)
)× a, m = 1, 99
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Algunos Percentiles de interesCuartiles, Deciles, Quintiles
Existen percentiles que son ampliamente utilizados y que llevan nombrepropio. Entre ellos destacan los cuartiles, quintiles y deciles.
Los cuartiles dividen la muestra en 4 partes iguales. Se denotan porQ1, Q2, Q3.
Los quintiles dividen la muestra en 5 partes iguales. Se denotan porC1, C2, C3, C4.
Los deciles dividen la muestra en 10 partes iguales. Se denotan porD1, D2, D3, D4, D5, D6, D7, D8, D9.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Algunos Percentiles de interesRelaciones entre ellos
Me = P50 = Q2 = D5
C4 = P80 = D8
C1 = D2 = P20
etc.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Algunos Percentiles de interes
Observacion
La forma de calcularlos se basa en buscar la equivalencia con el percentilcorrespondiente (esto siempre se puede hacer).
Luego aplicar la formula correspondiente como si se tratara de unpercentil de orden k ya sea si la variable en juego es cuantitativa discretao continua.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.
Pk =
xdLke , si Lk no es un numero entero
xLk + xdL(k+1)e
2, si Lk es entero
Por ejemplo
Determinar los valores de Q3, D7 y P42 para los elementos de la siguientemuestra: 4, 7, 8, 10, 15, 20, 24, 24, 25, 25.
En primer lugar la muestra tiene un total de n = 10 valores que sonx1 = 4, x2 = 7, x3 = 8, x4 = 10, x5 = 15, x6 = 20, x7 = 24, x8 = 24, x9 = 25 yx10 = 25.
Por otro lado, en virtud de la equivalencia existente entre los estadıgrafosexistentes podemos afirmar que el problema se reduce a encontrar los percentilesP75, P70 y P42.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.
Pk =
xdLke , si Lk no es un numero entero
xLk + xdL(k+1)e
2, si Lk es entero
Hallar P75,P70 y P42 para la muestra4, 7, 8, 10, 15, 20, 24, 24, 25, 25
Para Q3 = P75 consideramos k = 75 y calculamos
Lk =k × n
100=
75× 10
100= 7.5.
Como 7.5 no es un numero entero, diremos que P75 = xdLke = xd7.5e = x8 = 24.
Luego P75 = 24. Se interpreta como que el 75% de las observaciones estan pordebajo del valor 24 y que el 25% restante lo sobrepasan.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.
Pk =
xdLke , si Lk no es un numero entero
xLk + xdL(k+1)e
2, si Lk es entero
Hallar P75,P70 y P42 para la muestra4, 7, 8, 10, 15, 20, 24, 24, 25, 25
Para el caso de D7 = P70 consideramos k = 75 y calculamos
Lk =k × n
100=
70× 10
100= 7. Como Lk = L70 = 7 es entero, deberemos
calcular el valor de Lk+1 = L(70+1) = L71 = 71×10100
= 7.1 ⇒ dL71e = 8
De esta manera: P70 =xLk + xL(k+1)
2=
x7 + x8
2=
24 + 24
2= 24
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99Variable Cuantitativa Discreta.
Pk =
xdLke , si Lk no es un numero entero
xLk + xdL(k+1)e
2, si Lk es entero
Hallar P75,P70 y P42 para la muestra4, 7, 8, 10, 15, 20, 24, 24, 25, 25
Finalmente para encontrar el valor de P42 hacemos k = 42, con lo cualLk = 42×10
100= 4.2.
Como 4.2 no es un numero entero se sigue queP42 = xdLke = xd4.2e = x5 = 15.
Por lo tanto: P42 = 15. J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99
Variable Cuantitativa Continua: Pk = LIj +
(k×n100
−F(j−1)
Fj−F(j−1)
)× a, k = 1, 99, Fj ≥ k×n
100
Por ejemplo
Encontrar los valores de Q1, D3 y P45 para los datos de una muestra cuyatabla de frecuencia es
i Int. Clase Real fi Fi
1 [45, 55[ 6 62 [55, 65[ 10 163 [65, 75[ 19 354 [75, 85[ 11 465 [85, 95[ 4 50
Total 50
Es necesario precisar que, en virtud de la equivalencia existente cuartiles,quintiles y deciles con los percentiles, nuestro problema se reduce a hallarQ1 = P25, D3 = P30 y P45.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99
Variable Cuantitativa Continua: Pk = LIj +
(k×n100
−F(j−1)
Fj−F(j−1)
)× a, k = 1, 99, Fj ≥ k×n
100
Hallar Q1 = P25,D3 = P30 y P45
Para Q1 = P25 deberemos encontrar el intervalo cuya frecuenciaacumulada sea inmediatamente superior a k×n
100, con k = 25 y n = 50. Es
decir, mayor o igual que 25×50100
= 12.5.
Dicho intervalo es [55, 65[ cuyo lımite inferior es 55 y cuyo ındiceasociado j = 2 y cuya amplitud vale a = 65− 55 = 10.
Ası: Fj = F2 = 16, F(j−1) = F(2−1) = F1 = 6.
Luego Q1 = P25 = 55 + 50/4−616−6
× 10 = 61.5.
Esto se interpreta como que el 25% de los datos es menor o igual que61.5 y que el 75% restante es mayor que ese numero.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Calculo de Percentiles de orden k , k = 1, 99
Variable Cuantitativa Continua: Pk = LIj +
(k×n100
−F(j−1)
Fj−F(j−1)
)× a, k = 1, 99, Fj ≥ k×n
100
Hallar Q1 = P25,D3 = P30 y P45
En forma analoga se concluye que:
D3 = P30 = 55 +30×50
100− 6
16− 6× 10 = 64 (segundo intervalo)
P45 = 65 +45×50
100− 16
35− 16× 10 = 68.4 (tercer intervalo) J
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Diagrama de CajasBox and Whisker Plot
Presentacion visual que describe al mismo tiempo varias caracterısticas
importantes de un conjunto de datos tales como:
centrodispersionalejamiento de la simetrıaidentificacion de valores extremos (puntos atıpicos), es decir, devalores que se alejan de una manera poco usual del resto de losdatos.
Sus ingredientes principales son los 3 cuartiles. Recordemos que lamediana es el cuartil de orden 2 o bien Q2.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Diagrama de CajasReglas de Construccion
1 Calcular la mediana y los otros dos cuartiles, con los cuales se formara la caja,que tiene la mediana como eje central y como lados los dos cuartiles. Estoscuartiles reciben tambien los nombres de “bisagras”. La altura (anchura) de lacaja no interesa.
2 Calculamos el rango intercuartılico RIC = Q3 − Q1.
3 Calculamos el paso P = 1.5× RIC .
4 Determinamos las cercas internas que estan a un paso de los cuartiles o
bisagras. Tenemos la
Cerca Interna Inferior CIi = Q1 − PCerca Interna Superior CIs = Q3 + P
Si la cerca interna inferior da menor que el valor mınimo de la muestra, esta sehace igual al valor mınimo; igualmente, si la cerca interna superior da mayor queel valor maximo, esta se hace igual a dicho valor.
5 “Valores extremos” son los ubicados entre las dos cercas y merecen especialatencion, ya que pueden ser valores atıpicos, que en algunos casos nopertenecen realmente a la distribucion general de donde provienen los datos.
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Diagrama de Cajas
Por ejemplo
Imaginemos que tenemos una variable a partir de cuya tabla de
frecuencias se pueda extraer la siguiente informacion:
Primer Cuartil Q1 = 7.0Segundo Cuartil Q2 = Me = 7.8Tercer Cuartil Q3 = 8.8Recorrido Intercuartılico RIC = Q3 − Q1 = 8.8− 7.0 = 1.8Paso P = 1.5× RIC = 1.5× 1.8 = 2.7Cerca Interna Inferior CIi = Q1 − P = 7.0− 2.7 = 4.3Cerca Interna Exterior CIe = Q3 + P = 8.8 + 2.7 = 11.5
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Construir el Diagrama de Cajas con los siguientes datos:Q1 = 7.0, Q2 = 7.8, Q3 = 8.8, RIC = 1.8, P = 2.7, CIi = 4.3, CIe = 11.5
La grafica queda de esta manera
CIi = 4.3 CIe = 11.5Q1 = 7.0
Q2 = Me = 7.8
Q3 = 8.8
RIC = Q3 - Q1 = 1.8
EYGDD *.* - Curso Completo
Estadıgrafos de Tendencia Central
Medidas de Localizacion: Cuartiles, Deciles, Percentiles
Diagrama de CajasInterpretacion
La mitad de los datos es inferior a 7.8
La mitad de los datos toman valores entre 7.0 y 8.8
La primera mitad de los datos (antes del primer cuartil) son menores que7.0
La cuarta parte de los datos (25%) toman valores entre 7.0 y 7.8
El 25% de los datos toman valores entre 7.8 y 8.8
Despues del tercer cuartil, el 25% de los datos son mayores que 8.8
La mayorıa de los datos se concentran entre 7.0 y 8.8
Los valores que sean menores que 4.3 o superiores a 11.5 son atıpicos.
J
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Estadıgrafos de DispersionIntroduccion
Las medidas de tendencia central no proporcionan suficiente informacionpara una adecuada descripcion de los datos, porque no toman en cuentala variabilidad o dispersion de los mismos.
Luego, para completar la interpretacion que pueda deducirse y para evitarfalsas interpretaciones, es necesario acompanar el valor medio con uncoeficiente que mida el grado de dispersion de la distribucion de lavariable.
Dentro de los estadıgrafos de dispersion que vamos a estudiar seencuentran el rango, varianza, desviacion estandar y coeficiente devariacion porcentual.
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Rango
Estadıgrafos de DispersionRango
El rango es igual a la diferencia entre los valores maximos y mınimospresentes en una muestra.
Este posee la ventaja de su independencia respecto de la media detendencia central y de la facilidad de su calculo; sin embargo tiene ladesventaja que para su calculo se toman solo dos valores del conjunto.
Se denota por r y es igual a r = xmax − xmin.
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Varianza
Estadıgrafos de DispersionVarianza
Corresponde al promedio de los cuadrados de las distancias entre cadaobservacion y la media aritmetica del conjunto de observaciones.
Se denota por S2.
En el caso de variables cuantitativas discretas que puedan tomar k valoresdistintos x1, . . . , xk con frecuencias absolutas f1, . . . , fk :
S2 =
k∑i=1
(xi − X
)2 × fi
n − 1, n 6= 1
Para el caso de variables cuantitativas continuas donde las marcas declase m1, . . . , mk tienen frecuencias absolutas f1, . . . , fk :
S2 =
k∑i=1
(mi − X
)2 × fi
n − 1, n 6= 1
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Varianza
Estadıgrafos de Dispersion - Varianza en caso discreto
S2 =
k∑i=1
(xi−X)2×fi
n−1, n 6= 1
Por ejemplo
Encontrar la varianza para los siguientes valores: 3,4,6,7.
En primer lugar encontremos la media aritmetica de ellos: X = 3+4+6+74
= 5.0
A la tabla de frecuencias le vamos a agregar el dato de (xi − X )2 × fi :
i xi fi (xi − X )2 × fi1 3 1 (3− 5.0)2 × 1 = 42 4 1 (4− 5.0)2 × 1 = 13 6 1 (6− 5.0)2 × 1 = 14 7 1 (7− 5.0)2 × 1 = 4
Total 4 10
De acuerdo a esto tenemos quek∑
i=1
(xi − X
)2× fi = 10. Por lo tanto
S2 =
k∑i=1
(xi−X)2×fi
n−1= 10
3= 3.3 J
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Varianza
Estadıgrafos de Dispersion - Varianza en caso continuo -Ejemplo
S2 =
k∑i=1
(mi − X
)2 × fi
n − 1, n 6= 1
Consideremos la siguiente tabla de frecuencias:
i Int. Clase Real mi fi mi × fi(mi − X
)2× fi
1 [5.2, 6.1[ 5.65 3 16.95 (5.65− 7.87)2 × 3 = 14.792 [6.1, 7.0[ 6.55 5 32.75 (6.55− 7.87)2 × 5 = 8.713 [7.0, 7.9[ 7.45 9 67.05 (7.45− 7.87)2 × 9 = 1.594 [7.9, 8.8[ 8.35 7 58.45 (8.35− 7.87)2 × 7 = 1.615 [8.8, 9.7[ 9.25 5 46.25 (9.25− 7.87)2 × 5 = 9.526 [9.7, 10.6[ 10.15 3 30.45 (10.15− 7.87)2 × 3 = 15.60
Total 32 251.9 51.81X = 251.9
32= 7.87
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Varianza
Estadıgrafos de Dispersion - Varianza en caso continuo -Ejemplo
S2 =
k∑i=1
(mi − X
)2 × fi
n − 1, n 6= 1
Como X = 7.87 yk∑
i=1
(mi − X )2 × fi = 51.81 se concluye que
S2 =
k∑i=1
(mi − X
)2 × fi
n − 1=
51.81
31= 1.67 J
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Desviacion Estandar
Estadıgrafos de DispersionDesviacion Estandar
La desviacion estandar — denotada por S — corresponde a la raız cuadradapositiva de la varianza. Es decir:
S = +√
S2
Para efectos de estudio se prefiere trabajar con la desviacion estandar en lugarde la varianza, ya que es compatible con la dimensionalidad de los datos.
Se interpreta de la siguiente manera: “Es la distancia media que existe entretodas las observaciones respecto del valor central, esto es, de la media”.
En el ejemplo anterior de varianza en el caso discreto se tiene queS = +
√S2 =
√3.3 = 1.82 y en el caso del ejemplo continuo es igual a
S =√
1.67 = 1.29 J
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Coeficiente de Variacion Porcentual
Estadıgrafos de DispersionCoeficiente de Variacion Porcentual
El coeficiente de variacion porcentual — denotado por CV% es util paracomparar el grado de dispersion entre dos o mas distribuciones expresadasen distintas unidades de medida, puesto que las varianzas o lasdesviaciones estandar no permiten efectuarlas.
Representa el porcentaje de variacion de la desviacion estandar de unconjunto de observaciones en relacion a la media de tal conjunto deobservaciones. Esto es
CV% =S
X× 100
Este indicador deja de tener utilidad cuando el valor de la mediaaritmetica se aproxima a cero.
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Coeficiente de Variacion Porcentual
Estadıgrafos de DispersionCoeficiente de Variacion Porcentual
Por ejemplo
En el caso discreto cuando tenıamos S = 1.82 y X = 5.0 se concluye queCV% = S
X× 100 = 1.82
5.0× 100 = 36, lo que significa que la desviacion
estandar de los datos presenta un 36% de variacion en relacion al valor dela media.
Queda de ejercicio hacer el calculo para el ejemplo del caso continuopresentado anteriormente. J
EYGDD *.* - Curso Completo
Estadıgrafos de Dispersion
Coeficiente de Variacion Porcentual
Por su atencion muchas gracias. . .
♠♠♠♠♠♠ ♠♠♠ ♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠ ♠♠♠♠♠♠♠♠ ♠♠♠ ♠♠♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠♠♠ ♠♠♠♠ ♠♠♠ ♠♠♠♠♠♠♠♠♠