TABLA DE CONTENIDO
Estadstica I
Programas de Estudio a Distancia
www.unipamplona.edu.co
Esperanza Paredes HernndezRectoraMara Eugenia Velasco EspitiaESTADISTICA I_________________________________________________________________________Decana Facultad de Estudios a Distancia_________________________________________________________________________UNIVERSIDAD DE PAMPLONA-.Facultad de Estudios a Distancia
Tabla de Contenido
PresentacinIntroduccin
UNIDAD 1: Generalidades de la EstadsticaNcleos Temticos y ProblemticosProceso de Informacin1.1.DEFINICIN1.1.1Importancia1.1.2Poblacin1.1.3Muestra1.1.4Mtodos de Seleccin de una Muestra al Azar1.1.5Unidad Estadstica1.2ESTADSTICA DESCRIPTIVA DISTRIBUCIN DE FRECUENCIAS 1.2.1Recoleccin de Datos1.2.2 Intervalos1.2.3 Amplitud1.2.4 Frecuencia de Clase o Frecuencia Absoluta1.2.5 Marca de Clase (X)1.2.6 Frecuencia Relativa (Fr)1.2.7 Frecuencia Acumulada (Fa)1.2.8 Frecuencia Relativa Acumulada (Fra)Proceso de Comprensin y Anlisis
UNIDAD 2: Medidas de Tendencia CentralNcleos Temticos y ProblemticosProceso de Informacin2.1PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS2.1.1 Media Aritmtica2.1.2 Mediana2.1.3 Moda2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS2.2.1 Media Aritmtica2.2.2 Mediana2.2.3 ModaProceso de Comprensin y AnlisisUNIDAD 3: Medidas de DispersinNcleos Temticos y ProblemticosProceso de Informacin3.1DESVIACIN ESTNDAR O TPICA3.2VARIANZA3.3COEFICIENTE DE VARIACINProceso de Comprensin y Anlisis
UNIDAD 4:Medidas de UbicacinNcleos Temticos y ProblemticosProceso de Informacin4.1 CUARTILES, PERCENTILES Y DECILES4.2 DIAGRAMAS DE CAJAProceso de Comprensin y Anlisis
UNIDAD 5: Presentacin de la InformacinNcleos Temticos y ProblemticosProceso de Informacin5.1HISTOGRAMA5.2POLGONOS DE FRECUENCIA5.3OJIVAS5.4BARRAS5.4.1Barras Verticales5.4.2Barras HorizontalesProceso de Comprensin y Anlisis
ANEXO: Tablas
BIBLIOGRAFA GENERAL
Presentacin
La educacin superior se ha convertido hoy da en prioridad para el gobierno Nacional y para las universidades pblicas, brindando oportunidades de superacin y desarrollo personal y social, sin que la poblacin tenga que abandonar su regin para merecer de este servicio educativo; prueba de ello es el espritu de las actuales polticas educativas que se refleja en el proyecto de decreto Estndares de Calidad en Programas Acadmicos de Educacin Superior a Distancia de la Presidencia de la Repblica, el cual define: Que la Educacin Superior a Distancia es aquella que se caracteriza por disear ambientes de aprendizaje en los cuales se hace uso de mediaciones pedaggicas que permiten crear una ruptura espacio temporal en las relaciones inmediatas entre la institucin de Educacin Superior y el estudiante, el profesor y el estudiante, y los estudiantes entre s.
La Educacin Superior a Distancia ofrece esta cobertura y oportunidad educativa ya que su modelo est pensado para satisfacer las necesidades de toda nuestra poblacin, en especial de los sectores menos favorecidos y para quienes las oportunidades se ven disminuidas por su situacin econmica y social, con actividades flexibles acordes a las posibilidades de los estudiantes.
La Universidad de Pamplona gestora de la educacin y promotora de llevar servicios con calidad a las diferentes regiones, y el Centro de Educacin Virtual y a Distancia de la Universidad de Pamplona, presentan los siguientes materiales de apoyo con los contenidos esperados para cada programa y les saluda como parte integral de nuestra comunidad universitaria e invita a su participacin activa para trabajar en equipo en pro del aseguramiento de la calidad de la educacin superior y el fortalecimiento permanente de nuestra Universidad, para contribuir colectivamente a la construccin del pas que queremos; apuntando siempre hacia el cumplimiento de nuestra visin y misin como reza en el nuevo Estatuto Orgnico:
Misin: Formar profesionales integrales que sean agentes generadores de cambios, promotores de la paz, la dignidad humana y el desarrollo nacional.
Visin: La Universidad de Pamplona al finalizar la primera dcada del siglo XXI, deber ser el primer centro de Educacin Superior del Oriente Colombiano.Maria Eugenia Velasco Espitia Directora CEDUP
Introduccin
La importancia que tiene la matemtica en el desarrollo de los procesos intelectuales del hombre es notoria a travs de su historia. Fue as como en la antigedad el pensamiento matemtico contribuy a resolver problemas en tareas econmicas y constructoras de diferentes pueblos, dio la base para revelar tos misterios del mundo, es decir, dar explicaciones razonables para alcanzar la verdad de los fenmenos que lo suceden. Contrariamente a los griegos, los hombres de la edad media utilizaron el contenido matemtico como una simple rutina para disciplinar la mente. Sin embargo, a partir de los trabajos de Galileo, la matemtica en la edad moderna ayud a buscar explicaciones concretas de problemas que se daban en ingeniera, construccin y otras actividades prcticas del hombre.
Por tal motivo, gracias al medio, las personas estn rodeadas constantemente por un conjunto de experiencias, que manejan y manipulan de una manera sorprendente. Es decir, en cierta forma se est efectuando una serie de operaciones: recoge, organiza, analiza e interpreta esas informaciones mediante unas representaciones significativas para l y as se obtiene una serie de conclusiones razonables.
Esta informacin que de cierta manera se manipula, se debe matematizar. Es decir, seguir un procedimiento para poder tabular la informacin, presentarla y as hacer el anlisis respectivo para dar las conclusiones pertinentes al estudio que se est realizando.
La Estadstica es utilizada en casi todas las ramas de la ciencia moderna, as como en muchos otros campos de la actividad humana. Como dijo Salomn Fabricant todo el mundo parece hoy coincidir en que la Estadstica puede ser til para comprender, evaluar y controlar el funcionamiento de la sociedad. En nuestra sociedad, el progreso puede medirse mediante diversos ndices numricos, la estadstica se utiliza para describir, manipular e interpretar estos nmeros.
An cuando los tipos de problemas a los cuales puede aplicarse la Estadstica como herramienta fundamental para el anlisis e interpretacin de resultados son bastante heterogneos, en muchos casos los pasos de una investigacin estadstica son los siguientes:Primera etapa: formulacin del problema. Para investigar con xito un problema dado, primero se tienen que crear conceptos precisos, formular preguntas claras e imponer limitaciones adecuadas al problema, tomando en cuenta el tiempo, dinero disponible y la habilidad de los investigadores.Segunda etapa: diseo del experimento. Nuestro deseo es obtener un mximo de informacin empleando un mnimo de costo y tiempo. Esto implica, entre otras cosas, que se debe determinar el tamao de la muestra o la cantidad y tipo de datos que resolvern ms eficientemente el problema. A la vez este tamao ser afectado por el mtodo empleado para la seleccin de la muestra representativa.
Con respecto a la representatividad de la muestra, se debe observar que no es fcil obtener selecciones que sean completamente aleatorias. Existe el peligro de que una seleccin pueda ser preferida en alguna forma. Se han propuesto varios mtodos para vencer esta dificultad y se han usado en la prctica. Se considera este punto dentro del desarrollo del mdulo.
Tercera etapa: experimentacin o recoleccin de datos. En general, sta es la parte que ms tiempo consume en toda investigacin que sea realizada, sta debe sujetarse a reglas estrictas. De hecho, cuanto menos opiniones impongamos, sern mejores los resultados.
Cuarta etapa: tabulacin y formulacin de la respuesta. Al aplicar el mtodo estadstico antes mencionado, se obtienen conclusiones a partir de la muestra, acerca de la poblacin correspondiente. Es decir, se va a inferir sobre la muestra y se trata de sacar conclusiones para la poblacin. Es esta etapa la que le da el objetivo final a la estadstica, puesto que se van a tomar decisiones con base en los resultados obtenidos en el estudio descriptivo de la muestra.
No existe una frmula mgica ni nica en estadstica que tome en cuenta todas las situaciones prcticas concebibles. Por lo cual es necesario adquirir conocimientos generales de los mtodos ms importantes para hacer inferencias. En cada caso prctico debe situarse con cuidado la naturaleza del problema especfico, para estar seguros de que ser escogido el mtodo ms apropiado.
Con el apoyo del computador los clculos matemticos se hacen ms fciles, por lo tanto se recomienda utilizar e integrar un software apropiado para tal fin. En la actualidad existen varios paquetes estadsticos sencillos de manejar, tales como el Statgraphics, Sas, Minitab, Spss.
De comn acuerdo con su Tutor se pueden desarrollar los ejercicios propuestos al final de cada tema, se puede utilizar calculadora y computador para facilidad de los clculos.84
ESTADISTICA BASICA
UNIVERSIDAD DE PAMPLONA Facultad de Estudios a Distancia
UNIDAD 1: Generalidades de la Estadstica
Ncleos Temticos y Problemticos
Definicin Estadstica Descriptiva Distribucin de Frecuencias
Proceso de Informacin
1.1 DEFINICIN
Al evolucionar las ciencias, pierden sus rasgos primitivos, se transforman, dividen y an cambian de nombre. Como ciencia que es, la estadstica ha sufrido igual proceso y para comprender su estado actual y su campo de actividades se necesita conocer algo de su historia. Se considera fundador de la estadstica a Godofredo AchenwalL profesor y economista alemn (1719 - 1772) quien, siendo profesor de la universidad de Leipzig, escribi sobre el descubrimiento de una nueva ciencia que lamo estadstica (palabra derivada de Staat que significa gobierno) y que defini como el conocimiento profundo de la situacin respectiva y comparativa de cada estado Achenwa y sus seguidores estructuraron los mtodos estadsticos que se orientaron a investigar, medir y comparar las riquezas de las naciones Lo anterior no significa que antes de los estudios de Godofredo Achenwa, los estados no hubiesen efectuado inventarios de sus riquezas; estos invntanos o censos se efectuaron desde la antigedad. Se sabe que 2000 a 2500 aos antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales Desde su creacin la estadstica se ha enriquecido continuamente con los aportes de matemticos, filsofos y cientficos.
Adems, en un principio se consideraba que la funcin de a estadstica era la descripcin de las caractersticas de un grupo, de observar y describir el hecho En su origen la estadstica era histrica: hoy en da, la estadstica, adems de ser descriptiva, es analtica, considerndose esta ltima como la funcin ms importante que realiza, ya que permite obtener conclusiones para un grupo mayor, denominado poblacin, partiendo de una investigacin realizada en un grupo menor, denominado muestra.
Las siguientes son unas definiciones que ayudan a determinar el sentido de la estadstica:
Dicaonano de Webster una rama de las matemticas que trata de la recopilacin, el anlisis, la interpretacin y la presentacin de una gran cantidad de datos numricos.'
Kendall y Stuart la estadstica es la rama del mtodo cientfico que traa de los datos reunidos al contar o medir las propiedades de alguna poblacin.
Fraser la estadstica trata con mtodos para obtener conclusiones a partir de los resultados de los experimentos o procesos."
Al unir estas definiciones, se puede notar que a partir de la recopilacin de datos se pueden hacer inferencias con respecto a resultados de experimentos. Es decir a partir de un conjunto de mtodos, normas, reglas y de principios para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo.
Es entonces, un campo parcial de la Matemtica aplicada a un conjunto de objetos que se asignan valores numricos y luego estos se siguen elaborando matemticamente.
Matemticamente los procedimientos estadsticos estn muy desarrollados y asegurados en el plano de la teora, por ejemplo, mediante la indicacin de mbitos dentro de los cuales puede suponerse o rechazarse una hiptesis. Se acostumbran a distinguir dos clases de Estadstica, la descriptiva y la de inferencia.
1.1.1Importancia
La teora general de la estadstica es aplicable a cualquier campo cientfico en el cual se hacen observaciones el estudio y aplicacin de los mtodos estadsticos son necesarios en todos (los campos del saber, sean estos de nivel tcnico o cientfico). Es obvio que en cada campo se aplican o desarrollan procedimientos especficos, como aplicaciones particulares a variantes de la teora general. Las primeras aplicaciones de la estadstica fueron los asuntos de gobierno, luego las utilizaron las compaas de seguros y los empresarios de juegos de azar, despus siguieron los comerciantes, los industriales, los educadores, etc.
Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de la vida:
Se disean encuestas para recoger informacin y as poder predecir algn suceso. Los experimentos que se hacen para determinar el mtodo apropiado paracurar cierta enfermedad. La duracin, intensidad, extensin de las lluvias, tormentas o granizos, las Temperaturas, la intensidad y direccin del viento son variables aleatorias.
1.1.2Poblacin
Es el conjunto de elementos que se toma de referencia para el estudio que se desea investigar la ocurrencia de una caracterstica o propiedad. Los elementos que integran la poblacin pueden pertenecer a personas, objetos o cosas. Segn sea el tamao, la poblacin puede considerarse como finita o infinita.
Es poblacin finita cuando el nmero de elementos que la componen es limitado; infinita cuando consta de infinitos elementos.
Ejemplo
La poblacin consistente en todas las tuercas producidas por una fbrica en un da especfico, los estudiantes matriculados en un colegio, son poblaciones finitas; mientras que la determinada por todos los posibles resultados (caras, cruces) de sucesivas tiradas de una moneda, las personas que hoy y en el futuro subscriban un seguro de vida, las piezas fabricadas por una mquina, son poblaciones infinitas, cantidad de carros que transitan por un peaje en un tiempo determinado es finita pero si no se especifica este tiempo es entonces infinita.
1.1.3Muestra
Se considera como muestra el subconjunto de elementos que pertenecen a la poblacin objetivo sobre los cuales se recoger la informacin necesaria, para tomar una decisin vlida relativa a la poblacin de estudio. Si una muestra es representativa de una poblacin es posible inferir importantes conclusiones sobre la poblacin a partir del anlisis de la muestra.
Las muestras pueden ser de dos tipos: probabilstica o al azar, cuando cada uno de los elementos tiene la misma probabilidad de ser escogido y no probalstica cuando se seleccionan los datos con determinado criterio o conveniencia del investigador; en estos casos, algunas unidades tienen mayor posibilidad que otras de ser seleccionadas, por tal razn no se puede determina la validez, ni la confianza que merecen dichos resultados.
1.1.4 Mtodos de Seleccin de una Muestra al Azar
La clave de un procedimiento de muestreo es garantizar que la muestra sea representativa de la poblacin, este muestreo puede ser probabilstica o intencional Es probabilstica cuando todos los elementos de la poblacin tienen la misma posibilidad de ser elegidos. En cambio, intencional, es cuando el investigador selecciona bajo un criterio la muestra.
La seleccin de esta muestra probabilstica se puede realizar por medio de los siguientes mtodos:
Azar Simple
Este mtodo de seleccin permite que todos los elementos que constituyen la poblacin tengan la misma posibilidad de ser incluidos en la muestra. Este mtodo es de gran importancia cuando la poblacin no es grande o siendo grande, este se concentra en un rea pequea. Tambin cuando las caractersticas que se investiga presentan poca variabilidad o cuando la poblacin facilita su enumeracin para su seleccin.
Ejemplo: en la fabrica T&T hay mil personas trabajando, 600 de las cuales son obreros, 250 son tcnicos y 150 son profesionales Si se quiere seleccionar una muestra aleatoria simple de 200 personas, en este caso, la probabilidad de seleccin de cada persona es:nN2001000==0.2P =
Lo cual indica que el 20% de los obreros corresponden a 120 de los tcnicos 50 y 30 profesionales.
Por Estratos
Para el muestreo estratificado se divide la poblacin en vanos grupos o estratos con el fin de dar representatividad a los distintos factores que integran la poblacin del estudio, la condicin de la estratificacin es la presencia en cada estrato de las caractersticas que conforman la poblacin.
Este proces de estratificacin requiere que la poblacin sea dividida en grupos homogneos donde cada elemento tiene una caracterstica tal que no le permite pertenecer a otro estrato.
Para la seleccin de los elementos o unidades representantes de cada estrato se utiliza el mtodo del muestreo aleatorio o al azar. Dentro de este muestreo encontramos casos tres especiales:
Muestras de igual tamao. En este tipo de muestreo debe seleccionarse un nmero igual de elementos en cada grupo mediante procedimiento al azar. Muestreo proporcional. En este tipo el tamao de muestra por estrato se escoge de tal forma que sea proporcional al tamao poblacional del mismo. Afinacin ptima. Este mtodo utiliza la mejor subdivisin posible de una muestra total, reparticin en todos los estratos, considerando tanto la variacin como el tamao de cada estrato adems se tiene en cuota el costo de la investigacin.
Ejemplo: en el caso de la fabrica T&T se puede argumentar que obreros, tcnicos y profesionales son importantes para establecer comparaciones y se decide escoger 80 de cada estrato. En este caso las probabilidades de seleccin seran, por estrato, las siguientes:
Obreros80/600= 0,133Tcnicos80/250= 0,32Profesionales80/150= 0,53
Donde se puede apreciar que la probabilidad de seleccin no es igual para todas las personas, sino que depende del estrato en que stas se encuentran y as un obrero tiene menor posibilidad de ser seleccionado que un profesional, simplemente porque estos ltimos son menores.
Por Conglomerado
Existen situaciones donde ni el muestreo aleatorio simple ni el estratificado son aplicables, ya que no se dispone de una lista con el numero de elementos de la poblacin ni en los posibles estratos. En estos casos tpicamente los elementos de la poblacin se encuentran de manera natural agrupados en conglomerados, cuyo nmero si se conoce.
Por ejemplo la poblacin se distribuye en provincias, los habitantes de una ciudad en barrios, etc. Si se supone que cada uno de estos conglomerados es una muestra representativa de la poblacin total respecto a la variable que se estudia, se puede seleccionar algunos de estos conglomerados al azar y dentro de ellos, analizar todos sus elementos o una muestra aleatoria simple.
Ejemplo: se desea tomar una muestra de la poblacin colombiana para estudiar la proporcin de personas que estn de acuerdo con la relaciones prematrimoniales; si se supone que la edad y el sexo pueden influir en la opinin, se debera tomar una muestra donde estas caractersticas sean las mismas que en la poblacin base, lo que implica una muestra estratificada.
Sistematizada
Una forma prctica para seleccionar la muestra es hacerla en forma sistemtica, escogiendo una muestra de cada intervalo, donde el intervalo se calcula as: K= N/n; donde N es el tamao de la poblacin y n el de la muestra.
Ejemplo: si se quiere tomar una muestra de 500 viviendas en un barrio que tiene 2000 viviendas, el intervalo de seleccin ser: K= 2000 / 500 = 4.
Para iniciar el proceso de seleccin sistemtica se escoge al azar un nmero entre 1 y 4, a partir del nmero seleccionado y cada 4 viviendas se hace una escogencia, hasta completar la muestra.
1.1.5Unidad Estadstica
Una vez identificada la poblacin y la muestra, se ubica la unidad estadstica, o sea el objeto de la medicin. La unidad estadstica es el elemento del universo que reporta la informacin (observacin) y sobre el cual se realiza un determinado estudio (anlisis).
Dato
Hace referencia a la observacin particular, es decir, la informacin relacionada con las caractersticas de cosas existentes que pueden ser recogidos, anotados u observados
Variables
Es una dimensin o una caracterstica de una unidad de anlisis, dimensin que adopta la forma de una clasificacin. Una variable se puede representar por un smbolo X, Y, Z, V, x, h etc. que puede tomar un conjunto prefijado de valores; dichas variables pueden ser: Nominal: a veces conviene extender la nocin de variable a entidades no numricas: es decir que relacionan un carcter, un nombre, una cualidad. Por ejemplo, el color C de un arco iris es una variable que puede tomar los valores rojo, anaranjado, amarillo, verde, azul, violeta y rosado. Puede ser posible sustituir tales variables por entidades numricas de la siguiente manera: denotando el rojo como 1, el anaranjado como 2 etc.
Ordinal: le asigna valores numricos a los sujetos, de tal forma que los valores ms altos se le asignan a los individuos que tienen ms de la caracterstica que se mide. Esto hace que necesariamente satisfaga la caracterstica de diferenciacin pero en adicin introduce la posibilidad de ordenamiento.
Por ejemplo, en una competencia ciclstica se tiene en cuenta los cinco primeros puestos para la premiacin.
Intervalo: en adicin a la clasificacin y ordenamiento se introduce la posibilidad de establecer el ordenamiento con intervalos iguales.
Por ejemplo, la medicin de la temperatura la cual se puede hacer por medio de un termmetro en grados Fahrenheit.
Variable Continua: es la variable que puede tomar cualquier valor entre dos valores dados. La estatura H de una persona que puede ser 1.62 cm, 1.65 cm, 1.80.
Variable Discreta: es la variable que solo puede tomar un determinado nmero de valores enteros. El nmero N de hijos en una familia puede ser O, 1, 2, 3.
1.2ESTADSTICA DESCRIPTIVA - DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencias o tabla de frecuencia, es la disposicin tabular de los datos por clases junto con las correspondientes frecuencias de clase. Para la elaboracin de esta distribucin si los datos son cuantitativos, hay que tener en cuenta los siguientes pasos:
1.2.1 Recoleccin de Datos
Es la base para cualquier estudio estadstico, es la toma de datos u observaciones; estos se llevan a cabo mediante la recopilacin de los mismos sin ninguna ordenacin de acuerdo a lo que se est investigando.
Por ejemplo la empresa Cuero Lindo recopil la informacin resultante de encuestar 60 establecimientos pequeos, para estudiar sus ventas semanales en miles de pesos, los resultados son:
401726102621182716382233242028143025293728283322252929292132193523282215341316262420312918191123202428113439102517213418
Despus de tener dicha informacin, se procede a ordenarla; es decir, colocar los datos numricos en orden creciente o decreciente. Existe un tipo de ordenacin y se hacen generalmente en una tabla de distribucin de frecuencias. Para ello se debe encontrar inicialmente el rango de la distribucin; que es la diferencia entre el mayor y el menor dato obtenido. As:
R = Dm - dm, donde R = rangoDm = dato mayordm = dato menorR= 40 - 10 = 30
1.2.2 Intervalos
Al resumir grandes colecciones de datos es til distribuidos en clases o categoras; en cuanto al nmero de clases el investigador es autnomo para escoger el nmero de intervalos para trabajar, sin embargo existe una frmula que se utiliza como base o gua para indicar la cantidad de intervalos que se van a crear en la tabla de frecuencias. Esta frmula esta determinada por:
m = 1 + 3.33 log n;donde m = nmero de intervalosm = 1 + 3.33 log 60 = 6.92n = tamao de la muestra
Lo cual indica que se puede aproximar a 6 o 7 intervalos. En este caso se toman 6 intervalos, pero se agregan dos ms que son: el intervalo menor que el dato menor y el intervalo mayor que el dato mayor; esto cuando se utiliza un programa de computador.
1.2.3 Amplitud
El rango nos ayuda a determinar la amplitud o el tamao de cada clase, siendo esta una constante para cada intervalo. La amplitud indica la distancia que debe tener cada clase.
La amplitud se puede determinar como el cociente entre el rango y el nmero de intervalos.
A = R / m; dondeA = amplitud A = 30 / 6 = 5 miles de pesos
Para formar los intervalos de clase, si es utilizando un programa estadstico, se parte del dato menor 10 y se le suma la amplitud, as, 10 + 5=15. Entonces el primer grupo esta comprendido entre 10 y 15 miles de pesos.
El siguiente grupo ser: 15 + 5 = 20, donde el intervalo estar entre 15 y 20 miles de pesos. En forma similar se crean los dems intervalos, incluyendo los intervalos menores a 10 miles de pesos y mayores a 40 miles de pesos.
NMERO DE CLASESINTERVALOS
- 10
110 - 15
215 - 20
320 - 25
425 - 30
530 - 35
635 - 40
40 -
Otra manera de formar los intervalos de clase es tomar un dato como medida de referencia, por ejemplo 5 (que indica $5000) o el dato menor y sumarle el valor de la amplitud:NMERO DE INTERVALOSINTERVALOS
15 - 10
210 - 15
315 - 20
420 - 25
525 - 30
630 - 35
735 - 40
1.2.4 Frecuencia de Clase o Frecuencia Absoluta
Se determina el nmero de individuos que pertenecen a cada clase. Como cada clase est formada por un intervalo, entonces se debe tomar como un intervalo abierto a izquierda y cerrado a derecha. Esto quiere decir, por ejemplo: que para hacer el conteo para determinar las frecuencias correspondientes al intervalo 20 - 25, van a estar los valores 21, 22, 23, 24 y 25. De igual manera los valores que van a estar entre 25 - 30 son 26, 27, 28, 29 y 30.
Teniendo esto en cuenta, podemos utilizar el siguiente cuadro para realizar el conteo:
IntervalosNmero de EstablecimientosF
5 - 10/2
10 - 15/////5
15 - 20////////////12
20 - 25/////////////14
25 - 30//////////////15
30 - 35////////8
35 - 40////4
TOTAL60
Esta frecuencia significa; por ejemplo: que 12 establecimientos tienen ventas semanales entre $15000 y $20000; las mayores ventas estn entre $25000 y $30000, las menores ventas presentadas son de $10000, etc.
1.2.5 Marca de Clase (X)
Es el punto medio del intervalo de clase y se obtiene promediando el limite inferior y superior de cada clase.
IntervalosX
5 - 107,5
10 - 1512,5
15 - 2017,5
20 - 2522,5
25 - 3027,5
30 - 3532,5
35 - 4037,5
X =5+102= 7,5
Miles de pesos; esto quiere decir que el promedio del primer intervalo es de $7500.
Otra manera de hallar la amplitud de un intervalo es encontrar la diferencia comn entre marcas de clase sucesivas. Por ejemplo: 32,5 - 27,5 = 5 miles de pesos.
1.2.6 Frecuencia Relativa (Fr)
Es su frecuencia dividida por la frecuencia total de todas las clases y se expresa generalmente como un porcentaje.FFr = n
La frecuencia relativa del primer intervalo es 0.0333. Este valor se obtuvo de la relacin entre 2/60 = 0.0333; significa que el 3.33% de los establecimientos tienen ventas menores de $10000. Este porcentaje se obtiene al multiplicar por 100 el resultado obtenido.
De igual manera, la frecuencia relativa del segundo intervalo es de 0.0833, que significa que el 8.33% de los establecimientos tienen ventas entre $10000 a $15000.
1.2.7 Frecuencia Acumulada (Fa)
Es la acumulacin ascendente o descendente (de la primera a la ltima clase o viceversa) de frecuencias absolutas. La frecuencia acumulada descendente se obtiene de la siguiente manera:
La primera frecuencia acumulada corresponde a la primera frecuencia absoluta. La segunda acumulada se obtiene sumando las dos primeras absolutas, es decir, 2+5 = 7. La tercera acumulada se obtiene de sumar 7 + 12 = 19 y as sucesivamente.
La frecuencia acumulada ascendente se obtiene as: se inicia por la frecuencia absoluta del ltimo intervalo; en este caso 4. La siguiente es sumar esta frecuencia acumulada con la anterior: 4+8 = 12. La que sigue sera 4 + 8 = 12 y as sucesivamente.
IntervalosFFa
5 - 102260
10 - 155758
15 - 20121953
20 - 25143341
25 - 30154827
30 - 3585612
35 - 404604
El significado de este cuadro es el siguiente: si tomamos el tercer grupo descendente, su frecuencia acumulada, significa que 19 establecimientos tienen ventas semanales entre $10000 y $20000 o inferiores a $20000. Y si tomamos el segundo grupo ascendente, quiere decir que 12 establecimientos tienen ventas semanales entre $30000 y $40000 o mayores a $30000.
1.2.8 Frecuencia Relativa Acumulada (Fra)
Es la acumulacin sucesiva en forma ascendente o descendente de frecuencias relativas. La primera frecuencia relativa acumulada corresponde a la primera frecuencia relativa. La segunda, se obtiene sumando las dos primeras frecuencias relativas, es decir, 0,0333 + 0,0833 = 0,1167 y as sucesivamente. La frecuencia relativa acumulada ascendente se obtiene as: se inicia por la frecuencia relativa del ltimo intervalo; en este caso 0,0667. La siguiente es sumar esta frecuencia acumulada con la anterior 0,0667 + 0,1333 = 0,2 y as sucesivamente.
IntervaloFrFra
5 100.03330.03331
10 - 150.08330.11670.9666
15 - 200.20.31670.8833
20 - 250.23330.550.6833
25 - 300.250.80.45
30 - 350.13330.93330.2
35 - 400.066710.0667
Si tomamos el grupo 5 descendente su acumulado es de 0.8, cuyo significado es que el 80% de los establecimientos tienen ventas semanales menores a $30000; si tomamos el grupo 4 ascendente su acumulado ser del 0,6833, esto significa que el 68.33% de los establecimientos tienen ventas mayores a $20000 mil pesos.
IntervaloFFrFaFra
5 - 1020,03332600,03331
10 - 1550,08337580,11670,9666
15 - 20120,219530,31670,8833
20 - 25140,233333410,550,6833
25 - 30150,2548270,80,45
30 - 3580,133356120,93330,2
35 - 4040,066760410,0667
Total601,00
La tabla presenta el resumen de la clasificacin de los 60 establecimientos analizados por los investigadores de la empresa Cuero Lindo, esto significa que se ha organizado la informacin.
Proceso de Comprensin y Anlisis
Decir de las siguientes variables cules son continuas y cules son discretas
La altura de las personas La medida de la cantidad de lluvia cada en una localidad en un mes La edad de las personas, en aos cumplidos El nmero de alumnos de cada curso de un colegio
Por qu es til la estadstica en el campo para el cual se est preparando.
La Estadstica estudia el comportamiento de fenmenos colectivos y nunca de una observacin individual comentar este principio.
Clasificar a que tipo de estadstica pertenecen los siguientes tems:
Realizar un inventario Determinar la demanda de un producto La posibilidad que llueva en una ciudad determinada El porcentaje de desempleo en una ciudad especfica El promedio de las acciones vendidas en la bolsa de valores en una empresa en un mes determinado El aumento del ndice de precios al consumidor en un mes especfico El aumento del costo de vida en un mes especfico El nmero de accidentes ocurridos en una ciudad determinada Las ventas de un almacn en un mes determinado El aumento de costos de produccin con respecto al mismo mes del ao anterior.
Dar un ejemplo donde se aplique la estadstica en los siguientes campos:
Agricultura Biologa Negocios Qumica Comunicaciones Finanzas Economa Educacin Electrnica Educacin Electrnica Medicina Fsica Mercadeo Ciencias polticas Psicologa Medicina Fsica Mercadeo Ciencias polticas Psicologa Ingeniera Administracin Produccin Sociologa
Responder a los siguientes enunciados:
Qu significan las variaciones en los precios de los artculos al consumidor? Cree que cualquier investigacin requiere informacin estadstica? Cules son las funciones del Departamento Administrativo Nacional de Estadstica (DANE)?
Las calificaciones finales de 80 estudiantes son:
68 93 71 78 82 79 83 57 88 7784 60 59 66 75 60 71 73 78 8575 73 85 72 94 95 79 80 62 7582 88 75 63 77 75 62 65 76 7668 79 61 78 69 61 67 75 53 6390 73 65 95 74 89 97 71 74 7262 93 75 62 68 78 78 65 86 8188 76 87 74 60 96 85 76 67 73
Hallar:
La calificacin ms alta La calificacin ms baja El rango Las cinco notas ms altas Las cinco notas ms bajas La dcima nota de mayor a menor La tabla de frecuencias utilizando 7 intervalos Comprobar que la amplitud de los intervalos es de 6.29 El nmero de estudiantes de 79 o ms El nmero de estudiantes con calificaciones por debajo de 71 El porcentaje de estudiantes con calificaciones mayores de 65 pero no superiores a 85. Cul es el significado del 91.25%? Cul es el significado del 33.75%?
En una empresa se investig una muestra de 56 empleados para determinar su salario mensual en miles de pesos. Los resultados fueron los siguientes:
987117612331248944110512431109117312339851093131082411851157133010241079169012629568161220133110001032122913851252972138112409321358614102214041415130398412341324918106712038271209105511041343120275910249051490
Crear la tabla de frecuencias con siete intervalos y comprobar que su amplitud es de 153.71 e interpretar cada uno de los siguientes valores en la clasificacin:
X4F5Fa 3Fr6Fra 4Fra 5Fa2nFr 2
Responder:
Cuntos empleados tienen un salario inferior a $1'382.000? Qu porcentaje de empleados tienen un salario superior a $1'228.000? Cuntos empleados tienen un salario entre $921.000 y $1'075.000? Qu porcentaje de empleados tienen un salario entre $1'228.000 y $1'382.000?
En la tabla que sigue se recogen los pesos de 40 estudiantes varones de una universidad con precisin de 1 Kilo, construir una distribucin de frecuencias con 5 intervalos y establecer las conclusiones ms importantes.
69726274787379707368828463698881997782747573867173677670677666807267717578726472 La siguiente tabla muestra una distribucin de frecuencia de los salarios semanales de 65 empleados de la empresa P & R.
SALARIOSNMERO DE EMPLEADOS
$250.000 - $260.0008
$260.000 - $270.00010
$270.00 - $280.00016
$280.000 - $290.00014
$290.000 - $300.00010
$300.000 - $310.0005
$310.000 - $320.0002
Total65
Determinar de la tabla de frecuencias:
El lmite inferior de la sexta clase. El lmite superior de la cuarta clase. La marca de clase o punto medio de la tercera clase. La anchura del quinto intervalo de clase. La frecuencia de la tercera clase. El intervalo de clase con mxima frecuencia. El porcentaje de empleados que cobran menos o igual de $280.000 a la semana. El porcentaje de empleados que cobran igual o menos de $300.000 pero al menos $260.000 por semana.
Si las marcas de clase en una distribucin de frecuencias de pesos de estudiantes son 128, 137, 146, 155, 164, 173 y 182 libras. Hallar:
La anchura del intervalo de clase. Los lmites de clase, suponiendo que los pesos se midieron con 1 libra de precisin.
La menor de 150 medidas es 5,18 m y la mayor 7.44 m.
Determinar un conjunto apropiado de intervalos de clase. Marcas de clase que puedan usarse para formar la distribucin de frecuencia de esas medidas.
La siguiente tabla muestra una distribucin de frecuencias de las vidas medias de 400 vlvulas de radio probadas en la empresa L & M.
VIDA MEDIA (Horas)NMERO DE TUBOS
300 - 40014
400 - 50046
500 - 60058
600 - 70076
700 - 80068
800 - 90062
900 - 100048
1000 - 110022
1100 - 12006
Total400
Determinar de la tabla de frecuencias:
El lmite superior de la quinta clase. El lmite inferior de la octava clase. La marca de clase de la sptima clase. La anchura de intervalos de clase. La frecuencia de la cuarta clase. La frecuencia relativa de la sexta clase. Porcentaje de tubos cuya vida media no pasa de 600 horas. Porcentaje de tubos cuya vida media es mayor de 900 horas. Porcentaje de tubos cuya vida media es de al menos 501 horas, pero menor o igual que 1000 horas.
Los dimetros internos de los tubos fabricados por una empresa se miden con precisin de milsima de pulgada. Si las marcas de clase de una distribucin de frecuencias de esos dimetros vienen dadas por 0.321, 0.324, 0.327, 0.33, 0.333 y 0.336. Hallar la anchura del intervalo de clase y los lmites de clase.
La tabla adjunta muestra los dimetros en centmetros de una muestra de 60 bolas de cojinete manufacturadas por una fbrica. Construir una distribucin de frecuencias con intervalos de clase apropiados y establecer las conclusiones respectivas.1.7381.7291.7431.7401.7361.741
1.7351.7311.7261.7371.7281.737
1.7361.7351.7241.7331.7421.736
1.7391.7351.7451.7361.7421.740
1.7281.7381.7251.7331.7341.732
1.7331.7301.7321.7301.7391.734
1.7381.7291.7271.7351.7351.732
1.7351.7271.7341.7321.7361.741
1.7361.7441.7321.7371.7311.746
1.7351.7351.7291.7341.7301.740
UNIDAD 2: Medidas de Tendencia Central
Ncleos Temticos y Problemticos
Primer Caso: Cuando los Datos no Estn Agrupados Segundo Caso: Cuando los Datos Estn Agrupados
Proceso de Informacin
Las medidas de centralizacin son valores que tienden a situarse en el centro del conjunto de datos ordenados segn su magnitud. Las medidas de centralizacin ms usadas son: Media aritmtica, mediana y moda.
La media aritmtica es la medida de tendencia central ms conocida, es fcil de calcular, de gran estabilidad en el muestreo; se puede aplicar a variables de intervalos ya sean discretos o continuos. Esta medida se define como la suma de todos los valores observados dividido por el nmero de observaciones, es decir encontrar el promedio de los datos en estudio.
La mediana se define como la medida de tendencia central que divide a cualquier distribucin en dos partes iguales. Esta medida se puede aplicar a variables de intervalos (discretas y continuas) y variables ordinales.
La moda de una distribucin se define como el valor que presenta la mayor frecuencia, se usa con variables de intervalos nominales y ordinales. Es comnmente utilizada como una medida de popularidad que refleja la tendencia de una opinin.
2.1 PRIMER CASO: CUANDO LOS DATOS NO ESTN AGRUPADOS
2.1.1Media Aritmtica
La media aritmtica de un conjunto de n nmeros x1, x2, X3..., Xn, se representa por x y se define como:X =
X1 + X2 + X3 + Xn
n nxii=1 n=
Cuando los nmeros x1, x2, x3,....xn, aparecen f1, f2, f3,..... fn veces, respectivamente, es decir, que sus frecuencias respectivas son f1, f2, f3,....fn, la media aritmtica se puede calcular del modo siguiente:X =
f1X1 +f2X2 + f3X3 + ....+fnXn =f1+f2+f3++fn nfixii=1 nfii=1
En ocasiones, a cada uno de los nmeros x1, x2, x3,....xn, se les asigna un peso determinado w1, w2, w3,....wn. En estos casos, se acostumbra a calcular la media aritmtica ponderada del modo siguiente:X =
w1x1 +w2x2 + w3x3 + ....+wnnn
w1+w2+w3+..+wn nwixii=1 nwii=1
Ejemplo
Hallar la media aritmtica del puntaje obtenido por 5 estudiantes en una prueba: 6, 4, 3, 7, 8.
6+4+3+7+8 28Este es el puntaje promedio de los 5 estudiantes
x = =5,6 55
Hallar la media aritmtica de los siguientes datos que representan las edades de 10 nios. 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.3*6+4*4+2*3+1*747x= = 4,73+4+2+110
El promedio de edad de los 10 nios es de 4 aos, 7meses de 5aos.
Un estudiante ha obtenido las calificaciones siguientes:
AsignaturaNotaPeso
Historia81
Qumica73
Fsica33
Matemtica63
Biologa 53
Geologa62
Dibujo52
Idioma72
filosofa41
Calculando su nota media ponderada:
1*8 + 3*7 + 3*3 + 3*6 + 3*5 + 2*6 + 2*5 + 2*7 + 1*4X =
1+3+3+3+3+2+2+2+1
111X =
= 5,5520
Por lo tanto el promedio de las notas del estudiante es de 5,55
2.1.2 Mediana
La mediana es una serie de datos ordenados en orden de magnitud, es el valor medio si el nmero de datos es impar o bien la media aritmtica de los valores medios si el nmero de datos es par.
Ejemplo
Hallar la mediana de los siguientes datos que corresponden a la venta de leche en un expendio durante los ltimos 7 das:
27800543006080073200438506050054350
27800438505430054350605006080073200
Md = 54350. El precio de la venta de leche que se encuentra en la mitad de los precios es de $54350.
Hallar el valor de la mediana para los siguientes puntajes de las pruebas ICFES: 304, 283,332, 344;295, 339.
283295304332339344
304+332Md == 3182El puntaje de las pruebas que se encuentra en la mitad es de 318.
2.1.3Moda
La moda no puede ser nica e incluso puede no existir.
Ejemplo
En una encuesta realizada sobre los deportes que se practican en un grado determinado de un Colegio de Varones, se presentan los siguientes resultados:
DeporteN de Alumnos
Basket10
Ftbol18
Voleibol5
Otros4
La moda en este caso es el Ftbol, puesto que la mayora de los alumnos lo prefieren.
Se le ha preguntado a un grupo de personas acerca del color preferido por ellas y se obtuvo lo siguiente:
ColorNumero de Personas
Blanco4
Gris8
Azul9
Negro4
Rojo3
Morado2
Caf8
Vinotinto8
Lo cual indica que los colores que pueden estar de moda son el gris, caf y vinotinto.
Hallar la moda de los nmeros 2, 3, 4, 5, 6, 7, 8; como ningn nmero se repite ms que los otros, por consiguiente no hay moda.
2.2 SEGUNDO CASO: CUANDO LOS DATOS ESTN AGRUPADOS
2.2.1 Media AritmticaX =
n xi fii=1 n
Ejemplo
Hallar la media aritmtica de las ventas de los sesenta establecimientos:
IntervalosFXX*F
5 - 1027.515
10 - 15512.562.5
15 - 201217.5210
20 - 251422.5315
25 - 301527.5412.5
30 - 35832.5260
35 - 40437.5150
40 -00
Total601425
X =
1425 = 23,7 = 24 60
Las ventas promedio de los sesenta establecimientos son de $24000.
Hallar el valor promedio para la distribucin correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadstica:
IntervalosFXX*F
10 - 19.61014.8148
19.6 - 29.2324.473.2
29.2 - 38.8734238
38.8 - 48.4743.6305.2
48.4 - 58553.2266
58 - 67.6862.8502.4
Total401532.8
X =
1532.8 = 38.3 = 38 40
El puntaje promedio de los 40 alumnos es de 38.
2.2.2Mediana
Para hallarla cuando los datos estn agrupados se siguen los siguientes pasos:
Ubicar el intervalo donde quede la frecuencia correspondiente a la mitad del tamao de la muestra. Encontrar el valor del lmite real inferior del intervalo dnde est. Aplicar la siguiente frmula:
Md = li + n _ Fa2F n/2
A; donde:li :es el lmite real inferior donde est la F n/2Fa es la sumatoria de frecuencias anteriores a n/2F n/2 es la frecuencia donde est n/2A es la amplitud del intervalo
Ejemplo
Encontrar la mediana de las ventas de los sesenta establecimientos:
IntervalosF
5 - 102
10 155
15 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
TOTAL60
$24.000 corresponde a la venta que est en la mitad.
Encontrar la mediana de la distribucin correspondiente a las notas obtenidas por 40 estudiantes en una prueba estadstica
IntervalosF
10 - 19.610
19.6 - 29.23
29.2 - 38.87
38.8 - 48.47
48.4 - 585
58 67.68
Total40
La nota que est en la mitad en esta distribucin es Moda.
2.2.3Moda
Se debe ubicar el intervalo donde est la mayor frecuencia, y despus se aplica la siguiente frmula:
Li es el lmite real inferior donde est la moda. , 1es la diferencia entre la frecuencia modal y la frecuencia inmediatamente anterior. 2 es la diferencia entre la frecuencia modal y la frecuencia inmediatamente posterior. A es la amplitud del intervalo.
Ejemplo
Encontrar la moda de las ventas de los sesenta establecimientos:
IntervalosF
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
Encontrar la moda de la distribucin correspondiente a las notas obtenidas por 40 estudiantes
IntervaloF
10-19.610
19.6-29.23
29.2-38.87
38.8-48.47
48.4-585
58-67.68
Total40
Proceso de Comprensin y Anlisis
Supngase que en un viaje, un automovilista hace las siguientes compras de gasolina. 10 galones a $2500 c/u, 8 galones a $2550 c/u, 15 galones a $2600 c/u y 12 galones $2480 c/u. Cul sera el costo medio por galn?.
La siguiente tabla muestra los salarios mensuales en miles de pesos de 144 empleados de una empresa:
SalariosF
540 - 6076
607 - 67419
674 - 74136
741 - 80824
808 - 87526
875 - 94219
942 - 100910
1009 - 10764
Total144
Encontrar la media, la moda y la mediana.
Diez medidas del dimetro de un cilindro fueron anotadas por un cientfico como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros; hallar la media aritmtica de tales medidas.
De entre 100 nmeros: 20 son cuatros, 40 son cincos, 30 son seis y los restantes sietes. Hallar la media aritmtica, la media y la moda.
De los 80 empleados de una empresa, 60 cobran $7000 a la hora y el resto $4000 a la hora. Hallar cunto cobran la media por hora.
Usar la distribucin de frecuencias para hallar la altura media, la altura que ms se repite y la altura que se encuentra en la mitad de 100 estudiantes.
Altura (m)F
1.60 - 1.635
1.63 - 1.6618
1.66 - 1.6942
1.69 - 1.7227
1.72 - 1.758
Total100
Hallar la media, mediana y moda de los pesos de 40 estudiantes de la siguiente tabla:
PESO (Lb)F
118 - 1263
126 1345
134 1429
142 15012
150 - 1585
158 - 1664
166 - 1742
Total40
Los tipos de reaccin de un individuo ante diversos estmulos, medidos por un psiclogo, fueron: 0.53, 0.46, 0.5, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos respectivamente. Determinar su tiempo medio de reaccin.
La siguiente tabla muestra la distribucin de cargas mximas en toneladas cortas que soportan los cables producidos en cierta fbrica. Determinar la carga mxima media, la carga mxima que se repite y la carga que ms se repite.
Carga Mxima(Toneladas Cortas)F
9.3 - 9.72
9.7 - 10.15
10.1 - 10.512
10.5 - 10.917
10.9 - 11.314
11.3 - 11.76
11.7 - 12.14
Total60
La siguiente tabla muestra el nmero de bodas en Colombia para hombres y mujeres de distintos grupos de edad durante 1984.
Hallar la media, mediana y moda tanto para hombres como para mujeres, estableciendo las respectivas conclusiones.
Edad (aos)Hombres(Miles)Mujeres(Miles)
15 - 19121481
19 - 232.4414.184
23 - 275.9306.952
27 - 316.5877.193
31 - 3511.78811.893
35 - 399.0499.022
39 - 438.7498.171
43 - 475.7864.654
47 - 512.5811.524
UNIDAD 3: Medidas de dispersin
Ncleos Temticos y Problemticos
Desviacin Estndar o Tpica Varianza Coeficiente de Variacin
Proceso de Informacin
Las medidas de dispersin o variacin dan idea de la separacin de los datos numricos alrededor de una medida de centralizacin. Las medidas de dispersin ms utilizadas son:
3.1 DESVIACIN ESTNDAR O TPICA
Indica que tan dispersos estn los datos con respecto a la media aritmtica. Si los datos no estn agrupados, la desviacin estndar de una serie de nmeros n. X1, x2, x3,.....xn est determinada por:
Si los datos estn agrupados, la desviacin estndar viene dada por:
Las anteriores frmulas se utilizan cuando se trabaja con la poblacin.
Si los datos estn agrupados, la desviacin estndar viene dada por:
Las anteriores frmulas se utilizan cuando se trabaja con la muestra.
Ejemplo
Hallar la desviacin estndar del puntaje obtenido por 4 estudiantes en una prueba: 6 4, 3, 7. 8.
5.6X =
Hallar la desviacin estndar de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3, 7.
Hallar la desviacin estndar de las ventas de los sesenta establecimientos x = 24.
IntervalosFX(X-x)2 F
5 1027.5544.5
10 - 15512.5661.25
15 - 201217.5507
20 - 251422.531.5
25 - 301527.5183.75
30 - 35832.5578
35 - 40437.5729
Total603235
3.2 VARIANZA
Esta es la medida de variacin ms importante, ya que se obtiene a partir de la media aritmtica de una distribucin. La varianza seala la distancia promedio de cualquier observacin en el conjunto de datos. La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica.
La varianza es una medida de dispersin, en la cual, las unidades son los cuadrados de las unidades de los datos, es decir, pesos cuadrados, personas cuadradas, etc., y por esto no son expresiones fciles de interpretar.
Si los datos no estn agrupados, la varianza de una serie de nmeros n: x1, x2, x3........ Xn est determinada por:
Si los datos estn agrupados, la varianza viene dada por:
Ejemplo
Hallar la varianza del puntaje de 5 estudiantes: 6, 4, 3, 7, 8.
Hallar la varianza de las edades de 10 nios: 6, 6, 6, 4, 4, 4, 4, 3, 3. 7.
X = 4.7
18.1S2 = = 1.8110
Hallar la varianza de las ventas de los sesenta establecimientos: X = 24
IntervalosFX(X-x)2 F
5 1027.5544.5
10 15512.5661.25
15 201217.5507
20 251422.531.5
25 301527.5183.75
30 - 35832.5578
35 - 40437.5729
Total603235
3235S2 = = 53.960
3.3 COEFICIENTE DE VARIACIN
Esta medida relaciona la desviacin estndar y la media, para expresar la variacin de la desviacin con respecto a la media aritmtica. Este coeficiente de variacin se acostumbra expresarlo en porcentaje.
SLa frmula que se utiliza es: cv = * 100X
El coeficiente de variacin es una medida muy utilizada en control de calidad. Para estos casos, generalmente existen especificaciones que limitan el coeficiente de variacin. Tambin nos sirve para determinar la homogeneidad de la informacin, es decir, si el coeficiente de variacin es pequeo la informacin es homognea y si el coeficiente de variacin es grande la informacin es heterognea.
Ejemplo
Hallar el coeficiente de variacin de 6, 4, 3, 7, 8
X = 5.6S = 1.34Cv = 23.9%
Este porcentaje indica cmo se distribuye la desviacin estndar con respecto a la media a travs de los datos.
Hallar el coeficiente de variacin de las ventas de los sesenta establecimientos y obtener conclusiones.
X = 24S = 7.3
7.3Cv = *10024
Cv = 30.42%. De aqu se puede decir que las ventas de los sesenta establecimientos son homogneas. Si el trabajador A produce por hora 40 tornillos en promedio, con desviacin de 5 tornillos y el trabajador B produce 180 tornillos en promedio con desviacin de 15, cul de los trabajadores presenta menor variabilidad?
5CVA = *100 = 12.5% para el operador A40
15CVB = *100 = 9.4% Para el operador B180
Esto significa que el operador B, quien tiene mayor desviacin en la produccin, presenta menor variacin, porque la media de produccin para el operador B es mucho mayor que la del operador A.
Proceso de Comprensin y Anlisis
Hallar la desviacin estndar y la varianza de los puntos obtenidos asignados a 8 nios en un juego: 12, 6, 7, 3, 15, 10 18 y 5.
Hallar la desviacin estndar y la varianza en la compra de cremas dentales: $9.345, $3.850, $8.235, $8.000, $9.578, $8.560, $9.234, y 18.456.
Hallar la desviacin estndar de las alturas de los estudiantes de acuerdo a la siguiente tabla:
Altura (m)F
1.60 1.635
1.63 1.6618
1.66 1.6942
1.69 1.7227
1.72 1.758
Total100
Hallar la desviacin estndar de la distribucin de salarios de la siguiente tabla:
SALARIOSNM. EMPLEADOS
$250.000 - $260.0008
$260.000 - $270.00010
$270.000 - $280.00016
$280.000 - $290.00014
SALARIOSNM. EMPLEADOS
$290.000 - $300.00010
$300.000 - $310.0005
$310.000 - $320.0002
Total65
La siguiente tabla muestra los cocientes de inteligencia (lQ) de 480 nios de una escuela elemental. Hallar la desviacin estndar:
FX
470
974
1678
2882
4586
6690
8594
7298
54102
38106
27110
18114
11118
5122
2126
Un fabricante de tubos de televisin produce dos tipos de tubos A y B, que tienen vidas medias respectivas: xA = 1495 horas y xB = 1875 horas y desviacin tpica de SA = 280 horas y SB = 310 horas. Qu tipo de tubo tiene mayor dispersin?
En un examen final de Estadstica, la puntuacin media de 150 estudiantes fue de 78 y la desviacin estndar 8. En lgebra la media fue de 73 y la desviacin estndar 7.6. En qu materia fue mayor la dispersin?.
Hallar la desviacin estndar y el coeficiente de variacin para los datos de la siguiente tabla:
Carga Mxima(Toneladas Cortas)F
9.3 - 9.72
9.7 10.15
10.1 - 10.512
10.5 - 10.917
Carga Mxima(Toneladas Cortas)F
10.9 - 11.314
11.3 - 11.76
11.7 - 12.14
Total60
UNIDAD 4: Medidas de Ubicacin
Ncleos Temticos y Problemticos
Cuartiles, Percentiles y Deciles Diagramas de Caja
Proceso de Informacin
4.1 CUARTILES, PERCENTILES, DECILES
Si un conjunto de datos est ordenado por magnitud, el valor central que divide al conjunto en dos mitades iguales, es la mediana.
Extendiendo esa idea, se puede pensar en aquellos valores que dividen al conjunto en cuatro partes iguales, (cuartiles) esos valores denotados Q1 Q2 y Q3, llamados primer, segundo y tercer cuartil respectivamente. El Q2 coincide con la mediana.
Anlogamente, los valores que dividen a los datos en 10 partes iguales se llaman deciles y se denotan por D1 D2,...D9. El D5 coincide con la mediana.
Y los valores que dividen a los datos en 100 partes iguales se llaman percentiles, denotados por P1 P2,.....P99. El P50 coincide con la mediana.
Si los datos no estn agrupados, se deben ordenar en forma ascendente o descendente y ubicar el dato que est en la posicin n * p:donde,qq = 4, 10, 100p = Nmero a la ubicacin al que se desea referirn = Total de datos
Ejemplo
Con los siguientes datos ubicar el que corresponde a:
Al primer cuartil Al tercer decil Al percentil 80
1285101146334568101112n * p8*1Q1 = = = 2q4
El dato que est en el primer cuartil es 4, ya que est en la segunda posicin.
n * p8*3D3 = = = 2.4 2q10
El dato que est en el tercer decil es 4, ya que est en la segunda posicin.n * p8 * 80P80 = = = 6.4 6q100
El dato que est en el percentil 80 es 10, ya que este valor est en la sexta posicin.
Cuando los datos estn agrupados, utilizamos la misma frmula de la mediana y reemplazamos donde est n/2 por n * p; el lmite inferior es donde est la F (n*p)/qq
Donde U hace referencia a la medida de ubicacin, li es el limite inferior donde est F(n*p)/q
Ejemplo
En las ventas de los sesenta establecimientos encontrar:
El primer, segundo y tercer cuartil El primer, quinto y el sexto decil El percentil doce, cincuenta y ochentan * p
q
Para encontrar estas medidas, primero hay que encontrar para ubicar el intervalo correspondiente a esta posicin.
El Primer, Segundo y Tercer Cuartiln = 60p = 1q = 4n*p = 60*1 = 15 q 4Li= 15Fa = 7F (n*p)/q = 12A = 5
IntervalosF
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
De donde el 25% de las ventas de los 60 establecimientos es de $18000 o menos.
IntervaloFn = 60p = 2q = 4n*p = 60*2 = 30 q 4Li= 20Fa = 19F (n*p)/q = 14A = 5
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
Donde el 50% de las ventas de los 60 establecimientos es de $24000 o menos.
IntervalosFn = 60p = 3q = 4n*p = 60*3 = 45 q 4Li= 25Fa = 33F (n*p)/q = 15A = 5
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
Por lo tanto el 75% de las ventas de los 60 establecimientos es de $29000 o menos
El Primer, Quinto y el Sexto Decil
IntervalosFn = 60p = 1q = 10n*p = 60*1 = 6 q 10Li= 10Fa = 2F (n*p)/q = 5A = 5
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
El 10% de las ventas es de $9000 o menos.
IntervalosFn = 60p = 5q = 10n*p = 60*5 = 30 q 10Li= 20Fa = 19F (n*p)/q = 14A = 5
5 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
El 50% de las ventas es de $24000 o menos
IntervalosFn = 60p = 6q = 10n*p = 60*6 = 36 q 10Li= 25Fa = 33F (n*p)/q = 15A = 5
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
Y el 60% de las ventas es de $26000 o menos.
El Percentil Doce, Cincuenta y Ochentan = 60p = 12q = 100n*p = 60*12 = 7.2 = 7 q 100Li= 10Fa = 2F (n*p)/q = 5A = 5
IntervaloF
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
60*12
100
5-25 = 15.2 15P12= 10+
Por lo tanto el 12% de las ventas de los sesenta establecimientos es de $15000 o menos.
IntervalosFn = 60p = 50q = 100n*p = 60*50 = 30 q 100Li= 20Fa = 19F (n*p)/q = 14A = 5
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
60*50
100
14-195 = 23.9 24P50= 20+
El 50% de las ventas de los sesenta establecimientos es de $24000 o menos.
IntervaloFn = 60p = 80q = 100n*p = 60*80 = 48 q 100Li= 25Fa = 33F (n*p)/q = 15A = 5
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
Total60
Y el 80% de los establecimientos tienen ventas de $30.000 o menos.
4.2 DIAGRAMAS DE CAJA
Es una representacin del diagrama de una distribucin construida para mostrar sus caractersticas principales y sealar los posibles datos atpicos, es decir, aquellas observaciones que parecen ser distintas de las dems. Su principal utilidad es para depurar informacin puesto que se pueden eliminar los datos de mayor variacin en los extremos. Un diagrama de caja se construye as:
Ordenar los datos de la muestra y obtener el valor mnimo, el mximo y los tres cuartiles Q1, Q2, Q3, localizndolos en una recta numrica utilizando una escala adecuada. Dibujar un rectngulo cuyos extremos son Q1 y Q3. Calcular unos limites admisibles superior e inferior que van a servir para identificar los valores atpicos. Estos lmites se calculan con :Q3 Q1
2Li = Q3 +1.5Q3 Q1
2Li = Q1-1.5
Considerar como valores atpicos los situados fuera del intervalo (li, Ls). Dibujar una lnea que vaya desde cada extremo del rectngulo central hasta el valor ms alejado no atpico, es decir, que est dentro del intervalo (li, ls). Identificar todos los datos que estn fuera del intervalo (li, ls) marcndolos como atpicos.
Ejemplo: Los siguientes datos muestran el nmero de das con aire contaminado en 2001 y 2002 en varias ciudades colombianas:
20012002
A248221
B208171
C113131
D12889
E106
F118101
G6033
H7963
I5556
20012002
J4754
K8855
L4769
M5859
N8248
O3316
Construir el diagrama de cajas correspondiente a la tabla dada.
Para 2001
El primer paso es ordenar la informacin de mayor a menor:
33 47 47 55 58 60 79 82 88 106 113 118 128 208 248
Luego se encuentran los tres cuartiles:
15*1Q1 = = 3.75 4 4
El 25% de ciudades tienen 55 das o menos de contaminacin o el 25% de las ciudades de EEUU tienen entre 33 y 55 das de contaminacin.
15*2Q2 = = 7.5 84
El 50% de ciudades tienen 82 das o menos de contaminacin
15*3Q3 = = 11.25 114
El 75% de ciudades tienen 113 das o menos de contaminacin.
Por tanto los lmites admisibles son:= 156,5113 55
2Li = 55 1,5= 11,5113 - 55
2Ls = 113 + 1,5
Como todos los valores son superiores al lmite inferior, la lnea inferior del diagrama de caja deber llegar hasta el valor mnimo y no hay atpicos en esta direccin.
2001
Este diagrama de caja, muestra que la mayor parte de las observaciones son menores que 113 y que el extremo superior de 248 est muy alejado del grupo principal de datos. Se ve con claridad la amplitud de los datos, que es la longitud del diagrama completo (248 - 33 = 215).
Para 2002
16 33 48 54 55 56 59 63 69 89 101 131 171 22114*1Q1= = 3.75 44
El 25% de ciudades tienen 55 das o menos de contaminacin.14*2Q2= = 74
El 25% de ciudades tienen 59 das o menos de contaminacin.
14*3Q3= = 10.5 114
El 25% de ciudades tienen 101 das o menos de contaminacin.
101 - 55
2= 20.5Li = 55 1,5101 - 55
2= 135.5Ls = 101 + 1,5
2002
Estos diagramas de caja son muy eficaces cuando ellos se comparan conjuntos de datos.
2001
2002
Ntese como los datos tienden a concentrarse ms y ms hacia el extremo inferior de la escala, excepto el extremo alto, el cual permaneci alto durante los dos aos.
Proceso de Comprensin y Anlisis
En la siguiente tabla que relaciona las alturas de 100 estudiantes, determinar el primer, el segundo y tercer cuartil y realizar el grfico correspondiente:
Altura (m)F
1.60 - 1.635
1.63 - 1.6618
1.66 - 1.6942
1.69 - 1.7227
1.72 - 1.758
Total100
Hallar en la siguiente tabla para los salarios en miles de pesos de 144 empleados de una empresa: El primer cuartil El quinto y octavo decil El percentil 10 y el percentil 45
SalarioF
540 - 6076
607 - 67419
674 - 74136
741 - 80824
808 - 87526
875 94219
942 - 100910
1009 - 10764
Total144
Encontrar el primer, segundo y tercer cuartil de la siguiente tabla que relaciona los pesos de 40 personas y realizar el grfico correspondiente:
Peso (Lb)F
118 - 1263
126 - 1345
134 - 1429
142 - 15012
150 - 1585
158 - 1664
166 1742
Total40
Las siguientes son diez medidas del dimetro de un cilindro: 3.88, 4.09, 3.92, 3.97, 4.02 3.95, 3.98, 4.03, 3.92 y 4.06 centmetros. Hallar:
El primer y tercer cuartil El cuarto, el sexto y noveno decil El percentil 48 y el percentil 10
La siguiente tabla muestra una distribucin de frecuencias de las vidas medias de 400 vlvulas de radio probadas en la empresa L & M.Encontrar: El primer, segundo, tercer cuartil y su respectiva grfica El segundo, cuarto y sexto decil. El cincuenta percentil.Vida MediaNmero de Tubos
300 40014
400 - 50046
500 - 60058
600 - 70076
700 - 80068
800 - 90062
900 - 100048
1000 - 110022
1100 - 12006
Total400
UNIDAD 5: Presentacin de la Informacin
Ncleos Temticos y Problemticos
Histograma Polgonos de Frecuencia Ojivas Barras
Proceso de Informacin
Una grfica estadstica es aquella en la cual se presentan los datos estadsticos en trminos de magnitudes, para interpretarlos en forma visual.
Presentar la informacin de la tabla de frecuencias por medio de grficas sirve para reforzar las conclusiones que se determinan de esta tabla. Estas grficas se pueden utilizar para:
Evaluar resultados de un proceso. Presentar resultados de una investigacin.
Para la elaboracin de un grfico hay que tener en cuenta:
Ttulo: indica la descripcin del contenido de la grfica, es decir, indica el fenmeno de estudio. Por ejemplo, Produccin de caf en Colombia en el perodo 1995 - 1997.
Diagrama: es empleado para representar los datos mostrados en una grfica; los diagramas pueden ser de varios tipos: lneas, barras, dimensiones y smbolos.
Escala: se aplica para saber la dimensin del fenmeno graficado. Se debe identificar en los ejes X y Y de un sistema de coordenadas. Las magnitudes en la ordenada o eje Y y las clasificaciones de los datos en las abscisas o eje X.
Existen varios tipos de grficas para representar los datos estadsticos y al mismo tiempo sirven para reforzar las conclusiones dadas en la tabla de frecuencias.
5.1 HISTOGRAMA
Sirve para representar grficamente una distribucin de frecuencias. El grfico se disea trazando los intervalos sobre el eje X y las frecuencias absolutas sobre el eje Y. A partir del intervalo se traza la altura respectiva dada por la frecuencia absoluta.
La empresa Cuero Lindo ha recopilado informacin sobre las ventas en miles de pesos de 60 almacenes. Estos datos son:
VENTAS PARA SESENTA ESTABLECIMIENTOS(Miles de pesos)
IntervaloF
5 - 102
10 - 155
15 - 2012
20 - 2514
25 - 3015
30 - 358
35 - 404
40 - 0
Total60
Las ventas ms frecuentes de los sesenta establecimientos estn entre $25000 y $30000; $20000 y $25000. Y la menos frecuente est en $10000.
5.2 POLGONOS DE FRECUENCIAS
Es una curva que se traza a partir de los puntos medios de cada clase de amplitud; estos se unen por medio de una lnea recta, la cual se disea con base en los datos del histograma.
5.3 OJIVAS
Es el grfico de una distribucin de frecuencias acumuladas (relativa, absoluta) descendente o ascendente. Esta grfica indica la forma como crece la informacin a travs de los intervalos, se puede utilizar como medicin de las variaciones de los grupos. El punto donde se cortan las dos ojivas es el punto central de la distribucin es decir la mitad de la informacin.
5.4 BARRAS
Sirven bsicamente para establecer las diferencias entre grupos individuales y pueden ser de dos tipos:
5.4.1 Barras Verticales
Se emplean para presentar datos clasificados cronolgica o cuantitativamente:
Ejemplo: en la siguiente tabla se encuentra la informacin correspondiente a las ventas anuales de la empresa El Retorno durante el perodo de 1987 - 1996 (en millones de pesos).
AosVentas
19876
19889
198915
199030
199150
199280
1993110
1994150
1995130
1996100
5.4.2 Barras Horizontales
Se emplean para dar datos clasificados geogrfica y cualitativamente, indican la importancia de un atributo con respecto a los dems.
Ejemplo: la siguiente informacin nos indica el nmero de profesionales egresados de distintas carreras en la ciudad de Bogot en 2002:
CarreraNmero de profesionales
Ciencias Sociales1100
Administracin800
Ingenieras500
derecho700
Segmentada
Ejemplo: presenta una comparacin de la magnitud relativa de ventas dentro de cada departamento y de las ventas totales por departamentos. La siguiente informacin corresponde a las ventas por departamentos al contado y a crdito en un almacn, se presenta en miles de pesos.
DepartamentoContadoCrditoTotal
Hombres200120320
Mujeres180110290
Nios15090240
Electrodomsticos300210510
Agrupada
Muestra las ventas por departamento en una empresa al contado y a crdito y permite hacer comparaciones entre departamentos y al interior de cada uno.
Las Grficas de barras horizontales pueden presentarse de dos formas:
Circular o de Tortas
Se utiliza para representar las variables y sirve para hacer notar las diferencias en las proporciones o porcentajes. Es efectiva para permitir las comparaciones cuando los segmentos son relativamente grandes. El proceso para realizar el diagrama consiste en una regla de tres para:
Conocer el ngulo de cada sector, entonces se debe relacionar los 360 que tiene una circunferencia con el tamao de la muestra y con cada una de sus frecuencias absolutas.360 nxFiAs por ejemplo:
360 60x2
360*2x = = 1260
Donde 60 es la muestra de las ventas de los establecimientos; 2 es la frecuencia absoluta del primer intervalo.
360 60x5
360*35x = = 1860
Donde 60 es la muestra de las ventas de los establecimientos; 5 es la frecuencia absoluta del segundo intervalo.Y para conocer el porcentaje que corresponde a cada parte, relacionando 100% con el tamao de la muestra con la frecuencia absoluta.100n yFi
As, por ejemplo:Donde 60 es la muestra de las ventas de los establecimientos; 2 es la frecuencia absoluta del primer intervalo.100% 60 y 2
100*2y= = 3.3 3%60
Esto quiere decir que el 3% de los establecimientos tienen ventas entre $5000 y $10000.
Tallo y Hojas
Se puede tener un cuadro ms informativo que la tabla de recoleccin de datos si se hace un listado diferente.
Se tienen los porcentajes invertidos por 15 industrias manufactureras en el control de contaminacin de Colombia en 2001:170207040817040414030302041001
Para elaborar el diagrama de Tallos y Hojas hay que seguir los siguientes pasos:
El dgito de la extrema izquierda de cada valor es el punto de partida adecuado para clasificar los datos en dos grupos. El O y 1 se usa para formar el tallo y se escribe en columna vertical. A continuacin se escribe el segundo dgito como si fuera una hoja en el rengln adecuado del tallo, a la derecha de la barra vertical.O 3,2,4,2,7,4,4,4,8,3,11 7,7,4,0
Ya que la mayor parte de las observaciones tienen el cero como primer dgito, se puede alargar el tallo a dos categoras de O y dos de 1; en la que los segundos dgitos del O al 4 quedarn en el rengln superior y los dgitos del 5 al 9 en el inferior. Como es fcil de ordenar las observaciones en cualquier rengln, tambin se puede presentar la grfica ordenada de tallo y hojas.O 1,2,2,3,3,4,4,4,4O 7,81 0,41 7,7
Ahora se ve con facilidad que las observaciones van de 01 a 17, que nueve de las 15 observaciones son de 4 o menos.
Con el ejemplo que se ha venido trabajando; se puede elaborar este diagrama de tallos y hojas. En los siguientes datos los resultados son obtenidos en miles de pesos:
401726102621182716382233242028143025293728283322252929292132193523282215341316262420312918191123202428113439102517213418
Presentacin de los Datos en Forma de Tallo y Hojas
10,0,1,1,3,415,6,6,7,7,8,8,8,9,920,0,0,1,1,1,,2,2,2,3,3,4,4,425,5,5,6,6,6,7,8,8,8,8,8,9,9,9,9,930,1,2,3,3,4,4,438,94O4
Las presentaciones de tallo y hoja de ms de dos dgitos se pueden elaborar de diversos modos. Los siguientes datos muestran el nmero de das con aire contaminado en el 2001 en varias ciudades de Colombia:
Ciudad2001
A248
B208
C113
D128
E106
F118
G60
H79
I55
J47
K88
L47
M58
N82
O33
Para construir una grfica de tallo y hojas con los datos del 2001, los dgitos de las centenas y decenas formarn el tallo y las unidades sern las hojas.
033
047.7
055.8
060
079
0828
09
106
113.8
128
13
14
15
16
17
18
19
208
21
22
23
248
Como esta grfica es muy dispersa: hay que hacer que el tallo contenga las centenas y las hojas los dems dgitos
033,47,47
055,58,60,79,82,88
106,13,18,28
1
208,48
2
Proceso de Comprensin y Anlisis
La siguiente tabla muestra la poblacin de alguna ciudad (en millones) en los aos de 1882 2002. Representar estos datos en un diagrama de barras.
AOPOBLACIN(Millones)
188231.4
189239.8
190250.2
191262.9
192276
193292
1942105.7
1952122.8
1962131.7
1972151.1
1982179.3
1992203.3
2002226.5
La siguiente tabla muestra el nmero de sacos de trigo y maz en la cooperativa PQR durante los aos de 1992 2002:
AONMERO DE SACOS DE TRIGONMERO DE SACOS DE MAIZ
199220075
199318590
1994225100
199525085
199624080
AONMERO DE SACOS DE TRIGONMERO DE SACOS DE MAIZ
1997195110
1998210110
1999225105
200025095
2001230110
2002235100
Con referencia a la grfica, determinar el ao o aos durante los cuales:
La produccin de trigo fue mnima. La de maz fue mxima. Se dio el mayor descenso en la produccin de trigo. Decreci la produccin de maz respecto al ao anterior y creci la de trigo. Se produjo idntica cantidad de trigo La produccin conjunta de trigo y maz fue mxima.
Las reas de algunos departamentos de Colombia (en miles de millas cuadradas) se recogen en la siguiente tabla. Representar estos datos en un grfico de tortas y determinar las conclusiones ms relevantes.
DEPARTAMENTOREA (miles de millas cuadradas)
Cundinamarca11.7
Antioquia10.4
Armenia1.9
Amazonas9.4
Meta3.3
Choc6.9
Norte de Santander7.9
Total51.5
En la siguiente tabla, se ven los nmeros (en millones) de estudiantes de enseanza elemental, media y superior en Colombia. Representar los datos, usando grficos de barras y determinar algunas conclusiones.
AOELEMENTALMEDIASUPERIOR
198232.410.23.6
198735.5135.7
199237.114.77.4
199733.815.79.7
200230.614.610.2
La siguiente tabla muestra el estado civil de hombres y mujeres (de ms de 18 aos) en Colombia en 2001. Representar los datos mediante dos grficos circulares y un grfico de diseo propio.
ESTADO CIVILHOMBRES(% total)MUJERES(% total)
Soltero25.118.4
Casado66.761.3
Viudo2.412.4
Divorciado5.87.9
Una fbrica de gaseosa proyecta lanzar al mercado un nuevo sabor, para lo cual se realiza un test de aceptacin de dicho sabor, en una muestra de 32 personas. Se utiliza una escala de 30 para medir el grado de aceptacin. Los puntos obtenidos fueron los siguientes:
19 24 26 31 18 17 22 2124 19 18 19 21 32 31 2628 27 22 17 19 21 22 2430 19 26 27 28 21 24 26
Realizar la representacin del esquema de tallos y hojas de esta informacin.
Un artculo de revista titulado Amargo Panorama, habla acerca del caf colombiano y muestra un grfico de este tipo:
Qu se puede decir de este grfico?.
En la seccin de actualidad de una revista, hay un titular sobre Los Derechos Humanos: una tortura. Y muestra entre otras los siguientes grficos:
De acuerdo a estas grficas responder:
Qu porcentaje de quejas estn concluidas? Qu significado tiene el valor 3794 en el grfico de estado de las quejas? Qu interpretacin le puede dar al grfico quines se quejan?
ANEXO: Tablas
BIBLIOGRAFA GENERAL
BERNAL V. Miguel. Estadstica Descriptiva: J. Elaboracin y Presentacin de Datos Universidad de Pamplona, 1987.GALLARDO, Yolanda. Estadstica: Programa de Sicologa Universidad de Pamplona. 1997.MARTNEZ BENCARDINO, Ciro. Estadstica Comercial. Bogot: Norma, 1981.MORENO GARZN, Adonay. Serie aprender a investigar: Recoleccin de la informacin. Cali: ICFES, 1995.PARZEN, Emmanuel. Teora Moderna de Probabilidades y sus Aplicaciones Mxico: LIMUSA, 1991.PEA SNCHEZ, Damel. Estadstica Modelos y Mtodos I. Fundamentos. Madrid: Alianza editorial, 1986.PORTUS GOVINDEN. Lincoyn. Curso Prctico de Estadstica. Bogot: McGRAW - Hill, 1986.SPIEGEL Murria R. Estadstica. Madrid: McGraw Hill, 1993.
Top Related