Dis Perci On

download Dis Perci On

of 256

Transcript of Dis Perci On

  • 5/24/2018 Dis Perci On

    1/256

    Apuntes

    deTCNICAS CUANTITATIVAS 1

    Jos Alberto Hermoso Gutirrez

    Dpto. Mtodos Cuantitativos para la Economa y la Empresa

    Universidad de Granada

  • 5/24/2018 Dis Perci On

    2/256

    Apuntes de TCNICAS CUANTITATIVAS 1

    2013,Jos Alberto Hermoso Gutirrez

    Edita e imprime: Copicentro S. L.

    ISBN:978-84-15814-40-5

    Depsito Legal: GR-1690/2013

    Impreso en Espaa. Printed in Spain

    Quedan rigurosamente prohibidas, bajo

    las sanciones establecidas en las leyes, la

    reproduccin o almacenamiento total oparcial de la presente publicacin,

    incluyendo el diseo de la portada, as

    como la transmisin de la misma por

    cualquiera de sus medios tanto si es

    elctrico, como qumico, mecnico,

    ptico, de grabacin o bien de fotocopia,

    sin la autorizacin escrita de los titulares

    del copyright

  • 5/24/2018 Dis Perci On

    3/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 3

  • 5/24/2018 Dis Perci On

    4/256

    4 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

  • 5/24/2018 Dis Perci On

    5/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 5

    1.- Variables estadsticas unidimensionales.

    1.1 Variables estadsticas. Tablas estadsticas. Representaciones grficas . . . . . . . . . 7

    1.2 Momentos centrados y no centrados . . . . . . . . . . . . . . . . . . . . . . . . . . 12

    1.3 Medidas de posicin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161.4 Medidas de dispersin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

    1.5 Medidas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    1.6 Medidas de concentracin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    1.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    2.- Variables estadsticas bidimensionales.

    2.1 Representaciones numricas en dos columnas y en tablas de contingencia . . . . . . 662.2 Distribuciones marginales y condicionadas. Independencia de variables estadsticas . 68

    2.3 Covarianza y coeficiente de correlacin lineal . . . . . . . . . . . . . . . . . . . . . 71

    2.4 Recta de regresin de mnimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . 77

    2.5 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    3.- Nmeros ndices.

    3.1 Tasas de variacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1043.2 ndice elemental. ndice sinttico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

    3.3 ndices de precios, de cantidades y de valor . . . . . . . . . . . . . . . . . . . . . . 114

    3.4 Enlace de series de nmeros ndices con distinta base . . . . . . . . . . . . . . . . . 117

    3.5 Deflacin de series econmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

    3.6 Dependencia de un ndice general de un grupo de productos . . . . . . . . . . . . . . 121

    3.7 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

    4.- Anlisis descriptivo de series cronolgicas.

    4.1 Definicin de una serie cronolgica. Representacin grfica . . . . . . . . . . . . . . 135

    4.2 Componentes de una serie cronolgica. Modelos . . . . . . . . . . . . . . . . . . . . 136

    4.3 Tendencia secular: ajuste de una recta de mnimos cuadrados y medias mviles . . . 138

    4.4 Variacin estacional. Desestacionalizacin . . . . . . . . . . . . . . . . . . . . . . . 143

    4.5 Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

    4.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

  • 5/24/2018 Dis Perci On

    6/256

    6 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    5.- Probabilidad.

    5.1 Definicin de probabilidad. Asignacin de probabilidades . . . . . . . . . . . . . . . 172

    5.2 Definicin de probabilidad condicionada. Sucesos dependientes e independientes . . 179

    5.3 Frmula de la probabilidad total. Frmula de Bayes . . . . . . . . . . . . . . . . . . 182

    5.4 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

    6.- Variables aleatorias y distribuciones de probabilidad.

    6.1 Concepto de variable aleatoria. Distribucin de probabilidad . . . . . . . . . . . . . 194

    6.2 Funcin de distribucin. Variables aleatorias discretas y variables aleatorias continuas 196

    6.3 Valor esperado de una variable aleatoria. Momentos . . . . . . . . . . . . . . . . . . 200

    6.4 Otras medidas de posicin, dispersin y forma . . . . . . . . . . . . . . . . . . . . . 202

    6.5 Variables aleatorias bidimensionales. Independencia de variables aleatorias . . . . . 2066.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

    7.- Distribuciones discretas de probabilidad.

    7.1 Distribucin Uniforme discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

    7.2 Distribucin Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

    7.3 Distribucin de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241

    7.4 Distribucin Hipergeomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2437.5 Distribucin Geomtrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

    7.6 Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

  • 5/24/2018 Dis Perci On

    7/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 7

    1. VARIABLES ESTADSTICAS

    UNIDIMENSIONALES.

    1.1 Variables estadsticas. Tablas estadsticas. Representaciones

    grficas.

    El trmino Estadsticaprocede del latn status debido a que sus primeras aplicaciones tuvieron

    que ver con la recogida y cuantificacin de informacin referente al estado: censos de poblacin,

    ejrcito, cosechas, impuestos, etc. El trmino estadstica o estadsticas en muchos casos hace

    referencia a una cantidad de informacin, por ejemplo estadsticas de precios, estadsticas deproduccin, etc.

    La descripcin de esta informacin es el objetivo de laEstadstica Descriptiva. Para llevar a cabo

    esta tarea fundamentalmente nos apoyaremos en las representaciones grficas de dichos datos y en

    su sntesis mediante medidas que resuman las caractersticas ms relevantes.

    Podemos distinguir, fundamentalmente, dos tipos de fenmenos:

    Fenmenos causales o determinsticos: Son aquellos que presentan los mismos resultados si

    se realizan en idnticas condiciones (por ejemplo las reacciones qumicas).

    Fenmenos aleatorios o estadsticos: Son los que no se puede predecir el resultado aunque

    sean conocidas las condiciones de realizacin (por ejemplo el lanzamiento de una moneda).

    Fenmenos de naturaleza social, econmica,... en los que la incertidumbre de su

    comportamiento se debe tambin a la imposibilidad de repetirlos en las mismas condiciones,

    son tratados como fenmenos estadsticos.

    Se denomina poblacinal conjunto de elementos sobre los que se quiere realizar un estudio. En la

    prctica se observa un subconjunto de la poblacin que debe ser representativo y al que llamamos

    muestra.

    Entre otras muchas razones para restringirnos al estudio de muestras destacamos:

    Rapidez. Por ejemplo, las elecciones.

    Evitar la destruccin de la poblacin.Como en el control de calidad.

    Economa y precisin. El estudio de una poblacin completa puede llevar a cometer muchos

    errores, mientras que en una muestra se puede dedicar ms atencin a la calidad de los datos.

  • 5/24/2018 Dis Perci On

    8/256

    8 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Utilizaremos el trmino variable(variable estadstica) para referirnos a la caracterstica en estudio.

    Se dice que una variable es cuantitativa cuando sus diversas modalidades pueden ser medidas

    numricamente (precios, edad,...). Denominaremos atributos a las variables no numricas (sexo,

    profesin,...).Segn los valores que toman las variables estadsticas distinguimos:

    Variables discretas: toman valores aislados (nmero de empleados, habitaciones de una

    vivienda,...)

    Variables continuas: pueden tomar todos los valores de un intervalo (estatura, peso,...)

    En la prctica toda variable es discreta debido a la precisin limitada de los aparatos de medida, por

    ello distinguiremos entre variables con pocas modalidades (discretas) y variables que toman un

    gran nmero de valores distintos (donde se incluyen las variables continuas y otras muchasmagnitudes sociales y econmicas como salarios, poblacin de ciudades,...)

    Tablas estadsticas.

    Una vez recogidos los datos se procede a su descripcin con la finalidad de obtener el mayor

    conocimiento acerca del fenmeno.

    El primer paso de esta descripcin consiste en la ordenacin, clasificacin, recuento y

    representacin de los datos. Posteriormente se procede a resumirlos en cantidades que midencaractersticas del fenmeno.

    EJEMPLO 1.1

    Un estudio sobre el tipo de vivienda en construccin en una gran urbe ha aportado los siguientes

    datos

    TIPO

    ColectivaUnifamiliar

    5614

    total 70

    Nmero de

    dormitorios12345

    71421217

    total 70

    EJEMPLO 1.2

    Para conocer el salario/hora de los trabajadores de un sector se ha observado una muestra de 100.Los datos se han recogido en la siguiente tabla

  • 5/24/2018 Dis Perci On

    9/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 9

    Salario/hora0-10

    10-2020-4040-50

    25402015

    total 100

    A estas representaciones numricas se denominan tablas estadsticas.

    Estas tablas recogen la siguiente informacin: las modalidades, i , (valores que ha presentado el

    fenmeno) de forma individual o agrupadas en intervalos y las frecuencias absolutas de cada

    modalidad o intervalo, in , (nmero de veces que se ha observado esa modalidad o valores del

    intervalo). El nmero total de observaciones, n , se obtiene sumando todas las frecuencias

    absolutas (lo que hemos llamado total en los ejemplos 1.1 y 1.2)

    1

    k

    i

    i

    n n=

    = A las tablas estadsticas se le puede aadir ms informacin, como:

    La frecuencia relativa de la modalidad o intervalo i, if , es el cociente de la frecuencia absoluta

    sobre el total de observaciones

    i

    i

    n

    f n=

    A menudo las frecuencias relativas se multiplican por 100 para expresar en tanto por ciento la

    medida en que se presenta cada modalidad o intervalo de valores.

    La frecuencia absoluta acumuladade la modalidad o intervalo i, iN , es el nmero de veces que se

    han observado valores menores o iguales que dicha modalidad o intervalo.

    1

    i

    i j

    j

    N n=

    = Anlogamente se define la frecuencia relativa acumulada, iF, a partir de las frecuencias relativas.

    Se denomina distribucin de frecuencias al conjunto de valores que presenta una variable

    estadstica junto con sus frecuencias. sta se representa segn el siguiente modelo donde no todas

    las columnas son necesarias y su posicin puede cambiarse

  • 5/24/2018 Dis Perci On

    10/256

    10 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    1i iL L i in if iN iF

    0 1L L

    1 2L L

    ...

    1k kL L

    1

    2x

    ...

    kx

    1n

    2n

    ...

    kn

    1f

    2f

    ...

    kf

    1

    2N

    ...

    kN

    1F

    2F

    ...

    kF

    n 1

    EJEMPLO 1.3

    Usando los datos de los ejemplos 1.1 y 1.2.

    i in if

    ColectivaUnifamiliar

    5614

    0,800,20

    total 70 1

    ix in iN if iF

    123

    45

    71421

    217

    72142

    6370

    0,100,200,30

    0,300,10

    0,100,300,60

    0,901total 70 1

    1i iL L ix in if iN iF

    0-1010-2020-4040-50

    5153045

    25402015

    0,250,400,200,15

    256585

    100

    0,250,650,85

    1total 100 1

    Nota: en variables de tipo continuo cada intervalo de valores o claseest representado por su punto

    medio o marca de clase, i .

    Cada da ms, debido al uso de los ordenadores(hojas de clculo, programas de estadstica,...), la

    representacin numrica de los datos se reduce a escribir en una columna los valores observados sin

    ordenarlos, clasificarlos o contarlos (sin frecuencias), tal y como aparece en la siguiente imagen.

    i

    1

    2x

    ...

    nx

  • 5/24/2018 Dis Perci On

    11/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 11

    Representaciones grficas.

    Aunque es cierto que una tabla estadstica contiene toda la informacin observada de un fenmeno,

    es conveniente en ocasiones traducir toda esa informacin en un grfico que nos permita realizar

    una rpida sntesis visual.

    Entre las representaciones grficas ms utilizadas estn el diagrama de barras, histograma, y

    diagrama de sectores.

    DIAGRAMA DE BARRAS

    La longitud de la barra nos informa de la frecuencia con que se ha observado cada valor de la

    variable.

    Nmero dedormitorios in

    12345

    71421217

    HISTOGRAMA

    En esta representacin y en la siguiente es el rea de las figuras utilizadas (rectngulos o sectores) laque nos indica con qu frecuencia se observa cada clase o modalidad

    1i iL L in ia ih

    0-1010-2020-4040-50

    25402015

    10102010

    2,541

    1,5

    La pirmide de poblacin consiste en dos histogramas colindantes, uno para la edad de los

    hombres y otro para la edad de las mujeres. La tpica forma triangular de este grfico le ha dado el

    nombre de pirmide de poblacin.

    0

    5

    10

    15

    20

    25

    1 2 3 4 5

  • 5/24/2018 Dis Perci On

    12/256

    12 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    DIAGRAMA DE SECTORES

    i in if sector

    ColectivaUnifamiliar

    5614

    0,800,20

    0,80x360=2880,20x360=72

    total 70 1 360

    1.2 Momentos centrados y no centrados.

    Los momentos son unos valores calculados a partir de la distribucin de frecuencias que resumen la

    informacin relativa a alguna propiedad de la variable.

    Como veremos ms adelante, la media aritmtica y la varianza son casos particulares de momentos

    que resumen el valor global y la dispersin de los valores que presenta la variable estadstica. Otros

    momentos sern utilizados para medir ciertas caractersticas relativas a la forma de la distribucin

    de frecuencias.

    En la prctica utilizaremos momentos de rdenes uno a cuatro.

    Colectiva Unifamiliar

  • 5/24/2018 Dis Perci On

    13/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 13

    Momentos no centrados.

    Se definen los momentos no centrados (o respecto al origen) como:

    1 1

    1 k kr rr i i i i

    i i

    a x n x f n = =

    = = (para tablas con frecuencias)

    1

    1 n rr i

    i

    a xn =

    = (para tablas sin frecuencias)Propiedades:

    El momento no centrado 1a se conoce tambin como media (aritmtica) y se suele notar como

    .

    0 1a = .

    Momentos centrados.

    Se definen los momentos centrados (o respecto a la media) como:

    ( ) ( )1 1

    1 k kr rr i i i i

    i i

    m x x n x x f n = =

    = = (para tablas con frecuencias)

    ( )1

    1 n rr i

    i

    m x xn =

    = (para tablas sin frecuencias)

    Propiedades: El momento centrado 2m se conoce tambin como varianza y se suele notar como

    2S .

    0 11, 0m m= = .

    ( )

    2 2 22 2

    1 1 1 1 1 1 12

    2 2k k k k k k k

    i i i i i i i i i i i i

    i i i i i i i

    x n x n x n xx n x n x n x x n

    mn n n n n n n

    = = = = = = =

    = = + = + =

    2 2 22 1 2 1 1 1 2 12 2a x xa a a a a a a= + = + =

    Anlogamente, desarrollando el correspondiente binomio elevado a r, cualquier momento

    centrado puede escribirse en funcin de los momentos no centrados. Sealamos por su

    importancia los casos r=2 y r=3.

    3 2 43 3 2 1 1 4 4 3 1 2 1 13 2 4 6 3m a a a a m a a a a a a= + = +

    Clculo de los momentos.

    Para facilitar la obtencin de los momentos, los clculos se disponen en una tabla como sigue:

  • 5/24/2018 Dis Perci On

    14/256

    14 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    EJEMPLO 1.4 (momentos no centrados)

    Tabla sin frecuencias.

    ix 2i 3i 4i 3 9 27 81

    3 9 27 812 4 8 162 4 8 163 9 27 815 25 125 625

    18 60 222 900

    21 2

    1 1

    3 43 4

    1 1

    1 18 1 603 10

    6 6

    1 222 1 90037 150

    6 6

    n n

    i i

    i i

    n n

    i i

    i i

    x a x a xn n

    a x a xn n

    = =

    = =

    = = = = = = =

    = = = = = =

    Tabla con frecuencias. Variable discreta.

    i in i ix n 2i in 3i in 4i in1 7 7 7 7 72 14 28 56 112 2243 21 63 189 567 17014 21 84 336 1344 53765 7 35 175 875 4375

    total n=70 217 763 2905 116832

    1 21 1

    3 43 4

    1 1

    1 217 1 7633'1 10 '9

    70 70

    1 2905 1 1168341'5 166 '9

    70 70

    k k

    i i i i

    i i

    k k

    i i i i

    i i

    x a x n a x nn n

    a x n a x nn n

    = =

    = =

    = = = = = = =

    = = = = = =

    Tabla con frecuencias. Variable continua.

    1i iL L i in i in 2i in 3i in 4i in0-10 5 25 125 625 3125 1562510-20 15 40 600 9000 135000 202500020-40 30 20 600 18000 540000 1620000040-50 45 15 675 30375 1366875 61509375total n=100 2000 58000 2045000 79750000

    21 2

    1 1

    3 43 4

    1 1

    1 2000 1 5800020 580

    100 100

    1 2045000 1 7975000020450 797500

    100 100

    k k

    i i i i

    i i

    k k

    i i i i

    i i

    x a x n a x nn n

    a x n a x nn n

    = =

    = =

    = = = = = = =

    = = = = = =

  • 5/24/2018 Dis Perci On

    15/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 15

    EJEMPLO 1.5 (momentos centrados)

    Tabla sin frecuencias.

    ix ix x ( )2ix x ( )3i x ( )4ix x3 0 0 0 0

    3 0 0 0 02 -1 1 -1 12 -1 1 -1 13 0 0 0 05 2 4 8 16

    total 0 6 6 18

    ( ) ( )

    ( ) ( )

    2

    1 21 1

    3 4

    3 4

    1 1

    1 0 1 60 1

    6 6

    1 6 1 181 3

    6 6

    n n

    i i

    i i

    n n

    i i

    i i

    m x x m x xn n

    m x x m x x

    n n

    = =

    = =

    = = = = = =

    = = = = = =

    Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos

    obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as

    22 2 2 22 2 1

    1

    110 3 1

    n

    i

    i

    S m a a x xn =

    = = = = =

    Dado que los clculos para tablas con frecuencias son anlogos para variables discretas y continuas,

    incluimos un solo ejemplo de momentos centrados con frecuencias.

    Tabla con frecuencias. Variable continua.

    1i iL L ix in ( )i x ( )i ix x n ( )2i ix n ( )3i ix n ( )4i ix n 0-10 5 25 -15 -375 5625 -84375 126562510-20 15 40 -5 -200 1000 -5000 2500020-40 30 20 10 200 2000 20000 20000040-50 45 15 25 375 9375 234375 5859375

    total n=100 0 18000 165000 7350000( ) ( )

    ( ) ( )

    2

    1 21 1

    3 4

    3 41 1

    1 0 1 180000 180

    100 100

    1 165000 1 73500001650 73500

    100 100

    k k

    i i i i

    i i

    k k

    i i i i

    i i

    m x x n m x x nn n

    m x x n m x x nn n

    = =

    = =

    = = = = = =

    = = = = = =

    Tambin podramos haberlos calculado en funcin de los momentos no centrados que hemos

    obtenido en el ejemplo 1.4. El momento centrado de orden dos (varianza) se suele calcular as

    22 2 2 2

    2 2 1 1

    1

    580 20 580 400 180

    k

    i iiS m a a x n xn =

    = = = = = =

  • 5/24/2018 Dis Perci On

    16/256

    16 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Clculoscomo los anteriores, dispuestos en forma de tabla, son muy fcilesde hacer con la ayuda

    de una hoja de clculo.

    1.3 Medidas de posicin.

    Las distintas medias, la moda y la mediana tratan de representar mediante un solo valor a un

    conjunto de datos y suelen tomar una posicin central respecto de los mismos, motivo por el que son

    conocidas como medidas de posicin central.

    Media aritmtica.

    Es el promedio ms familiar y utilizado en los ms diversos mbitos, aunque no es el nico ni el

    ms adecuado en todas las ocasiones. Se define como

    1 1

    1i i

    k k

    i i

    i i

    x x n x fn = =

    = = (para tablas con frecuencias)

    1

    1i

    n

    i

    x xn =

    = (para tablas sin frecuencias)Coincide con el momento no centrado 1a x= .

    Las calculadoras cientficasnos permiten obtener fcilmente algunos valores estadsticos con la

    opcin SD, entre ellos la media aritmtica x .

    EJEMPLO 1.6.

    ix in i ix n

    1234

    5

    7142121

    7

    7286384

    35total 70 217

    1

    1 2173,1

    70i

    k

    i

    i

    x x nn =

    = = =

    1i iL L ix in i ix n

    0-1010-2020-4040-50

    5153045

    25402015

    125600600675

    total 100 2000

    1

    1 200020

    100i

    k

    i

    i

    x x nn =

    = = =

  • 5/24/2018 Dis Perci On

    17/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 17

    Propiedades de la media aritmtica:

    Consideramos n observaciones agrupadas en s conjuntos de datos con 1n , 2n , , sn

    observaciones cada uno y con medias 1 2, , ..., sx x respectivamente, entonces la media x de

    las n observaciones es:

    1 1

    11

    ... 1

    ...s

    i

    ss

    i

    is

    x n x nx x n

    n n n =

    + += =

    + +

    Con frecuencia se dividen o multiplican los valores de la variable por una constante, iex

    (cambio de escala), por ejemplo cuando decidimos expresar los valores en millones en lugar

    de en euros (en $ en lugar de ,). En otras ocasiones se suma o resta una constante a los

    valores de la variable, ix c+ (cambio de origen). Si realizamos una o ambas

    transformaciones sobre la variable original obtenemos una nueva variable, i iy ex c= + , cuyamedia est relacionada con la media de la variable de partida segn:

    y ex c= +

    ( )1 1 1 1 1 1

    1 1 1 1 1 1i i i

    k k k k k k

    i i i i i i i

    i i i i i i

    y y n ex c n ex n cn e x n c n ex cn n n n n n= = = = = =

    = = + = + = + = +

    Media geomtrica.

    11

    1

    ...n nni kk

    nn

    i k

    i

    G x x x=

    = = (para tablas con frecuencias)

    11

    ...n

    nni n

    i

    G x x x=

    = = (para tablas sin frecuencias)

    La media geomtrica se utiliza para promediar porcentajes, tasas, ndices de precios,... es decir, en

    aquellos casos en los que la variable representa variaciones acumulativas. La media geomtrica es

    menor que la media aritmtica calculada sobre los mismos datos.

    EJEMPLO 1.7.

    El valor de la vivienda ha sufrido en los ltimos 5 aos los siguientes incrementos

    incremento6%5%

    17%20%

    14%Obtenga el incremento anual medio del valor de la vivienda en estos cinco aos.

  • 5/24/2018 Dis Perci On

    18/256

    18 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    Una vivienda cuyo valor fuese 0V al comienzo de estos cinco aos alcanzara un valor

    1 0 0 0

    61,06

    100V V V V = + =

    al final del primer ao, que se transformara en

    2 1 1 1 0

    51,05 1,05 1,06

    100V V V V V = + = =

    despus de transcurridos dos aos.

    As sucesivamente, al final de los cinco aos

    5 01,14 1,20 1,17 1,05 1,06V V=

    55 0

    0

    1,7814 1,7814V

    V V

    V

    = =

    Luego ha habido un incremento del precio de la vivienda en los ltimos cinco aos del 78,14%

    (0,7814 por uno).

    El incremento medio anual ser aquel valor r (en tanto por uno) tal que si se hubiera observado

    durante todo el periodo (ltimos 5 aos) ese incremento constante, el resultado final habra sido el

    mismo

    0 01,14 1,20 1,17 1,05 1,06 (1 ) (1 ) (1 ) (1 ) (1 )V r r r r r V = + + + + +

    por tanto5

    5 5

    (1 ) 1,14 1,20 1,17 1,05 1,06 1,7814

    1 1,14 1,20 1,17 1,05 1,06 1,7814 1,1224

    0,1224 en tanto por ciento % 12,24%

    r

    r

    r r

    + = =

    + = = =

    = =

    1 r+ es la media geomtrica de los valores 1 ir+ , donde ir es el incremento en cada ao

    expresado en tanto por uno.

    Teniendo en cuenta que 5

    0

    1,14 1, 20 1,17 1, 05 1, 06 1, 7814V

    V = = , otra forma de expresar res

    55

    0

    1V

    rV

    + =

    O en general para naos

    0

    1 nnV

    rV

    + =

  • 5/24/2018 Dis Perci On

    19/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 19

    Utilizaremos esto ltimo cuando se desconozcan los incrementos anuales (6%, 5%,) pero se

    conozcan los valores inicial ( 0V ) y final ( nV ) del bien que se est analizando (como en el ejemplo

    1.8)

    Lamedia aritmtica no es adecuada en este contextocomo puede verse

    ( )

    0,06 0,05 0,17 0,20 0,140,124

    56% 5% 17% 20% 14%

    (en tanto por ciento) 12,4% 12,4% 12,24%5

    r

    r

    + + + += =

    + + + += =

    Segn la media aritmtica habra un incremento del valor de la vivienda en los 5 aos de

    ( )5

    1,124 1,794 79, 4%= , que no se corresponde con la realidad del ejemplo (78,14%).

    EJEMPLO 1.8.

    Una vivienda que en el ao 2000 se compr por 125.000 se ha vendido en el ao 2007 por

    500.000. Otra vivienda que se compr en 1995 por 100.000 se vendi en el 2006 por 700.000.

    Cul de las viviendas increment ms su valor?

    Solucin:

    Responderemos apoyndonos en el incremento anual medio observado en el valor de cada vivienda.

    72007 77

    2000

    500.0004 1,219

    125.000

    V

    V= = = incremento anual medio del 21,9% (primera vivienda)

    112006 1111

    1995

    700.0007 1,1935

    100.000

    V

    V= = = incremento anual medio del 19,35% (segunda vivienda)

    La primera vivienda experiment un incremento anual medio del 21,9% en su valor mientras que la

    segunda experiment un incremento menor, 19,35%.

    Media armnica.

    1

    ki

    i i

    nH

    n

    x=

    =

    (para tablas con frecuencias)

    1

    1n

    i i

    nH

    x=

    =

    (para tablas sin frecuencias)

  • 5/24/2018 Dis Perci On

    20/256

    20 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Se utiliza para promediar velocidades, precios por unidad, cambios de divisas,...

    La media armnica es menor que la media geomtrica y esta ltima menor que la media aritmtica.

    EJEMPLO 1.9.

    Si se sube en bicicleta a Sierra Nevada a una velocidad de 10 Km/h y se baja a una velocidad de 60Km/h, a qu velocidad media se ha hecho el recorrido completo de ida y vuelta. Suponga que la

    distancia desde la casa del ciclista a Sierra Nevada es de 30 Km.

    Solucin:

    Si calculamos la media aritmtica, obtenemos10 60

    35 /2

    x Km h+

    = = , que no es la solucin.

    Entendiendo por velocidad media aquella velocidad constante a la que si se realizara el recorrido se

    tardara lo mismo, claramente 35 Km/h no lo cumple.

    30 301,7143

    35h

    += mientras que hemos tardado

    303

    10h= en subir y

    300,5

    60h= en bajar, en total 3

    horas y media.

    La solucin sera la media armnica 2

    1

    2 2 217,1429 /

    1 11 0,10 0,016710 60i i

    H km h

    x=

    = = = =++

    (Obsrvese que la distancia, 30 Km., no interviene en el clculo)

    A esa velocidad media tardaramos 30 30 3,4999917,1429

    h+ = , es decir 3,5 h (la diferencia que se

    observa es debida a los errores de redondeo), lo que realmente se ha tardado en la subida y bajada.

    Nota:

    Utilizando el valor de las distancias recorridas, la media se hubiera calculado como

    2

    1

    2 2 601 1 30 301

    10 60 10 60i i

    H

    x=

    = = =

    + +

    y en general

    1

    11

    distancia total

    tiempo total como suma de los tiempos parciales...k

    ki

    ki i

    D DH

    ddd

    v vv=

    = = =

    + +

    EJEMPLO 1.10.

    Una agencia inmobiliaria ha vendido las siguientes viviendas

  • 5/24/2018 Dis Perci On

    21/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 21

    Precio Superficie 2/precio m240.000180.000420.000

    6090

    100

    4.0002.0004.200

    Cual ha sido el precio medio al que ha vendido el metro cuadrado.

    Solucin:

    ini

    i

    ni

    240.000180.000420.000

    6090

    100

    4.0002.0004.200

    840.000 250

    2

    1

    840.000 Precio total3.360/

    250 Superficie totalk ii i

    nH m

    n

    x=

    = = = =

    Todos aquellos datos que representen precios por unidadcomo cambio de divisas (p.e., $/, /$),

    precios de alimentacin, combustibles,... (p.e., /Kg, /l), precio de la vivienda por m2(/m2), etc.,

    se promedian utilizando la media armnica.

    Hay ms tipos de medias, como la media cuadrtica, , que no estudiaremos en esta asignatura.

    Moda.

    Es el valor que se presenta con ms frecuencia. Se nota Mo. Puede haber varias modas.

    Para variables discretas y atributossu clculo es inmediato. En las variables continuasla mayor

    o menor frecuencia de las observaciones en un intervalo depende en parte de su amplitud, por lo que

    para calcular la moda consideraremos las frecuencias observadas en conjuntos de igual amplitud

    (amplitud unidad).

    Dentro del intervalo modal (el de mayor frecuencia por unidad de amplitud, mayor altura en el

    histograma) hay que seleccionar un punto como moda, para lo cual no hay un nico criterio.

    Sealaremos tres criterios diferentes que notaremos como ( ), ( ) ( )o I Mo II y Mo III .

    Uno de ellos consiste en tomar el punto medio o marca de clase:

    1( )2

    i ii

    L Lo I x

    += =

    Otro criterio sita la moda a una distancia de los extremos del intervalo proporcional a las alturas de

    los intervalos anterior y posterior al intervalo modal:

    11

    1 1

    ( ) ii ii i

    ho II L a

    h h

    +

    +

    = +

    +

  • 5/24/2018 Dis Perci On

    22/256

    22 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Y el tercero tiene en cuenta un procedimiento grfico para situar la moda dentro del intervalo

    modal:

    ( ) ( )1

    11 1

    ( ) i ii ii i i i

    h ho III L a

    h h h h

    +

    = +

    +

    En las expresiones anteriores 1iL es el extremo inferior del intervalo modal, ia la amplitud del

    intervalo modal y ih la altura del intervalo modal ( 1ih la altura del intervalo anterior, 1ih + la altura

    del intervalo posterior).

    EJEMPLO 1.11.

    ix in

    1

    2345

    7

    142121770n =

    Mo=3

    Mo=4

    TIPOin

    Colectiva

    Unifamiliar

    56

    14total 70

    Mo=Colectiva

    1i iL L in ia ih

    0-1010-20

    20-4040-50

    25304015

    10102010

    2,53

    21,5100n =

    Intervalo modal: 10-20.

    Dentro del intervalo modal hay que seleccionar

    un punto como moda. Hay diversos criterios:

    1 10 20( ) 152 2

    i iL LMo I + +

    = = =

    11

    1 1

    2( ) 10 10 14,44

    2,5 2i

    i i

    i i

    hMo II L a

    h h

    +

    +

    = + = + =+ +

    ( ) ( ) ( ) ( )1

    11 1

    3 2,5

    ( ) 10 10 13,333 2,5 3 2i i

    i ii i i i

    h h

    Mo III L ah h h h

    +

    = + = + = + +

    Mediana.

    Es aquel valor, Me, que divide a la muestra ordenada en dos partes iguales, es decir, hay el mismo

    nmero de datos menores que la mediana como mayores que ella.

    Si hay un nmero impar de observaciones, la mediana es el nico valor central

    5, 10, 30, 45, 50 Me=30

  • 5/24/2018 Dis Perci On

    23/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 23

    Si hay un nmero par de observaciones, la mediana es el punto medio de los dos valores centrales

    5, 10, 30, 45 Me=(10+30)/2=40/2=20

    Si tenemos los datos representados en una tabla estadstica la mediana se calcula buscando el valor

    que deja por debajo de l una frecuencia acumulada igual a

    2

    n

    EJEMPLO 1.12.

    Para variables discretasbuscamos en la columna de frecuencias absolutas acumuladas el valor2

    n,

    7035

    2 2

    n = =

    i i

    ni

    N

    12345

    71414287

    721356370

    70n =

    pudiendo ocurrir que hay un 2in

    N = , en cuyo caso la mediana

    es: 13 4

    3,52 2

    i ix xMe ++ +

    = = = ,

    ix in iN

    1

    2345

    7

    1421217

    7

    21426370

    70n =

    o bien, como en este otro ejemplo, todos los2in

    N . Entonces, se

    busca el primer 2in

    N > , siendo la modalidad i asociada a esa

    frecuencia acumulada el valor que se toma como mediana, 3Me = .

    En variables continuasse distinguen las mismas dos posibilidades:

    1i iL L in iN

    0-1010-2020-4040-50

    2030

    3515

    205085100

    100n =

    2in

    N = . La mediana es el extremo superior del intervalo

    donde se alcanza la mitad de las observaciones.

    20iMe L= =

    1i iL L ia in iN

    100-110110-120120-140140-150

    10102010

    25402015

    256585

    100

    100n =

    Todos los2in

    N . La mediana est en el intervalo donde

    por primera vez2in

    N > y se calcula mediante:

  • 5/24/2018 Dis Perci On

    24/256

    24 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    1

    1

    50 252 110 10 116,2540

    i

    i i

    i

    nN

    Me L an

    = + = + =

    que es el resultado de repartir homogneamente las 40 observaciones sobre la amplitud 10 del

    intervalo. Segn la tabla, hasta 110 hay una frecuencia acumulada de 25, hasta 120 hay una

    frecuencia acumulada de 65 (por tanto 40 observaciones entre 110 y 120), luego el valor Mehasta

    el que hay una frecuencia acumulada de 502

    n= estar entre 110 y 120. Si las observaciones se

    reparten homogneamente en el intervalo, la distancia entre la mediana y el extremo inferior del

    intervalo ser proporcional al nmero de observaciones entre dichos valores

    120 110 40

    110 50 25Me

    =

    ( )

    120 11050 25 110

    40Me

    =

    120 11040 =Amplitud entre cada una de las 40 observaciones del intervalo 110-120.

    ( )50 25 =Nmero de observaciones en el intervalo 110-Me.

    Despejando el valor Me se obtiene la anterior expresin para la mediana

    10 40 110 50 25 50 25 50 25110 10 110 10

    110 50 25 10 40 40 40

    MeMe Me

    Me

    = = = = +

    Percentiles.

    Estas medidas ( )1 99 1 99,..., ,...,P P o C C dividen a la muestra ordenada en 100 conjuntos con igual

    nmero de observaciones,100

    n, habiendo por tanto

    100

    n observaciones menores que P . La

    mediana coincide con 50P . Salvo este percentil, el resto de percentiles ocupan una posicin no

    central respecto de los datos de la muestra, propiedad por la que reciben la denominacin de

    medidas de posicin no central.

    Otros casos particulares de percentiles son los denominados cuartiles

    ( )1 25 2 50 3 75, ,Q P Q P Q P = = = que dividen a la muestra en 4 conjuntos con igual nmero de

    observaciones,4

    n, y los deciles ( )1 10 2 20 9 90, , ...,D P D P D P= = = que dividen a la muestra en 10

    conjuntos con igual nmero de observaciones,

    10

    n.

  • 5/24/2018 Dis Perci On

    25/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 25

    El clculo de los percentiles es similar al de la mediana, cambiando 502 100

    n n= por

    100

    n

    dependiendo del percentil, P , que se quiera calcular.

    En las distribuciones de variables discretas no hay consenso sobre la forma de calcular los

    percentiles, existiendo en la literatura cientfica nueve mtodos diferentes que conducen aresultados diferentes. Por ello, al calcular cualquier percentil por medio de software o manualmente,

    es bsico saber e indicar el mtodo utilizado. Excel no utiliza el mismo mtodo que en estos

    apuntes.

    EJEMPLO 1.13.

    Calcule sobre las siguientes tablas los percentiles 30 y 85

    i in iN12345

    71414287

    721356370

    70n =

    130 2 330 21 2,5100 2 2

    i ix xn P ++ += = = =

    8585 59,5 4100

    nP= =

    1i iL L ia in iN

    100-110110-120120-140140-150

    10102010

    25402015

    256585

    100100n =

    8585 85 140100

    nP= =

    30 30100

    n=

    100in

    N P est en el intervalo donde por primera vez 100in

    N >

    se calcula con una expresin similar a la de la mediana, sustituyendo2

    n por

    100

    n , que es el

    resultado de repartir homogneamente las observaciones sobre la amplitud del intervalo

    1

    1100 i

    i i

    i

    n NP L a

    n

    = +

    1

    30 1

    30 30 25100 110 10 111,2540

    i

    i i

    i

    nN

    P L an

    = + = + =

    EJEMPLO 1.14.

    Los saldos de las cuentas abiertas por los clientes de una sucursal bancaria se distribuyen de

    acuerdo a la siguiente tabla

  • 5/24/2018 Dis Perci On

    26/256

    26 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    SALDOS NUMERO DE CLIENTES0-200

    200-1.0001.000-5.000

    5.000-30.000

    10040030050

    Se consideran clientes preferentes al 10% de los clientes con mayores saldos, cul ha de ser el

    saldo para que un cliente sea considerado como tal?

    Qu porcentaje de clientes tienen un saldo superior a 900?

    Solucin:

    SALDOS NUMERO DE CLIENTESiN

    0-200200-1.000

    1.000-5.0005.000-30.000

    10040030050

    100500800850

    850850 90 765100

    n= =

    1

    90 1

    90 765 500100 1000 4000 4533,33300

    i

    i i

    i

    nN

    P L an

    = + = + =

    Se considerarn clientes preferentes a los que tienen un saldo superior a 4533,33.

    1

    1

    850100

    100 100900 200 800 52,94400

    i

    i i

    i

    nN

    P L an

    = + = = + =

    El 52,94% de los clientes tienen un saldo inferior a 900, por tanto un 47,06% =(100-52.94)% de

    clientes tienen un saldo superior a 900.

    Considerando el reparto homogneo de las observaciones en cada intervalo, las anteriores

    cuestiones se podran haber resuelto tambin de la siguiente manera

    90 9090 90

    5000 1000 800 500 4000 300 4000 2651000 3533,33 4533,331000 765 500 1000 265 300P PP P

    = = = = =

    1000 200 500 100 800 400 400 700100 350 450

    900 200 100 700 100 800x x

    x x

    = = = = =

    . Hay 450 clientes

    con un saldo inferior a 900 que representan un450

    100 52, 94%850

    = .

  • 5/24/2018 Dis Perci On

    27/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 27

    1.4 Medidas de dispersin.

    Las medidas de dispersincuantifican la variabilidad o esparcimiento de los datos. Cuando esta

    dispersin se mide respecto de alguna medida de posicin central (por ejemplo, la media) nos indica

    la mayor o menor representatividadde dicha medida.

    Recorridos

    El recorrido o rangoRse define como la diferencia entre los valores extremos.

    R=mximo-mnimo

    Es la medida de dispersin ms fcil de calcular pero tiene el inconveniente de que slo utiliza dos

    valores (estando sujeta a posibles datos errneos) por lo que no nos da una medida precisa de la

    dispersin de todos los datos.

    El recorrido intercuartlico IR se define como la diferencia entre el tercer y primer cuartil,

    3 1 75 25IR Q Q P P= =

    representa la amplitud del intervalo donde se encuentra el 50% de las observaciones centrales de la

    muestra. Con esta medida se evita la fuerte influencia que tienen los valores extremos en el

    recorridoR.Con la misma idea se pueden definir distintos recorridos utilizando otros percentiles.

    Varianza

    ( )2

    2

    1

    1 ki i

    i

    S x x nn =

    = (para tablas con frecuencias)

    ( )2

    2

    1

    1 ni

    i

    S x x

    n =

    = (para tablas sin frecuencias)La varianza coincide con el momento centrado de orden 2, 2 2S m= .

    Mide la dispersin o distancia de los datos, ix , respecto de la media aritmtica, x . Esta medida est

    expresada en las unidades de los datos al cuadrado (p.e., 2, hab.2,...) por lo que no tiene una

    interpretacin fcil. Con el objeto de tener una medida de dispersin expresada en las mismas

    unidades que los datos en estudio, se define la desviacin tpica como la raz cuadrada positiva de la

    varianza.

  • 5/24/2018 Dis Perci On

    28/256

    28 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Con frecuencia se dividen o multiplican los valores de la variable por una constante, iex (cambio de

    escala), por ejemplo cuando decidimos expresar los valores en millones en lugar de en euros (en $

    en lugar de en ,). En otras ocasiones se suma o resta una constante a los valores de la variable,

    ix c+ (cambio de origen). Si realizamos una o ambas transformaciones sobre la variable original

    obtenemos una nueva variable, i iy ex c= + , cuya varianza est relacionada con la varianza de la

    variable de partida mediante:

    2 2 2y xS e S=

    (los cambios de origen en los valores de la variable no afectan al valor de la varianza, pero s los

    cambios de escala).

    ( ) ( ) ( ) ( )( )

    ( ) ( )

    22 2 22

    1 1 1 1

    2 22 2 2 2

    1 1

    1 1 1 1

    1 1

    i i i

    i i

    k k k k

    y i i i i i

    i i i i

    k k

    i i x

    i i

    S y y n ex c ex c n ex ex n e x x nn n n n

    e x x n e x x n e S n n

    = = = =

    = =

    = = + = = =

    = = =

    En general, para cualquier momento centrado se tiene que

    ( ) ( )rr rm y e m x=

    Desviacin tpica.

    La medida de dispersin absoluta ms utilizadaes la desviacin tpica, S.2S S=

    Las calculadoras cientficas nos permiten obtener fcilmente algunos valores estadsticos con la

    opcin SD, entre ellos la desviacin tpica nS = y elevndola al cuadrado obtenemos la varianza

    2S .

    Los cambios de origenen los valores de la variable no afectan al valor de la desviacin tpica, pero

    s los cambios de escalasegn la expresiny xS e S= .

    EJEMPLO 1.15.

    Calcule el rango, la varianza y la desviacin tpica para la siguiente distribucin de frecuencias.

    1i iL L in

    0-1010-2020-3030-40

    1234

    10

  • 5/24/2018 Dis Perci On

    29/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 29

    Solucin:

    1i iL L in ix i ix n ( )

    2

    i x ( )2

    i ix x n

    0-1010-2020-3030-40

    1234

    5152535

    53075

    140

    400100

    0100

    400200

    0400

    10 250 1000

    R=40-0=40

    1

    1 25025

    10

    k

    i i

    i

    x x nn =

    = = =

    ( )221

    1 1000 10010

    k

    i i

    i

    S x x nn =

    = = = 2 100 10S S= = =

    Desigualdad de Tchebycheff

    Esta desigualdad nos permite entender mejor el significado de la desviacin tpicacomo medida

    de dispersin.

    Dado un conjunto de datos con media y desviacin tpica S, la proporcin de datos en el

    intervalo ( ),x kS x kS + es mayor o igual que 21

    1k

    (k>1).

    ( ) 21

    , 1ip x x kS x kSk

    +

    Otra forma equivalente de expresar el mismo resultado, haciendo2

    22

    t tt kS k k

    S S

    = = = , dice

    que la proporcin de datos en el intervalo ( ),x t x t + es mayor o igual que2

    21

    S

    t .

    Por ejemplo, para k=2, ( )2 , 2S x S + , tenemos que alejndonos de la media dos desviaciones

    tpicas, a la derecha e izquierda, abarcaramos ms del 75% de las observaciones,

    2 2

    1 11 1 0,75

    2k = = .

    EJEMPLO 1.16.

    Se sabe que el nmero medio de unidades diarias de un determinado producto que vende un

    supermercado es 100x= y la desviacin tpica 40S= . Si cada da el supermercado repone hasta

    completar 200 unidades del producto en sus estanteras:

    Cuntos das al ao la demanda ser mayor que su oferta?

    Cunto habra que reponer para asegurar que no va a faltar producto en las estanteras el 95% de

    los das?

  • 5/24/2018 Dis Perci On

    30/256

    30 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    200 100x t t+ = = la proporcin de observaciones dentro del intervalo

    ( ) ( ), 0, 200x t x t + = es mayor o igual que2

    2

    16001 1 0,84

    10000

    S

    t = = y por tanto fuera de dicho

    intervalo (demanda inferior a 0 o superior a 200) la proporcin de observaciones es menor o igual a

    0,16=1-0,84 . Es decir, en menos del 16% de los das la demanda es superior a 200 unidades.

    22

    2 2

    1600 16001 1 0,95 32000 178,9 279

    0,05

    St t x t

    t t = = = = = +

    Reponiendo hasta completar 279 unidades en las estanteras aseguramos que ms del 95% de los

    das no faltar producto en el supermercado.

    Variable tipificada

    Se define la variable X tipificada como la nueva variable obtenida al realizar el siguiente cambio

    X xZ

    S

    =

    Esta nueva variable se caracteriza por tener media cero y desviacin tpica 1.

    La tipificacin de variables se puede utilizar para establecer comparacionesentre valores de dos

    variables (por ejemplo, las calificaciones de dos alumnos en dos centros diferentes).

    EJEMPLO 1.17.

    Se quiere comparar los precios de dos viviendas con las mismas caractersticas, una en Madrid y

    otra en Granada. El precio medio de las viviendas del tipo considerado es 200.000 en Madrid y

    140.000 en Granada, las desviaciones tpicas son respectivamente 20.000 y 15.000. Las dos

    viviendas a comparar tienen unos precios de 260.000 (Madrid) y 190.000 (Granada). cul de las

    dos viviendas est alcanzando un mayor valor en su mercado?Solucin:

    260.000 200.000 60.0003

    20.000 20.000

    = =

    190.000 140.000 50.0003,33

    15.000 15.000

    = =

    3,33 3> por tanto la vivienda de Granada est alcanzando mayor valor en su mercado

    que la de Madrid.

    Una vivienda con las caractersticas de la de Granada en Madrid tendra un precio de unos 266.600

    ( )200.000 3,33 20.000 3,33 200.000 266.60020.000x x = = + =

  • 5/24/2018 Dis Perci On

    31/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 31

    Los recorridos, la varianza y la desviacin tpica son medidas de dispersin absoluta que

    dependen de la unidad de medida de la variable (y por tanto les afecta el cambio de escala), lo

    anterior conlleva que no se puedan comparar estas medidas en dos variables con distinta unidad de

    medida. En la prctica para evitar este problema se prefiere trabajar con otras medidas dedispersin, obtenidas de las anteriores, que se denominan medidas de dispersin relativa. Las

    medidas de dispersin relativa son adimensionales (no dependen de la unidad de medida de la

    variable estadstica y por tanto no les afectan loscambios de escala)

    Coeficiente de Variacin.

    Es la medida de dispersin relativa ms utilizada. Se define como el cociente de la desviacin

    tpica sobre la media aritmtica

    SCV =

    Esta medida es invariante frente a cambios de escala pero le afecta los cambios de origen.

    EJEMPLO 1.18.

    La distribucin de los salarios mensuales de 10 trabajadores con igual cualificacin profesional es

    Salarios encientos de in

    0-1010-2020-3030-40

    123410

    El horario de trabajo no es nico para todos, siendo 6 el nmero medio de horas trabajadas cada da

    y 1 hora la desviacin tpica. Es coherente la distribucin de los salarios con la de las horas

    trabajadas?

    Razonamiento:

    Si todos los empleados trabajan las mismas horas, lo coherente es que reciban el mismo salario (la

    variacin del salario sera cero y tambin la del nmero de horas). Quien trabaje ms debe recibir

    ms salario y quien trabaje menos debe recibir menos, es decir, debe haber la misma variabilidad en

    las horas trabajadas que en los salarios percibidos.

    Solucin:

    La media y desviacin tpica de los salarios segn hemos calculado en el ejemplo 1.15 sobre estos

    mismos datos son:

  • 5/24/2018 Dis Perci On

    32/256

    32 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    1

    1 25025

    10

    k

    i i

    i

    x x nn =

    = = = 2 100 10S S= = = 10( ) 0,425

    CV salarios = =

    Mientras que1

    ( ) 0,1676

    CV horarios = = . La dispersin en los salarios es ms del doble que en las

    horas trabajadas, luego no es coherente la distribucin de salarios en relacin con las horas detrabajo.

    Otra forma de razonar:

    x=horas trabajadas, y=salario

    Si y kx= , donde k=salario/hora,debido a la invariabilidad del coeficiente de variacin frente a

    cambios de escala x yCV CV = , pero si x yCV CV y kx . Los salarios no son

    proporcionales a las horas trabajadas.

    EJEMPLO 1.19.

    Las subvenciones, en millones de euros, a las pequeas empresas en 2006 y 2007 segn

    comunidades autonmicas se recogen en la siguiente tabla

    2006 2007

    ANDALUCIA 42,95 69,15

    ARAGON 5,91 19,25

    ASTURIAS 2,23 28,5

    BALEARES 1,24 12,5

    CANARIAS 3,29 25,8CANTABRIA 7,20 16,25

    CASTILLA LA MANCHA 11,02 19,5

    CASTILLA LEON 11,15 26,05

    CATALUA 25,89 58,2

    COMUNIDAD VALENCIANA 17,26 58,35

    EXTREMADURA 6,08 41,5

    GALICIA 6,75 29

    MADRID 8,15 13,55

    MURCIA 9,78 25,35

    NAVARRA 1,84 15,5

    PAIS VASCO 7,88 34,35LA RIOJA 1,38 17,2

    Se han mantenido las diferencias entre las subvenciones recibidas en 2006 y 2007? Si han variado,

    indique en qu sentido.

  • 5/24/2018 Dis Perci On

    33/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 33

    Solucin:

    2006

    ix ( )

    2

    i x2007

    iy ( )

    2

    iy y

    ANDALUCIA 42,95 1085,7025 69,15 1532,7225

    ARAGON 5,91 16,7281 19,25 115,5625

    ASTURIAS 2,23 60,3729 28,5 2,25

    BALEARES 1,24 76,7376 12,5 306,25

    CANARIAS 3,29 45,0241 25,8 17,64

    CANTABRIA 7,20 7,84 16,25 189,0625

    CASTILLA LA MANCHA 11,02 1,0404 19,5 110,25

    CASTILLA LEON 11,15 1,3225 26,05 15,6025

    CATALUA 25,89 252,4921 58,2 795,24

    COMUNIDAD VALENCIANA 17,26 52,7076 58,35 803,7225

    EXTREMADURA 6,08 15,3664 41,5 132,25

    GALICIA 6,75 10,5625 29 1

    MADRID 8,15 3,4225 13,55 270,6025

    MURCIA 9,78 0,0484 25,35 21,6225

    NAVARRA 1,84 66,5856 15,5 210,25PAIS VASCO 7,88 4,4944 34,35 18,9225

    LA RIOJA 1,38 74,3044 17,2 163,84

    TOTAL 170,00 1774,75 510,00 4706,79

    17n= 1

    1 17010

    17

    n

    i

    i

    x xn =

    = = = 1

    1 51030

    17

    n

    i

    i

    y yn =

    = = =

    ( )2

    2

    1

    1 1774,75104,40

    17

    n

    x i

    i

    S x xn =

    = = = ( )221

    1 4706,79276,87

    17

    n

    y i

    i

    S y yn =

    = = = 2 10,22

    x xS S= = 2 16,64

    y yS S= =

    2006

    10,221,022

    10xSCV

    x= = = 2007

    16,640,555

    30yS

    CVy

    = = =

    Las diferencias entre las subvenciones recibidas por las distintas comunidades autonmicas han

    disminuido en 2007 en relacin al ao anterior.

    1.5 Medidas de forma.

    Momentos como la media y la varianza nos aportan informacin sobre la posicin y dispersin de

    los datos. En este apartado, las denominadas medidas de forma cuantifican caractersticas

    observables en la forma de la representacin grfica que nos proporcionan ms informacin sobre el

    fenmeno en estudio.

    Hay diversas medidas de forma, las ms utilizadas se basan en los momentos.

  • 5/24/2018 Dis Perci On

    34/256

    34 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Coeficiente de asimetra de Fisher.

    31 3

    mg

    S=

    Se basa en que en distribuciones simtricas por cada observacin a la derecha de la media hay otra a

    igual distancia a la izquierda, por tanto la expresin

    ( )3

    1

    0n

    i

    i

    x x=

    =

    Si la grfica es asimtrica a la izquierda se rompe el anterior equilibrio entre sumandos positivos y

    negativos, resultando la suma negativa. Lo mismo ocurre cuando la distribucin de frecuencias es

    asimtrica a la derecha, resultando la suma positiva. El signo del denominador de 1g es siempre

    positivo, por tanto:

    Si la distribucin es simtrica 1 0g =

    Si la distribucin es asimtrica a la izquierda 1 0g

    El signo de 1 lo aporta 3m , se define dividiendo por3Spara conseguir que el coeficiente sea una

    medida adimensional que pueda compararse con la asimetra de otras distribuciones, adems

    tambin se consigue as que sea independiente de cambios de origen y escala.

    Coeficiente de curtosis (o apuntamiento) de Fisher.

    Las medidas de curtosis se utilizan en distribuciones unimodales simtricas o levemente asimtricas

    para cuantificar la mayor o menor frecuencia de observaciones en torno a la media. La mayor

    frecuencia de observaciones prximas a la media dar lugar a una representacin grfica ms

    apuntada, la menor frecuencia de observaciones prximas a la media dar lugar a una representacin

    ms aplanada. El perfil de apuntamiento que se toma como referencia es el de la conocida campana

    de Gauss ocurva normal.

    La medida de apuntamiento ms utilizada es el coeficiente de curtosis de Fisher

    42 4

    3m

    gS

    =

    Al igual que el coeficiente de asimetra de Fisher es adimensionale independiente de cambios de

    origen y escala.

    Los valores del coeficiente de curtosis de Fisher se interpretan de la siguiente manera:

    Si la distribucin tiene un apuntamiento normal(mesocrtica) 2 0g =

  • 5/24/2018 Dis Perci On

    35/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 35

    Si la distribucin es ms aplanada que la curva normal(platicrtica) 2 0g

    1.6 Medidas de concentracin.

    Las medidas de concentracin miden la mayor o menor igualdad en el reparto de una cantidad (por

    ejemplo, la masa salarial total de una empresa, ). Ante este problema eminentemente econmico,

    medidas estadsticas como la media, la varianza, , no son significativas, por lo que es necesario

    construir unos indicadores especficos. Debido a la naturaleza de los fenmenos que aqu se

    consideran, las variables tomarn slo valores positivos (por ste y otros motivos, no deben hacerse

    cambios de origen).

    La caracterstica que se va a estudiar puede presentar las siguientes situaciones lmite:

    Mxima concentracin:Cuando un solo individuo recibe la cantidad total a repartir y el resto

    nada.

    Equidistribucin (mnima concentracin): Todos los individuos reciben la misma cantidad.

    Entre ambas situaciones extremas hay infinidad de situaciones intermedias que trataremos de

    cuantificar con las siguientes medidas de concentracin:

    Curva de concentracin de Lorenz.

    Ilustraremos la construccin de la curva de Lorenzcon un ejemplo.

    EJEMPLO 1.20.

    Estudiar la concentracin de los salarios/hora de 25 trabajadores recogidos en la siguiente tabla

    1i iL L in

  • 5/24/2018 Dis Perci On

    36/256

    36

    Hacemos los siguientes clcul

    1iL iL ix

    Donde in son los trabajadore

    en cada intervalo, acumuland

    (representan el nmero de tra

    intervalo i)

    Por ltimo, ip y iq son los va

    p

    (representan el porcentaje de

    hasta el intervalo i)

    La curva de Lorenz es la rep

    , a los que se aade el punto (

    del punto (0, 0) y termina en

    Apuntes de Tcnicas Cuantitativas 1. Jos

    os

    in i ix n iN iu

    25n= 1

    73000k

    j j

    j

    x n=

    =

    en cada intervalo, i ix n es la suma de los s

    los anteriores valores obtenemos respectiva

    1

    i

    i j

    jN n

    == 1

    i

    i j j

    ju x n

    ==

    bajadores y la suma de los salarios de todos

    lores iN y iu expresados en porcentajes.

    100iiN

    n=

    1

    100ii kj j

    j

    uq

    x n=

    =

    trabajadores y el porcentaje de los salarios

    esentacin grfica de los puntos con coorde

    , 0). Como puede verse en el grfico, la cur

    l punto (100, 100).

    lberto Hermoso Gutirrez.

    ip iq

    larios de los trabajadores

    ente iN y iu .

    los trabajadores hasta el

    e todos los trabajadores

    adas ( ),i ip q , 1,...,i k=

    a de Lorenz siempre parte

  • 5/24/2018 Dis Perci On

    37/256

    Apuntes de Tcnicas Cuantitativa

    Interpretacin de la curva d

    Si hay un reparto equitativo

    corresponde un porcentaje iq

    iguales a los valores iq y la

    cuadrante). Cuanto ms prxi

    la curva de Lorenz de la recta

    curva de Lorenz de dicha lne

    ndice de Gini.

    El ndice de Gini cuantifica la

    los puntos ( ),i ip q , 1, ...i=

    ( ), (100 ,100)k kp q = ].

    Interpretacin del ndice de

    Si hay un reparto equit

    Si hay concentracin

    0 1, ...,iq i k = =

    Luego el ndice de Gini esconcentracin cuanto mayor s

    1. Jos Alberto Hermoso Gutirrez.

    e Lorenz.

    (todos reciben lo mismo), a un porcent

    de la cantidad total repartida igual a ip . E

    curva de Lorenz coindice con la lnea y

    os estemos de esta situacin de reparto equ

    y x= , cuanto mayor sea la concentracin d

    .

    anterior propiedad de la curva de Lorenz ba

    , 1k , a la recta y x= . [No se tienen en

    ( )1 1

    1 11 1

    1 1

    1

    k k

    i i i

    i iG k k

    i i

    i i

    p q q

    I

    p p

    = =

    = =

    = =

    Gini.

    ativo (equidistribucin) 1,i ip q i = =

    xima (todos reciben nada, salvo uno que re

    1 , 100 1k Gq I = =

    un valor entre 0 y 1 que mide la concenea y mayor equidistribucin cuanto menor se

    37

    je ip de trabajadores le

    s decir los valores ip son

    x= (bisectriz del primer

    tativo ms prxima estar

    l reparto ms se alejar la

    sndose en la distancia de

    cuenta los puntos (0,0) y

    ..., 1 0Gk I =

    cibe todo)

    tracin, indicando mayora.

  • 5/24/2018 Dis Perci On

    38/256

    38 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    En el ejemplo anterior el ndice de Gini vale253,5

    1 0,1769308G

    I = = .

    (Obsrvese que a la suma de los ip y iq se ha restado 100 puesto que 100kp = y 100kq = no se

    incluyen en el clculo del ndice de Gini)

    Mediala.

    La mediala o valor medial, Ml, es aquel valor tal que la suma de las observacionesmenores que l

    es igual a la suma de las observaciones mayores que l.

    Se trata pues de una mediana sobre los valores i ix n en lugar de sobre las frecuencias in . Su clculo

    se realiza de forma anloga, buscando el valor de la variable asociado a la mitad de la cantidad total

    repartida, 12

    k

    j j

    j

    x n=

    , o equivalentemente asociado a 50%iq = .

    Segn lo anterior, en variables continuas (valores agrupados en intervalos) la mediala se obtiene de

    ( )1 1

    1 11

    50 50

    %i i

    i i i i

    i i i i

    q ql L a L a

    n x q q

    = + = +

    Donde ( )%i in x representa el porcentaje recibido en el reparto por el intervalo i (intervalo donde se

    encuentra la mediala), 1iL es el extremo inferior del intervalo medial (intervalo donde por primera

    vez 50iq > ) y ia es la amplitud del intervalo donde est la mediala.

    La mediala de los datos del ejemplo anterior es:

    50 23,32500 1000 3311,55

    56, 2 23, 3Ml

    = + =

    De qu forma nos ayuda la mediala a medir la concentracin? Si hay equidistribucin la

    mediana y mediala coinciden, separndose ms cuanto mayor sea la concentracin. Por tanto la

    respuesta es

    Ml Me =

    En el ejemplo anterior12,5 10

    2500 1000 2812,58

    Me

    = + = 499,05M Ml Me = =

  • 5/24/2018 Dis Perci On

    39/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 39

    El valor M , que depende de la unidad de medida de la variable, se suele relativizar en

    comparacin con el rango, /R .

    En nuestro ejemplo, 6500 500 6000 0,0832M

    RR

    = = = , que confirma de nuevo lo que

    ya conocamos por la curva de Lorenz e ndice de Gini de que la concentracin es dbil.

    En el anterior ejemplo hemos visto cmo sobre una variable continua se calculan las medidas de

    concentracin, en el siguiente ejemplo lo veremos sobre una variable discreta.

    EJEMPLO 1.21.

    Dos familias con 4 y 5 hijos respectivamente deciden repartir parte de sus patrimonios entre ellos de

    la siguiente forma.

    Familia A

    Familia B

    Cul de los dos repartos es ms equitativo?

    Solucin:

    De estas tablas pasamos los datos a tablas estadsticas con frecuencias para variables discretas.

    Familia A:

    i in i in iN iu ip iq

    1

    11

    1

    99,9( ) 1 1 0,334

    150

    k

    i

    iG k

    i

    i

    q

    I A

    p

    =

    =

    = = =

    Para obtener la mediala, sencillamente buscamos en la columna de los iq dnde se supera por

    primera vez el valor 50%, 3 356,5 50 ( ) 300000q Ml A x= > = = .

  • 5/24/2018 Dis Perci On

    40/256

    40 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    (Si hay un 1502

    i ii

    x xq Ml +

    += = , anlogamente a como se hace en el clculo de la

    mediana)

    Familia B:i in i in iN iu ip iq

    1

    11

    1

    73,4( ) 1 1 0,266100

    k

    i

    iG k

    i

    i

    q

    I Bp

    =

    =

    = = =

    Para obtener la mediala, sencillamente buscamos en la columna de los iq dnde se supera por

    primera vez el valor 50%, 3 3100 50 ( ) 2000000q Ml B x= > = = .

    Comparando ambos ndices de Gini se observa que es ms equitativo el reparto de la familia B

    ( ) 0,334 ( ) 0, 266G GI A I B= > =

    1.7 Ejercicios resueltos.

    1. La compaa de telefona mvil Noteoigo est considerando cambiar sus tarifas. Para ello ha

    observado la duracin en segundos de 1000 llamadas realizadas por sus abonados:

    Duracin de las llamadas Nmero de llamadas0-20

    20-6060-9090-180

    180-300

    15180195405205

    Obtenga:

    a) Duracin media de las llamadas.

    b) Coste medio de las llamadas segn las siguientes tarifas:

    b.1) 10 cntimos el establecimiento de llamada, ms 6 cntimos por minuto

    (proporcionalmente las fracciones de minuto).

  • 5/24/2018 Dis Perci On

    41/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 41

    b.2) 8 cntimos por minuto (proporcionalmente las fracciones de minuto), sin coste

    de establecimiento de llamada.

    c) Porcentaje de llamadas que superan los 2 minutos de duracin.

    Solucin:

    1iL iL i ix n 0 20 10 15 150 15 1,5

    20 60 40 180 7200 195 19,560 90 75 195 14625 390 3990 180 135 405 54675 795 79,5

    180 300 240 205 49200 1000 1001000 125850

    a)1

    1 125850125,85

    1000i

    k

    i

    i

    x n segundosn =

    = = =

    b) Utilizaremos como afecta a la media un cambio de origen y/o escala:

    Y eX c y ex c= + = +

    X=duracin de las llamadas en segundos. Y=duracin de las llamadas en minutos.

    1Z = coste de la llamada segn la opcin b.1 2Z = coste de la llamada segn la opcin b.2

    1 1 125,852,0975

    60 60 60Y X y x= = = =

    b.1) ( ) ( )1 110 6 10 6 10 6 2,0975 22,585Z Y z y= + = + = + = cntimos.

    b.2) 2 28 8 8 2,0975 16,78Z Y z y= = = = cntimos.

    c) Calculamos, interpolando, el porcentaje de llamadas que duran menos de 120 segundos, y se lo

    restamos a 100%.

    90 39120 x180 79,5

    180 90 120 9052,5% 100 52,5 47,5%

    79,5 39 39x

    x

    = = =

    El 47,5% de las llamadas superan los dos minutos.

    2. Se dispone de la siguiente informacin sobre los salarios anuales brutos de los empleados de una

    empresa (en miles de euros):

    Salarios 0-20 20-60 60-70 70-90n empleados 10 45 30 15

    a) Obtenga el coeficiente de variacin de los salarios.

    b) Qu salario es superado por el 60% de los empleados?

    c) Qu tanto por ciento de empleados tienen un salario superior a 63000 euros?

    ix in iN ip

  • 5/24/2018 Dis Perci On

    42/256

    42 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    0-2020-6060-70

    70-90

    104065

    80

    104530

    15

    10018001950

    1200

    100072000

    126750

    96000

    105585

    100

    105585

    100n=100 5050 295750

    a)1

    1 15050 50, 5

    100

    n

    i i

    i

    x x nn =

    = = =22 2 2

    1

    1 29575050,5 407, 25 407,25 20,18

    100

    n

    i i

    i

    S x n x S n =

    = = = = =20,18

    0,399650,5

    SCV

    x= = =

    b)

    20x

    60

    104055

    60 20 20 1200

    20 46,655 10 40 10 4546666 40%

    46666 60%

    x

    x x

    euros no son superados por el de los empleados

    euros son superados por el de los empleados

    = + = =

    c)

    606370

    55x

    85

    70 60 63 60 3 3055 64

    85 55 55 1064% 63000

    100 36% 63000

    x xx

    de los empleados tienen salario inferior a euros

    de los empleados tienen salario superior a euros

    = = =

    =

    3. Se tienen datos sobre los beneficios en millones de euros (ya deflactados) obtenidos por las

    empresas de tres sectores productivos en los aos 2008 y 2012:

    2008 2012

    SectorBeneficio medio

    (millones de euros)Nmero de

    empresasBeneficio medio

    (millones de euros)Nmero de

    empresasABC

    406550

    80012001000

    356035

    7351165900

    Calcule para los tres sectores en conjunto:

    a) El beneficio medio en 2008 y 2012.b) La disminucin media anual (en %) de los beneficios en el periodo 2008-2012.

    Solucin:

    a) ( ) ( ) ( )( )1

    2008

    1 1 16000040 800 65 1200 50 1000 53,33

    3000 3000

    s

    i

    i

    ix x nn =

    = = + + = =

    ( ) ( ) ( )( )1

    2012

    1 1 12712535 735 60 1165 35 900 45, 4

    2800 2800

    s

    i

    i

    ix x nn =

    = = + + = =

    iL

    ip

    iL ip

    1i iL L i in i in2i ix n i ip

  • 5/24/2018 Dis Perci On

    43/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 43

    b) 445,4

    1 0,96 0,04 ( 4%)53,33

    r r+ = = = . Se ha producido una disminucin

    media anual del 4% en los beneficios del sector.

    4. El salario medio, la desviacin tpica de los salarios y el nmero de empleados en tres empresasfiliales de G.E.C.O.S.A. son

    Salario medio Desviacin tpica Nmero de empleadosABC

    136513001560

    105100120

    100300170

    Se decide subir el salario un 5% en la filial A, un 6% en la filial B y 50 euros a los empleados de la

    filial C.

    a) En cul de las tres filiales son ms homogneos los salarios antes de la subida?

    b) En cul de las tres filiales son ms homogneos los salarios tras la subida?

    Solucin:

    a) Antes de la subida la homogeneidad de los salarios es la misma en las tres filiales

    105 100 1200,0769

    1365 1300 1560A B CCV CV CV = = = = = =

    b) Despus de la subida la homogeneidad no cambia en las filiales A y B pues el coeficiente de

    variacin es invariante frente a cambios de escala.

    Y X

    y x x

    y ex xY eX CV CV

    S eS S = = = = =

    Sin embargo, si cambia en la filial C al cambiar la media aunque no la desviacin tpica.

    Si llamamos X al salario antes de la subida e Y al salario despus de la subida:

    Filial A Y=X+0,05X=1,05X

    Filial B Y=X+0,06X=1,06X

    Filial C Y=X+50

    120 1200,0769 0,07451560 50 1610A B C

    CV CV CV = = = = =+

    Por tanto, despus de la subida la filial C es la de salarios ms homogneos (aunque C tiene

    la mayor desviacin tpica, recuerde que para comparar la dispersin de dos variables

    estadsticas se ha de usar una medida de dispersin relativa)

    5. Sea una distribucin de frecuencias con media 300, varianza 36 y n=5000. Cuntas observaciones

    contiene el conjunto ( ,288] [312, ) ?

  • 5/24/2018 Dis Perci On

    44/256

    44 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    La desigualdad de Tchebycheff afirma que la proporcin de datos en el intervalo ( ),kS x kS + es

    mayor o igual que2

    11

    k (k>1).

    ( ) 21, 1ip x x kS x kSk

    +

    En nuestro caso: 288=300-12= 2x S 312=300+12= 2x S+

    Por tanto, la proporcin de observaciones en el intervalo (288, 312) es mayor o igual que

    2 2

    1 1 31 1 0,75

    2 4k = = = , de modo que en el conjunto ( ,288] [312, ) habr menos de un

    25% de las observaciones, es decir, menos de 1250 observaciones25

    5000 1250

    100

    =

    .

    6. En un fenmeno se han observado 2000 individuos con media 1000 y varianza 100. Cuntas

    observaciones, como mnimo, son mayores que 970 y menores que 1030?

    Solucin:

    De nuevo, de acuerdo a la desigualdad de Tchebycheff :

    970=1000-30= 3S , 1030=1000+30= 3S+ , en el intervalo ( )3 , 3S x S + hay una

    proporcin de observaciones mayor o igual que2

    1 81 0,88893 9

    = = . El 88,89% de las 2000

    observaciones son 1777,8 , luego como mnimo hay 1778 observaciones entre 970 y 1030.

    7. Para asignar los puestos de trabajo en una cadena de montaje se realiza un test a los 90 empleados;

    12 de ellos realizarn un trabajo tipo A (los que obtengan mejor puntuacin), otros tantos un

    trabajo tipo C (los que saquen puntuacin ms baja), y el resto realizarn labores tipo B. El

    resultado del test fue:Puntuacin 0-30 30-50 50-70 70-100 100-120 120-150

    in 10 15 20 20 20 5

    Cul fue la puntuacin en el test para los que desempearn un trabajo tipo B?

  • 5/24/2018 Dis Perci On

    45/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 45

    Solucin:

    1iL iL in iN

    0 30 10 10

    30 50 15 25

    50 70 20 45

    70 100 20 65

    100 120 20 85

    120 150 5 90Si los 12 mejores harn el trabajo A, los 78=90-12 restantes con la puntuacin ms baja no lo harn.

    Buscamos 78 en la columna de frecuencias acumuladas, como no aparece interpolaremos entre los

    siguientes valores

    100 65x 78

    120 85

    120 100 100113

    85 65 78 65

    xx

    = =

    Los que obtengan ms de 113 harn el trabajo A.

    Los 12 con puntuacin ms baja harn el trabajo C. Buscamos 12 en la columna de frecuencias

    acumuladas e interpolamos entre los valores ms prximos

    30 10x 12

    50 25

    50 30 3032,67

    25 10 12 10

    xx

    = =

    Los que obtengan menos de 32,67 puntos harn el trabajo C.

    Por tanto harn el trabajo B los que obtengan una puntuacin entre 32,67 y 113 puntos.

    8. En la siguiente tabla se recogen los salarios anuales, en miles de euros, de los empleados de dos

    empresas del mismo sector

    Nmero de empleadossalarios Empresa A Empresa B

    5-1515-2525-3535-4545-55

    215284510

    55

    105030

    a) Qu empresa constituye un grupo ms homogneo de empleados en cuanto a salarios se

    refiere?

    b) Qu empresa presenta mayor concentracin en sus salarios?

    c) Qu porcentaje de la masa salarial de la empresa A perciben los trabajadores cuyo salario

    anual est comprendido entre 22500 y 30000 euros?

    d) Qu salario anual percibe un empleado de la empresa B que se encuentra dentro del 25% de

    los mejor pagados en dicha empresa?

  • 5/24/2018 Dis Perci On

    46/256

    46 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    Empresa A

    1iL iL i in i ix n2i in iN iu ip iq

    5 15 10 2 20 200 2 20 2 0,58

    15 25 20 15 300 6000 17 320 17 9,25

    25 35 30 28 840 25200 45 1160 45 33,53

    35 45 40 45 1800 72000 90 2960 90 85,55

    45 55 50 10 500 25000 100 3460 100 100,00

    100 3460 128400 254 228,90

    1

    1 346034,6

    100

    k

    i i

    i

    x x nn =

    = = = 22 2 2

    1

    1 12840034,6 86,84 86,84 9,3188 ( ) 0,2693

    100

    k

    i i

    i

    SS x n x S CV A

    n x=

    = = = = = = =

    ( )

    1 1

    1 11 1

    1 1

    118,90( ) 1 1 0,163

    154

    k k

    i i i

    i iG k k

    i i

    i i

    p q qI A

    p p

    = =

    = =

    = = = =

    Empresa B

    1iL iL i in i ix n2i ix n iN iu ip iq

    5 15 10 5 50 500 5 50 5 1,27

    15 25 20 5 100 2000 10 150 10 3,80

    25 35 30 10 300 9000 20 450 20 11,39

    35 45 40 50 2000 80000 70 2450 70 62,0345 55 50 30 1500 75000 100 3950 100 100,00

    100 3950 166500 205 178,48

    1

    1 395039,5

    100

    k

    i i

    i

    x x nn =

    = = = 22 2 2

    1

    1 16650039,5 104,75 104,75 10, 2347 ( ) 0, 2591

    100

    k

    i i

    i

    SS x n x S CV B

    n x=

    = = = = = = =

    ( )1 1

    1 11 1

    1 1

    78,48( ) 1 1 0, 2526105

    k k

    i i i

    i iG k k

    i i

    i i

    p q q

    I Bp p

    = =

    = =

    = = = =

    a) Para ver donde son ms homogneos los salarios estudiamos la variabilidad o dispersin de

    esta variable. Para poder comparar la dispersin necesitamos una medida de dispersin

    relativa como el coeficiente de variacin. Se observa una dispersin similar en ambas

    empresas, si bien algo mayor en la empresa A

    ( ) 0,2693 ( ) 0,2591CV A CV B= > =

  • 5/24/2018 Dis Perci On

    47/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 47

    Observe que si nos hubiramos apoyado en los valores de las varianzas o de las desviaciones

    tpicas la conclusin hubiese sido la opuesta.

    b) El ndice de Gini en la empresa A es menor que en la empresa B, luego hay menos

    concentracin en los salarios de la empresa A.

    ( ) 0,163 ( ) 0,2526G GI A I B= < =

    c) Buscamos en la tabla de la empresa A el tanto por ciento de masa salarial acumulada

    asociada a los valores 22,5 y 30. Como ninguno aparece en la tabla interpolaremos entre los

    valores ms prximos:

    15 0,5822,5 x25 9,25

    25 15 22,5 157,08

    9,25 0,58 0,58x

    x

    = =

    25 9,2530 x35 33,53

    35 25 30 25 21,3933,53 9,25 9,25

    xx

    = =

    Los trabajadores con un salario inferior a 30000 euros reciben el 21,39% de la masa salarial.

    Los que su salario es inferior a 22500 euros reciben el 7,08% de la masa salarial. Por tanto

    los que su salario est comprendido entre 22500 y 30000 euros recibirn el 14,31% de la

    masa salarial (21,39-7,08=14,31).

    d) El salario que es superado por el 25% de los empleados de la empresa B mejor pagados es el

    mismo salario que no es alcanzado por el 75% restante. Buscamos en la columna de los ipel valor 75, como no aparece, interpolamos entre los valores ms prximos

    45 70x 75

    55 100

    55 45 4546,667 46667

    100 70 75 70

    xx euros

    = =

    9. El sueldo mensual, en euros, correspondiente a los empleados de dos factoras de una misma

    empresa es

    Sueldomensual

    Nmero de empleados.Factora A

    Nmero de empleados.Factora B

    600-10001000-14001400-20002000-3000

    20403010

    16203232

    a) Qu sueldo corresponde al 60% de los empleados de la empresa?

    b) Calcule el sueldo del 25% de los empleados de la factora B con menor salario.

    c) Qu sueldo puede ser considerado moda de la factora A?

    d) Halle el sueldo medio: de la factora A, de la factora B y de la empresa.

    e) En cul de las dos factoras los sueldos son ms homogneos?

  • 5/24/2018 Dis Perci On

    48/256

    48 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    f) En cul de las dos factoras los sueldos tienen una concentracin mayor?

    g) Calcule la mediana y la mediala para todos los empleados de la empresa.

    h) Qu porcentaje de empleados de la empresa tienen un sueldo superior a 2300 euros?

    i) Qu sueldo corresponde al 30% de los empleados de la empresa con mayor sueldo?

    j) Calcule el porcentaje de empleados de la empresa, con menor sueldo, que reciben el 43% dela nmina.

    k) Cuntos empleados de la empresa, con mayor sueldo, reciben el 25% de la nmina?

    Solucin:

    Sumando el nmero de empleados en las dos factoras de la empresa obtenemos la distribucin de

    frecuencias para todos los empleados de la empresa.

    Sueldomensual

    Nmero de empleados.Factora A

    Nmero de empleados.Factora B

    Nmero de empleados.EMPRESA

    600-10001000-14001400-20002000-3000

    20403010

    16203232

    36606242

    En primer lugar realizamos en las siguientes tablas los clculos necesarios para responder a todos

    los apartados:

    Factora A

    1iL iL ix in i in2i in ia ih iN iu ip iq

    600 1000 800 20 16000 12800000 400 0,05 20 16000 20 11,43

    1000 1400 1200 40 48000 57600000 400 0,1 60 64000 60 45,711400 2000 1700 30 51000 86700000 600 0,05 90 115000 90 82,14

    2000 3000 2500 10 25000 62500000 1000 0,01 100 140000 100 100,00

    100 140000 219600000 270 239,29

    Factora B

    1iL iL ix in i in2i i

    x n iN iu ip iq

    600 1000 800 16 12800 10240000 16 12800 16 7,48

    1000 1400 1200 20 24000 28800000 36 36800 36 21,50

    1400 2000 1700 32 54400 92480000 68 91200 68 53,272000 3000 2500 32 80000 200000000 100 171200 100 100,00

    100 171200 331520000 220 182,24

    Empresa

    1iL iL ix in i in2i ix n iN iu ip iq

    600 1000 800 36 28800 23040000 36 28800 18 9,25

    1000 1400 1200 60 72000 86400000 96 100800 48 32,39

    1400 2000 1700 62 105400 179180000 158 206200 79 66,26

    2000 3000 2500 42 105000 262500000 200 311200 100 100,00

    200 311200 551120000 245 207,90

  • 5/24/2018 Dis Perci On

    49/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 49

    a) Esta pregunta puede tener diferentes interpretaciones: el 60% de los empleados de la

    empresa con mayores sueldos, el 60% con menores sueldos, el 60% de los sueldos

    intermedios o centrales,

    Para su resolucin aqu supondremos el 60% de los empleados con menores sueldos.

    60 no aparece en la columna de los ip de la tabla Empresa, por lo que interpolaremos

    entre los valores ms prximos a 60 en la tabla.

    1400 48x 60

    2000 79

    2000 1400 14001632,26

    79 48 60 48

    xeuros

    = =

    El 60% de los empleados con menores sueldos tienen un salario inferior a 1632,26 .

    b) 25 no aparece en la columna de los ip de la tabla Factora B, por lo que interpolaremos

    entre los valores ms prximos a 25 en la tabla.

    1000 16x 25

    1400 36

    1400 1000 1000 118036 16 25 16

    xeuros

    = =

    El 25% de los empleados de la factora B con menores salarios tienen un salario por debajo

    de 1180 .

    c) La moda es el valor ms frecuente de la variable. En variables continuas se sita en el

    intervalo de mayor altura (que no siempre coincide con el de mayor frecuencia, aunque s en

    este caso). Calculamos las alturas dividiendo la frecuencia absoluta, in , entre la amplitud

    del intervalo, ia . Dentro del intervalo de mayor altura ( )0,1 , 1000-1400ih = hay

    diferentes criterios para situar la moda, el ms sencillo es el del punto medio del intervalo.

    Segn dicho criterio, 1200 euros puede considerarse la moda en la factora A.

    d)140000 171200 311200

    ( ) 1400 ( ) 1712 ( ) 1556100 100 200

    x A x B x empresa= = = = = =

    e)22 2 2

    1

    1 219600000( ) 1400 236000 ( ) 236000 485,8

    100

    k

    i i

    i

    S A x n x S An =

    = = = = =

    ( )( ) 0,347

    ( )

    S ACV A

    x A= =

    22 2 2

    1

    1 331520000( ) 1712 384256 ( ) 384256 619,88

    100

    k

    i i

    i

    S B x n x S Bn =

    = = = = =

    ( )( ) 0,362

    ( )

    S BCV B

    x B= =

    Hay menos dispersin, por tanto son ms homogneos los sueldos, en la factora A, aunque

    como puede observarse las diferencias no son importantes.

  • 5/24/2018 Dis Perci On

    50/256

    50 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    f)

    1

    11

    1

    139,29( ) 1 1 0,181

    170

    k

    i

    iG k

    i

    i

    q

    I A

    p

    =

    =

    = = =

    1

    11

    1

    82,24( ) 1 1 0,315

    120

    k

    i

    iG k

    i

    i

    q

    I B

    p

    =

    =

    = = =

    Hay una mayor concentracin en el reparto de los sueldos en la factora B.

    g)1

    1

    100 962 1400 600 1438,7162

    i

    i i

    i

    nN

    Me L an

    = + = + =

    11

    1

    50 50 32,391400 600 1711,96

    66,26 32,39i

    i i

    i i

    qMl L a

    q q

    = + = + =

    h) En la tabla Empresa buscamos el valor 2300. ste no est, interpolamos entre los valores

    ms prximos a 2300:

    2000 792300 x3000 100

    3000 2000 2300 2000 85,3% 100 85,3 14,7%100 79 79

    x = = =

    Luego el 14,7% de empleados en la empresa tienen un sueldo superior a 2300 .

    i) El mismo sueldo que es superado slo por el 30% de los empleados de la empresa con

    mayor sueldo no es alcanzado por el 70% restante. Buscamos en la tabla Empresa el

    valor 70 en la columna ip e interpolamos entre los valores ms prximos:

    1400 48x 70

    2000 79

    2000 1400 14001825,8

    79 48 70 48

    xx euros

    = =

    El 30% de los empleados de la empresa con mayor sueldo tienen un sueldo superior a

    1825,8 .

    j) Buscamos en la columna iq de la tabla Empresa el valor 43 e interpolamos:

    48 32,39x 43

    79 66,26

    79 48 4857,71%

    66,26 32,39 43 32,39

    xx

    = =

    k) Buscamos en la tabla Empresa el porcentaje de empleados, con menor sueldo, que

    reciben el 75% de la nmina79 66,26x 75

    100 100

    100 79 7984,44% 100 84,44 15,56%

    100 66,26 75 66, 26

    xx

    = = =

    Por tanto, el 15,56% restante de empleados recibirn el 25% restante de la nmina. El

    15,56% de los 200 empleados de la empresa son 31,12 31 empleados.

    10. Se conoce el salario medio, la desviacin tpica de los salarios y el nmero de empleados de dos

    empresas filiales:

  • 5/24/2018 Dis Perci On

    51/256

    Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez. 51

    Filial Sueldo medio () Desviacin tpica () Nmero de empleadosA 853,4 60 25B 795 52 35

    Se decide subir el sueldo un 5% a los empleados de la filial A y subir 138 euros a cada uno de los

    de la filial B. Justifique en cul de las dos filiales los sueldos sern ms heterogneos despus de la

    subida.Solucin:

    Llamemos X=sueldo antes de la subida e Y=sueldo tras la subida.

    En la filial A la relacin entre X e Y es un sencillo cambio de escala:

    Y=X+0,05X=1,05X

    En la filial B la relacin entre X e Y es un cambio de origen

    Y=X+138

    En la filial A la media y desviacin tpica para la nueva variable Y son:( ) 1,05 ( ) 1,05 853,4 897,12y A x A= = =

    ( ) 1,05 ( ) 1,05 60 63y xS A S A= = =

    En la filial B la media y desviacin tpica para la nueva variable Y son:

    ( ) ( ) 138 795 138 933y B x B= + = + =

    La desviacin tpica de X e Y es la misma en la filial B puesto que los cambios de origen no afectan

    a su valor.

    Para comparar la variabilidad de los sueldos despus de la subida utilizamos el coeficiente de

    variacin

    630,0702

    897,12ACV = =

    520,0557

    933BCV = =

    Luego, despus de la subida, son ms heterogneos los sueldo en la filial A.

    11. En una empresa de embalaje se conoce el nmero de cajas que hacen los 75 empleados de esa

    seccin al final de una semana:Nmero de cajas 350-400 400-450 450-500 500-550% de empleados 26,67 22,67 36 14,66

    a) Calcule la varianza.

    b) Calcule el nmero de cajas que con ms frecuencia hace un empleado.

    c) Para incentivar la productividad se decide aumentar el salario 70 euros a la tercera parte de

    los empleados que ms cajas hace. Cul ha de ser el nmero mnimo de cajas que debe

    hacer un empleado para que le suban el sueldo?

  • 5/24/2018 Dis Perci On

    52/256

    52 Apuntes de Tcnicas Cuantitativas 1. Jos Alberto Hermoso Gutirrez.

    Solucin:

    1iL iL ix if i if2i ix f ia ih iF ip

    350 400 375 0,2667 100,0125 37504,6875 50 0,005334 0,2667 26,67

    400 450 425 0,2267 96,3475 40947,6875 50 0,004534 0,4934 49,34

    450 500 475 0,36 171 81225 50 0,0072 0,8534 85,34

    500 550 525 0,1466 76,965 40406,625 50 0,002932 1 1001 444,325 200084 261,35

    a) En este ejemplo nos dan la distribucin de frecuencias en tantos por ciento. Estos tantos por

    ciento son las frecuencias relativas multiplicadas por 100.

    1 1

    1444,325

    k k

    i i i i

    i i

    x x n x fn = =

    = = = 2 22 2 2 2

    1 1

    1 1200084 444,325 2659,29

    k k

    i i i i

    i i

    S x n x x f xn n= =

    = = = =

    b) Al ser todos los intervalos de igual amplitud, el intervalo de mayor altura coincide con el de

    mayor frecuencia relativa (y absoluta), 450-500. Segn los distintos criterios de obtencin

    de la moda obtenemos:

    1 450 500( ) 4752 2

    i iL LMo I + +

    = = =

    11

    1 1

    0,002932( ) 450 50 469,64

    0,004534 0,002932i

    i i

    i i

    hMo II L a

    h h

    +

    +

    = + = + =+ +

    ( ) ( ) ( ) ( )1

    11 1

    0,0072 0,004534( ) 450 50 469, 220, 0072 0, 004534 0, 0072 0, 002932

    i ii i

    i i i i

    h hMo III L a