Analisis de Correlación (Uso de Excel)

download Analisis de Correlación (Uso de Excel)

of 8

Transcript of Analisis de Correlación (Uso de Excel)

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    1/19

    ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL

    Cuando se estudian en forma conjunta dos características (variables estadísticas) deuna población o muestra, se dice que estamos analizando una variable estadística

    bidimensional. La correlación es el grado de relación que existe entre ambas

    características, la regresión es la forma de expresar matem!ticamente dic"a relación.

    #ado dos variables, la correlación permite "acer estimaciones del valor de una de ellasconociendo el valor de la otra variable.

    1) Diagrama de dispersión

    Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos

    correspondientes a los pares ordenados ($, %) de los valores de las variables.

    2) Clasii!a!ión de la !"rrela!ión

    2#1) Seg$n la rela!ión en%re &aria'les

    - C"rrela!ión lineal( &e representa mediante una línea recta.- C"rrela!ión n" lineal( &e representa con una línea curva.

    2#2) Seg$n el n$mer" de &aria'les

    - C"rrela!ión simple( La variable dependiente act'a sobre la variable independiente.- C"rrela!ión m$l%iple( Cuando la variable dependiente act'a sobre varias variables

    independientes.- C"rrela!ión par!ial( Cuando la relación que existe entre una variable dependiente

    una independiente es de tal forma que los dem!s factores permanezcan constantes.

    2#) Seg$n el &al"r !*an%i%a%i&"

    - C"rrela!ión pere!%a( l valor del coeficiente de correlación es  - C"rrela!ión impere!%a( l coeficiente de correlación es menor a sea en sentido

    positivo o negativo#- C"rrela!ión n*la( l coeficiente de correlación es *. +o existe correlación entre las

    variables. 

    2#+) Seg$n el sign"

    - C"rrela!ión p"si%i&a#, #os variables tiene correlación positiva cuando al aumentar odisminuir el valor de una de ellas entonces el valor correspondiente a la otra

    aumentar! o disminuir! respectivamente, es decir, cuando las dos variables aumentanen el mismo sentido. jemplo La cantidad de carbo"idratos que consume peso de

    una persona.

    - C"rrela!ión nega%i&a#, #os variables tiene correlación negativa cuando al aumentar odisminuir el valor de una de ellas entonces el valor de la otra disminuir! o aumentar!

    respectivamente, es decir, una variable aumenta otra disminue o viceversa.

    jemplo +'mero de ítems incorrectos el rendimiento en la evaluación.

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    2/19

     

    ) C"ei!ien%es de !"rrela!ión

    Los coeficientes de correlación son medidas que indican la situación relativa de los

    mismos sucesos respecto a las dos variables, es decir, son la expresión num-rica quenos indica el grado de relación existente entre las variables en qu- medida se

    relacionan. &on n'meros que varían entre los límites / 0. &u magnitud indica elgrado de asociación entre las variables1 el valor r 2 * indica que no existe relación entre

    las variables1 los valores 3 son indicadores de una correlación perfecta positiva (alcrecer o decrecer $, crece o decrece %) o negativa (4l crecer o decrecer $, decrece o

    crece %).

    +o existe correlación

    Correlación 5ositiva

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    3/19

     

    Correlación +egativa

     

    5ara interpretar el coeficiente de correlación utilizamos la siguiente escala

    -al"r Signii!ad"

    0 Correlación negativa grande

    perfecta

    0*,6 a 0*,66 Correlación negativa mu alta

    0*,7 a 0*,86 Correlación negativa alta

    0*,9 a 0*,:6 Correlación negativa moderada

    0*, a 0*,;6 Correlación negativa baja

    0*,* a

    0*,6

    Correlación negativa mu baja

    * Correlación nula

    *,* a *,6 Correlación positiva mu baja

    *, a *,;6 Correlación positiva baja

    *,9 a *,:6 Correlación positiva moderada

    *,7 a *,86 Correlación positiva alta

    *,6 a *,66 Correlación positiva mu alta

    Correlación positiva grande perfecta

     

    #1) COE.ICIEN/E DE CORRELACIÓN DE PEARSON

    Llamando tambi-n coeficiente de correlación producto0momento.

    a) Para da%"s n" agr*pad"s se !al!*la apli!and" la sig*ien%e e!*a!ión(

    n donde r 2 Coeficiente producto0momento de correlación lineal

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    4/19

     

    E0empl" il*s%ra%i&"(

    Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de correlación que existe entre ellas mediante el coeficiente de 5earson.

    $ 8 7 < : 9 6 < : 9 : 8 =$ 28*

    % ; < 9 ; 6 * 8 ; ; * 8 =%2 ;8

    S"l*!ión(

    &e calcula la media aritm-tica

    5ara $

    5ara %

    &e llena la siguiente tabla

    8 ; ; ,< 6 9,< ,<7 < ;,< 9 7 ,<

    < 9 * ,< * * :,<

    : ; ,< ,< ,<

    9 6 0 0,< ,< :,<

    * 0; 0,< 6 9,< ,<

    6 8 0: 0;,< ;: ,<

    < ; * ,< * * ,<

    : *,< *,< *,<

    9 ; 0 ,< 0,< ,<

    : * 0,< 0,< ,<

    8 8 ; 0;,< 6 0*,< ,<

    1 1 32 2 4

    &e aplica la fórmula

    n consecuencia, existe una correlación moderada.

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    5/19

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    6/19

     

    El diagrama de dispersión en Excel se realiza de la siguiente manera:

    a) &eleccionar los datos en men' Inser%ar6Diagrama de dispersión  e insertar 

    diagrama de dispersión.

    b) n diagrama dispersión, escoger el primero.

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    7/19

     

    5ara que ver las coordenadas escoger el dise>o +? 7.

    @orrar &erie , las líneas "orizontales verticales ("aciendo clic suprimir en cada

    objeto).

    n título del gr!fico escribir #iagrama de dispersión.

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    8/19

     Clic en el eje x, luego clic derec"o para dar formato al eje.

    5oner en la casilla unidad maor para ver los n'meros de en en el eje x.

    c) Clic en Cerrar para culminar la elaboración del diagrama de dispersión, aunque se lepuede seguir "aciendo m!s mejoras.

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    9/19

    ') Para da%"s agr*pad"s9 el !"ei!ien%e de C"rrela!ión de Pears"n se !al!*laapli!and" la sig*ien%e órm*la(

    #onde

    2 n'mero de datos.

    2 frecuencia de celda.

    2 frecuencia de la variable $. 2 frecuencia de la variable %.

    2 valores codificados o cambiados para los intervalos de la variable $, procurando

    que al intervalo central le corresponda 2 *, para que se "agan m!s f!ciles los

    c!lculos.

    2 valores codificados o cambiados para los intervalos de la variable $, procurandoque al intervalo central le corresponda 2 *, para que se "agan m!s f!ciles losc!lculos.

    E0empl" il*s%ra%i&"(

    Con los siguientes datos sobre los Coeficientes Antelectuales ($) de las calificacionesen una prueba de conocimiento (%) de

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    10/19

    8; ;7 6 ;

    ; 8; ;8 6; ;;

    9 8; ; ;6 6; ;<

    < 89 < 9* 6; 9

    : 89 9 69 9*

    7 89 < 9 6: ;<

    8 8< ; 9; 67 ;:

    6 8< ;< 99 68 9*

    * 8: : 9< 66 ;;

    8: ;* 9: **

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    11/19

    Califcaciones (Y )

     

    n la variable %

    Calculando el Dango se obtiene

    Calculando el n'mero de intervalos se obtiene

    Calculando el anc"o se obtiene

    N"%a( 5ara la variable $ se tomar! un anc"o de intervalo igual a < para la variable %un anc"o de intervalo igual a 8 para obtener un n'mero de intervalos igual a : para cadavariable.

    Contando las frecuencias de celda para cada par de intervalos de las variables $ % se

    obtiene la siguiente tabla de frecuencias de dos variables

    Coeficientes Antelectuales ($)

    7:08* 808< 8:06* 606< 6:0** *0*<

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    12/19

     

    N"%a(

    Los n'meros de las esquinas de cada celda en la anterior tabla representan el producto

    fEdxEd, así por ejemplo, para obtener el n'mero el n'mero 08 de los intervalos 7:08* en$ 9;0

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    13/19

     

    xiste una correlación positiva moderada 

    N"%a( videntemente, resulta m!s f!cil "acer los an!lisis pertinentes a trav-s de tablasno agrupadas

     #2) COE.ICIEN/E DE CORRELACIÓN POR RAN;OS DE SPEARMAN

    ste coeficiente se emplea cuando una o ambas escalas de medidas de las variables

    son ordinales, es decir, cuando una o ambas escalas de medida son posiciones.

    jemplo Grden de llegada en una carrera peso de los atletas.

    &e calcula aplicando la siguiente ecuación

    ( )

    2

    2

    61

    1 s

    d r 

    n n= −

    r s 2 Coeficiente de correlación por rangos de &pearman 

    d 2 #iferencia entre los rangos ($ menos %) HDango posiciónI

    n 2 +'mero de datos

    N"%a( Los datos "a que traducirlos u ordenarlos, de maor a menor, en rangos. 4 lospuntajes m!s elevados le asignamos el rango al siguiente el rango así

    sucesivamente. &i se repiten dos puntajes o m!s se calculan las medias aritm-ticas.

    E0empl" il*s%ra%i&" N< 1( La siguiente tabla muestra el rango u orden obtenido en la

    primera evaluación ($) el rango o puesto obtenido en la segunda evaluación (%) de 8estudiantes universitarios en la asignatura de stadística. Dealizar el diagrama dedispersión calcular el coeficiente de correlación por rangos de &pearman.

    studiante  

    #iana ;

    lizabet" 9

    Jario ;

    Grlando 9 <

    Jatías < :

    Kosu- :

     4nita 7 8

    Lucía 8 7

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    14/19

    N"%a Gbservar que la tabla a describe los rangos correspondientes a cada variable.

    S"l*!ión(

    l diagrama de dispersión "ec"o en xcel se muestra en la siguiente figura

    5ara calcular el coeficiente de correlación por rangos de &pearman de se llena la

    siguiente tabla

    studiante 

    #iana ; 0 9

    lizabet" 9 0 9

    Jario ; 9

    Grlando 9 < 0

    Jatías < : 0

    Kosu- : 9 :

     4nita 7 8 0

    Lucía 8 7

    &e aplica la fórmula

    5or lo tanto existe una correlación positiva moderada entre la primera segundaevaluación de los 8 estudiantes.

    n xcel se calcula de la siguiente manera

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    15/19

    a) &e inserta la función COE.#DE#CORREL  pulsar en A!ep%ar .

    b) n el cuadro de argumentos de la función, en el recuadro de la Ma%ri8 1 seleccionar lasceldas de $, en el recuadro de la Ma%ri8 2 seleccionar las celdas de %.

    c) 5ulsar en 4ceptar.

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    16/19

     

    E0empl" il*s%ra%i&" N< 2

    La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las

    asignaturas de Jatem!tica stadística. Calcular el coeficiente de correlación por rangos de &pearman realizar el diagrama de dispersión.  

    +? studiante Jatem!tica stadística

    #iana * 8

    lizabet" 6 :

    ; Jario 8 *

    9 Grlando 7 6< Jatías 7 8

    : Kosu- : 7

    7 4nita : :

    8 Lucía 9 6

    N"%a( La tabla, a diferencia del ejemplo anterior, brinda puntuaciones directas para cadaestudiante.

    S"l*!ión(

    5ara calcular el coeficiente de correlación por rangos de &pearman se procede a

    clasificar u ordenar los datos en rangos ($ para Jatem!tica % para stadística)tomando en cuenta las siguientes observaciones

    n la asignatura de Jatem!tica se observa

    #iana tiene la m!s alta calificación, ocupando el primer puesto, por lo que su rango es

    lizabet" ocupa el segundo puesto, por lo que su rango es Jario se encuentra ubicado en el tercer lugar, por lo que su rango es ; Grlando Jatías ocupan el cuarto quinto puesto, por lo que su rango es la media

    aritm-tica de 9 < que da por resultado 9,

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    17/19

    Kosu- 4nita  ocupan el sexto s-ptimo lugar, por lo que su rango es la mediaaritm-tica de : 7 que da por resultado :,<

    Lucía se encuentra ubicada en el octavo lugar, por lo que su rango es 8

    n la asignatura de stadística se observa

    Jario tiene la m!s alta calificación, ocupando el primer puesto, por lo que su rangoes

    Grlando Lucía ocupan el segundo tercer puesto, por lo que su rango es la mediaaritm-tica de ; que da por resultado ,<

    #iana Jatías ocupan el cuarto quinto puesto, por lo que su rango es la media

    aritm-tica de 9 < que da por resultado 9,< Kosu- se encuentra ubicado en el sexto lugar, por lo que su rango es : lizabet" 4nita ocupan el s-ptimo octavo lugar, por lo que su rango es la media

    aritm-tica de 7 8 que da por resultado 7,<

    Los rangos $ % se presentan en la siguiente tabla 

    +? studiante Jatem!tica stadística $ %

    #iana * 8 9,<

    lizabet" 6 : 7,<

    ; Jario 8 * ;

    9 Grlando 7 6 9,< ,<

    < Jatías 7 8 9,< 9,<

    : Kosu- : 7 :,< :

    7 4nita : : :,< 7,<

    8 Lucía 9 6 8 ,<

    Calculando se obtiene los siguientes resultados 

    +? studiante Jatem!tica stadística $ % d2 $0% d2($0%) 

    #iana * 8 9,< 0;,< ,<

    lizabet" 6 : 7,< 0

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    18/19

     +) COE.ICIEN/E DE DE/ERMINACIÓN

    Devela qu- porcentaje del cambio en % se explica por un cambio en $. &e calcula

    elevando al cuadrado el coeficiente de correlación.

    r 2 Coeficiente de correlación de 5earson

    #e donde coeficiente de determinación 2 D 2 r  

    E0empl" il*s%ra%i&"

    Con los datos de la tabla sobre las temperaturas (ejemplo anteriormente resuelto),

    calcular el coeficiente de determinación.

    $ 8 7 < : 9 6 < : 9 : 8

    % ; < 9 ; 6 * 8 ; ; * 8

    S"l*!ión(

    &e sabe que coeficiente de 5earson es r 2 *,9:

    levando al cuadrado coeficiente de 5earson queda calculado el coeficiente de

    determinación.

    Coeficiente de determinación 2

    sto establece que 7M de los cambios en la variable % puede ser explicado a trav-sde los cambios en la variable $.

    N"%a( 

    l valor tiene significado sólo para las relaciones lineales. #os variables pueden tener   sin embargo estar relacionadas en sentido curvilíneo. l valor de no se

    interpreta como si la variable % fuera causado por un cambio de la variable $, a que lacorrelación no significa causa.

    n xcel se calcula elevando al cuadrado el coeficiente de correlación o insertando la

    función =COE.ICIEN/E#R2 como muestra la siguiente figura

  • 8/19/2019 Analisis de Correlación (Uso de Excel)

    19/19