ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma...

Post on 24-Sep-2020

1 views 0 download

Transcript of ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL · 2020. 4. 13. · próximo a 1, nube de puntos deforma...

ESTADÍSTICA DESCRIPTIVA BIDIMENSIONAL

EL conjunto (X,Y) de valores que pueden tomar dos caracteres diferentes X e Y medidos sobre cada uno de los individuos de una población o muestra, puede venir dado de la siguiente forma:

X\Y 38 39 40 4137 1 3 5 238 1 3 3 339 0 3 3 5

X= nº pie madreY=nº pie hijas a los 14 años

TABLAS DE DOBLE ENTRADA

x f37 1138 1039 11

32

y f38 239 940 1141 10

32

DISTRIBUCIONES MARGINALES

ANÁLISIS DESCRIPTIVO DE LAS VARIABLEShttps://marielmatesblog.wordpress.com/

X(mates) 1 3 5 5 7 8Y(Fca) 2 3 6 5 9 8f 1 1 1 1 1 1

TABLAS DE FRECUENCIAS

N=6

N=32

REPRESENTACIO ́N GRA ́FICA: NUBE DE PUNTOS.

37,5

38

38,5

39

39,5

40

40,5

41

41,5

36,5 37 37,5 38 38,5 39 39,5

MER

O P

IE H

IJA

NÚMERO PIE MADRE

https://marielmatesblog.wordpress.com/

No determinista: Conocido el valor de X, el valor de Y no queda perfectamente establecido. Son del tipo: y = f (x) + udonde u es una perturbación desconocida

Lineal: Cuando la función f (x ) es lineal, y la representación gráfica de los datos tiene un aspecto lineal, f(x)=mx+n• Si m > 0 hay relación lineal positiva. • Si m < 0 hay relación lineal negativa.

No lineal: Cuando la función f (x ) no es lineal.

Ausencia de relación: Cuando f (x) = c.

Determinista: Conocido el valorde X, el valor de Y quedaperfectamente establecido. Sondel tipo:

y = f (x)

TIPOS DE RELACIÓN ENTRE X E Yhttp

s://marielm

atesb

log.word

press.com

/

LA COVARIANZA

CovX,Y=∑ (xi−"x)(yi−"y)

n

=∑ xi· yi

n − "x·"y

•Si hay relación lineal positiva, la covarianza será positiva y “grande”. • Si hay relación lineal negativa, la covarianza será negativa y “grande” en valor absoluto. • Si hay no hay relación entre las variables o la relación es marcadamente no lineal, la covarianza será próxima a cero. •La covarianza depende de las unidades de medida de las variables.

COEFICIENTE DE CORRELACIÓN LINEAL

Esta medida no depende de las unidades de medida

rxy=CovX,YSX·SY

EXISTEN DOS FORMAS DE CUANTIFICAR LA RELACIÓN LINEAL ENTRE LAS VARIABLES

-1≤ rxy ≤1 r (x,y) = r (y,x)

rxy ≈1

rxy ≈-1

rxy ≈0

https://marielmatesblog.wordpress.com/

Varianza de X:

sx2=∑(xi−"x)2

n =∑ xi

2

n −!x2,

Desviación típica: sx= sx2

una correlación FUERTE no implica

causalidad.

Sólo porque los movimientos de dos variables sigan caminos similares durante un tiempo no implica que uno haga que ocurra el otro.

• Estatura del padre sobre la estatura del hijo. • Precio de una vivienda en función de su superficie. • Predecir la tasa de paro para cada edad. • Aproximar la calificación obtenida en una materia según el número de horas de estudio semanal.

Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre otra variable Y . X: Variable independiente o explicativa o exógena Y: Variable dependiente o respuesta o endógena

https://marielmatesblog.wordpress.com/

El modelo de regresión linealsimple

y=m·x+n

m=CovX,Y

sx2, n="y−m· "x

m y n son los coeficientes de regresión: • n : intercepto • m : pendiente

REGRESIÓN

SIEMPRE Y CUANDO EL MODELO SEA ADECUADO (coeficiente de correlación

próximo a 1, nube de puntos de forma lineal, …), podremos usarlo para poder

predecir resultados de la variable dependiente y, conocido un valor de la

variable x

Dado una valor de la variable x, usamos nuestro modelo lineal y=n+m·x,

sustituimos en la función y hallamos el valor de estimación de la variable y, "y.

https://marielmatesblog.wordpress.com/

ESTIMACIÓN

“No toda nube de puntos se ajusta apropiadamente a un modelo de regresión lineal”(a pesar de que la recta de regresión siempre se pueda calcular).CONSEJO: calcular “r”, coeficiente de correlación lineal.

Cuarteto de Anscombe

I II III IV

x y x y x y x y

10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58

8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76

13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71

9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84

11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47

14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04

6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25

4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50

12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56

7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91

5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89

https://marielm

atesblog.wordpress.com

/

0

5

10

15

0 5 10 15

0

5

10

15

0 5 10 15

0

5

10

15

0 10 200,002,004,006,008,00

10,00

0 5 10 15

0

5

10

15

0 5 10 15

0,00

5,00

10,00

15,00

0 5 10 15

0

5

10

15

0 5 10 15

0

5

10

15

0 10 20

y=3+0,5·x

Datos de Anscombe