Practica de Estadistica y Analisis de Pronosticos

16
ENRIQUE VILLAUME ANTONIO HERRERA PRACTICA DE ESTADISTICA Y ANALISIS DE PRONOSTICOS LOS ACCIONISTAS DE UNA EMPRESA IMPORTANTE DE LOS EEUU DESEAN EVALUAR LA POLITICA DE REMUNERACION DE LOS CEO´S DE SUS DIFERENTES AREAS DE NEGOCIO. PARA ESTO HAN CONTRATADO A UN INVESTIGADOR ECONOMETRISTA PARA PODER CONOCER LOS PRINCIPALES DETERMINANTES DEL SALARIO DE LOS CEO´S EN LOS ESTADOS UNIDOS. CON LA BASE DE DATOS PROPORCIONADA (ENCUESTAS A 177 CEO´S DE LAS MÁS GRANDES EMPRESAS DE EEUU EN EL AÑO 2000) SE LE PIDE: 1) Realizar una regresión que tenga al salario de los CEO ´s como variable dependiente, en función a una constante, las ganancias (profits) y la edad del CEO. a. Discuta la bondad de ajuste de este modelo inicial. Bondad de ajuste Cuando hablamos de bondad de ajuste queremos sabe R 2 (R- squared), R 2 ajustado, S.E.R y F-statistic. Al analizar la bondad de ajuste de este modelo, como primera medida utilizamos el R-cuadrado para evaluar la calidad del ajuste de esta regresión. R-cuadrado es una proporción, que llega a tomar valores entre 0 y 1.

description

Econometric eviews essay

Transcript of Practica de Estadistica y Analisis de Pronosticos

Page 1: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

PRACTICA DE ESTADISTICA Y ANALISIS DE PRONOSTICOS

LOS ACCIONISTAS DE UNA EMPRESA IMPORTANTE DE LOS EEUU DESEAN EVALUAR LA POLITICA DE REMUNERACION DE LOS CEO´S DE SUS DIFERENTES AREAS DENEGOCIO. PARA ESTO HAN CONTRATADO A UN INVESTIGADOR ECONOMETRISTA PARA PODER CONOCER LOS PRINCIPALES DETERMINANTES DEL SALARIO DE LOS CEO´S EN LOS ESTADOS UNIDOS. CON LA BASE DE DATOS PROPORCIONADA (ENCUESTAS A 177 CEO´S DE LAS MÁS GRANDES EMPRESAS DE EEUU EN EL AÑO 2000) SE LE PIDE:

1) Realizar una regresión que tenga al salario de los CEO´s como variable dependiente, en función a una constante, las ganancias (profits) y la edad del CEO.

a. Discuta la bondad de ajuste de este modelo inicial.

Bondad de ajuste

Cuando hablamos de bondad de ajuste queremos sabeR2 (R-squared), R2ajustado, S.E.R y F-statistic.

Al analizar la bondad de ajuste de este modelo, como primera medida utilizamos el R-cuadrado para evaluar la calidad del ajuste de esta regresión. R-cuadrado es una proporción, que llega a tomar valores entre 0 y 1.

Page 2: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

Utilizamos la siguiente fórmula para poder evaluar la calidad de ajuste de la regresión con la bondad de ajuste con R2

R2=∑i=1

n

(Ŷi−Yi ) ²

∑i=1

n

(Yi−Ŷi ) ²

0 ≤ R2 ≤ 1

Cuando R2 tiende a 0 significa que las variables independientes utilizadas no explican la relación con “SALARY” (variable dependiente).Cuando R2 tiende a 1 significa que las variables independientes utilizadas si explican la relación con “SALARY” (variable dependiente), por lo cual es un buen modelo.

Como podemos ver en la imagen de nuestro ejercicio R2 es igual a 0.160 lo cual significa que con estas variables sólo se está explicando el 16% del modelo, por lo cual significa que este es un mal modelo .

Adjusted R2 :

Este estadístico lo que hace es corregir el sesgo de Ṝ2 a aumentar por la simple adición de nuevas variables explicativas que pueden no guardar relación con “Y”.

La fórmula para obtener Adjusted R2 es:

Ṝ2=1−( N−1N−K

)(1−R2)

Donde “N” es la muestra total y “k” el número de parámetros estimados.

Las variables no son suficientes, se necesitan mas variables para tener un mejor modelo.

SER (STANDARD ERROR OF THE REGRESSION)

Es el estadístico que mide el nivel de dispersión de las variables del modelo. Para calcular este estadístico se usa la siguiente fórmula:

R2=∑i=1

n

(Ūi )

N−2

En nuestro ejercicio el valor de S.E.R es de 541.56 por lo cual el modeloes malo ya que tiene que ser 0. Lo que recomendamos es que se tendrías que

Page 3: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

poner otros modelos para que el modelo llega a 0 y asi poder tener un buen modelo

F-statistic: Podemos ver la significancia estadística de todos los parámetros estimados de manera conjunta mediante F-stadistic.

F=( N−kk−1

)( R2

1−R2)

N = Numero de observacionesk= Parametros estimados

DOCIMA DE HIPOTESIS:

H0: β0 = β1 = 0 El modelo no es bueno

H1: β0 ≠ β1 ≠ 0 El modelo es útil

Entonces en nuestro ejercicio F-statistic nos sale 16.59244 y comparando con la F-tablas a 95% de confianza nos sale que el F-calculado es mayor al F_tablas.

F-calculado ˃ F-tablas 16.59244 ˃ F-tablas

Por lo tanto SE RECHAZA H0 por lo cual los parámetros estimados son buenos para el modelo.

b. Discuta la significancia estadística individual de los coeficientes estimados.

Discutiremos la significancia estadística a través del T-estadístico, el P-Value y el intervalo de confianza:T-ESTADISTICO

Hipotesis nula H0: β0 = 0

Hipotesis Alterna H1: β0 ≠ 0

En el caso de la variable PROFITS se rechaza H0, por lo que es bueno para poder explicar el modelo porque es mayor a 2.

En el caso de la variable AGE que es menor a 2, no se rechaza H0, y lo que tendríamos que hacer es eliminar del modelo.

Page 4: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

P_VALUE En el caso de la variable PROFITS que tiene un P_value de 0.000,

menor a 0,05, no se rechaza H0, por lo tanto los errores son normales. La variable AGE que tiene un P_value de 0,3106, mayor a 0,05,

entonces rechazamos H0 , por lo cual los errores no son normales, lo que se recomienda es sacar esta variable del modelo.

INTERVALO DE CONFIANZA

Los parámetros C y AGE al ser valores negativos tienen que salir del modelo La variable PROFITS se debe seguir en el modelo ya que los intervalos de confianza son positivos, y el 0 no está incluido.

c. Interprete los valores de los coeficientes. ¿Tienen sentido lógico?

ΔSALARYΔPROFITS

=0.5604

El PROFIT de la empresa aumenta en un millón de dólares, SALARY aumentará en 0.5604 en miles de dólares.

ΔSALARYΔAGE

=4.9619

Si la variación de AGE en años aumenta, el salario tendrá que aumentar 4.9619 en miles de dólares.

Page 5: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

d. ¿Considera usted que el modelo propuesto posee variables redundantes? ¿Cuáles? ¿Por qué? (Si identificó variables redundantes elimínelas del modelo).

e. ¿Considera usted que el modelo adolece de variables omitidas? ¿Por qué?

Consideramos que el modelo si adolece de variables omitidas. Necesita más variables explicativas para que el modelo sea representativo.

2) Para fines de mejora del modelo, se le sugiere incluir las siguientes variables: 1) ventas de la empresa, 2) si el CEO obtuvo una licenciatura o no y 3) años que cada CEO lleva en esa posición.

a. ¿Mejora la bondad de ajuste del modelo?

Partiendo de los términos mencionados en el inciso a) del ejercicio 1 llegamos a las siguientes conclusiones:

R2: El R-squared de nuestro ejercicio con las nuevas añadidas al modelo es de 0,1943, lo cual nos indica que con las nuevas variables el modelo mejoraron en un 3.42%.el modelo sigue siendo malo ya que se explica, apenas el 19.43%. En este caso deberíamos sacar las variables que no son muy significativas en nuestro modelo.

R2 Ajustado :NuestroR2 ajustado en nuestro modelo es de 0.1707 lo cual es malo y en comparación del R2 no mejoro casi nada, este indicador debe estar lo mas

Page 6: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

cercano posible a R2, y comparando con el modelo anterior sin las variables añadidas, el modelo ha empeorado ya que existe una brecha más grande entre el R2 y el R2 ajustado.

Standard error of the regression (S.E.R)Este indicador es 535.07 por lo cual se ve que con estas variables añadidas el modelo sigue siendo muy malo ya que este estadístico debería tender a 0.

F-STATISTIC:En este caso utilizando el P_value de F-statistic si:

Prob (F-statistic) > 0,05 Se rechaza H0Prob (F-statistic) < 0,05 No Se rechaza H0

Entonces tomando en cuenta el P_value vemos que a un 95% de confianza SE RECHAZA H0 ya que el P_value es menor a 0.05 estos parámetros son útiles al modelo.b. ¿Son las nuevas variables incluidas útiles al modelo? ¿Cómo

interpreta sus coeficientes estimados?Con las nuevas variables añadidas vemos que el modelo mejoro pero casi nada, el modelo sigue siendo muy malo ya que R2 y R2 ajustado son muy bajos y tienden más a 0 que a 1

Interpretando sus coeficientes llegamos a la conclusión de:

ΔSALARYΔCOLLEGE

= -122.5807

Por cada licenciatura más que tenga un CEO, su sueldo disminuirá en 122.58.

ΔSALARYΔCEOTEN

= 12.8968

Por cada año que un CEO esté en esa posición en la empresa su salario aumentará en 12.8968.

c. Calcule los intervalos de confianza para los tres nuevos coeficientes estimados. ¿Qué conclusiones obtiene?

Page 7: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

Los parámetros SALES y COLLEGE son valores negativos, no son variables útiles al modelo por lo tanto deben salir del modelo. La variable CEOTEN se debe mantener ya que los intervalos de confianza son positivos, y el 0 no está incluido.

d. Realice el test de normalidad (Jarque Bera y test de la media) para el modelo sin variables redundantes. ¿Son los errores normales?

Jarque Bera

Page 8: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

El P_value (probability) es menor a 0.05 por lo tanto se rechaza H0 por lo tanto los residuos no son normales.

Test de la Media

Dócima de hipótesis:H0: t(U) = 0H1: t(U) ≠ 0

Entonces:Si P_Val < 0.05 → RH0

Si P_Val ˃ 0.05 → NRH0

El P_value del test de la media es igual a 1.00 siendo mayor a 0.05 entonces no se rechaza H0.

Por lo visto anteriormente decimos que no existe problema de normalidad de los residuos.

e. ¿Cuáles podrían ser las razones de su hallazgo?

Las razones de nuestro hallazgo son las siguientes. La probabilidad de tener outliers.

La posible no linealidad de relación entre variables.

3) Para mejorar el modelo aún más se le pide revisar los errores de la última estimación y tratar de identificar si existen outliers (valores aberrantes) significativos.a) En caso de existir outliers, cree una o más variables dummy (1 para el número de encuesta en el cual se identificó el outlier y 0 en cualquier otro caso)- Identificamos que los dos valores aberrantes están en las observaciones 74 y 103 respectivamente. Proseguimos a crear Dummys para poder eliminar dichas aberraciones.

Page 9: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

.Dummy 74 y dummy 103.b) Corra la regresión con el modelo incluyendo la dummy como variable regresora y comente si hubieron mejoras de bondad de ajuste.

Page 10: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

Las mejoras en la bondad de ajuste del modelo son significativas.- El Estadístico “R2” explica el 58.61% del modelo y el Estadístico “R2” ajustado explica el 57.40%. Estos regresores explican de una manera mas exacta al modelo.- En cuanto al Error Estándar de la Regresión vemos que igual mejora bastante, pasa de 441 a 383. Es una mejora pero todavía hay una fuerte posibilidad que los valores que se predicen estén bastante lejos de los valores observados.- Finalmente hablando del estadístico “F”, Lo que tenemos sigue es menor a 0.05, por lo que se rechaza la hipótesis nula. Podemos afirmar más de uno los regresores explica a la variable dependiente.c) Vuelva a testear la normalidad de los errores. ¿ Hay mejoras en el test de JB? ¿Son las mejoras suficientes? Sugiera más medidas correctivas para poder obtener errores o residuos normales en esta regresión.

Se aprecia que el gráfico se parece más a uno de forma normal pero con fallas o huecos.Se rechaza . Al rechazar H₀. Se acepta a H₁, no hay normalidad.d) Suponiendo que los residuos fueron normales, realice las pruebas de Heteroscedasticidad y Autocorrelación para este modelo. En caso de encontrar alguno o ambos problemas, aplique el ajuste de Newey- West y vuelva a reportar el modelo.- Heteroscedasticidad:

Page 11: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

- Según el test de Arch al ser los resultados mayores a 0.05 se sabe que el resultado es homosedastico.

-Según el test de Arch, el resultado es homosedastico al ser mayor a 0.05

Page 12: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

Autocorrelación:Según Durbin- Watson, como el valor esta cerca a 2, no hay problemas de autocorrelación de primer grado.

.

Page 13: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

-Según el Q- Stat, se concluye que no hay problemas de autocorrelacion orque las observaciones son mayores a 0.05, sea no se rechaza la hiotesis nula.

- Según el LM Test, cómo se puede ver en el cuadro, los p-values tanto para el estadístico F como para TR-squared son mayores a 0.05 por lo que no se rechaza la hipoteis nula y se puedo concluir que no existe problemas de autocorrelación.

Page 14: Practica de Estadistica y Analisis de Pronosticos

ENRIQUE VILLAUMEANTONIO HERRERA

- Según el LM Test, cómo se puede ver en el cuadro, los p-values tanto para el estadístico F como para TR-squared son mayores a 0.05 por lo que no se rechaza la hipoteis nula y se puedo concluir que no existe problemas de autocorrelación.