Introduction to the Analysis of univariate time series€¦ · Los modelos econométricos pueden...

Post on 30-Apr-2020

5 views 0 download

Transcript of Introduction to the Analysis of univariate time series€¦ · Los modelos econométricos pueden...

Econometría IIEsther Ruiz

Dpt. de EstadísticaUniversidad Carlos III de Madrid

La econometría de series temporales en la empresa.

1. Usos de los modelos econométricos2. Tipos de datos3. Características de los datos temporales4. Factores en la evolución de una series temporal:

tendencia y estacionalidad5. Tendencia determinista6. Estacionalidad determinista7. Interpretación de las transformaciones habituales de

series temporales: logaritmos y diferencias8. Procesos estocásticos estacionarios9. Las funciones de autocovarianzas y de

autocorrelaciones

1. Usos de los modelos econométricosLa Econometría consiste en el análisis

cuantitativo de los fenómenos económicos reales basados en el desarrollo concurrente de la teoría y la observación, relacionándolos mediante métodos apropiados de inferencia.

Los modelos econométricos pueden utilizarse para:

1) Análisis estructural: Medir relaciones entre variables y contrastar teorías postuladas por la Teoría Económica

2) Predicción de valores futuros de las variables económicas y evaluación de nuevas observaciones

3) Simulación para la planificación

Algunos ejemplos en el ámbito de la decisión empresarial:

a) Finanzas· Valoración de una compañía que no cotiza

en bolsa para un canje de acciones· Análisis de la reducción del riesgo de una

compañía cuando diversifica entre múltiples países

· Factores que afectan a la valoración en bolsa de una compañía en un país emergente: flujo financiero y/o factores de riesgo de un país

Modelar la cotización trimestral de la compañía en función de:

flujo de caja operativodividendo por acciónindicadores de nivel de endeudamiento y

vencimiento medio de la demandacalificación de la compañía en las agencias de

ratingriesgo del país

b) Estrategia/planificación· Proyecciones financieras y fijación de

objetivos por país: Variables macro relevantes como, por ejemplo, inflación, tipos de interés y tipo de cambio. Demanda. Escenarios de medio plazo para adquisiciones

· Análisis a posteriori de contribución a las ventas de diferentes factores: demanda, precios, publicidad/promociones, factores estacionales.

c) Marketing· Diseño de sondeos y encuestas de satisfacción,

imagen, intención de compra· Estudios de valoración de factores de compra

0 5 10 15 20 25 30

Precio

Plazos de pago

Garantía de suministro

Calidad / Prestaciones

Servicio post-venta

Atención comercial

Programa fidelización

% utilidad

d) Producción/calidadDeterminación de métricas de calidad de fabricación relevantes desde un punto de vista de calidad percibida por el cliente

Modelos de regresión:Dosificación cliente = f (dosificación

otras materias primas, métricas de calidad en fabricación)

e) LogisticaDemand planning: previsiones de demanda de muy corto plazo para planificar requerimientos de inventario y flota de transporte

Previsión mixta ARIMA + experto comercial para un número muy elevado de puntos de demanda y/o suministroConexión con módulos de planificación de producción y transporte

Vendor Managed Inventory (VMI): Gestión automática del inventario de clientes mediante modelos automáticos de previsión horaria o diaria

Conexión con sistema de ventas del cliente o instalación de sensores de volumen de inventario que transmiten información cada horaModelos dinámicos horarios o diários

Previsiones de tiempo de transporte en función de datos históricos y posiciones actualizadas de camiones por GPS

Conexión automática con algoritmos de planificación de transporte (programación lineal)

Planificación de requerimientos de personal de servicio (teléfonos 902 o cajeros en supermercados)

Modelos dinámicos horarios en función de ventas, previsiones meteorológicas, y eventos previstos (partidos de futbol...)

2. Tipos de datosLos datos económicos se presentan habitualmente

en tres formas:a) Datos de sección cruzada. Observamos en un

único momentos del tiempo varias variables referidas a varias unidades económicas. Normalmente son datos microeconómicos.

b) Datos de series temporales. Observamos una o varias variables a lo largo del tiempo. Suelen referirse a datos macroeconómicos

c) Datos de panel. Variables referidas a varias unidades económicas son observadas a lo largo del tiempo.

Ejemplo de sección cruzadaObservamos en 2005 la renta (x) y el consumo (y)

de 1000 familias españolas. Estos datos son 1000 réplicas independientes de la variable (x,y).

0

400

800

1200

1600

2000

2400

-400 400 8001200 2000 2800

X

Y

Y vs. X

Ejemplo de series temporalesUna serie temporal es una sucesión de

observaciones de una o varias variables obtenidasa intervalos regulares de tiempo:

Podemos tener series univariantes cuandoobservamos una única variable o series multivariantes cuando observamos en un mismomomento varias variables:

Tyyy ,...,, 21

T

T

T

zzzxxxyyy

...

...

...

21

21

21

En el caso univariante, observamos una únicavariable en cada momento del tiempo.

0.8

0.9

1.0

1.1

1.2

1.3

1.4

250 500 750 1000 1250 1500

Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 20051200000

1300000

1400000

1500000

1600000

1700000

91 92 93 94 95 96 97 98 99 00 01 02 03 04

Quartely GDP Europe from 1st 1991 up to 3th 2004

80

85

90

95

100

105

110

115

120

91 92 93 94 95 96 97 98 99 00 01 02 03 04

Monthly IPC Europe from January 1991 up to December 2004

Ejemplo de una serie multivariante

0,00

0,50

1,00

1,50

2,00

2,50

3,00fe

b-80

feb-

81

feb-

82

feb-

83

feb-

84

feb-

85

feb-

86

feb-

87

feb-

88

feb-

89

feb-

90

feb-

91

feb-

92

feb-

93

feb-

94

feb-

95

feb-

96

feb-

97

feb-

98

feb-

99

feb-

00

PNOVARG

PEXARG

Ejemplo de datos de panelEn este caso observamos, por ejemplo, la renta (x)

y el consumo (y) de 1000 familias en distintos años: 1990, 1995, 2000 y 2005

1000,...,1,4,...,1,, == itxy itit

2. Características de los datos temporalesLos datos temporales se caracterizan por:a) Ser dependientes. Ya no podemos considerar

que la observación correspondiente al momento t es independiente de lo que hayamos observado en el momento t-1. Como consecuencia, y a diferencia de lo que teníamos al analizar datos de sección cruzada, la ordenación de las observaciones es fundamental.

b) Las observaciones se obtienen en un entorno que evoluciona. No podemos asumir que tenemos T observaciones de la misma variable aleatoria.

3. Factores en la evolución de una serie temporal: tendencia y estacionalidadObjetivos:

i) Descripción de las propiedades dinámicas de una serie: tendencia, estacionalidad, dependencia con respecto al pasado.

ii) Predicción de los valores futuros

Es evidente al observar series económicas que dos de sus características más habituales son la tendencia y la estacionalidad por lo que vamos a empezar por plantear modelos sencillos que representen estas dos características.

1200000

1300000

1400000

1500000

1600000

1700000

91 92 93 94 95 96 97 98 99 00 01 02 03 04

Quartely GDP Europe from 1st 1991 up to 3th 2004

4. Tendencia deterministaLa tendencia es aquella parte de la variable que se

perpetúa hacia el futuro. Vamos a suponer que una serie temporal tiene una tendencia determinista, en el sentido de que esta tendencia se puede predecir sin incertidumbre.

Si la serie tuviera una media constante podríamos representarla mediante:

tty εμ +=

6

7

8

9

10

11

12

13

250 500 750 1000

En este caso, μ, es la tendencia determinista que puede ser estimada por OLS en el modelo anterior.

-4

-3

-2

-1

0

1

2

3

250 500 750 1000Residuos de la regresión de y sobre una constante

Pero cuando tenemos series relativamente largas es habitual que observemos rupturas en el nivel de la serie.

Las rupturas en el nivel pueden deberse a acontecimientos especiales que son poco frecuentes: depresión de 1929, crisis energética de 1974, incorporación del euro en 2000, etc.

6

7

8

9

10

11

12

13

14

15

250 500 750 1000Serie con ruptura en el nivel

En este caso podemos ajustar el siguiente modelo de regresión para obtener las desviaciones con respecto a la tendencia:

donde la variable Et toma valor 1 a partir del momento de la ruptura.

ttt uEy ++= δμ

-4

-3

-2

-1

0

1

2

3

250 500 750 1000Residuos del modelo con una ruptura

Vamos a considerar ahora que la serie que estamos analizando tiene una tendencia creciente o decreciente lineal.

La variable yt crece βunidades en cada unidad de tiempo.

-20

0

20

40

60

80

100

120

250 500 750 1000

tt uty ++= βα

En este caso, podemos ajustar una tendencia determinista:

tt uty ++= βα

-15

-10

-5

0

5

10

15

250 500 750 1000Residuos de tendencia determinista

Las tendencias pueden tener rupturas en el nivel y en la pendiente. Vamos a considerar primero una ruptura en el nivel

-20

0

20

40

60

80

100

120

140

250 500 750 1000

Si ajustamos una tendencia determinista

-15

-10

-5

0

5

10

15

250 500 750 1000

Residuos de tendencia determinista

Tenemos que introducir una variable ficticia para recoger el cambio en el nivel

-15

-10

-5

0

5

10

15

250 500 750 1000Residuos del modelo con tendencia y una ruptura en el nivel

Finalmente, podemos tener cambios en la pendiente de la tendencia

-10

0

10

20

30

40

50

60

70

80

250 500 750 1000

Ajustando una tendencia determinista sin cambios en la pendiente obtendríamos el siguiente ajuste

-30

-20

-10

0

10

20

30

250 500 750 1000

Residuos de tendencia determinista

Ajuste del modelo de regresión con rupturas en la pendiente

donde D1t toma valor cero excepto entre t=501 y t=700 donde toma valor t-500. D2t toma valor cero hasta t=700 y a partir de ese momento toma valor t-700.

tttt uDDty ++++= 2211 δδβα

-15

-10

-5

0

5

10

15

250 500 750 1000Residuos de modelo con tendencia determinista y rupturas en la pendiente

Las tendencias también pueden ser exponenciales cuando la variable ytaparece en logaritmos:

β es la tasa de crecimiento media en tanto por uno. Si no hubiera errores

}exp{log

tt

tt

utyuty++=++=

βαβα

0

2

4

6

8

10

12

250 500 750 1000Tendencia exponencial

1

1

11

1

1log

loglog

−−

−=−=⎟⎟

⎞⎜⎜⎝

+=

t

tt

t

t

t

t

tt

yyy

yy

yy

tyy β

5. Estacionalidad deterministaIgualmente podemos modelizar mediante variables

ficticias la estacionalidad determinista. La estacionalidad son aquellos componentes de la serie que se repiten sistemáticamente en un periodo de tiempo determinado, por ejemplo, un año.

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

25 50 75 100 125 150 175 200

0

4

8

12

16

20

24

25 50 75 100 125 150 175 200

1200000

1300000

1400000

1500000

1600000

1700000

91 92 93 94 95 96 97 98 99 00 01 02 03 04

Quartely GDP Europe from 1st 1991 up to 3th 2004

0

1000000

2000000

3000000

4000000

92 93 94 95 96 97 98 99 00 01 02 03 04 05

BUILDINGS

0.00E+00

4.00E+06

8.00E+06

1.20E+07

1.60E+07

2.00E+07

2.40E+07

1970 1975 1980 1985 1990 1995 2000 2005

Turistas extranjeros en España desde abril 1965 hasta diciembre 2005

0

400000

800000

1200000

1600000

2000000

2400000

2800000

3200000

40 45 50 55 60 65 70 75 80 85 90 95 00 05

Desempleo mensual en España desde septiembre 1939 hasta enero 2006

En este caso, para obtener las desviaciones con respecto a la tendencia y al componente estacional, ajustaríamos el siguiente modelo de regresión:

donde las variables D1t, D2t y D3t son variables ficticias que toman valor 1 en el trimestre 1,2 y 3 respectivamente y cero en todos los demás.

ttttt uDDDty +++++= 332211 δδδβα

-.3

-.2

-.1

.0

.1

.2

.3

25 50 75 100 125 150 175 200Residuos del modelo de regresión con tendencia y estacionalidad deter

6. Interpretación de las transformaciones habituales de series temporales: logaritmos y diferencias

Es frecuente realizar ciertas transformaciones de las variables antes de su análisis mediante un modelo econométrico. Vamos a ver cuál es la interpretación de las variables transformadas.

La transformación más habitual es la transformación logarítmica que reduce la escala de las observaciones más extremas. Sin embargo, esta transformación no cambia la tendencia de la variable.

La transformación logarítmica es adecuada para estabilizar la variabilidad de la variable cuando dicha variabilidad se incrementa con el nivel de la serie.

0.00E+00

4.00E+08

8.00E+08

1.20E+09

1.60E+09

2.00E+09

2.40E+09

60 65 70 75 80 85 90 95 00

Monthly Spanish Exports from January 1960 up to Jult 2004

14

15

16

17

18

19

20

21

22

60 65 70 75 80 85 90 95 00

Monthly logarithmic exports in Spain from January 1960 to July 2004

0

1000000

2000000

3000000

4000000

92 93 94 95 96 97 98 99 00 01 02 03 04 05

BUILDINGS

12.4

12.8

13.2

13.6

14.0

14.4

14.8

15.2

92 93 94 95 96 97 98 99 00 01 02 03 04 05

Logaritmo-construcciones en España desde noviembre de 1991 hasta noviembre de 2005

Además también es frecuente que estemos interesados en modelizar no la serie original sino sus tasas de crecimiento. En este caso, consideraríamos la variable

En el caso de variables financieras, estas tasas de crecimiento se conocen como rendimientos.

En el caso de índices de precios, las tasas de crecimiento se conoce como inflación.

1

1)log(−

−−≈Δ

t

ttt y

yyy

0.8

0.9

1.0

1.1

1.2

1.3

1.4

250 500 750 1000 1250 1500

Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005

-.03

-.02

-.01

.00

.01

.02

.03

250 500 750 1000 1250 1500

First differences of logs of euro-dollar exchange rates: returns

7. Procesos estocásticos estacionariosVamos a asumir que hemos eliminado todas las

componentes deterministas de la variable que estamos interesados en modelizar. Recuérdese que las dos características fundamentales de las series temporales son la dependencia entre observaciones y que dichas observaciones se realizan en un contexto dinámico y, por lo tanto, no puede asumirse que son T observaciones de la misma variable aleatoria. Vamos a ver ahora que instrumento estadístico podemos utilizar para representar esa dependencia.

tttt ayyyfy += −− ),...,,( 121

Para representar esta situación vamos a considerar que la serie que estamos analizando es la realización de un proceso estocástico: sucesión de variables aleatorias ordenadas en el tiempo

)(),...,2(),1( TYYY

Un proceso estocástico puede generar, en teoría, infinitas realizaciones durante el periodo t=1,…,T

........................

)(...)2()1(

)3()3(2

)3(1

)2()2(2

)2(1

)1()1(2

)1(1

T

T

T

yyyyyyyyy

TYYY↓↓↓

Si dispusiéramos de varias realizaciones del proceso, entonces la media de cada una de las variables que lo componen podría ser estimada mediante

m

ym

j

jt

t

∑= =1

)(

μ̂

Sin embargo, en la práctica, sólo disponemos de una única realización y, por lo tanto, no es posible estimar los momentosde las variables aleatorias que componen el proceso.

Tyyy

TYYY

...

...)(...)2()1(

21

↓↓↓

Para poder estimar los momentos (media, varianza etc.) de cada variable en el periodo t, es necesario restringir las propiedades del proceso estocástico.

Las restricciones que se imponen en este sentido son las de estacionariedad.

Un proceso es estacionario sii) ii)iii)

ttYE ∀= ,))(( μ

ttYVar ∀∞<= ,))(( 2σ

thhtYtYCov ∀=+ ),())(),(( γ

La primera condición nos permite estimar la media (que es común a todas las variables) mediante la media muestral

Lo mismo puede decirse de las otras dos condiciones.

T

yy

T

ii∑

== =1μ̂

En la práctica, las condiciones de estacionariedad nos permiten estimar las autocorrelaciones (medida de la dependencia lineal entre observaciones separadas por h periodos de tiempo) mediante las autocorrelaciones muestrales

T

yyyyhch

T

hthtt∑ −−

== +=−

1))((

)()(γ̂

Como ya hemos comentadoantes, el objetivo del

análisis de series temporales es

descomponer la serieobservada en una parte

que depende del pasado y otra que es impredecible

El proceso se conocecomo innovación y tiene la

característica de ser un ruido blanco:

ttt ayyfy += − ),...,( 11

}{ ta

haaCovaVar

aE

htt

at

t

∀==

=

− ,0),()(

0)(2σ

Teorema de Wald: Si un proceso esestacionario y no tiene componentesdeterministas, entonces

donde , y es un ruidoblanco

∑Ψ=∞

=−

0iitit ay

10 =Ψ ∑ ∞<Ψ∞

=0

2

ii }{ ta

El teorema de Wald nos permite aproximarla dependencia dinámica de una variable mediante un modelo lineal.

Cuando asumimos que las innovaciones son independientes, entonces la representación lineal es la única posible.

Sin embargo, cuando las innovaciones son incorreladas pero no independientes, el modelo lineal no es la únicarepresentación de la dependencia, puedehaber dependencias no lineales.

La representación de Wald depende de infinitos parámetros y, por lo tanto, no esoperativa en la práctica.

Tenemos que aproximar dicharepresentación mediante modelos quetengan un número finito de parámetros.

Modelos ARMA(p,q)

tt aLy )(∞Ψ= )()(

)(LL

Lp

Θ=Ψ∞

qtqttptptt aaayyy −−−− −−−+++= θθφφ ...... 1111

Aunque esta aproximación es válida en muchos casos, existen procesosestacionarios que no pueden aproximarsemediante modelos ARMA: modelos de memoria larga.

Los modelos ARMA models juegan un papelmuy importante en modelización dinámicaporque permiten una representaciónparsimoniosa (con relativamente pocosparámetros) de una serie estacionaria.

8. Las funciones de autocovarianzas y de autocorrelacionesObjectivo: descomponer la serie observada en un

parte que depende del pasado (puede predecirse) y otra parte inesperada:

Teorema de Wald: f es linealLas autocovarianzas son el instrumento que vamos

a utilizar para medir relaciones lineales.

ectedUnt

edictablett ayyfy

expPr11 ),...,( += −

2}{)})({()( μμμγ −=−−= −− htthtt yyEyyEh

Las autocorrelaciones no dependen de las unidades de medida de la variable que estemos analizando:

Para estimar la autocorrelación de orden h utilizamos su análogo muestral

)0()()(

γγρ hh =

∑ −

∑ −−=

=

+=−

T

tt

T

hthtt

yy

yyyyhr

1

21

)(

))(()(

Si es una secuencia iid (independiente e idénticamentedistribuida) con varianza finita, entonces r(h) esasintóticamente Normal con media cero y varianza 1/T. Este resultado puede utilizarse para construir bandas de confianza para las autocorrelaciones:

±1.96/√TPara contrastar, podemos utilizar

el estadístico de Ljung-Box-Pierce

Si es una secuencia iid con momento de cuarto ordenfinito, entonces Q(m) es asintóticamente una chi-cuadradocon m grados de libertad.

}{ ty

0)(...)2()1(:0 ==== mH ρρρ

∑−

+==

m

h hThrTTmQ

1

2)()2()(

}{ ty

Correlograma de losincrementos anualesde las tasasmensuales de M3 europea

Correlograma de rendimientos diariosdel tipo de cambioEuro/Dollar

Cuando, como en el caso de los rendimientos Euro-Dólar, el correlogramade una serie no tiene correlaciones significativas, no existen modelos lineales que relacionen el pasado de la serie con su futuro. Sin embargo, es posible que existan transformaciones no lineales que estén correlacionadas y, por lo tanto, se puedan predecir.

10

15

20

25

30

35

40

45

250 500 750 1000 1250 1500

Daily CAC index from 7 December 1998 up to 9 September 2005

-.2

-.1

.0

.1

.2

.3

.4

250 500 750 1000 1250 1500

Daily returns of CAC index from 7 december 1998 to 9 September 2005