Introduction to the Analysis of univariate time series€¦ · Los modelos econométricos pueden...
Transcript of Introduction to the Analysis of univariate time series€¦ · Los modelos econométricos pueden...
Econometría IIEsther Ruiz
Dpt. de EstadísticaUniversidad Carlos III de Madrid
La econometría de series temporales en la empresa.
1. Usos de los modelos econométricos2. Tipos de datos3. Características de los datos temporales4. Factores en la evolución de una series temporal:
tendencia y estacionalidad5. Tendencia determinista6. Estacionalidad determinista7. Interpretación de las transformaciones habituales de
series temporales: logaritmos y diferencias8. Procesos estocásticos estacionarios9. Las funciones de autocovarianzas y de
autocorrelaciones
1. Usos de los modelos econométricosLa Econometría consiste en el análisis
cuantitativo de los fenómenos económicos reales basados en el desarrollo concurrente de la teoría y la observación, relacionándolos mediante métodos apropiados de inferencia.
Los modelos econométricos pueden utilizarse para:
1) Análisis estructural: Medir relaciones entre variables y contrastar teorías postuladas por la Teoría Económica
2) Predicción de valores futuros de las variables económicas y evaluación de nuevas observaciones
3) Simulación para la planificación
Algunos ejemplos en el ámbito de la decisión empresarial:
a) Finanzas· Valoración de una compañía que no cotiza
en bolsa para un canje de acciones· Análisis de la reducción del riesgo de una
compañía cuando diversifica entre múltiples países
· Factores que afectan a la valoración en bolsa de una compañía en un país emergente: flujo financiero y/o factores de riesgo de un país
Modelar la cotización trimestral de la compañía en función de:
flujo de caja operativodividendo por acciónindicadores de nivel de endeudamiento y
vencimiento medio de la demandacalificación de la compañía en las agencias de
ratingriesgo del país
b) Estrategia/planificación· Proyecciones financieras y fijación de
objetivos por país: Variables macro relevantes como, por ejemplo, inflación, tipos de interés y tipo de cambio. Demanda. Escenarios de medio plazo para adquisiciones
· Análisis a posteriori de contribución a las ventas de diferentes factores: demanda, precios, publicidad/promociones, factores estacionales.
c) Marketing· Diseño de sondeos y encuestas de satisfacción,
imagen, intención de compra· Estudios de valoración de factores de compra
0 5 10 15 20 25 30
Precio
Plazos de pago
Garantía de suministro
Calidad / Prestaciones
Servicio post-venta
Atención comercial
Programa fidelización
% utilidad
d) Producción/calidadDeterminación de métricas de calidad de fabricación relevantes desde un punto de vista de calidad percibida por el cliente
Modelos de regresión:Dosificación cliente = f (dosificación
otras materias primas, métricas de calidad en fabricación)
e) LogisticaDemand planning: previsiones de demanda de muy corto plazo para planificar requerimientos de inventario y flota de transporte
Previsión mixta ARIMA + experto comercial para un número muy elevado de puntos de demanda y/o suministroConexión con módulos de planificación de producción y transporte
Vendor Managed Inventory (VMI): Gestión automática del inventario de clientes mediante modelos automáticos de previsión horaria o diaria
Conexión con sistema de ventas del cliente o instalación de sensores de volumen de inventario que transmiten información cada horaModelos dinámicos horarios o diários
Previsiones de tiempo de transporte en función de datos históricos y posiciones actualizadas de camiones por GPS
Conexión automática con algoritmos de planificación de transporte (programación lineal)
Planificación de requerimientos de personal de servicio (teléfonos 902 o cajeros en supermercados)
Modelos dinámicos horarios en función de ventas, previsiones meteorológicas, y eventos previstos (partidos de futbol...)
2. Tipos de datosLos datos económicos se presentan habitualmente
en tres formas:a) Datos de sección cruzada. Observamos en un
único momentos del tiempo varias variables referidas a varias unidades económicas. Normalmente son datos microeconómicos.
b) Datos de series temporales. Observamos una o varias variables a lo largo del tiempo. Suelen referirse a datos macroeconómicos
c) Datos de panel. Variables referidas a varias unidades económicas son observadas a lo largo del tiempo.
Ejemplo de sección cruzadaObservamos en 2005 la renta (x) y el consumo (y)
de 1000 familias españolas. Estos datos son 1000 réplicas independientes de la variable (x,y).
0
400
800
1200
1600
2000
2400
-400 400 8001200 2000 2800
X
Y
Y vs. X
Ejemplo de series temporalesUna serie temporal es una sucesión de
observaciones de una o varias variables obtenidasa intervalos regulares de tiempo:
Podemos tener series univariantes cuandoobservamos una única variable o series multivariantes cuando observamos en un mismomomento varias variables:
Tyyy ,...,, 21
T
T
T
zzzxxxyyy
...
...
...
21
21
21
En el caso univariante, observamos una únicavariable en cada momento del tiempo.
0.8
0.9
1.0
1.1
1.2
1.3
1.4
250 500 750 1000 1250 1500
Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 20051200000
1300000
1400000
1500000
1600000
1700000
91 92 93 94 95 96 97 98 99 00 01 02 03 04
Quartely GDP Europe from 1st 1991 up to 3th 2004
80
85
90
95
100
105
110
115
120
91 92 93 94 95 96 97 98 99 00 01 02 03 04
Monthly IPC Europe from January 1991 up to December 2004
Ejemplo de una serie multivariante
0,00
0,50
1,00
1,50
2,00
2,50
3,00fe
b-80
feb-
81
feb-
82
feb-
83
feb-
84
feb-
85
feb-
86
feb-
87
feb-
88
feb-
89
feb-
90
feb-
91
feb-
92
feb-
93
feb-
94
feb-
95
feb-
96
feb-
97
feb-
98
feb-
99
feb-
00
PNOVARG
PEXARG
Ejemplo de datos de panelEn este caso observamos, por ejemplo, la renta (x)
y el consumo (y) de 1000 familias en distintos años: 1990, 1995, 2000 y 2005
1000,...,1,4,...,1,, == itxy itit
2. Características de los datos temporalesLos datos temporales se caracterizan por:a) Ser dependientes. Ya no podemos considerar
que la observación correspondiente al momento t es independiente de lo que hayamos observado en el momento t-1. Como consecuencia, y a diferencia de lo que teníamos al analizar datos de sección cruzada, la ordenación de las observaciones es fundamental.
b) Las observaciones se obtienen en un entorno que evoluciona. No podemos asumir que tenemos T observaciones de la misma variable aleatoria.
3. Factores en la evolución de una serie temporal: tendencia y estacionalidadObjetivos:
i) Descripción de las propiedades dinámicas de una serie: tendencia, estacionalidad, dependencia con respecto al pasado.
ii) Predicción de los valores futuros
Es evidente al observar series económicas que dos de sus características más habituales son la tendencia y la estacionalidad por lo que vamos a empezar por plantear modelos sencillos que representen estas dos características.
1200000
1300000
1400000
1500000
1600000
1700000
91 92 93 94 95 96 97 98 99 00 01 02 03 04
Quartely GDP Europe from 1st 1991 up to 3th 2004
4. Tendencia deterministaLa tendencia es aquella parte de la variable que se
perpetúa hacia el futuro. Vamos a suponer que una serie temporal tiene una tendencia determinista, en el sentido de que esta tendencia se puede predecir sin incertidumbre.
Si la serie tuviera una media constante podríamos representarla mediante:
tty εμ +=
6
7
8
9
10
11
12
13
250 500 750 1000
En este caso, μ, es la tendencia determinista que puede ser estimada por OLS en el modelo anterior.
-4
-3
-2
-1
0
1
2
3
250 500 750 1000Residuos de la regresión de y sobre una constante
Pero cuando tenemos series relativamente largas es habitual que observemos rupturas en el nivel de la serie.
Las rupturas en el nivel pueden deberse a acontecimientos especiales que son poco frecuentes: depresión de 1929, crisis energética de 1974, incorporación del euro en 2000, etc.
6
7
8
9
10
11
12
13
14
15
250 500 750 1000Serie con ruptura en el nivel
En este caso podemos ajustar el siguiente modelo de regresión para obtener las desviaciones con respecto a la tendencia:
donde la variable Et toma valor 1 a partir del momento de la ruptura.
ttt uEy ++= δμ
-4
-3
-2
-1
0
1
2
3
250 500 750 1000Residuos del modelo con una ruptura
Vamos a considerar ahora que la serie que estamos analizando tiene una tendencia creciente o decreciente lineal.
La variable yt crece βunidades en cada unidad de tiempo.
-20
0
20
40
60
80
100
120
250 500 750 1000
tt uty ++= βα
En este caso, podemos ajustar una tendencia determinista:
tt uty ++= βα
-15
-10
-5
0
5
10
15
250 500 750 1000Residuos de tendencia determinista
Las tendencias pueden tener rupturas en el nivel y en la pendiente. Vamos a considerar primero una ruptura en el nivel
-20
0
20
40
60
80
100
120
140
250 500 750 1000
Si ajustamos una tendencia determinista
-15
-10
-5
0
5
10
15
250 500 750 1000
Residuos de tendencia determinista
Tenemos que introducir una variable ficticia para recoger el cambio en el nivel
-15
-10
-5
0
5
10
15
250 500 750 1000Residuos del modelo con tendencia y una ruptura en el nivel
Finalmente, podemos tener cambios en la pendiente de la tendencia
-10
0
10
20
30
40
50
60
70
80
250 500 750 1000
Ajustando una tendencia determinista sin cambios en la pendiente obtendríamos el siguiente ajuste
-30
-20
-10
0
10
20
30
250 500 750 1000
Residuos de tendencia determinista
Ajuste del modelo de regresión con rupturas en la pendiente
donde D1t toma valor cero excepto entre t=501 y t=700 donde toma valor t-500. D2t toma valor cero hasta t=700 y a partir de ese momento toma valor t-700.
tttt uDDty ++++= 2211 δδβα
-15
-10
-5
0
5
10
15
250 500 750 1000Residuos de modelo con tendencia determinista y rupturas en la pendiente
Las tendencias también pueden ser exponenciales cuando la variable ytaparece en logaritmos:
β es la tasa de crecimiento media en tanto por uno. Si no hubiera errores
}exp{log
tt
tt
utyuty++=++=
βαβα
0
2
4
6
8
10
12
250 500 750 1000Tendencia exponencial
1
1
11
1
1log
loglog
−
−
−−
−
−=−=⎟⎟
⎠
⎞⎜⎜⎝
⎛
+=
t
tt
t
t
t
t
tt
yyy
yy
yy
tyy β
5. Estacionalidad deterministaIgualmente podemos modelizar mediante variables
ficticias la estacionalidad determinista. La estacionalidad son aquellos componentes de la serie que se repiten sistemáticamente en un periodo de tiempo determinado, por ejemplo, un año.
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
25 50 75 100 125 150 175 200
0
4
8
12
16
20
24
25 50 75 100 125 150 175 200
1200000
1300000
1400000
1500000
1600000
1700000
91 92 93 94 95 96 97 98 99 00 01 02 03 04
Quartely GDP Europe from 1st 1991 up to 3th 2004
0
1000000
2000000
3000000
4000000
92 93 94 95 96 97 98 99 00 01 02 03 04 05
BUILDINGS
0.00E+00
4.00E+06
8.00E+06
1.20E+07
1.60E+07
2.00E+07
2.40E+07
1970 1975 1980 1985 1990 1995 2000 2005
Turistas extranjeros en España desde abril 1965 hasta diciembre 2005
0
400000
800000
1200000
1600000
2000000
2400000
2800000
3200000
40 45 50 55 60 65 70 75 80 85 90 95 00 05
Desempleo mensual en España desde septiembre 1939 hasta enero 2006
En este caso, para obtener las desviaciones con respecto a la tendencia y al componente estacional, ajustaríamos el siguiente modelo de regresión:
donde las variables D1t, D2t y D3t son variables ficticias que toman valor 1 en el trimestre 1,2 y 3 respectivamente y cero en todos los demás.
ttttt uDDDty +++++= 332211 δδδβα
-.3
-.2
-.1
.0
.1
.2
.3
25 50 75 100 125 150 175 200Residuos del modelo de regresión con tendencia y estacionalidad deter
6. Interpretación de las transformaciones habituales de series temporales: logaritmos y diferencias
Es frecuente realizar ciertas transformaciones de las variables antes de su análisis mediante un modelo econométrico. Vamos a ver cuál es la interpretación de las variables transformadas.
La transformación más habitual es la transformación logarítmica que reduce la escala de las observaciones más extremas. Sin embargo, esta transformación no cambia la tendencia de la variable.
La transformación logarítmica es adecuada para estabilizar la variabilidad de la variable cuando dicha variabilidad se incrementa con el nivel de la serie.
0.00E+00
4.00E+08
8.00E+08
1.20E+09
1.60E+09
2.00E+09
2.40E+09
60 65 70 75 80 85 90 95 00
Monthly Spanish Exports from January 1960 up to Jult 2004
14
15
16
17
18
19
20
21
22
60 65 70 75 80 85 90 95 00
Monthly logarithmic exports in Spain from January 1960 to July 2004
0
1000000
2000000
3000000
4000000
92 93 94 95 96 97 98 99 00 01 02 03 04 05
BUILDINGS
12.4
12.8
13.2
13.6
14.0
14.4
14.8
15.2
92 93 94 95 96 97 98 99 00 01 02 03 04 05
Logaritmo-construcciones en España desde noviembre de 1991 hasta noviembre de 2005
Además también es frecuente que estemos interesados en modelizar no la serie original sino sus tasas de crecimiento. En este caso, consideraríamos la variable
En el caso de variables financieras, estas tasas de crecimiento se conocen como rendimientos.
En el caso de índices de precios, las tasas de crecimiento se conoce como inflación.
1
1)log(−
−−≈Δ
t
ttt y
yyy
0.8
0.9
1.0
1.1
1.2
1.3
1.4
250 500 750 1000 1250 1500
Daily Euro-Dollar exchange rate from 4th January 1999 up to 25th May 2005
-.03
-.02
-.01
.00
.01
.02
.03
250 500 750 1000 1250 1500
First differences of logs of euro-dollar exchange rates: returns
7. Procesos estocásticos estacionariosVamos a asumir que hemos eliminado todas las
componentes deterministas de la variable que estamos interesados en modelizar. Recuérdese que las dos características fundamentales de las series temporales son la dependencia entre observaciones y que dichas observaciones se realizan en un contexto dinámico y, por lo tanto, no puede asumirse que son T observaciones de la misma variable aleatoria. Vamos a ver ahora que instrumento estadístico podemos utilizar para representar esa dependencia.
tttt ayyyfy += −− ),...,,( 121
Para representar esta situación vamos a considerar que la serie que estamos analizando es la realización de un proceso estocástico: sucesión de variables aleatorias ordenadas en el tiempo
)(),...,2(),1( TYYY
Un proceso estocástico puede generar, en teoría, infinitas realizaciones durante el periodo t=1,…,T
........................
)(...)2()1(
)3()3(2
)3(1
)2()2(2
)2(1
)1()1(2
)1(1
T
T
T
yyyyyyyyy
TYYY↓↓↓
Si dispusiéramos de varias realizaciones del proceso, entonces la media de cada una de las variables que lo componen podría ser estimada mediante
m
ym
j
jt
t
∑= =1
)(
μ̂
Sin embargo, en la práctica, sólo disponemos de una única realización y, por lo tanto, no es posible estimar los momentosde las variables aleatorias que componen el proceso.
Tyyy
TYYY
...
...)(...)2()1(
21
↓↓↓
Para poder estimar los momentos (media, varianza etc.) de cada variable en el periodo t, es necesario restringir las propiedades del proceso estocástico.
Las restricciones que se imponen en este sentido son las de estacionariedad.
Un proceso es estacionario sii) ii)iii)
ttYE ∀= ,))(( μ
ttYVar ∀∞<= ,))(( 2σ
thhtYtYCov ∀=+ ),())(),(( γ
La primera condición nos permite estimar la media (que es común a todas las variables) mediante la media muestral
Lo mismo puede decirse de las otras dos condiciones.
T
yy
T
ii∑
== =1μ̂
En la práctica, las condiciones de estacionariedad nos permiten estimar las autocorrelaciones (medida de la dependencia lineal entre observaciones separadas por h periodos de tiempo) mediante las autocorrelaciones muestrales
T
yyyyhch
T
hthtt∑ −−
== +=−
1))((
)()(γ̂
Como ya hemos comentadoantes, el objetivo del
análisis de series temporales es
descomponer la serieobservada en una parte
que depende del pasado y otra que es impredecible
El proceso se conocecomo innovación y tiene la
característica de ser un ruido blanco:
ttt ayyfy += − ),...,( 11
}{ ta
haaCovaVar
aE
htt
at
t
∀==
=
− ,0),()(
0)(2σ
Teorema de Wald: Si un proceso esestacionario y no tiene componentesdeterministas, entonces
donde , y es un ruidoblanco
∑Ψ=∞
=−
0iitit ay
10 =Ψ ∑ ∞<Ψ∞
=0
2
ii }{ ta
El teorema de Wald nos permite aproximarla dependencia dinámica de una variable mediante un modelo lineal.
Cuando asumimos que las innovaciones son independientes, entonces la representación lineal es la única posible.
Sin embargo, cuando las innovaciones son incorreladas pero no independientes, el modelo lineal no es la únicarepresentación de la dependencia, puedehaber dependencias no lineales.
La representación de Wald depende de infinitos parámetros y, por lo tanto, no esoperativa en la práctica.
Tenemos que aproximar dicharepresentación mediante modelos quetengan un número finito de parámetros.
Modelos ARMA(p,q)
tt aLy )(∞Ψ= )()(
)(LL
Lp
qΦ
Θ=Ψ∞
qtqttptptt aaayyy −−−− −−−+++= θθφφ ...... 1111
Aunque esta aproximación es válida en muchos casos, existen procesosestacionarios que no pueden aproximarsemediante modelos ARMA: modelos de memoria larga.
Los modelos ARMA models juegan un papelmuy importante en modelización dinámicaporque permiten una representaciónparsimoniosa (con relativamente pocosparámetros) de una serie estacionaria.
8. Las funciones de autocovarianzas y de autocorrelacionesObjectivo: descomponer la serie observada en un
parte que depende del pasado (puede predecirse) y otra parte inesperada:
Teorema de Wald: f es linealLas autocovarianzas son el instrumento que vamos
a utilizar para medir relaciones lineales.
ectedUnt
edictablett ayyfy
expPr11 ),...,( += −
2}{)})({()( μμμγ −=−−= −− htthtt yyEyyEh
Las autocorrelaciones no dependen de las unidades de medida de la variable que estemos analizando:
Para estimar la autocorrelación de orden h utilizamos su análogo muestral
)0()()(
γγρ hh =
∑ −
∑ −−=
=
+=−
T
tt
T
hthtt
yy
yyyyhr
1
21
)(
))(()(
Si es una secuencia iid (independiente e idénticamentedistribuida) con varianza finita, entonces r(h) esasintóticamente Normal con media cero y varianza 1/T. Este resultado puede utilizarse para construir bandas de confianza para las autocorrelaciones:
±1.96/√TPara contrastar, podemos utilizar
el estadístico de Ljung-Box-Pierce
Si es una secuencia iid con momento de cuarto ordenfinito, entonces Q(m) es asintóticamente una chi-cuadradocon m grados de libertad.
}{ ty
0)(...)2()1(:0 ==== mH ρρρ
∑−
+==
m
h hThrTTmQ
1
2)()2()(
}{ ty
Correlograma de losincrementos anualesde las tasasmensuales de M3 europea
Correlograma de rendimientos diariosdel tipo de cambioEuro/Dollar
Cuando, como en el caso de los rendimientos Euro-Dólar, el correlogramade una serie no tiene correlaciones significativas, no existen modelos lineales que relacionen el pasado de la serie con su futuro. Sin embargo, es posible que existan transformaciones no lineales que estén correlacionadas y, por lo tanto, se puedan predecir.
10
15
20
25
30
35
40
45
250 500 750 1000 1250 1500
Daily CAC index from 7 December 1998 up to 9 September 2005
-.2
-.1
.0
.1
.2
.3
.4
250 500 750 1000 1250 1500
Daily returns of CAC index from 7 december 1998 to 9 September 2005