Estadistica Espacial
Transcript of Estadistica Espacial
-
7/24/2019 Estadistica Espacial
1/46
XI Escuela de Probabilidad y EstadsticaCIMAT
Estadstica Espacial
Rogelio Ramos Quiroga
Guanajuato, Gto. 29 de febrero de 2012.
1
-
7/24/2019 Estadistica Espacial
2/46
Una Introducci on al Tema
2
-
7/24/2019 Estadistica Espacial
3/46
Geoestadstica, version simplicada
0 1 2 3 4 5 6
0
1
2
3
4
5
6
x
y
2 2 2 2 2
2 3 3 3 2
2 3 4 3 2
2 3 3 3 2
2 2 2 2 2
1 1
11
0 1 2 3 4 5 6
0
1
2
3
4
5
6
Prediccin
x
y
1.5 2 2.5 3 3.5
0 1 2 3 4 5 6
0
1
2
3
4
5
6
Errores estndar de prediccin
x
y
0.05 0 .1 0 .15 0 .2 0 .25 0 .3
3
-
7/24/2019 Estadistica Espacial
4/46
Geoestadstica, version simplicada
0 1 2 3 4 5 6
0
1
2
3
4
5
6
x
y
2 2 2 2
2 3 3 3 2
2 3 4 3 2
2 3 3 2
2 2 2 2 2
1 1
11
0 1 2 3 4 5 6
0
1
2
3
4
5
6
Prediccin
x
y
0 1 2 3 4 5 6
0
1
2
3
4
5
6
Errores estndar de prediccin
x
y
4
-
7/24/2019 Estadistica Espacial
5/46
Aplicaciones de Estadstica Espacial
5
-
7/24/2019 Estadistica Espacial
6/46
Hidrologa
Niveles piezometricos de un acufero. ( Cressie (1991) ).
6
-
7/24/2019 Estadistica Espacial
7/46
Procesamiento de Imagenes: Texturas
( Winkler (2003), Cross & Jain (1983), Geman & Geman (1984) )
7
-
7/24/2019 Estadistica Espacial
8/46
Ecologa
Densidad de arboles (en regi on de 4 has). ( Cressie (1991) ).
8
-
7/24/2019 Estadistica Espacial
9/46
Agronoma
( Besag & Higdon (1999) )
9
-
7/24/2019 Estadistica Espacial
10/46
Epidemiologa
Mapeo del riesgo de una enfermedad. Tasas de incidencia decancer de tiroides, en Francia, en el perodo 19711978.
( Besag, York & Mollie (1991) )
10
-
7/24/2019 Estadistica Espacial
11/46
Epidemiologa
Prevalencia de Malaria en Gambia.
11
-
7/24/2019 Estadistica Espacial
12/46
Epidemiologa
300 350 400 450 500 550 600
1
3 5 0
1 4 0 0
1 4 5 0
1 5 0 0
1 5 5 0
1 6 0 0
Prevalencia de Malaria en Gambia
OE (kilmetros)
S
N ( k i l m
e t r o s
)
Regin Oeste
Regin Este
Regin Central
12
-
7/24/2019 Estadistica Espacial
13/46
Pero primero, lo primero: Antecedentes
13
-
7/24/2019 Estadistica Espacial
14/46
Los inicios de la Geoestadstica
D.G. Krige en los 1950s
Predicci on del grado de mineral para regiones, basadas en muestreopuntual.
Sin supuestos de i.i.d., s olo vectores de observaciones espacialmentecorrelacionadas.
Impacto fuerte en minera.
G. Matheron en los 1950s y 60s
Primeras publicaciones detalladas sobre geoestadstica y kriging (acu n oeste termino en honor de Krige).
Lder de la llamada Escuela de Fontainbleau en Francia (en la Escuelade Minas).
14
-
7/24/2019 Estadistica Espacial
15/46
Geoestadstica y Estadstica Espacial
Geoestadstica Krige (1951) Matheron (1963)
Estadstica Espacial Kolmogorov (1941) Matern (1960) Whittle (1962) Bartlett (1964) Besag (1974)
Estamos hablando de lo mismo Watson (1972) Ripley (1981)
Cressie (1993)
15
-
7/24/2019 Estadistica Espacial
16/46
Kriging
16
-
7/24/2019 Estadistica Espacial
17/46
Predicci on con Error Cuadratico Mnimo
Sea T una variable aleatoria cuyo valor queremos predecir basandonos
en las realizaciones de y = ( y1 , , yn ) T . Sea T = t ( y) un predictorpuntual. El Error Cuadratico Medio de T se dene como:ECM( T ) = E[( T T )2 ]
Haciendo p = E( T |y), note que
ECM( T ) = E y E T ( T T ) 2 |y = E y E T ( T p + p T ) 2 |y = E y E T ( T p)2 |y + E y E T ( T p) 2 |y
= E y ( T p)2 + E y [ Var( T |y) ] E y [ Var( T |y) ]
El predictor con mnimo error cuadratico medio es
T = p = E( T |y) .A Var( T |y) se le llama Varianza de Predicci on .17
-
7/24/2019 Estadistica Espacial
18/46
Geoestadstica Basada en Modelos
Especicaci on del modelo:
Proceso estacionario gaussiano S ( x) , x R 2 :
i. E {S ( x ) } = .
ii. Cov S ( x ) , S ( x) =
2( || x x
|| ).
Observaciones independendientes, yi |S ( ) N ( S ( x i) , 2 ), condi-cionadas al proceso subyacente.
El modelo gaussiano implica que: yi = S ( x i) + ei con ei indepen-diente de S ( x i) y ei N (0 , 2 ).
18
-
7/24/2019 Estadistica Espacial
19/46
Predicci on con Error Cuadratico Mnimo
Tambien, el modelo gaussiano implica que:
y = ( y1 , , yn ) T N n ( 1 , 2 V )
donde V = R + ( 2 / 2 ) I y R ij = ( || x i x j || ).
Si deseamos efectuar una predicci on de T = S ( x) donde x esun sitio no muestreado, entonces el predictor con mnimo errorcuadratico medio es
T = p = E( T |y)para ello necesitamos la conjunta de y y T . Puede verse que T y N 1+ n
1 ,
2 1 r T
r V
donde r = ( r 1 , , r n ) T y r i = ( || x x i || ).19
-
7/24/2019 Estadistica Espacial
20/46
Recordar: Propiedades de Normal Multivariada
Si y N ( , ) y particionamos los diferentes vectores y matricescomo
y = y1y2, = 12
= 11 12 21 22
entonces, la distribuci on condicional de y1 | y2 , es Normal con
E( y1 | y2 ) = 1 + 12 122 ( y2 2 )Var( y1 | y2 ) = 11 12 122 21
20
-
7/24/2019 Estadistica Espacial
21/46
Predicci on con Error Cuadratico Mnimo
De las propiedades de la normal multivariada se tiene que el pre-dictor optimo (en el sentido de error cuadratico medio) es:
T = E( T |y) = + rT V 1 ( y 1)
y la varianza de predicci on es
Var( T |y) = 2 (1 r T V 1 r )
Kriging Simple : = y. Kriging Ordinario : = (1 T V 1 1) 1 1 T V 1 y.
21
-
7/24/2019 Estadistica Espacial
22/46
Predicci on Optima
T = E( T |y) = + rT
V 1
( y 1)En general, la estimaci on de no presenta gran dicultad, a un enpresencia de tendencias o covariables. Sin embargo, la parte real-mente crtica del predictor es la estimaci on de V . Los enfoquesasociados a su estimaci on dan lugar a dos escuelas en Geoes-tadstica:
Enfoque clasico : Estimar V usando el Variograma emprico.
Enfoque basado en modelos : Estimar V postulando modelosprobabilsticos especcos (comunmente el modelo normal) yusar las herramientas de inferencia usuales basadas en Verosimil-itud.
22
-
7/24/2019 Estadistica Espacial
23/46
Predicci on Optima
T = E( T |y) = + rT V 1 ( y 1)
Enfoque clasico : Kriging encontrar la combinaci on lineal de
las observaciones y1 , , yn que mejor prediga el valor de lasupercie en una localidad arbitraria x.
Enfoque basado en modelos : Kriging predicci on con mnimoerror cuadratico bajo supuestos de normalidad.
23
-
7/24/2019 Estadistica Espacial
24/46
Enfoque Clasico: Variogramas
24
-
7/24/2019 Estadistica Espacial
25/46
Variograma Te orico
El variograma de un proceso y( x ) es la funci on:
V ( x, x ) = 12 Var y( x ) y( x )
En el caso del modelo gaussiano, se tiene, con u = || x x ||
V ( u ) = 2 + 2 {1 ( u ) }
V ( u ) provee un resumen de los parametros basicos de la estructura
de un proceso espacial gaussiano.
En la practica, cuando el diseno muestral especica una sola ob-servaci on en cada sitio, el parametro 2 tiene una doble inter-pretaci on: Como la varianza del error de medici on o como la vari-abilidad espacial a una escala menor que la distancia mas peque na
entre puntos del dise no. Se le llama efecto Pepita (nugget) pueslos dep ositos de alto grado de mineral tienden a estar concentradosen venas.
25
-
7/24/2019 Estadistica Espacial
26/46
0 1 2 3 4 5
0 . 0
0 . 2
0 . 4
0 . 6
0 . 8
1 . 0
Variograma
u
V ( u )
meseta
rango emprico
pepita
26
-
7/24/2019 Estadistica Espacial
27/46
Variograma Emprico
La contraparte del variograma te orico
V ( x, x ) = 12
Var y( x ) y( x )
es el Variograma Emprico que consiste de la graca de puntos( u ij , vij ), donde
u ij = || x i x j || y vij = [ y( x i) y( x j ) ] 2 / 2
El variograma emprico suaviza la nube de puntos promediandosobre intervalos u h/ 2 uij < u + h/ 2.
En procesos con media no-constante (e.g. cuando inclumos co-variables), el variograma se calcula sobre residuales
r ( x i) = y( x i) ( x i)para obtener las vij s.27
-
7/24/2019 Estadistica Espacial
28/46
28
-
7/24/2019 Estadistica Espacial
29/46
Suiza: Datos de Lluvia (mm)
Este Oeste
S u r
N o r t e
[ 0 ,100)[100,200)[200,300)> 300
29
-
7/24/2019 Estadistica Espacial
30/46
0 50 100 150 200 250 300
0
5 0 0 0 0
1 0
0 0 0 0
Variograma: Datos de Precipitacin
u
V ( u
)
0 50 100 150 200 250 300
0
5 0 0 0
1 0 0 0 0
1 5 0 0 0
u
V ( u )
30
-
7/24/2019 Estadistica Espacial
31/46
Estimaci on de parametros en base al Variograma
Mediante el ajuste del variograma emprico al te orico se obtienenestimaciones de los parametros de la matriz de varianzas y covar-ianzas. Tpicamente se opta por un ajuste va mnimos cuadradosponderados:
W ( ) = k n k V k V ( u k ; ) 2donde es el vector de parametros de covarianza y V k es el prome-dio de nk valores del variograma vij .
31
-
7/24/2019 Estadistica Espacial
32/46
Estimaci on de parametros en base al Variograma
min W ( ) = k n k V k V ( uk ; )2
con V ( u ) = 2
+ 2
{1 ( u ) }
Modelos mas usados:
Exponencial : ( u ) = exp { ( u/ ) }, con 0 < 2.
Esferico : ( u ) = 1 3 / 2 ( u/ ) + 1 / 2 ( u/ ) 3 , 0 u .
Gaussiano : ( u ) = exp ( u/ ) 2 .
Matern : ( u ) = 2 1 ( ) 1
( u/ ) K ( u/ ) .
32
-
7/24/2019 Estadistica Espacial
33/46
Comentarios
La nube del variograma puede ser inestable, tanto a nivel pun-tual como en su forma global.
El efecto pepita ( 2 ) es difcil de estimar pues ocurre en unextremo de la regi on de distancias alrededor del origen.
Las ordenadas, vij , del variograma estan correlacionadas. Estopuede inducir un forma del variograma que es independientedel variograma te orico mismo.
El ajuste es sensible a la estimacion de la media (i.e. si seajusta una tendencia o no).
33
-
7/24/2019 Estadistica Espacial
34/46
Enfoque Basado en Modelos: Maxima Verosimilitud
34
-
7/24/2019 Estadistica Espacial
35/46
La familia de funciones de correlaci on de Matern
( u ) = 2 1 ( ) 1 ( u/ ) K ( u/ ) , > 0 , > 0
K ( ) : Funci on modicada de Bessel de orden .
( u ) = exp { ( u/ ) } corresponde a = 0 .5.
( u ) = exp { ( u/ ) 2 } corresponde a .
( u ) decrece conforme la distancia entre sitios, u, crece.
35
-
7/24/2019 Estadistica Espacial
36/46
0.0 0.2 0.4 0.6 0.8 1.0
0 . 0
0 . 2
0 . 4
0 . 6
0 . 8
1 . 0
Funciones de correlacin de Matrn
u
(
u )
= 0.5, = 0.25
= 1.5, = 0.16 = 2.5, = 0.13
36
-
7/24/2019 Estadistica Espacial
37/46
0 50 100 150 200
2
1
0
1
Procesos gaussianos unidimensionales subyacentes
Localidad
S ( x )
= 0.5, = 0.25 = 1.5, = 0.16
= 2.5, = 0.13
37
-
7/24/2019 Estadistica Espacial
38/46
Maxima Verosimilitud
Recordemos el modelo gaussiano: y N n ( 1 , 2 R + 2 I ), dondeR tiene elementos R ij = ( u ij ) y uij = || x i x j || .
Mas general, incluyendo covariables,
( x i) =
k
j =1 dk( x i) k = dT i
donde di = ( d1 ( x i) , , dk( x i)) T es un vector de covariables aso-ciado a la localidad i. Entonces el modelo gaussiano reformuladoes
y N n ( D,2
R + 2
I )
38
-
7/24/2019 Estadistica Espacial
39/46
Maxima Verosimilitud
La logverosimilitud asociada a y N n ( D, 2 R ( ) + 2 I ) es
l( , 2,
2, ) =
12 C + log |
2R ( ) +
2I | + ( y D )
T [
2R ( ) +
2I ]
1( y D )
Reparametrizando, 2 = 2 / 2 y haciendo V = R( ) + 2 I , te-nemos que, para V ja, el maximizador para esta dado por(mnimos cuadrados generalizados):
( V ) = ( D T V 1 D ) 1 D T V 1 y
y
2 ( V ) = ( y D )
T V 1 ( y D ) /nLa logverosimilitud perl para y 2 queda como:l( 2 , ) =
12 C + n log 2 ( V )+ log |V | + nla cual hay que maximizar numericamente con respecto a 2 y .
39
-
7/24/2019 Estadistica Espacial
40/46
0 50 100 150 200 250 300
0
5 0
1
0 0
1 5 0
2 0 0
2 5 0
Suiza: Precipitacin Media Predicha
Este Oeste
S u r
N o r t e
100 200 300 400
40
-
7/24/2019 Estadistica Espacial
41/46
0 50 100 150 200 250 300
0
5 0
1
0 0
1 5 0
2 0 0
2 5 0
Errores estndar de precipitacin media predicha
Este Oeste
S u r
N o r t e
20 40 60
41
-
7/24/2019 Estadistica Espacial
42/46
Predicci on de Funcionales No-Lineales
El predictor optimo no es invariante ante transformaciones no-lineales. Una forma de abordar el problema de predicci on es vasimulaci on. Por ejemplo, si queremos predecir la probabilidad deque en cierta localidad, x, ocurra un evento de precipitaci on queexceda el umbral de 200, entonces, T , la variable aleatoria deinteres puede considerarse como una variable Bernoulli con p =P[ y( x ) > 200]. Res umenes numericos apropiados de la simulacionrepetida de S ( x ) |y nos permiten efectuar esta predicci on.
42
-
7/24/2019 Estadistica Espacial
43/46
Dist. predictiva de excedencias a 200 mm
A200
F r e q u e n c y
0.36 0.38 0.40 0.42
0
5 0
1 0 0
1 5 0
43
-
7/24/2019 Estadistica Espacial
44/46
0 50 100 150 200 250 300
0
5 0
1
0 0
1 5 0
2 0 0
2 5 0
Probabilidad de exceder 200 mm
Este Oeste
S u r
N o r t e
0.2 0.4 0.6 0.8
44
-
7/24/2019 Estadistica Espacial
45/46
Comentarios Finales
La Geoestadstica (y, consecuentemente, la Estadstica Espacial) tienen ungran campo de aplicabilidad: Meteorologa, Hidrologa, Minera, Cienciasdel Suelo, Epidemiologa, Agronoma.
Las tecnicas estandar de interpolaci on no incorporan informaci on sobre laestructura de correlaci on espacial. La Estadstica Espacial s.
Tpicamente, las tecnicas de interpolaci on no proveen medidas de incer-tidumbre puntual en sus ajustes. Kriging s, lo cual permite evaluar labondad de las predicciones.
El balance se inclina hacia el uso de predicci on basada en modelos; sinembargo no son la panacea pues, por supuesto, son dependientes de lavalidez del modelo. Aunque hay herramientas para evaluar esa validez.Estimaci on basada en variogramas tiene la ventaja de ser distribution
free, lo cual es un punto a su favor en terminos de robustez.
45
-
7/24/2019 Estadistica Espacial
46/46
Bibliografa
1. Diggle, P.J. & Ribeiro, P.J. (2007). Model-based Geostatistics. Springer.
2. Cressie, N. (1993). Statistics for Spatial Data. Wiley.
3. R Development Core Team (2011). R : A language and environmentfor statistical computing. R Foundation for Statistical Computing, Vienna,Austria. ISBN 3-900051-07-0, URL http://www.R-project.org/.
4. Ribeiro, P.J. & Diggle, P.J. (2001). geoR: A package for geostatisticalanalysis. R-NEWS, Vol.1, No.2, 15-18. ISSN 1609-3631.
5. Tgersen, F.A. & Badsberg, J.H. (2003). Geostatistics and Spa-tial Modelling. http://gbi.agrsci.dk/statistics/courses/JBS-Geostatistics-2003/
46