ESTADISTICA PARA LA CALIBRACIÓN Y …depa.fquim.unam.mx/amyd/archivero/ESTADISTICARE... · No...

ESTADISTICA PARA LA CALIBRACIÓN Y VALIDACIÓN DE

METODOLOGÍAS ANALÍTICAS

QUÍMICA ANALÍTICA EXPERIMENTAL III

SILVIA CITLALLI GAMA GONZÁLEZ

PROBLEMA

Cuando la cantidad de materia del analito que se encuentra presente en la muestra es muy baja es prácticamente imposible cuantificarla

de forma directa, es por ello que se recurre a la medición de alguna propiedad relacionada con

ésta.

SOLUCIÓN DE PROBLEMA

● Tipo I. El experimentador controla una de las dos variables y los valores de la otra variable están asociados a una incertidumbre apreciable. En Química Analítica la precisión con que se conocen las concentraciones de los estándares suele ser mucho mejor que la precisión de las correspondientes señales instrumentales

● Tipo II. No existe control por parte de ninguna de las dos variables, por lo que pueden estar sujetas a incertidumbres del mismo orden. En Química Analítica se tiene este caso cuando se comparan los resultados obtenidos analizando las mismas muestras por dos métodos distintos. La precisión de un método puede ser algo mejor, pero raramente será despreciable frente a la precisión dada por el otro método.

Para lograr la predicción es estos casos se realiza la construcción de un modelo matemático denominado recta de regresión.

REGRESION LINEAL SIMPLE● Es un problema del tipo I.

● La variable controlada por el experimentador se constituye en independiente, x, y la otra en dependiente, y.

● Se construye a partir de un conjunto de n estándares con valores conocidos, (x

i, y

i).

● ŷ = bo + b

1x

● Y es la predicción de y, bo es la estimación de la intersección

poblacional y b1 la estimación de la pendiente poblacional. Se

denominan coeficientes de regresión.

● Para cada xi, la diferencia entre el valor real observado, y

i, y el valor

predicho, ŷi, es el residual o residuo, e

i: e

i = y

i - ŷ

i.

REGRESIÓN LINEAL SIMPLE

yy

xxXX

ii

yyii

ŷŷii

(x, y)(x, y)

REGRESIÓN LINEAL SIMPLE

● El problema de regresión es de tipo I, esto es, los errores aleatorios son despreciables en x y predominantes en y.

● La relación entre x e y es lineal en el intervalo considerado.

● Los residuos son homocedásticos, esto es, su varianza es independiente de x.

● La distribución de los residuos es normal y su media es cero.

b 21

s 2x≪s 2

y

Para poder usar éste modelo es necesario que los resultados cumplan las siguientes condiciones:

REGRESIÓN LINEAL SIMPLEVERIFICACION DE LA LINEALIDAD

● Debe evitarse verificar la linealidad en función del coeficiente de correlación, r, puesto que la interpretación de su valor es equívoca, y la conclusión puede ser incorrecta. La forma más simple y efectiva para verificar la linealidad es el análisis gráfico de los residuos.

● Cuando se dispone de bastantes puntos estos gráficos nos permiten estimar a la vez la presencia de puntos anómalos y puntos niveladores, la linealidad de la relación ŷ=f(x), y la homocedasticidad de los residuos.

● La ausencia de linealidad se desprende de la tendencia de los puntos centrales de la serie a situarse a un lado de las abscisas, mientras que los puntos cercanos a los extremos se sitúan al otro lado.

● Se observa una secuencia de aumento seguida de una disminución de los residuos, o al contrario.

● Orden no aleatorio.

● La heterocedasticidad se refleja en la mayor dispersión de los residuos en un extremo del eje de abscisas, en comparación con los residuos del otro extremo.


0 2 4 6 8 10 12 14 16 18 20

-10

-8

-6

-4

-2

0

2

4

6

8

10

x

eA

0 2 4 6 8 10 12 14 16 18 20

-10

-8

-6

-4

-2

0

2

4

6

8

10

x

eB

0 2 4 6 8 10 12 14 16 18 20

-10

-8

-6

-4

-2

0

2

4

6

8

10

x

eC

0 2 4 6 8 10 12 14 16 18 20

-10

-8

-6

-4

-2

0

2

4

6

8

10

x

eD


● Los puntos anómalos son los que no siguen la tendencia de los demás puntos, y se distinguen por tener residuos demasiado grandes en relación al resto de puntos.

● Los puntos niveladores son los que se encuentran muy lejos del centroide en la dirección en la que los puntos están correlacionados y tienen una gran influencia sobre los parámetros del modelo. Pueden afectar la regresión para bien o para mal.


1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

0

1

2

3

4

5

6

7

8

9

10

11

Punto anómalo nivelador

x

yC

1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6

0.51

1.52

2.53

3.54

4.55

5.56

6.57

7.58

Punto nivelador no anómalo

x

yB


0 1 2 3 4 5 6 7

0

1

2

3

4

5

6

7

Punto anómalo no nivelador

x

yA

● Además del ensayo gráfico, la homocedasticidad de los residuos puede ensayarse como sigue: se obtienen N réplicas de y a dos valores extremos de x, uno bajo y otro alto, se calculan las dos varianzas y se comparan mediante un ensayo F. Si las varianzas de y en dos puntos distantes de la recta son iguales, los residuos son homocedásticos.

● En caso de heterocedasticidad, la recta de regresión se puede obtener de dos formas: realizando una trasformación sobre x e y, o bien, ponderando los puntos experimentales, lo que se conoce como regresión ponderada.

REGRESIÓN LINEAL SIMPLEHOMOCEDASTICIDAD DE LOS RESIDUOS

REGRESIÓN LINEAL SIMPLENORMALIDAD DE LOS RESIDUOS

● Si existe homocedasticidad los residuos pueden tratarse conjuntamente. Esto es, provienen de una misma población.

– Comparación del histograma de frecuencias con la curva de distribución normal.

● Se ordenan los n datos de la serie de menor a mayor, se dividen en grupos por intervalos o canales, y se calcula la frecuencia dentro de cada intervalo.

● Se representa el histograma de frecuencias frente al valor de la variable.

● Se encuentran los descriptores muestrales y s.● Se representa la curva de gauss superponiéndola al

histograma.

– Diagrama de posiciones o Q-Q.

– Diagrama de proporciones acumuladas o P-P.

x

● Si no existe homocedasticidad, lo que obliga a tener en cuenta que los residuos obtenidos a distintos valores de x pertenecen a poblaciones con distintas dispersiones, por lo que no es posible tratarlos conjuntamente.

● En este caso una solución es obtener dos series de datos a dos valores de x, uno bajo y otro alto, y estudiar la normalidad de cada serie por separado.

REGRESIÓN LINEAL SIMPLENORMALIDAD DE LOS RESIDUOS

CALCULO DE INCERTIDUMBRESSOBRE LOS COEFICIENTES DE REGRESIÓN

● Si se cumplen satisfactoriamente las condiciones indicadas anteriormente se pueden utilizar expresiones sencillas para calcular:– Varianza de la ordenada en el origen

–

– Varianza de la pendiente

–

– donde– Estos datos son útiles para decidir si la recta se ajusta a unas especificaciones

predeterminadas.

s21=

s2e

n∑ (x i− x)2

s2e=∑ y i− y i

2

n−2

s 20=s 2

e∗

∑ x 2i

n∑ (x i− x)2

0=b0±ts0

1=b1±ts1

CALCULO DE INCERTIDUMBRESSOBRE LAS PREDICCIONES

● Cuando se hace uso de la recta de regresión obtenida con n puntos para predecir un valor x

I

a partir de la media de m réplicas o lecturas experimentals y

I, la varianza de la predicción

viene dada por:●

●

● Limites de confianza de xI

● El valor de t se lee sobre la tabla de dos lados paa (m + n - 3) grados de libertad.

s2I=

s2e

b21 [ 1

m

1n

y I−y2

b21∑ xi−x

2 ]x I±

ts I

√m

CALCULO DE INCERTIDUMBRESCONSECUENCIAS

● La varianza de las predicciones es proporcional a la varianza de los residuos, , esto es, aumenta con la dispersión de los datos en torno a la recta de ajuste.

● La desviación estándar de las predicciones, sI, es inversamente

proporcional a b1.

● Como la incertidumbre se calcula a partir de los datos , entonces dependerá de la distancia entre y

I y la señal que corresponde a posición del

centroide de la curva.

● Es habitual construir rectas de calibrado con seis puntos y analizar los problemas por triplicado, lo que implica adoptar los valores n = 6 y m = 3. El uso de triplicado asegura la detección y eliminación de valores anómalos, sin aumentar excesivamente el trabajo experimental. Se utiliza un número mayor de puntos (n > m) para hacer posible la validación del modelo, y también porque el modelo se construye una sola vez para ser utilizado con un elevado número de muestras problemas.

s2e

x y y

CALCULO DE INCERTIDUMBRESPOR TRATAMIENTO DE MUESTRA

● Debido a las diferentes etapas de su tratamiento la incertidumbre asociada ala media de muestras problema, s

p

2, es mayor que la incertidumbre de las

medidas realizadas con estándares, se

2.

●

● Si sp

2 >> se

2, el error de la predicción dependerá

exclusivamente de sp

2, de la pendiente de la recta y

del número de réplicas:

s2I=

1

b21 [

s 2pm

s2e 1

n

y i−y 2

b21∑ x i−x

2 ]

s2I=

s 2p

mb21

ADICIONES DE ESTÁNDAR

● Cuando la interacción del analito con el particular entorno químico-físico en el que se encuentra produce una exaltación o una inhibición de la sensibilidad, lo que se conoce como efecto matriz.– Preparar la serie de estándares imitando la

composición de la muestra.

– Preparar la recta de calibrado de forma que todos los estándares contengan muestra, y la contengan en la misma cantidad. Se aplica cuando la matriz es compleja y no puede ser imitada artificialmente.

ADICIONES ESTANDAR

● La calibración externa es más precisa que la interna porque en ésta última las predicciones se realizan por extrapolación, lo que conlleva un mayor error aleatorio. Por ello sólo se usa cuando no se consigue desarrollar y validar un método de calibración externa.

● El modelo de regresión es el mismo que en el método de calibración externa, sin embargo, las predicciones se realizan de otro modo

ADICIONES ESTANDAR

● La varianza de la predicción esta dada por:●

●

● Si hay homocedasticidad, los límites de confianza se calculan como :

sE2 =

se2

b12 [ 1

n+

y2

b12∑ (xi− x)2 ]

xE ± tsE

ESTADISTICA PARA LA CALIBRACIÓN Y …depa.fquim.unam.mx/amyd/archivero/ESTADISTICARE... · No...

Documents

Transcript of ESTADISTICA PARA LA CALIBRACIÓN Y …depa.fquim.unam.mx/amyd/archivero/ESTADISTICARE... · No...