Normal

Introducción a la Probabilidad Francisco Rodríguez Henríquez

Distribuciones de ProbabilidadNormal [Gaussiana]


Distribución Normal o Gaussiana

Una variable aleatoria X es llamada variable aleatoria normal(guassiana) si su pdf está dado por,

• La distribución gaussiana es la reina de las distribuciones. Eneste universo, la naturaleza se comporta gaussianamente.

• El teorema del límite central garantiza que cualquier otradistribución se comporta como una gaussiana cuando se hacenun número suficiente de experimentos: “la suma de muestrasindependientes para cualquier distribución con valor esperadoy varianzas finitos converge a la distribución normal conformeel tamaño de muestras tiende a infinito”.

• El primer uso de la distribución normal fue la de hacer unaaproximación continua a la distribución binomial.

( ) ( ) ( )222/

2

1 !µ

!"

##= x

X exf



Una variable aleatoria X es llamada variable aleatoria normal(guassiana) si su pdf está dado por,

• La distribución gaussiana es la reina de las distribuciones. Eneste universo, la naturaleza se comporta gaussianamente.

• "Everybody believes in the Normal frequency distribution: theexperimenters, because they think it can be proved bymathematics; and the mathematicians, because they believe ithas been established by observation" (Whittaker and Robinson1967, p. 179).

Whittaker, E. T. and Robinson, G. "Normal Frequency Distribution." Ch. 8 in TheCalculus of Observations: A Treatise on Numerical Mathematics, 4th ed.New York: Dover, pp. 164-208, 1967.

( ) ( ) ( )222/

2

1 !µ

!"

##= x

X exf


Distribución Normal: valor esperado

( ) ( ) ( )222/

2

1 !µ

!"

##= x

X exf

Una variable aleatoria X es llamada variable aleatoria normal(guassiana) si su pdf, representado como N(µX, σ2

X), está dadopor,

Con:Haciendo x = x-µ+µ, se tiene:

Substituyendo y=x-µ en la primera integral se obtiene:

( ) ( )!"

"#

##== )2/( 22

2

1 $µ

$%µ x

XxeXE

( ) ( ) ( ) ( ) ( ) ( ) ( )dxedxexxEx

xx

!!"

"#

##"

"#

## +#==2222

2/

2

2/

222

1 $µ$µ

%$

µµ

%$µ

( ) ( )!!"

"#

"

"#

# =+= µµ$%

$ dxxfdyyeXE X

y 222/

2

1


Distribución Normal: Varianza

( ) ( ) !""µ2

222/ =#

$

$%

%%dxe

x

Con:Pero, por definición:

Tomando la derivada con respecto a σ, se obtiene:

Y multiplicando ambos lados por se tiene que:

[ ] ( ) ( )!"

"#

###=#= )2/(222 22

2

1 $µµ$%

µ$ x

XXXexXE

( )( ) ( ) !"

µ

"

"µ

"µ

2)2/(

3

2)2/(22

22

=#

= $$ %

%#

##

%

%#

##

dxex

d

dxedx

x

!" 2/2

( ) ( ) ( ) )(2

1 222/2 22

XVardxexX

x ===!"#

#!

!! $$µ$%

$µ



• Se usa la notación N(µ; σ2) para denotar que la variable aleatoriaX es normal con promedio µ y varianza σ2.

• A una variable aleatoria normal Z con promedio cero y varianza1 se le llama variable aleatoria normal estándar:

• Suponga que X tiene distribución normal N(µ; σ2). La variablealeatoria estandariza se obtiene a partir de la distribución de X,substituyendo: Z = (X-µ)/σ.

( ) ( ) )1;0(2

1 2/2

Nexf x

X != "

#


Regla 68-95-99.7

( ) ( ) )1;0(2

1 2/2

Nexf x

X != "

#


Propiedades de la distribuciónnormal

1. Si X~N(µ,σ) y a, b son dos constantes reales arbitrarias,entonces: aX+b~N(aµ+b, (aσ)2)

2. Si X~N(µX,σX) y Y~N(µY,σY) son variables aleatoriasindependientes normalmente distribuidas, entonces:

a. La suma está distribuida normalmente, así que:U = X+Y ~N(µX+µY, σ2

X +σ2Y)

b. La resta está distribuida normalmente, así que:U = X-Y ~N(µX-µY, σ2

X +σ2Y)


Pruebas de normalidad

Las pruebas de normalidad determinas si un conjunto de datosexperimentales muestra similaridades con la distribuciónnormal. En la jerga usada comúnmente en estadística, lahipótesis nula supone que los datos están distribuidosnormalmente, mientras que un valor suficientemente pequeñode P indica datos no normales. Ejemplos de pruebas denormalidad son:• Kolmogorov-Smirnov test• Lilliefors test• Ryan-Joiner test• Shapiro-Wilk test• normal probability plot (rankit plot)


Ocurrencia de la distribución normal

• Las distribuciones normales ocurren aproximadamente enmuchas situaciones como consecuencia del teorema del límitecentral.

• El teorema del límite central puede aplicarse en datosexperimentales cuando hay razones para pensar que tales datosson resultado de un conjunto grande de pequeños efectos queactúan aditivamente e independientemente.

• Las pruebas enlistadas en la lámina anterior pruebanempíricamente si un conjunto de datos se comportannormalmente.


Ocurrencia de la distribución normal

• Si el conjunto de pequeños efectos actúa de manera

multiplicativa, entonces es el logaritmo de la variable de

interés la que se comporta normalmente [distribución

log-normal]

• Finalmente si existe una perturbación externa que afecta

de manera significativa el resultado experimental, la

hipótesis de comportamiento nulo [hipótesis nula] no se

justifica.


Ocurrencia de la distribución normalEn resumen, el comportamiento normal de una variable aleatoria

se presenta en las siguientes situaciones:• Problemas de eventos discretos• Problemas que involucran variables aleatorias binarias• Problemas que involucran variables aleatorias Poissonianas• Mediciones fisiológicas de especímenes biológicos, la luz de

un rayo láser, la distribución térmica de la luz en distanciaspequeñas están distribuidas normalmente.

• En variables financieras, en cambio, es el logaritmo de losíndices bursátiles el que se comporta normalmente.

• La vida útil de componentes no se comporta normalmente.


Tests de Inteligencia: IQ• Los tests de inteligecnia IQ han sido específicamente

diseñados para que manifiesten un comportamiento normal

• Es posible diseñar un test de inteligencia para que tenga unadistribución arbitraria

• Se afirma que en general, cualquier prueba que contenga unacantidad suficiente de preguntas distribuidas en un rangoamplio de grados de dificultad, en una variedad de tópicos yen la que se incluyen preguntas que tienen una fuertecorrelación con el resultado final de la prueba,inevitablemente mostraran una distribución normal.


Evaluación de probabilidadesnormales

( ) ( )!=""b

adxxfbXaP

• Recordemos que para cualquier variable aleatoria continua Xcon función de densidad f(x), la probabilidad que X ∈ [a, b] estádada por:

• Sin embargo, en el caso de la distribución normal, no es posibleevaluar la integral correspondiente usando una funcióntrascendente. Es por ello que se han definido una variedad defunciones que tabulan dicha área [por ejemplo: función erf,función Φ(z), etc].

• En Matlab utilizaremos:! "#

#=

xz dzexnormcdf 2/2

2

1)(

$


Función de distribuciónacumulada

( ) ( ) )1;0(2

1 2/2

Nexf x

X != "

#


Evaluación de probabilidadesnormales estandarizadas

( ) ( ) )1;0(2

1 2/2

Nexf x

X != "

#

• A una variable aleatoria normal Z con promedio cero y varianza1 se le llama variable aleatoria normal estándar:

Ejemplos: cuál es la probabilidad que una variable normalestandarizada se encuentre en los rangos:

1. P(-1≤X≤1) = normcdf(1)-normcdf(-1)= 0.6827

2. P(0≤ X ≤1.72) = normcdf(1.72)-normcdf(0)= 0.4573

3. P(4.5≤X) = 1


Evaluación de probabilidadesnormales arbitrarias

• Suponga que la variable aleatoria X tiene distribución normal N(µ, σ2). Se evalua la probabilidad P(a ≤ X ≤ b), tras substituir losvalores a, b en sus correspondientes unidades estandarizadas, asíque:

implica:

P(a ≤ X ≤ b) = P(z1 ≤ Z ≤ z2).

De la misma manera:

P(X ≤ a) = P(Z ≤ z) y P(X ≥ a) = P(Z ≥ z)

!

µ

!

µ "=

"=

bz

az

21;



Problema: Suponga que la altura de las mujeres mexicanas estánormalmente distribuida, con promedio µ = 160cm y desviaciónestándar σ = 7.5cm. Encuentre el porcentaje de mexicanas queestán:

a) Entre 153 y 168 centímetros

b) Aproximadamente 170 centímetros



Problema: Suponga que la altura de las mujeres mexicanas estánormalmente distribuida, con promedio µ = 160cm y desviaciónestándar σ = 7.5cm.

entonces z1 = (153-160)/7.5=-0.93 y z2 = (168-160)/7.5=1.07

De aquí que:

P(153≤X≤168) = normcdf(-0.93)-normcdf(1.07)= 0.6815

Asuma que las alturas son redondeadas al centímetro más cercano,

entonces z1 = (169.5-160)/7.5=1.27 y z2 = (170.5-160)/7.5=1.4

De aquí que:

P(169.5≤X≤170.5) = normcdf(1.4)-normcdf(1.27)= 0.0213


Aproximación de distribuciónbinomial con distribución Gaussiana


Distribución Binomial aproximada pordistribución normal

( ) ( ) ( ) nkppk

nkXPkp

knk

X ,,1,0 1 K=!""#

$%%&

'===

!

Una variable aleatoria X es llamada variable aleatoria binomialcon parámetros b(n, p) si,

• Para np≥5 y nq≥5, el histograma de probabilidad para b(n,p) es casi simétrico alrededor de µ = np en el intervalo [µ-3σ, µ-3σ], donde, y fuera de este intervalo P(k) ≈ 0.

• Para cualquier valor entero de k entre [µ-3σ, µ-3σ], el áreabajo la curva normal es aproximadamente igual a b(n, p).

• Es decir: b(n, p) ≈ N(np, npq);

npq=!


Binaria asintótica= Gaussiana


Cálculo de probabilidades binomialescon aproximación normal

Problema: Se lanzan 100 volados con una moneda correcta.Encuentre la probabilidad que ocurran exactamente 60 águilas.

En Matlab, este problema se resuelve utilizando:

binocdf(61,100,0.5)-binocdf(59,100,0.5) = 0.0180

Pregunta: ¿Cuál es la predicción de la aproximación normal?

( ) ( ) 0108.05.05.060

100)5.0,60,100(

4060=!!

"

#$$%

&==== pknb



Problema: Se lanzan 100 volados con una moneda correcta.Encuentre la probabilidad que ocurran exactamente 60 águilas.

Note que: µ = np = 100(0.5) =50, σ2 = npq = 100(0.5)(0.5) = 25, porlo que σ = 5. Se usa entonces la distribución normal paraaproximar la probabilidad binomial como sigue:

b(100, 60, 0.5) ≈ N(59.5 ≤ X ≤ 60.5). Tras transformar, a = 59.5,

b = 60.5 en unidades estándar se obtiene:

z1 = (59.5-50)/5=1.9 y z2 = (60.5-50)/5=2.1. De aquí que:




Problema: Se lanzan 100 volados con una moneda correcta.Encuentre la probabilidad que ocurran entre 48 y 53 águilas.


b(47≤ k ≤ 53) ≈ N(47.5 ≤ X ≤ 53.5). Tras transformar, a = 47.5,


z1 = (47.5-50)/5=-0.5 y z2 = (53.5-50)/5=0.7. De aquí que:

P(59.5≤X≤60.5) = normcdf(0.7)-normcdf(-0.5)= 0.4495



Problema: Se lanzan 100 volados con una moneda correcta.Encuentre la probabilidad que ocurran menos de 45 águilas.


b(k≤ 45) ≈ N( X ≤ 44.5). Tras transformar, a = 44.5, en unidadesestándar se obtiene:

z1 = (44.5-50)/5=-1.1. De aquí que:

P(X≤44.5) = normcdf(-1.1) = 0.1357



Problema: Un dado es tirado 180 veces. Encuentre la probabilidadque un 6 ocurra:

a) Entre 29 y 32 veces;

b) Entre31 y 35 veces;

c) menos de 22 veces;



Problema: Un dado es tirado 180 veces. Encuentre la probabilidadque un 6 ocurra: (a) Entre 29 y 32 veces;

µ = np = 180(1/6) =30, σ2 = npq = 180(1/6)(5/6) = 25, por lo que σ= 5. Se usa entonces la distribución normal para aproximar laprobabilidad binomial como sigue:

b(29 ≤ k ≤ 32) ≈ N(28.5 ≤ X ≤ 33.5). Tras transformar, a = 28.5,


z1 = (28.5-30)/5=-0.3 y z2 = (33.5-30)/5=0.5. De aquí que:

P(28.5≤X≤33.5) = normcdf(0.5)-normcdf(-0.3)= 0.3094



Problema: Un dado es tirado 180 veces. Encuentre la probabilidadque un 6 ocurra: (a) Entre 31 y 35 veces;

µ = np = 180(1/6) =30, σ2 = npq = 180(1/6)(5/6) = 25, por lo que σ= 5. Se usa entonces la distribución normal para aproximar laprobabilidad binomial como sigue:

b(31 ≤ k ≤ 35) ≈ N(30.5 ≤ X ≤ 35.5). Tras transformar, a = 30.5,


z1 = (30.5-30)/5=0.1 y z2 = (35.5-30)/5=1.1. De aquí que:




Problema: Suponga que el 4% de la población de la tercera edadtiene Alzheimer. Suponga que se toma una muestra aleatoria de3500 ancianos. Encuentre la probabilidad que al menos 150 deellos tengan la enfermedad.



Problema: Suponga que el 4% de la población de la tercera edadtiene Alzheimer. Suponga que se toma una muestra aleatoria de3500 ancianos. Encuentre la probabilidad que al menos 150 deellos tengan la enfermedad.

µ = np = 3500(0.04) =140, σ2 = npq = 3500(0.04)(0.96) = 134.4, porlo que σ = 11.6. Se usa entonces la distribución normal paraaproximar la probabilidad binomial como sigue:

b(k ≤ 150) ≈ N(X ≤ 149.5). Tras transformar, a = 149.5, en unidadesestándar se obtiene: z1 = (149.5-140)/5= 0.82 De aquí que:

P(X≤149.5) = normcdf(0.82) = 0.7939


Generación de variable normal


function [gauss] = mirandn(N);for i=1:2:N rsq = 2; while(rsq>=1 || rsq==0) v1=2*rand(1)-1; v2=2*rand(1)-1; rsq=v1^2+v2^2; end fac = sqrt(-2*log10(rsq)/rsq)*v1; gauss(i)=fac; gauss(i+1)=fac*v2;endgauss = gauss(1:N);

Generación de distribución normal:mirandn

Fuente: Numerical recipes in C:http://www.library.cornell.edu/nr/bookcpdf.html


Histograma de minormal


Canal Gaussiano


Transmitiendo información digital


Canal contaminado con ruidoGaussiano


Canal contaminado con ruidoGaussiano: Análisis


Pregunta: ¿Cuál es la probabilidad que un ruido Gaussiano N(µ, σ)provoque errores en la recepción de los bits transmitidos?

Ocurrirán errores en la lectura de los bits, siempre que:P(Error) = P(señal+ruido<0|1transmitido)+P(señal+ruido<0|-1 transmitido)

Suponga que la distancia |1|=kσ±µ, donde k es una constante real.

Entonces, transformando a normal estandarizada y aprovechandosimetría se tiene que: z2 = (a- µ)/σ = (kσ+µ - µ)/σ=k.

De aquí que:

P(Error) = P(señal+ruido≥k) =1-normcdf(k).

Canal contaminado con ruidoGaussiano: Análisis


Razón señal a ruido

ruido

señal

P

PSNR =

La razón señal a ruido (SNR por sus siglas en inglés), indica la razónde la potencia de la señal con respecto al ruido de fondo:

Debido a que la inmensa mayoría de las señales tienen un ampliorango dinámico, el SNR se expresa típicamente en términos deuna escala logarítmica en decibelios. En decibelios, el SNR es10 veces el logaritmo base 10 de la razón de la potencia de laseñal y el ruido:

Lo que implica que:

!!"

#$$%

&=

ruido

señal

P

PSNR 10log10

10/10

SNR

señalruidoPP

!"=


function [err, bits] = gauss_channel(N, snr_ar);% This M-Function sends N random binary bits using a coherently detected% pi/4 DQPSK system.% The channel is modelled as an Additive White Gaussian Noise (AWGN) channel,% and the function produces a semilog BER vs Eb/No plot, where both,% the theoretical and the simulated results are compared.

% N is the number of samples to be simulated.% pg is the processing gain.% snr_ar is an array containing the different values of SNR (Eb/No)% to be simulated.% The function TX returns an error vector containing the corresponding BERs% for the given snr_ar values.

% Written by Francisco Rodri'guez-Henri'quez may 98..

Canal contaminado con ruidoGaussiano: Modelo


Canal contaminado con ruidoGaussiano: Simulación


Teorema de límite central


Teorema del límite Central

n

X

n

nXXZ

nn

n

/

1

!

µ

!

µ "=

"++=

L

Acaso el teorema del límite central sea el resultado más famoso, elmás celebrado de la teoría de la probabilidad. En su formamás simple, puede ser formulado como sigue:

“Sea X1,…,Xn una secuencia de variables aleatoriasindependientes, idénticamente distribuidas, cada una conpromedio µ y varianza σ2. Defina entonces

Donde,

Entonces

”

( )n

n

i

inXX

nX

nX ++== !

=

L1

1

11

( )1;0Nlímn

=!"


Teorema del límite Central:ejemplo

n

X

n

nXXZ

nn

n

/

1

!

µ

!

µ "=

"++=

L

“Sea X1,…,Xn una secuencia de variables aleatoriasindependientes, idénticamente distribuidas, cada una conpromedio µ y varianza σ2. Defina entonces

Note que E[Zn] = 0, Var[Zn] = 1.

Se desea calcular P(a≤Zn≤b) usando el TLC, ¡Pero Zn es unavariable aleatoria normal estandarizada!.

La función TLC.m dibuja las gráficas mostradas a continuación.

( )n

n

i

inXX

nX

nX ++== !

=

L1

1

11


Teorema del límite Central:ejemplo


Distribución Normal Conjunta



( )!"

!#$

!%

!&'

(()

*++,

- .+(()

*++,

- .(()

*++,

- ..((

)

*++,

- .

.=

22

22

1

1,

Y

Y

Y

Y

X

X

X

X yyxxyxQ

/

µ

/

µ

/

µ0

/

µ

0

• Sean σX, µX, σY, µY y ρ, constantes reales tales que, σX>0, σY>0y, -1< ρ <1. Para variables reales, x, y, definimos:

• Se define la distribución normal conjunta (o normal bi-variable)para variables aleatorias X, Y es definida por la función dedensidad:

( )!<<"!#

"=$

"

yxeyxQ

YX

YX ,,12

1 ,2

1

2,

%&'&



( )!<<"!#

"=$

"

yxeyxQ

YX

YX ,,12

1 ,2

1

2,

%&'&

• Se define la distribución normal conjunta (o normal bi-variable)para variables aleatorias X, Y es definida por la función dedensidad:

• Los parámetros son: E[X] = µX, E[Y] = µY, Var[X] = σ2X,

Var[Y] = σ2Y, y Cov[X, Y] = E[(X-µX)(Y- µY)]=ρσXσY.

• El parámetro sin dimensiones ρ es conocido como el coeficientede correlación. Si ρ es positivo (negativo) la correlación entre lasvariables X, Y es también positivo (negativo). Si ρ = 0, entonceslas variables X, Y son independientes. La función jointnorm.mproduce las imágenes mostradas en las siguientes láminas

Normal

Documents

Transcript of Normal