Estad stica Area de Estad´ıstica e Investigaci´on Operativa · Distribucion tn de Student ......
Transcript of Estad stica Area de Estad´ıstica e Investigaci´on Operativa · Distribucion tn de Student ......
Estadıstica
Tema 3: Calculo de Probabilidades
Unidad 4: Algunas Distribuciones Notables
de Variables Aleatorias
Area de Estadıstica e Investigacion OperativaLicesio J. Rodrıguez-Aragon
Noviembre 2010
Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Variables Aleatorias Discretas 3
Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Distribucion de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6Distribucion Binomial con R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8Distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9Distribucion de Poisson con R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Variables Aleatorias Continuas 12
Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13Distribucion de Uniforme con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Distribucion Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15Distribucion de Exponencial con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16Distribucion Normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17Distribucion Normal con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Distribucion Normal Estandar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19Teorema Central del Lımite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Aproximaciones por la Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24Distribucion χ2
n de Pearson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26Distribucion tn de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Distribucion Fm,n de Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1
Contenidos
� Variables Aleatorias Discretas.
– Uniforme, Bernoulli, Binomial, Poisson.
� Variables Aleatorias Continuas.
– Uniforme, Exponencial, Normal, aproximaciones por la Normal, χ2 de Pearson, t deStudent y F de Snedecor.
Presentamos en este tema algunas Distribuciones de Variables Aleatorias, primero
discretas y luego contınuas, a continuacion presentaremos su Esperanza y Varianza.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 2 / 37
Variables Aleatorias Discretas 3 / 37
Distribucion Uniforme
Sea X una variable aleatoria que toma valores x1, x2, . . . , xk con igual probabilidad, entonces laFuncion de Probabilidad de esta Variable Aleatoria Uniforme viene dada por,
f(x; k) = 1/k para x = x1, x2, . . . , xk,
siendo k un parametro de la distribucion de probabilidad.
Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) = µ =k∑
i=1
xif(xi) =k∑
i=1
xi
k.
Var(X) = σ2 =
k∑
i=1
(xi − µ)2
k=
k∑
i=1
x2i
k−(
k∑
i=1
xi
k
)2
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 4 / 37
2
Distribucion de Bernoulli
Daniel Bernoulli (1700-1782). Se conoce como prueba de Bernoulli, todo experimento aleatorio enel que solo son posibles dos resultados, eg. “exito” o “fracaso”. Definamos X como la variablealeatoria que toma el valor 1 con probabilidad p, “exito”, y 0 con probabilidad 1 − p, “fracaso”.
La Funcion de Probabilidad de la Variable Aleatoria X vendra dada por,
f(x; p) = px · (1 − p)1−x , para x = 0, 1.
Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) = 0 · f(0) + 1 · f(1) = 0 · (1 − p) + 1 · p = p.
Var(X) = E(X2) − E(X)2 = (0 · f(0) + 1 · f(1)) − p2 = p − p2 = p(1 − p).
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 5 / 37
3
Distribucion Binomial
Supongamos que realizamos n experimentos de Bernoulli, con probabilidad de “exito” p para cadauno de ellos. Definamos la Variable Aleatoria X como el numero de exitos en esas n ejecucionesdel experimento.La Funcion de Probabilidad es la siguiente:
f(x;n, p) =
(
n
x
)
px(1 − p)n−x , para x = 0, 1, 2, . . . , n,
siendo n y p parametros de la distribucion de probabilidad.
Su Esperanza y Varianza vienen dadas por las expresiones,
E(X) = µ = E(X1 + · · · + Xn) = E(X1) + · · · + E(Xn) = np.
Var(X) = σ2 = Var(X1) + · · · + Var(Xn) = np(1 − p).
Con Xi variables aleatorias independientes de Bernoulli.
Las graficas de la Funcion de Probabilidad y la Funcion de Distribucion de una variable aleatoriaBinomial, de parametros n = 10, p = 0.3.
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
Distribución Binomial: n = 10, p = 0.3
Número de Exitos
Pro
babi
lidad
0 2 4 6 8 10
0.0
0.2
0.4
0.6
0.8
1.0
Distribución Binomial: n = 10, p = 0.3
Número de Exitos
Pro
babi
lidad
Acu
mul
ada
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 6 / 37
4
Distribucion Binomial
Variable Aleatoria Binomial de parametros n = 10, p = 0.6.
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
Distribución Binomial: n = 10, p = 0.3
Número de Exitos
Pro
babi
lidad
0 2 4 6 8 100.
00.
20.
40.
60.
81.
0
Distribución Binomial: n = 10, p = 0.6
Número de Exitos
Pro
babi
lidad
Acu
mul
ada
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 7 / 37
Distribucion Binomial con R
Funcion de Probabilidad:
> x <- 0:10
> plot(x, dbinom(x, size=10, prob=0.6), xlab="Numero de Exitos",
+ ylab="Probabilidad",
+ main="Distribucion Binomial: n = 10, p = 0.3", type="h")
> points(x, dbinom(x, size=10, prob=0.6), pch=16)
> abline(h=0, col="gray")
Funcion de Distribucion:
> x <- 0:10
> x <- rep(x, rep(2, length(x)))
> plot(x[-1], pbinom(x, size=10, prob=0.6)[-length(x)],
+ xlab="Numero de Exitos", ylab="Probabilidad Acumulada",
+ main="Distribucion Binomial: n = 10, p = 0.6", type="l")
> abline(h=0, col="gray")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 8 / 37
5
Distribucion de Poisson
Simeon Denis Poisson (1781-1840). Una Variable Aleatoria discreta X se dice que es una variablede Poisson si su funcion de probabilidad es de la forma:
f(x;λ) =λxe−λ
x!, para x = 0, 1, 2, . . . ,
siendo λ un parametro positivo.
Su Esperanza y Varianza vienen dadas por las expresiones,
E(X) = µ =∞∑
x=0
xf(x) =∞∑
x=0
xλxe−λ
x!= λe−λ
∞∑
x=0
λx−1
(x − 1)!= λ.
Var(X) = σ2 = E(X2) − E(X)2 = E(X(X − 1)) + µ − µ2 = µ = λ.
La distribucion de Poisson se presenta en experimentos en los que se estudia la ocurrencia desucesos en un intervalo de tiempo dado. Usualmente para sucesos “raros”, pi <<.
� El numero de vehıculos que pasan a traves de un cierto punto en una ruta durante unperiodo definido de tiempo.
� El numero de errores de ortografıa que uno comete al escribir una unica pagina.
� El numero de llamadas telefonicas en una central telefonica por minuto.
� El numero de servidores web accedidos por minuto.
� El numero de mutaciones de determinada cadena de ADN despues de cierta cantidad deradiacion.
Funcion de Probabilidad y de Distribucion,
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
Distribución Poisson: Media = 3
x
Pro
babi
lidad
0 2 4 6 8 10
0.2
0.4
0.6
0.8
1.0
Distribución Poisson: Media = 3
x
Pro
babi
lidad
Acu
mul
ada
λ = 3
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 9 / 37
6
Distribucion de Poisson
Funcion de Probabilidad y de Distribucion,
0 5 10 15
0.00
0.05
0.10
0.15
Distribución Poisson: Media = 6
x
Pro
babi
lidad
0 5 10 150.
00.
20.
40.
60.
81.
0
Distribución Poisson: Media = 6
x
Pro
babi
lidad
Acu
mul
ada
λ = 6
La distribucion de Poisson aproxima de forma muy acertada a la distribucion Binomial cuandon > 25 y p < .1 y np = λ < 5
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
Distribución Binomial: n = 30, p = 0.1
Número de Exitos
Pro
babi
lidad
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
Distribución Poisson: Media = 3
x
Pro
babi
lidad
f(x;n, p) =
(
n
x
)
px(1 − p)n−x → f(x;λ) =λxe−λ
x!
Para un proceso de Poisson, la probabilidad de obtener exactamente x exitos en n intentos vienedada por el lımite de la distribucion binomial.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 10 / 37
7
Distribucion de Poisson con R
Funcion de Probabilidad:
> x <- 0:15
> plot(x, dpois(x, lambda=6), xlab="x", ylab="Probabilidad",
+ main="Distribucion Poisson: Media = 6", type="h")
> points(x, dpois(x, lambda=6), pch=16)
> abline(h=0, col="gray")
Funcion de Distribucion:
> x <- 0:15
> x <- rep(x, rep(2, length(.x)))
> plot(x[-1], ppois(x, lambda=6)[-length(.x)], xlab="x",
+ ylab="Probabilidad Acumulada",
+ main="Distribucion Poisson: Media = 6", type="l")
> abline(h=0, col="gray")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 11 / 37
8
Variables Aleatorias Continuas 12 / 37
Distribucion Uniforme
Cuando el valor de la variable aleatoria se mide y no se cuenta, entramos dentro del concepto devariable aleatoria continua.
Una Variable Aleatoria sera Uniforme en el intervalo (a, b) si su Funcion de Densidad esconstante, es decir:
f(x) =
1b−a para a < x < b
0 en el resto.
Su Funcion de Distribucion, viene dada por:
F (x) =
∫ x
−∞
f(t)dt =
0 si x ≤ a,x−ab−a para a < x < b
1 si x ≥ b.
Siendo a y b los parametros de la distribucion.Su Esperanza y Varianza vienen dadas por las expresiones:
E(X) =
∫ ∞
−∞
xf(x)dx =
∫ b
axf(x)dx =
a + b
2.
Var(X) =
∫ ∞
−∞
(x − µ)2f(x)dx = E(X2) − E(X)2 =(b − a)2
12.
Las graficas de la Funcion de Densidad y de la Funcion de Distribucion para una VariableAleatoria Uniforme en (0, 1),
−0.5 0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
Distribución Uniforme: mín=0, máx=1
x
Den
sida
d
−0.5 0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
Uniform Distribution: min=0, max=1
x
Pro
babi
lidad
Acu
mul
ada
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 13 / 37
9
Distribucion de Uniforme con R
Funcion de Densidad:
> x <- seq(-.5, 1.5, length=100)
> plot(x, dunif(x, min=0, max=1), xlab="x", ylab="Densidad",
+ main="Distribucion Uniforme: mın=0, max=1", type="l")
> abline(h=0, col="gray")
Funcion de Distribucion:
> x <- seq(-0.5, 1.5, length=100)
> plot(x, punif(x, min=0, max=1), xlab="x",
+ ylab="Probabilidad Acumulada",
+ main="Uniform Distribution: min=0, max=1", type="l")
> abline(h=0, col="gray")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 14 / 37
10
Distribucion Exponencial
Una Variable Aleatoria X sigue una distribucion Exponencial si su Funcion de Densidad vienedada por,
f(x;λ) =
λe−λx para x ≥ 0 y λ > 0
0 en el resto.
Su funcion de Distribucion sera,
F (x) =
∫ x
0f(t)dt =
{
0 si x ≤ 0,1 − e−λx para x ≥ 0
Su Esperanza y Varianza vienen dadas por las expresiones,
E(X) = µ =
∫ ∞
0xf(x)dx =
1
λ.
Var(X) = σ2 = E(X2) − E(X)2 = 1/λ2.
La representacon grafica de las Funciones de Densidad y de Distribucion para una Variablealeatoria que siga una distribucion Exponencial de parametro λ = 5,
0.0 0.5 1.0 1.5
01
23
45
Distribución Exponencial: λ = 5
x
Den
sida
d
0.0 0.5 1.0 1.5
0.0
0.2
0.4
0.6
0.8
1.0
Distribución Exponencial: λ = 5
x
Pro
babi
lidad
Acu
mul
ada
La distribucion Exponencial modeliza el tiempo transcurrido entre dos sucesos “raros”consecutivos modelizados por la distribucion de Poisson.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 15 / 37
11
Distribucion de Exponencial con R
Funcion de Densidad:
> x <- seq(0, 1.52, length=100)
> plot(x, dexp(x, rate=5), xlab="x", ylab="Densidad",
+ main=expression(paste("Distribucion Exponencial: ",lambda," = 5")),
+ type="l")
> abline(h=0, col="gray")
Funcion de Distribucion:
> x <- seq(0, 1.52, length=100)
> plot(x, pexp(x, rate=5), xlab="x",
+ ylab="Probabilidad Acumulada",
+ main=expression(paste("Distribucion Exponencial: ",lambda," = 5")),
+ type="l")
> abline(h=0, col="gray")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 16 / 37
12
Distribucion Normal
Johann Carl Friedrich Gauss (1777-1855). La Distribucion Normal es clave en multitud defenomenos naturales. Sobre todo destacar la distribucion de errores de medida, que siguen unadistribucion Normal.
Una variable aleatoria X, se dice que sigue una distribucion Normal si su Funcion de Densidad esde la forma,
f(x;µ, σ) =1
σ√
2πexp
{
−(x − µ)2
2σ2
}
,
con −∞ < x < ∞ siendo µ y σ parametros de la distribucion.
En estadıstica esta distribucion se conoce como la “distribucion normal”. Mientras en otroscampos se conoce con el nombre de distribucion Gaussiana o Campana Gaussiana.
Representacion grafica de las funciones de densidad de diferentes N (µ, σ),
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Distribución Normal: µ =−1, 0, 1, σ =1
x
Den
sida
d
µ = −1
µ = 0
µ = 1
−3 −2 −1 0 1 2 3
0.0
0.2
0.4
0.6
0.8
Distribución Normal: µ = 0 , σ = 0.5, 1, 1.5
x
Den
sida
d
σ = 0.5
σ = 1
σ = 1.5
La Esperanza y la Varianza de una variable aleatoria X de distribucion N (µ, σ), sonrespectivamente,
E(X) =
∫ ∞
−∞
xf(x)dx =1
σ√
2π
∫ ∞
−∞
xe
{
−(x−µ)2
2σ2
}
dx =
z = (x − µ)/σ, dx = σdz
=1√2π
∫ ∞
−∞
(µ + σz)e−z2/2dz = µ
Var(X) = E((X − µ)2) =σ2
√2π
∫ ∞
−∞
z2e−z2/2dz =
u = z, dv = ze−z2/2dz
=σ2
√2π
(
[
−ze−z2/2]∞
−∞+
∫ ∞
−∞
e−z2/2dz
)
= σ2(0 + 1) = σ2
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 17 / 37
13
Distribucion Normal con R
Funcion de Densidad:
> x <- seq(-3.291, 3.291, length=100)
> plot(x, dnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Densidad",
+ main=expression(paste("Distribucion Normal: ", mu, " = 0 , ", sigma, " = 1")),
+ type="l")
> abline(h=0, col="gray")
Funcion de Distribucion:
> x <- seq(-3.291, 3.291, length=100)
> plot(x, pnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Probabilidad Acumulada",
+ main=expression(paste("Distribucion Normal: ", mu, " = 0 , ", sigma, " = 1")),
+ type="l")
> abline(h=0, col="gray")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 18 / 37
14
Distribucion Normal Estandar
La funcion de Distribucion de una N (µ, σ),
F (x) =1
σ√
2π
∫ x
−∞
exp
{
−(t − µ)2
2σ2
}
dt.
La transformacion Z = (X − µ)/σ nos proporciona valores de una distribucion normal de mediacero y varianza uno, N (0, 1).
−3 −2 −1 0 1 2 3
0.0
0.2
0.4
0.6
0.8
1.0
Distribución Normal: µ = 0, σ = 1
x
Pro
babi
lidad
Acu
mul
ada
Definimos entonces la Funcion de Distribucion de la Normal Estandarizada o Tipificada,
Φ(z) =1√2π
∫ z
−∞
exp
{
− t2
2
}
dt
Esta integral no puede calcularse por metodos ordinarios, debemos acudir a integracion numerica,esta funcion Φ se encuentra recogida en las Tablas de la Normal Tipificada.
De esta forma si X sigue una distribucion N (0, 1), para el calculo de P(a < X < b) podemoshacer uso de las tablas,
P(a < X < b) = Φ(b) − Φ(a).
La “distribucion normal estandar” se obtiene al tomar una distribucion normal con parametrosµ = 0 y σ2 = 1.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 19 / 37
15
Distribucion Normal Estandar
X ≡ N (0, 1), P(1 < X < 2) = Φ(2) − Φ(1)
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Φ(2)
x
Den
sida
d
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Φ(1)
x
Den
sity
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Φ(2)−Φ(1)
x
Den
sity
P(1 < X < 2) = Φ(2) − Φ(1)
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 20 / 37
16
Distribucion Normal Estandar
Si X sigue una distribucion Normal cualquiera, N (µ, σ), la P(a < X < b) puede calcularserealizando la transformacion, Z = (X − µ)/σ, es decir:
P(a < X < b) = P((a − µ)/σ < Z < (b − µ)/σ) =
= Φ((b − µ)/σ) − Φ((a − µ)/σ).
Una conclusion de la definicion de Φ es que,
Φ(−x) = 1 − Φ(x),
esta relacion es muy util ya que en la mayorıa de las tablas, Φ solo aparece tabulada para valorespositivos de x.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 21 / 37
17
Distribucion Normal Estandar
Vamos ahora a calcular,P(µ − kσ < X < µ + kσ),
para X ≡ N (µ, σ),
P(µ − kσ < X < µ + kσ) = P(−k < (X − µ)/σ < k) =
= Φ(k) − Φ(−k) = 2Φ(k) − 1,
que no depende ni de µ ni de σ.
P(µ − σ < X < µ + σ) = 2Φ(1) − 1 = 0.6826895P(µ − 2σ < X < µ + 2σ) = 2Φ(2) − 1 = 0.9544997P(µ − 3σ < X < µ + 3σ) = 2Φ(3) − 1 = 0.9973002
> 2*pnorm(1,mean=0,sd=1)-1
[1] 0.6826895
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 22 / 37
Teorema Central del Lımite
• Si X1,X2, . . . ,Xn son n variables aleatorias independientes yX = k1 · X1 + k2 · X2 + · · · + kn · Xn, entonces X es otra v.a. de media y varianza:
E(X) =∑
i
kiE(Xi) Var(X) =∑
i
k2i Var(Xi)
Si las Xi son normales, tambien lo sera X.
• Si las v.a. X1, . . . ,Xn, constituyen una muestra de una poblacion de media µ y varianza σ2 yX = 1
n
∑
Xi, es la media muestral:
E(X) =1
n
∑
i
E(Xi) = µ Var(X) =1
n2
∑
i
Var(Xi) =nσ2
n2=
σ2
n
Ademas se tendra que X ≡ N (µ, σ2/n), n > 30.
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 23 / 37
18
Aproximaciones por la Normal
Si X es una variable Binomial, de parametros n y p, entonces si n es grande y ni p ni 1 − p sonproximos a cero:podemos considerar que X sigue aproximadamente una distribucionN (µ = n · p, σ2 = n · p · (1 − p)).
Z =X − n · p
√
n · p · (1 − p)≡ N (0, 1).
25 30 35 40 45 50 55
0.00
0.02
0.04
0.06
0.08
Distribución Binomial: n = 100, p = 0.4
Número de Exitos
Pro
babi
lidad
25 30 35 40 45 50 55
0.00
0.02
0.04
0.06
0.08
Distribución Normal: µ = 40, σ = 4.8989
x
Den
sida
d
Si X es una distribucion de Poisson de parametro λ grande, λ > 25, en la practica se puedeconsiderar que X sigue una distribucion N (µ = λ, σ2 = λ).
Z =X − λ√
λ≡ N (0, 1).
20 30 40 50
0.00
0.01
0.02
0.03
0.04
0.05
0.06
Distribución de Poisson: λ = 36
x
Pro
babi
lidad
20 30 40 50
0.00
0.01
0.02
0.03
0.04
0.05
0.06
Distribución Normal: µ = 36, σ = 6
x
Den
sida
d
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 24 / 37
19
Aproximaciones por la Normal con R
Aproximacion de la Binomial por la Normal:
> x <- seq(24, 56, length=100)
> plot(x, dnorm(x, mean=40, sd=sqrt(24)), xlab="x", ylab="Densidad",
+ main=expression(paste("Distribucion Normal: ", mu, " = 40, ", sigma, " = 4.89")),
+ type="l")
> x <- 24:56
> points(x, dbinom(x, size=100, prob=0.4), col="red", pch=16)
Aproximacion de la distribucion de Poisson por la Normal:
> x <- seq(18, 57, length=100)
> plot(x, dnorm(x, mean=40, sd=sqrt(40)), xlab="x", ylab="Densidad",
+ main=expression(paste("Distribucion Normal: ", mu, " = 40, ", sigma, " = 6.32")),
+ type="l")
> x <- 18:57
> points(x, dpois(x, lambda=40), col="blue", pch=16)
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 25 / 37
20
Distribucion χ2n de Pearson
Karl Pearson (1857-1936). Sean X1,X2, . . . ,Xn, n variables aleatorias independientes entre sı, deltipo N (0, 1). La variable:
X = X21 + X2
2 + · · · + X2n,
se dice que es una χ2n, ji-cuadrado de Pearson con n grados de libertad.
La funcion de densidad de una variable aleatoria χ2n es:
f(x;n) =
xn/2−1e−x/2
2n/2·Γ(n/2)si x > 0
0 en el resto.
Siendo Γ la funcion gamma definida: Γ(α) =∫∞
0 xα−1e−xdx para α > 0. La Esperanza yVarianza de la distribucion χ2
n, son respectivamente,
E(X) = µ = n
Var(X) = σ2 = 2n
0 2 4 6 8 10 12
0.0
0.2
0.4
0.6
0.8
1.0
Distribución χ2 : n = 1,2,3,4,5
χ2
Den
sida
d
n = 1
n = 2n = 3
n = 4n = 5
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 26 / 37
21
Distribucion χ2n de Pearson
Propiedad: La suma de χ2n1
, χ2n2
, . . . , independientes, es otra χ2n siendo n = n1 + n2 + . . . .
La Funcion de Distribucion F (x) nos permite saber, dada una variable aleatoria X ≡ χ2n,
P(X < a) = p =
∫ a
0f(x;n)dx.
El calculo de esta integral se encuentra en la Tabla de distribucion χ2n de Pearson.
> qchisq(0.95,df=3)
[1] 7.814728
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 27 / 37
22
Distribucion χ2n de Pearson
Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de n y de p se puedebuscar en la tabla su cuantil a.
0 2 4 6 8 10
0.00
0.05
0.10
0.15
0.20
0.25
χ2 n=3, P(X<a)=p=F(a)
x
Den
sida
d
p
a
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 28 / 37
χ2n de Pearson con R
Distribucion χ2n de Pearson:
> x <- seq(0, 12.116, length=100)
> plot(x, dchisq(x, df=1), xlab=expression(chi^2), ylab="Densidad",
+ main=expression(paste("Distribucion ", chi^2," : n = 1,2,3,4,5")), type="l")
> abline(h=0, col="gray")
> abline(v=0, col="gray")
> text(1,1,"n = 1",col="black")
> lines(x, dchisq(x, df=2),col="blue")
> text(2,.34,"n = 2",col="blue")
> lines(x, dchisq(x, df=3),col="green")
> text(3,.31,"n = 3",col="green")
> lines(x, dchisq(x, df=4),col="red")
> text(4,.28,"n = 4",col="red")
> lines(x, dchisq(x, df=5),col="pink")
> text(5,.25,"n = 5",col="pink")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 29 / 37
23
Distribucion tn de Student
William Sealy Gosset (1876-1937). Sea Z una variable aleatoria N (0, 1) e Y una χ2n ambas
independientes, entonces la variable aleatoria,
X =Z
√
Y/n,
se denomina tn de Student con n grados de libertad.La funcion de densidad de una variable aleatoria tn es:
f(x;n) =
1√
nβ( 12, n2)
(
1 + x2
n
)−(n+1)/2para −∞ < x < ∞y n > 0
0 en el resto.
Siendo β la funcion beta definida: β(α1, α2) = Γ(α1)·Γ(α2)Γ(α1+α2) para α1, α2 > 0.
La Esperanza y Varianza de la distribucion tn, son:
E(X) = µ = 0, para n > 1, indefinida para otros valores.
Var(X) = σ2 =n
n − 2, para n > 2, indefinida para otros valores.
−3 −2 −1 0 1 2 3
0.0
0.1
0.2
0.3
0.4
Distribución t Student : n = 1,2,3,4
x
Den
sida
d
N(0,1)
n = 1
n = 2
n = 3
n = 4
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 30 / 37
24
Distribucion tn de Student
Propiedad: A medida que aumenta n, tn −→ N (0, 1).
La Funcion de Distribucion F (x) nos permite saber, dada una variable aleatoria X ≡ tn,
P(X < a) = p =
∫ a
−∞
f(x;n)dx.
El calculo de esta integral se encuentra en la Tabla de distribucion tn de Student.
> qt(0.975,df=5)
[1] 2.570582
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 31 / 37
25
Distribucion tn de Student
Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de n y de p se puedebuscar en la tabla su cuantil a.
−4 −2 0 2 4
0.0
0.1
0.2
0.3
t n=3, P(X<a)=p=F(a)
x
Den
sida
d
p
a
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 32 / 37
tn de Student con R
Distribucion tn de Student:
> x <- seq(-3.291, 3.291, length=100)
> plot(x, dnorm(x, mean=0, sd=1), xlab="x", ylab="Densidad",
+ main="Distribucion t Student : n = 1,2,3,4",, type="l")
> abline(h=0, col="gray")
> text(2,.38,"N(0,1)",col="black")
> lines(.x, dt(x, df=1),col="blue")
> text(2,.36,"n = 1",col="blue")
> lines(.x, dt(x, df=2),col="green")
> text(2,.34,"n = 2",col="green")
> lines(.x, dt(x, df=3),col="red")
> text(2,.32,"n = 3",col="red")
> lines(.x, dt(x, df=4),col="pink")
> text(2,.30,"n = 4",col="pink")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 33 / 37
26
Distribucion Fm,n de Snedecor
George Waddel Snedecor (1881-1974). Sean U y V dos variables independientes distribuidassegun leyes ji-cuadrado de m y n grados de libertad respectivamente, la variable X,
X =U/m
V/n,
se dice que es una variable Fm,n de Snedecor con m y n grados de libertad, en el numerador ydenominador respectivamente.La funcion de densidad viene dada por la expresion,
f(x;m,n) =
(m/n)m/2
β(m2
, n2) · xm/2−1
(1+ mn
x)(m+n)/2 para x > 0 y m,n > 0
0 en el resto.
La Esperanza y la Varianza de una distribucion Fm,n son:
E(X) = µ =n
n − 2, para n > 2, indefinida para otros valores.
Var(X) = σ2 =2n2(m + n − 2)
m(n − 2)2(n − 4), para n > 4, indefinida para otros valores.
0 2 4 6 8
0.0
0.5
1.0
1.5
2.0
Distribución F: m,n
f
Den
sida
d
m=1, n=1
m=2, n=1
m=5, n=2
m=100, n=1
m=100, n=100
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 34 / 37
27
Distribucion Fm,n de Snedecor
Propiedad: Si X ≡ Fm,n entonces 1X ≡ Fn,m.
La Funcion de Distribucon F (x) nos permite saber, dada una variable aleatoria X ≡ Fm,n,
P(X < a) = p =
∫ a
0f(x;m,n)dx.
El calculo de esta integral se encuentra en la Tabla de distribucion Fm,n de Snedecor.
> qf(0.95,df1=3,df2=4)
[1] 6.591382
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 35 / 37
28
Distribucion Fm,n de Snedecor
Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de m,n y de p sepuede buscar en la tabla su cuantil a.
0 1 2 3 4 5 6
0.0
0.1
0.2
0.3
0.4
0.5
F m=5,n=2, P(X<a)=p=F(a)
x
Den
sida
d
p
a
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 36 / 37
Fm,n de Snedecor con R
Distribucion Fm,n de Snedecor:
> x <- seq(0, 8, length=400)
> plot(x, df(x, df1=1, df2=1), xlab="f", ylab="Densidad",
+ main="Distribucion F: m,n", type="l")
> abline(h=0, col="gray")
> abline(v=0, col="gray")
> text(6,2,"m=1, n=1",col="black")
> lines(.x, df(x, df1=2, df2=1),col="blue")
> text(6,1.8,"m=2, n=1",col="blue")
> lines(.x, df(x, df1=5, df2=2),col="green")
> text(6,1.6,"m=5, n=2",col="green")
> lines(.x, df(x, df1=100, df2=1),col="red")
> text(6,1.4,"m=100, n=1",col="red")
> lines(.x, df(x, df1=100, df2=100),col="pink")
> text(6,1.2,"m=100, n=100",col="pink")
Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 37 / 37
29