MBATPg3 201408 AnalisisDatos S06 ProbabilidadBasica
-
Upload
carlos-valenzuela-ramirez -
Category
Documents
-
view
22 -
download
4
description
Transcript of MBATPg3 201408 AnalisisDatos S06 ProbabilidadBasica
1 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
CURSO: Análisis de Datos para la Gerencia
José Antonio Robles Flores
Sistemas de Información y Métodos Cuantitativos
ESAN Graduate School of Business
Lima - Peru
Basado en: Levine; Krehbiel & Berenson 2014.
Estadística para Administración 6ta Edición.
Pearson.
2 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
CURSO: Análisis de Datos para la Gerencia
SESION 06: Introducción a la Probabilidad:
Conceptos básicos
(Capítulo 04)
Basado en: Levine; Krehbiel & Berenson 2014. Estadística para
Administración 6ta Edición. Pearson.
3 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Objetivos de esta sesión
• Los conceptos y definiciones básicos de
probabilidad
• Probabilidad condicional
• Uso del Teorema de Bayes
• Reglas de conteo
4 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Conceptos Básicos de Probabilidad
• Probabilidad – la posibilidad de que un evento
incierto ocurrirá (siempre entre 0 y 1)
• Evento Imposible – un evento que no tiene ninguna
posibilidad de ocurrir (probabilidad = 0)
• Evento Cierto – un evento que ocurrirá con toda
seguridad (probabilidad = 1)
5 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Evaluando la Probabilidad
• Hay tres aproximaciones para evaluar la probabilidad de un evento incierto:
1. probabilidad clásica a priori
2. probabilidad clásica empírica
3. probabilidad subjetiva
sobre la base de una combinación de la experiencia de una persona, la opinión personal y el análisis particular de la situación
posibles resultados de totalnúmero
ocurre evento el que lasen formasdenúmero
T
Xocurrenciadeadprobabilid
observados resultados de totalnúmero
evento del observadas formas de númeroocurrencia de adprobabilid
Asumiendo
que todos los
resultados
son
igualmente
posibles Probabilidad de ocurrencia
Probabilidad de ocurrencia
6 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Ejemplo de una probabilidad a priori
• Cuando se selecciona aleatoriamente un día del
año 2012, ¿cuál es la probabilidad de que el día sea
uno de Enero?
2012en dias de totalnúmero
Eneroen días de número Eneroen Día de adProbabilid
T
X
366
31
2012en días 366
Eneroen días 31
T
X
7 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Ejemplo de una probabilidad empírica
• Encuentre la probabilidad de seleccionar un hombre
que esté tomando el curso de análisis de datos de
una población descrita en la siguiente tabla:
Tomando
An. Datos
No Tomando
An. Datos
Total
Hombre 84 145 229
Mujer 76 134 210
Total 160 279 439
191.0439
84
personas de totalnúmero
Datos An. tomandohombre númeroProbabilidad hombre An. Datos
8 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Cada posible resultado de una variable es un evento.
• Evento simple
– Un evento que se describe por una sola característica
– e.g., Un naipe rojo de una baraja de cartas
• Evento conjunto
– Un evento que se describe por dos o más características
– e.g., Un as rojo de una baraja de cartas
• Complemento de un evento A (representado por A’)
– Todos los resultados que no son parte del evento A
– e.g., Todas los naipes que no son diamantes
Eventos
9 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
El Espacio Muestral es el conjunto de todos los
eventos posibles
Ej.: Las 6 caras de un dado:
Ej.: Los 52 naipes de un juego de cartas:
Espacio Muestral
10 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Visualizando Eventos
• Tablas de Contingencias – Para todos los días en 2012
• Árbol de Decisión
No Mierc 27 287 314
Miérc 4 48 52
Total 31 335 366
Ene No Ene Total
Todos los días en 2012
Espacio
Muestral
Número
total de
resultados
en el
Espacio
Muestral
4
27
48
287
11 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Definición: Probabilidad Simple
• La Probabilidad Simple se refiere a la probabilidad
de un evento simple.
– Ej: P(Ene)
– Ej: P(Mierc)
No Mierc 27 287 314
Miérc 4 48 52
Total 31 335 366
Ene No Ene Total
P(Ene.) = 31 / 366
P(Mierc.) = 52 / 366
12 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Definición: Probabilidad Conjunta
• La Probabilidad Conjunta se refiere a la probabilidad de
ocurrencia de dos o más eventos (evento conjunto).
– Ej: P(Ene. Y Mierc.)
– Ej: P(No Ene. Y No Mierc.)
No Mierc 27 287 314
Miérc 4 48 52
Total 31 335 366
Ene No Ene Total
P(Jan. and Wed.) = 4 / 366
P(Not Jan. and Not Wed.)
= 287 / 366
13 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Eventos Mutuamente Excluyentes
• Eventos que no pueden ocurrir en simultáneo
Ejemplo: Elegir aleatoriamente un día de 2012
A = día en Enero; B = día en Febrero
– Eventos A y B son mutuamente excluyentes
14 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Eventos Colectivamente Exhaustivos
• Eventos colectivamente exhaustivos
– Uno de los eventos debe ocurrir
– El conjunto de eventos cubre todo el espacio muestral
Ejemplo: Elegir aleatoriamente un día de 2012
A = Día de semana; B = Fin de semana
C = Enero; D = Primavera
– Los eventos A, B, C y D son colectivamente exhaustivos
(pero no mutuamente excluyentes – un día de semana
puede ser en Enero o en Primavera)
– Los eventos A y B son colectivamente exhaustivos y
también mutuamente excluyentes
15 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• La probabilidad de un evento conjunto, A y B:
• Computando una probabilidad marginal (o simple) :
• Donde B1, B2, …, Bk son k eventos mutuamente excluyentes y
colectivamente exhaustivos
básicos resultadosde totalnúmero
ByA satisfacen que resultadosdenúmeroB)yP(A
)ByP(A)ByP(A)ByP(AP(A) k21
Computando Probabilidades Conjunta y Marginal
16 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
P (Enero y Miércoles)
No Ene Enero Total
Mierc 4 48 52
No-Mierc 27 287 314
Total 31 335 366
366
4
2012en días de totalnúmero
Mierc.y Ene.en días de número
Ejemplo de Probabilidad Conjunta
17 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
P(Mierc)
No Ene Ene Total
Mierc 4 48 52
No-Mierc 27 287 314
Total 31 335 366
366
52
366
48
366
4Ene) Noy P(MiercEne)y P(Mierc
Ejemplo de Probabilidad Marginal
18 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
P(A1 y B2) P(A1)
Total Evento
P(A2 y B1)
P(A1 y B1)
Evento
Total 1
Probabilidad Conjunta Probabilidad Marginal (Simple)
A1
A2
B1 B2
P(B1) P(B2)
P(A2 y B2) P(A2)
Probabilidades Marginal y Conjunta utilizando
Tablas de Contingencia
19 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Probabilidad es la medida numérica de
la posibilidad de que un evento ocurra
• La probabilidad de un evento debe estar
entre 0 y 1, inclusive
• La suma de las probabilidades de todos
los eventos mutuamente excluyentes y
colectivamente exhaustivos es 1
Certeza
Imposible
0.5
1
0
0 ≤ P(A) ≤ 1 Para cualquier evento A
1P(C)P(B)P(A)
Si A, B, y C son mutuamente excluyentes y
colectivamente exhaustivos
Probabilidad
20 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
P(A o B) = P(A) + P(B) - P(A y B)
Regla General de la Adición:
Si A y B son mutuamente excluyentes, entonces
P(A y B) = 0, por lo que la regla se puede
simplificar:
P(A o B) = P(A) + P(B)
Para eventos mutuamente excluyentes A y B
Regla General de la Adición
21 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
P(Rojo o As) = P(Rojo) +P(As) - P(Rojo y As)
= 26/52 + 4/52 - 2/52 = 28/52 No contar los
dos ases rojos
repetidamente! Negro
Color Tipo Rojo Total
As 2 2 4
No-As 24 24 48
Total 26 26 52
Ejemplo de la Regla General de la Adición
22 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Una probabilidad condicional es la probabilidad
de un evento, dado que otro evento ha ocurrido:
P(B)
B)yP(AB)|P(A
P(A)
B)yP(AA)|P(B
Donde P(A y B) = probabilidad conjunta de A y B
P(A) = probabilidad marginal o simple de A
P(B) = probabilidad marginal o simple de B
La probabilidad
condicional de A dado
que B ha ocurrido
La probabilidad
condicional de B dado
que A ha ocurrido
Computando la Probabilidad Condicional
23 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• ¿Cuál es la probabilidad de que un auto tenga un GPS dado que tiene AC?
i.e., queremos hallar P(GPS | AC)
• En un lote de autos usados, 90% tienen aire acondicionado (AC) y 40% tienen un GPS. 35% de los autos tienen ambos.
Ejemplo de Probabilidad Condicional
24 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
No GPS GPS Total
AC 0.35 0.55 0.90
No AC 0.05 0.05 0.10
Total 0.40 0.60 1.00
• En un lote de autos usados, 90% tienen aire acondicionado (AC) y 40% tienen un GPS.
35% de los autos tienen ambos.
0.38890.90
0.35
P(AC)
AC)yP(GPSAC)|P(GPS
Ejemplo de Probabilidad Condicional (continuación)
25 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Dado AC, sólo consideramos la fila superior (90% de los autos). De éstos, 35% tienen GPS. 35% de 90% es aprox. 38.89%.
Ejemplo de Probabilidad Condicional (continuación)
No GPS GPS Total
AC 0.35 0.55 0.90
No AC 0.05 0.05 0.10
Total 0.40 0.60 1.00
0.38890.90
0.35
P(AC)
AC)yP(GPSAC)|P(GPS
26 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Utilizando Árboles de Decisión
P(AC y GPS) = 0.35
P(AC y GPS’) = 0.55
P(AC’ y GPS’) = 0.05
P(AC’ y GPS) = 0.05
90.
55.
10.
05.
10.
05.
Todos
los
Autos
90.
35.
Dado AC o
no AC:
Probabilidades
Condicionales
27 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Utilizando Árboles de Decisión
P(AC y GPS) = 0.35
P(AC y GPS’) = 0.55
P(AC’ y GPS’) = 0.05
P(AC’ y GPS) = 0.05
90.
55.
10.
05.
10.
05.
Todos
los
Autos
90.
35.
Dado AC o
no AC:
Probabilidades
Condicionales
28 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
P(CD y AC) = 0.35
P(CD y AC’) = 0.05
P(CD’ y AC’) = 0.05
P(CD’ y AC) = 0.55
Dado GPS o
no GPS:
Todos
los
Autos
Utilizando Árboles de Decisión (continuación)
40.
05.
60.
55.
60.
05.
40.
35.
29 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Independencia Estadística
• Dos eventos son independientes si y
sólo si:
• Los eventos A y B son independientes cuando la
probabilidad de un evento no está afectada por el
otro evento
P(A)B)|P(A
30 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Regla de Multiplicación para dos eventos A y B:
P(B)B)|P(AB)yP(A
P(A)B)|P(A Nota: Si A y B son independientes, entonces
y la regla de multiplicación se simplifica a
P(B)P(A)B)yP(A
Reglas de Multiplicación
31 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Probabilidad Marginal
• La probabilidad marginal para el evento A:
– Donde B1, B2, …, Bk son k eventos mutuamente excluyentes y colectivamente exhaustivos
)P(B)B|P(A)P(B)B|P(A)P(B)B|P(A P(A) kk2211
32 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Teorema de Bayes
• El Teorema de Bayes se utiliza para revisar
probabilidades calculadas previamente cuando hay
información adicional
• Fue desarrollado por Thomas Bayes en el Siglo 18
• Es una extensión de la probabilidad condicional
33 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Teorema de Bayes
• donde:
Bi = iésimo evento de k eventos mutuamente
excluyentes y colectivamente exhaustivos
A = nuevo evento que puede tener impacto en P(Bi)
))P(BB|P(A))P(BB|P(A))P(BB|P(A
))P(BB|P(AA)|P(B
k k 2 2 1 1
i i i
El teorema de Bayes se utiliza para revisar
probabilidades previamente calculadas después de
obtener nueva información
34 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Ejemplo del Teorema de Bayes
• Una compañía de perforación ha estimado un 40% de
posibilidad de obtener petróleo para su nuevo pozo.
• Una prueba detallada se ha programado para obtener
mayor información. Históricamente, 60% de los pozos
exitosos han tenido pruebas detalladas, y 20% de los
pozos no exitosos han tenido pruebas detalladas.
• Dado que este pozo ha sido programado para la
prueba detallada, ¿cuál es la probabilidad
de que el pozo será exitoso?
35 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Sea S = pozo exitoso
U = pozo no exitoso
• P(S) = 0.4 , P(U) = 0.6 (probabilidades previas)
• Definir el evento de prueba detallada como D
• Probabilidades Condicionales:
P(D|S) = 0.6 P(D|U) = 0.2
• La meta es encontrar P(S|D)
Ejemplo del Teorema de Bayes (continuación)
36 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
0.6670.120.24
0.24
(0.2)(0.6)(0.6)(0.4)
(0.6)(0.4)
U)P(U)|P(DS)P(S)|P(D
S)P(S)|P(DD)|P(S
Aplicar el Teorema de Bayes:
Entonces, la probabilidad revisada de éxito, dado que este pozo ha sido programado para una prueba detallada es 0.667
Ejemplo del Teorema de Bayes (continuación)
37 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Dada la prueba detallada, la probabilidad
revisada de que el pozo sea exitoso ha
aumentado a 0.667 del estimado
original de 0.4
Evento Prob
Previa
Prob
Condicional
Probabilidad
Conjunta
Probablidad
Revisada
S (exitoso) 0.4 0.6 (0.4)(0.6) = 0.24 0.24/0.36 = 0.667
U (no-exitoso) 0.6 0.2 (0.6)(0.2) = 0.12 0.12/0.36 = 0.333
Suma = 0.36
Ejemplo del Teorema de Bayes (continuación)
38 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Reglas para contar el número de posibles
resultados
• Regla de Conteo 1:
– Si uno de k eventos diferentes mutuamente excluyentes y
colectivamente exhaustivos puede ocurrir en cada uno de
n intentos, el número de posibles resultados es igual a
– Ejemplo:
• Si se lanza un dado 3 veces entonces hay 63 = 216 posibles
resultados
kn
Reglas de Conteo
39 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Regla de Conteo 2:
– Si hay k1 eventos en el primer intento, k2 eventos en
el segundo intento, … y kn eventos en el nésimo
intento, el número de posibles resultados es
– Ejemplo:
• Se quiere ir a un parque, almorzar en un restaurante e ir al
cine. Hay 3 parques, 4 restaurantes y 6 cines. ¿Cuántas
posibles combinaciones hay?
• Respuesta: (3)(4)(6) = 72 posibilidades diferentes
(k1)(k2)…(kn)
Reglas de Conteo (continuación)
40 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Regla de conteo 3:
– El número de formas que n objetos pueden arreglarse
en orden es
– Ejemplo:
• Usted tiene cinco libros para poner en una repisa. ¿De cuántas
maneras puede usted ponerlos en la repisa?
• Respuesta: 5! = (5)(4)(3)(2)(1) = 120 diferentes posibilidades
n! = (n)(n – 1)…(1)
Reglas de Conteo (continuación)
41 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
• Regla de Conteo 5: – Combinaciones: El número de formas en que se puede
seleccionar X objetos de n objetos, sin importar el orden, es
– Ejemplo: •Usted tiene cinco libros y va a seleccionar tres aleatoriamente para leer. ¿Cuántas combinaciones diferentes de libros puede seleccionar?
•Respuesta: posibilidades diferentes
X)!(nX!
n!Cxn
10(6)(2)
120
3)!(53!
5!
X)!(nX!
n!Cxn
Reglas de Conteo (continuación)
42 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Resumen del Capítulo:
• Se presentaron los conceptos básicos de probabilidad
• Espacios muestrales y eventos, tablas de contingencia,
probabilidad simple y probabilidad conjunta
• Se presentaron las reglas básicas de probabilidad
• La regla general de la suma, la regla de la suma para
eventos mutuamente excluyentes, la regla para eventos
colectivamente exhaustivos
• Se presentó la definición de probabilidad condicional
• Independencia estadística, probabilidad marginal, árboles de
decisión y la regla de la multiplicación
• Se presentó el Teorema de Bayes
• Se examinaron las reglas de conteo
43 José Antonio Robles Flores © 2014
Análisis de Datos para la Gerencia
Referencias
• Levine; Krehbiel & Berenson 2014. Estadística para
Administración 6ta Edición. Pearson.