Incertidumbre - INAOE - Ciencias Computacionales · 2011-08-08 · Llevar a conclusiones muy...
-
Upload
doankhuong -
Category
Documents
-
view
215 -
download
0
Transcript of Incertidumbre - INAOE - Ciencias Computacionales · 2011-08-08 · Llevar a conclusiones muy...
Incertidumbre
Universidad Politécnica de PueblaUniversidad Politécnica de Puebla
Dr. Jesús Antonio González Bernal
óIntroducción In which we see what an agent should do when not all is In which we see what an agent should do when not all is
crystal clear. R&N pg 462R&N, pg 462
2
óIntroducción Sea la acción At = salir al aeropuerto t minutos antes del vuelot p
Me llevará el agente At al aeropuerto a tiempo? Posibles problemas
Ambiente parcialmente observable (estado del camino planes de otros Ambiente parcialmente observable (estado del camino, planes de otros choferes, etc.)
Sensores ruidosos (reportes del tráfico) Incertidumbre en la salida de las acciones (ponchadura etc )Incertidumbre en la salida de las acciones (ponchadura, etc.) Muy complejo modelar y predecir el tráfico
Un método puramente lógico podría Ri f l d d “A ll hí ti ” ó Riesgo a falsedad “A25 me llevara ahí a tiempo”, ó Llevar a conclusiones muy débiles para la toma de decisiones
A25 me llevará ahí a tiempo si no hay un accidente en el puente y no llueve y no sufro ponchaduras etc ”ponchaduras, etc…
(A1440 podría razonablemente llevarme a tiempo pero tendría que pasar la noche en el aeropuerto…)
3
Métodos para Manejar Incertidumbre Default o lógica no monotónica (asumir )Default o lógica no monotónica (asumir…) Asumir que mi carro no tiene una llanta ponchada Asumir que A25 trabaja a menos que haya evidencia contradictoriaq 25 j q y Problemas: ¿Es razonable lo que asumimos?, ¿Cómo manejamos las contradicciones?
Reglas con problemas por resolver A25 0.3 AtAirportOnTime
Sprinkler WetGrass Sprinkler 0.99 WetGrass
WetGrass 0.7 Rain
Problemas con la combinación: ¿“Sprinkler causa Lluvia”?
Probabilidad Dada la evidencia, A25 me llevará a tiempo con probabilidad 0.04
4
Probabilidad Las afirmaciones probabilísticas resumen los efectos deLas afirmaciones probabilísticas resumen los efectos de Pereza: fallar en enumerar todas las excepciones, cuantificadores, etc. Ignorancia: falta de hechos relevantes, condiciones iniciales, etc.
Probabilidad Subjetiva o Bayesiana: Probabilidades relacionan proposiciones a nuestro propio estado de
conocimientoconocimiento P(A25 | no se reportan accidentes) = 0.06 No son afirmaciones con “tendencia probabilística” en la situación actual Se pueden aprender a partir de la experiencia de situaciones similares
Probabilidades de proposiciones cambian con nueva evidencia P(A | no reporte accidentes 5:00am) = 0 15 P(A25| no reporte accidentes, 5:00am) = 0.15 Análogo a estatus de entailment lógico KB╞ , de no es verdad
5
Tomando Decisiones bajo Incertidumbre Suponga que creemos lo siguiente:Suponga que creemos lo siguiente: P(A25 me lleva a tiempo | …) 0.04 P(A90 me lleva a tiempo | …) 0.70( 90 p | ) P(A120 me lleva a tiempo | …) 0.95 P(A1440 me lleva a tiempo | …) 0.9999
¿Qué acción elegir? Depende de mis preferencias entre perder el vuelo vs comer en
l t tel aeropuerto, etc. Teoría de Utilidad Se utiliza para representar e inferir preferenciasp p p
Teoría de Decisiones = Teoría de Utilidad + Teoría de Probabilidad
6
óIntroducción a la Probabilidad Iniciamos con un conjunto el espacio de muestra Iniciamos con un conjunto , el espacio de muestra i.e., 6 posibles tiradas de un dado
es un punto de muestra / posible mundo / evento es un punto de muestra / posible mundo / evento atómico
Un espacio de probabilidad o modelo de probabilidad es un Un espacio de probabilidad o modelo de probabilidad es un espacio de muestra con una asignación P() para cada tal que:q
Un evento A es un subconjunto de Un evento A es un subconjunto de
7
Variables Aleatorias Una variable aleatoria (v a ) es una función de un conjunto de Una variable aleatoria (v.a.) es una función de un conjunto de
puntos a un rango, i.e., los reales o booleanos i e P(heads) = 0 5 Odd(1) = truei.e., P(heads) 0.5, Odd(1) true
P induce una distribución de probabilidad para cada v.a. X:
8
Proposiciones Pensar en una proposición como un evento (conjunto de puntos muestra) donde p p ( j p )
la proposición es true
Dadas las variables aleatorias booleanas A y B:
Evento a = conjunto de puntos muestra donde A(w) = true
Evento a = conjunto de puntos de muestra A(w) = false
Evento a b = puntos donde A(w) = true y B(w) = true Evento a b puntos donde A(w) true y B(w) true
En aplicaciones de IA es común que los puntos de muestra estén definidos por los valores de un conjunto de variables aleatorias, i.e. el espacio de muestra es el producto cartesiano de los rangos de las variables
Con variables booleanas, punto de muestra = modelo de lógica proposicional
Proposición = disyunción de eventos atómicos en el cual es verdad
9
é¿Porqué usar Probabilidades? Las definiciones implican que ciertos eventos relacionados Las definiciones implican que ciertos eventos relacionados
lógicamente deben relacionar probabilidades
10
Sintaxis para Proposiciones Variables aleatorias Proposicionales o Booleanas Variables aleatorias Proposicionales o Booleanas i.e. Caries(¿tengo una caries?) Caries = true es una proposición también se escribe como Caries true es una proposición, también se escribe como
Caries
Variables aleatorias discretas (finitas ó infinitas)Variables aleatorias discretas (finitas ó infinitas) i.e., Clima es uno de (soleado, lluvioso, nublado, nevado) Clima = lluvioso es una proposiciónClima lluvioso es una proposición Los valores deben ser exhaustivos y mutuamente excluyentes
Variables aleatorias continuas (acotadas o no acotadas)Variables aleatorias continuas (acotadas o no acotadas) i.e.Temp < 21.6 ó 20.0 < Temp < 25.0
11
Probabilidad a-priori Probabilidades a-priori o incondicionales de proposicionesp p p
i.e. P(Cavidad = true) = 0.1 y P(Clima = soleado) = 0.72
Corresponden a una creencia a-priori para la llegada de nueva evidencia
Distribución de probabilidad da valores a las posibles asignaciones: Distribución de probabilidad da valores a las posibles asignaciones: P(Clima) = {0.72, 0.1, 0.08, 0.1) (normalizados, i.e., suman 1)
Distribución de probabilidad conjunta para un conjunto de v.a. da la probabilidad de cada ó i b (i d d )evento atómico sobre esas v.a. (i.e. en cada punto de muestra)
P(Clima, Caries) = una matriz de 4 x 2 valores
C d t b d i i d d l di t ib ió d b bilid d Cada pregunta sobre un dominio se puede responder con la distribución de probabilidad porque cada evento es una suma de sus puntos de muestra
12
Probabilidad Condicional Probabilidades condicionales o posterioresp i.e., P(caries | dolor-dientes) = 0.8 i.e., dado que dolor-dientes es todo lo que se NO “Si dolor dientes entonces 80% posibilidad de caries” NO Si dolor-dientes entonces 80% posibilidad de caries
Notación para distribuciones condicionales: P(caries|dolor-dientes) = vector de 2 elementos de vectores de 2 elementos
Si b á i i t bié t d d t Si sabemos más, i.e., caries también esta dado, entonces P(caries|dolor-dientes, caries) = 1
Nota: la creencia menos específica sigue siendo válida después de que ll á id i i útilllega más evidencia, pero no siempre es útil
La nueva evidencia puede ser irrelevante, permitiendo simplificar P(caries|dolor-dientes, CA-gana) = P(caries|dolor-dientes) = 0.8
Esta clase de inferencia, afectada por conocimiento del dominio, es muy importante
13
Probabilidad Condicional Definición de probabilidad condicional Definición de probabilidad condicional
R l d l d t it lt ti Regla del producto permite una alternativa
Aplica una versión general para distribuciones completas:
Se ve como ecuaciones de 4 x 2, no multip. Matrices
Regla de la cadena se deriva aplicando sucesivamente regla del producto
14
óInferencia por Enumeración Iniciar con la distribución conjunta Iniciar con la distribución conjunta
Para cualquier proposición , la suma de los eventos atómicos en que es verdadera:
15
óInferencia por Enumeración Iniciar con la distribución conjunta: Iniciar con la distribución conjunta:
Para cada proposición , la suma de los eventos atómicos en que es verdadera:
16
óInferencia por Enumeración Iniciar con la distribución conjunta Iniciar con la distribución conjunta
Para cada proposición , la suma de los eventos atómicos en que es verdadera:
17
óInferencia por Enumeración Se inicia con la distribución de probabilidad conjunta Se inicia con la distribución de probabilidad conjunta
También se pueden calcular probabilidades condicionales
18
óNormalización
El denominador se puede ver como una constante de normalización para que P(Cavity|toothache) sume 1
19
Independencia A y B son independientes iffA y B son independientes iff
32 entradas se reducen a 12 32 entradas se reducen a 12 Independencia absoluta poderosa pero rara Dominio de dentista muy grande cientos de variables Dominio de dentista muy grande, cientos de variables,
ninguna de ellas es independiente. ¿qué hacemos?
20
Independencia Condicional P(dolor-diente caries identificar) tiene 23 -1 = 7 entradas P(dolor diente, caries, identificar) tiene 2 1 7 entradas
indep. Si tengo caries, la prob. de que la prueba lo identifique no g , p q p q
depende de si tengo un dolor de dientes
La misma independencia se sostiene si no tengo la caries
Identificar es condicionalmente independiente de dolor-dientes dada caries
Equivalencias
21
Independencia Condicional Se escriben distribuciones conjuntas completas usando la Se escriben distribuciones conjuntas completas usando la
regla de la cadena
i.e. 2 + 2 + 1 = 5 números indep. (ecuaciones 1 y 2 quitan 2) En la mayoría de los casos, usar indep. cond. Reduce el tamaño
de la representación de la distribución disjunta de exponencial en n a lineal en n.
Independencia condicional es nuestra forma más básica y Independencia condicional es nuestra forma más básica y robusta de conocimiento acerca de ambientes con incertidumbre
22
Regla de Bayes Regla del productog p
O en forma de distribución
Útil para asignar probabilidad diagnóstica a partir de probabilidad causalÚtil para asignar probabilidad diagnóstica a partir de probabilidad causal
I.e. sea M meningitis, S sea torcedura de cuello
Nota: probabilidad posterior de meningitis es todavía muy pequeña
23
Regla de Bayes e Independencia Condicional
Este es un ejemplo de un modelo naive Bayes
El número total de parámetros es lineal en n
24
Mundo del Wumpus
25
Especificando el modelo de probabilidad La distribución conjunta completa es La distribución conjunta completa es
Aplicando regla del producto
Se hace así para obtener P(Efecto|Causa)
P é 1 d b 0 d Primer término: 1 si pozos son adyacentes a brizas, 0 de otra manera
S d é d d l Segundo término: pozos son acomodados aleatoriamente, probabilidad de 0.2 por cuadro
para n pozos
26
Observaciones y queries Conocemos los siguientes hechos Conocemos los siguientes hechos
El query es
Se define Desconocido = Pij que no son P1,3 y Conocido
Para inferencia por enumeración tenemos
Crece exponencialmente con el número de cuadrosp
27
Usando Independencia Condicional Idea básica: las observaciones son condicionalmente Idea básica: las observaciones son condicionalmente
independientes de otros cuadros escondidos dados los cuadrados vecinos escondidoscua a os vec os esco os
Manipular el query a una forma donde se pueda usar esto
28
Usando Independencia Condicional
29
Usando Independencia Condicional
30