Sesión 6: Redes Bayesianas- Inferencia Inferencia en Redes
Transcripción
Sesión 6: Redes Bayesianas- Inferencia Inferencia en Redes
!" ' ! ' (! ) ' -")! ! ' (! ) . /! ! . " . -) #$% * !" + !"* !" , " " ! ! ! ' & Propagación de Probabilidades El razonamiento probabilístico o propagación de probabilidades consiste en propagar de los efectos de la evidencia a través de la red para conocer la probabilidad a posteriori de las variables. 0 La propagación consiste en darle valores a ciertas variables (evidencia), y obtener la probabilidad posterior de las demás variables dadas las variables conocidas (instanciadas). 1 3 ! ' / " " ! .5 6 " . / "7 ! . / "7 34 " ! ! " " 7 ")! ! + , 6 " "" +* !" !"* !" , ! ) 6 " "7 ' -) ' " ' /! ! !+ !* ! , 2 3 ! ' 9 6 34 "+, 6 ..- ! ! " . ! " " 8 Tipos de Estructuras Redes conectadas en forma sencilla: • Árboles • Poliárboles Redes multiconectadas: # & Propagación en Árboles Cada nodo corresponde a una variable discreta, B{B 1, B 2,…, B n) con su respectiva matriz de probabilidad condicional, P(B|A)=P(Bj| Ai) $ (! ) : !" > / ; < = Dada cierta evidencia E --representada por la instanciación de ciertas variables-- la probabilidad posterior de cualquier variable B, por el teorema de Bayes: P( Bi | E)=P( Bi ) P(E | Bi) / P( E ) 0 6 > / ; < = ?@< A & Evidencia Ya que la estructura de la red es un árbol, el Nodo B la separa en dos subárboles, por lo que podemos dividir la evidencia en dos grupos: E-: Datos en el árbol que cuya raíz es B E+: Datos en el resto del árbol 0 6 > B / ; < = 1 1 Entonces: P( Bi | E ) = P ( Bi ) P ( E-,E+ | Bi ) / P(E) Pero dado que ambos son independientes y aplicando nuevamente Bayes: P( Bi | E ) = α P ( Bi | E+ ) P(E- | Bi ) Donde α es una constante de normalización Definiciones: Si definimos los siguientes términos: λ (Bi)= P ( E- | Bi) π (Bi)= P (Bi | E+ ) Entonces: P(Bi | E ) = α π (B i) λ (B i) 2 ; ' !" " ! " ) ! ' ( . 6 . 6 " 6 ""! ! ")! ! ! " ! ! ! !! " *" "! "! CD! +λ, "! * ! ! +π, 8 " ! CD ! +λ, 6 ' ; !7 "! CD! ! ! ! " ! " λ (Bi) = P ( E- | Bi) = Πk P ( Ek- | Bi) ' ;! Ek- ! ! * !" "CD!E " 6 " # 6 CD ! > / +;, ; < +, = F $ " ! CD ! +λ, 6 ' /! ! "! CD! λ (Bi)= Πk [ ! ! "! ! " 6 "! Σj P ( Ek- | Bi, Sjk) P(Sjk | Bi) ] ' ;! Sk "CD!E ! "! 6 "! ! " ! ", " ! C! ! !+ ! 2 " ! CD ! +λ, 6 ' ; !7 ! ! " " 6 ! CD! λ (Bi) = Πk [ Σj P ( Ek- | Sjk) P(Sjk | Bi) ] ' λ !" λ (Bi)= Πk [ Σj P(Sjk | Bi) λ (Sjk)] 6 CD ! > / λ+;, ; < λ+ , = & " ! CD ! +λ, 6 ' ! ! !7 λ ! " 6 "! " λ = 6 ! + 6 "! ! , "! ! ! 6 λ (+ G , 0 8 6 * ! ! +π, " ! ' /! ! "!! !! +-, "! 6 "! π (Bi) = P (Bi | E+ ) = Σj P (Bi | E+ , Aj) P(Aj | E+ ) ' ;! Aj ! "!! ! "! 6 "! 1 6 > - B / ; < 6 = " ! ' ; !7 H I * ! ! +π, " 6 - !- π (Bi) = Σj P (Bi | Aj) P(Aj | E+ ) ' P(Aj | E+ ) ! ! "( ! ! ! " 6 J ! CD! ! "!7 ! ! P(Aj | E+ ) = α π (A i) Πk≠B λk (A i) 2 # 6 π+-, > / λ+ /, ; < λ+ , = 8 6 * ! ! +π, " ! !P(Aj | E+ ) ' π " π (Bi) = Σj P (Bi | Aj) [ α π (A i) Πk≠B λk (A i) ] ' ; ! 7 "!! ! ! "λ ! "! !" π * CD! # 6 " ! 4 π "+ ! ' ; !7 ! 6 π = * ! ! +π, 6 ! "! ! ! 6 (" ! ! " ! ! CD! , ( + G-, (&$ $ Algoritmo Mediante estas ecuaciones se integra un algoritmo de propagación de probabilidades en árboles. Cada nodo guarda los valores de los vectores π y λ, así como las matrices de probabilidad P. La propagación se hace por un mecanismo de paso de mensajes, en donde cada nodo envía los mensajes correspondientes a su padre e hijos: & Mensaje al padre (hacia arriba) -- nodo B a su padre A: Mensaje a los hijos (hacia abajo) -nodo B a su hijo Sk : & Al instanciarse ciertos nodos, éstos envían mensajes a sus padres e hijos, y se propagan hasta a llegar a la raíz u hojas, o hasta encontrar un nodo instanciado. Así que la propagación se hace en un solo paso en un tiempo proporcional al diámetro de la red. && (! ) λ λ-+>, λ +-, - λ/+-, / λΙ+>, > λ ;+ , ; λ<+;, λ +, λ=+;, < = &0 (! ) π π>+-, π-+/, / πΗ+, > π-+ , - π +;, ; π;+<, < π +, π;+=, = &1 /! ' ! " ! ! C!D ! ! ! ! λ (Bi) = [1,1, …] ' !! ) ! +! ! ! , λ (Bi) = [0,0, ..1, 0, …, 0] (1 para valor asignado) π (Bi) = [0,0, ..1, 0, …, 0] (1 para valor asignado) ' ! ! KL π (A) = P(A), (probabilidad marginal inicial) & D " ! /! (+/, $8 $ (+ G /, $# $2 $ $& (+<G, $# $1 $ $1 < ;!"! (+;G, $2 $0 $& $ &2 D " ! /! <? λ? $% < ;!"! λ? % &8 D λ<? $%M # 1G 1% ? # 1% < (+<G, $# $1 $ $1 " ! /! λ;? ;!"! %M 2 0G & % ? % (+;G, $ $0 $& $ & D " ! λ+/, ? # 1%M # 2G &% /! ? 8 28% λ+ , ? # 1%M ? # 1% (+ G /, $# $2 $ $& % < ;!"! (+<G, $# $1 $ $1 (+;G, $0$2 $0 $& $ D " ! π+/, ? 8 π+ , ? 8 %M # 2G &% ? 8 0% < % /! (+ G /, $# $2 $ $& ;!"! (+<G, $# $1 $ $1 (+;G, $02 $0 $& $ D " ! π+/, ? 8 % /! π+ , ? 8 0% < π+;, ? 8 0%M # 1% 2 0G & % ? 1 #8 20 % ;!"! (+;G, $02 $0 $& $ 0 D " ! π+ , ? 8 0% λ+ , ? # 1% /! (+ ,?α 220 $2$% (+ ,? # 2 $8&% < ;!"! π+/, ? 8 % λ+/, ? 8 28% (+/,?α 88 1 % (+/,? 8 1 81% π+;, ? 12 2% λ(;)? % (+;,?α 12 2% (+;,? 2 &&% 0& ; ' D "! ! N 00 Propagación en Poliárboles . Un poliárbol es una red conectada en forma sencilla, pero en la que un nodo puede tener varios padres: P(B | A1, A2, …, An) 01 1 (! ) (!"* !" > / ; < = 0 -" )! ' " 4! ! ") ! ! ! " " * !" ! " . /! " ! " !! ! !! π λ . 6 "! D λ !! ! ! ! " " " *" "! ! "! 02 Propagación en Redes Multiconectadas Una red multiconectada es un grafo no conectado en forma sencilla, es decir, en el que hay múltiples trayectorias entre nodos (MCG). En este tipo de RP los métodos anteriores ya no aplican, pero existen otras técnicas alternativas: • Condicionamiento • Simulación estocástica • Agrupamiento 08 ; ' (! ) ! "6 0# ' H I ! ! ! " D! HJ " I+6 "! ! !D ! 6 ", 6 ' ! " "! 6 "! "!D ! HJ " I7 ! ! " ' ) " "!D ! ! ! " 9 ) " "! 6 "! 6 " ! ! " 1$ > / ; < = D "! N J(+- <G = , 1 2 ' ( "88 . / 0 1 ' !" #$. / 28 ' ! F! ./ 0 1 8