Bayesiskt nätverk

Från Wikipedia
Hoppa till: navigering, sök

Ett bayesiskt nätverk, bayesianskt nätverk eller nät är en grafisk modell för sannolikhet. Den föreställer ett set av tillfälliga variabler och deras betingade samband framställda med hjälp av en riktad acyklisk graf (en riktad graf som saknar cykler). Ett sådant nät är uppbyggt av noder, knutpunkter, som är beroende av varandra. Om det finns två noder, A och B, där B är beroende av A, innebär det att A är "förälder" till B. Med hjälp av ett bayesiskt nätverk kan man beräkna sannolikheter för olika utfall, där hänsyn tas till alla faktorer som kan spela in. Exempelvis om föräldranoderna är m boolska variabler, så kan sannolikhetsfunktionen representeras i en tabell av 2^m noteringar. Det är en för var och en av de 2^m möjliga kombinationerna av föräldranodernas möjlighet att vara sann eller falsk.

Användningsområden finns inom medicin, bildbehandling och beslutsstödsystem, bland annat för skräpposthantering eller textinmatning i mobiltelefon. Fördelar ligger i att en stor mängd data kan behandlas snabbt och kostnadseffektivt. En nackdel är att svaret blir approximativt.

Definitioner och begrepp[redigera | redigera wikitext]

Det finnes flera ekvivalenta definitioner av bayesiska nätverk. För de följande definitionerna låt G = (V,E) vara en riktat acyklisk graf (eng: DAG), och låt X = (Xv)vV vara en mängd av tillfälliga variabler betecknade med V.

Faktoriell definition[redigera | redigera wikitext]

X är ett bayesiskt nätverk med hänsyn till G, om deras gemensamma sannolikhets täthetsfunktion kan beskrivas som en produkt av de individuella täthetsfunktionerna, betingat av deras föräldravariabler: [1]

 p (x) = \prod_{v \in V} p \big(x_v \,\big|\,  x_{\operatorname{pa}(v)} \big) ,

där pa(v) är mängden föräldrar till v (t ex de toppunkter som pekar direkt till v via en enkel kant).

För en godtycklig mängd av tillfälliga variabler, bräknas sannolikheten av vilket som helst medlem av gemensam fördelning (eng: joint distribution) utifrån betingade sannolikheter genom att använda (eng: chain rule)kedjeregeln som följer:[1]

\mathrm  P(X_1=x_1, \ldots, X_n=x_n) = \prod_{v=1}^n  \mathrm P(X_v=x_v \mid X_{v+1}=x_{v+1}, \ldots, X_n=x_n )

Sammanknytes denna med definitionen ovan, kan det skrivas som:

\mathrm  P(X_1=x_1, \ldots, X_n=x_n) = \prod_{v=1}^n  \mathrm P(X_v=x_v \mid X_j=x_j för varje X_j\,, som är en förälder till  X_v\,

Skillnaden mellan de två uttryckena är variablenas betingade oberoendet från vilken som helst av deras ikke-efterkommande, givet värdena till deras föräldravariabler.

Lokal Markovegenskap[redigera | redigera wikitext]

X är ett bayesiskt nätverk med hänsyn till G, om det uppfyller den lokala Markovegenskapen. Det vill säga att varje variabel är betingat oberoende av dess ikke-efterkommande, givet att dess föräldravariabler följer[2] :

 X_v \perp\!\!\!\perp X_{V \setminus \operatorname{de}(v)} \,|\, X_{\operatorname{pa}(v)} \quad\text{för alla }v \in V

där de(v) är mängden av efterkommande av v.

Detta kan även uttryckas på en form som är maken till den första definitionen:

\mathrm  P(X_v=x_v \mid  X_i=x_i för varje X_i\, som inte är en efterkommande till  X_v\, ) = P(X_v=x_v \mid X_j=x_j för varje X_j\, som är föräldrar till  X_v\, )

Lägg märke till att mängden av föräldrar är en delmängd av mängden av icke-efterkommande, därför att grafen är acyklisk.

Se även[redigera | redigera wikitext]

Noter och referenser[redigera | redigera wikitext]

  1. ^ [a b] Stuart Russel & Peter Norvig (2003): Artificial Intelligence - a modern approach, ISBN 0-13-080302-2, Pearson Education (side 496)
  2. ^ Stuart Russel & Peter Norvig (2003): Artificial Intelligence - a modern approach, ISBN 0-13-080302-2, Pearson Education (sid 499)

Litteratur[redigera | redigera wikitext]