Hypergeometrisk fördelning

Från Wikipedia
Hoppa till: navigering, sök

Hypergeometriska fördelningen är en diskret sannolikhetsfördelning. Fördelningen beskriver dragning utan återläggning med två sorters föremål. Om N är antalet element i en given mängd; och om vi låter m beteckna det antal av en delmängd vi är intresserade av, t.ex. antalet vita bollar, är N-m antalet resterande bollar i den totala mängden, t.ex. röda bollar eller bollar av flera olika färger går också bra, huvudsaken är att de ses som inte vita bollar. Vi kan med dessa beteckningar skriva sannolikheten att vi väljer k vita bollar, utan återläggning,som

{P(X = k) =} {{m \choose k}  {N-m \choose n-k} \over {N \choose n}}

Ibland skriver vi mer kortfattat X \in Hyp(N,n,m) (utläses: den stokastiska variabeln X är hypergeometriskt fördelad med parameter N, totala antalet element i mängden, andra parameter n, antalet element vi plockar ur den totala mängden och tredje parameter m, antalet element vi är "intresserade av", här vita bollar).

Ibland skrivs den hypergeometriska fördelningen på formen

{P(X = x) =} {{Np \choose x}  {N-Np \choose n-x} \over {N \choose n}}

där p:=m/N, dvs. andelen av de element vi är intresserade av.

Väntevärdet för en hypergeomeriskt fördelad stokastisk variabel, vanligtvis betecknad X, är E(X)=np och variansen är V(X)={np(1-p)}{N-n \over N-1}.

Det finns ett nära samband mellan den hypergeometriska fördelningen och binomialfördelningen. Båda fördelningarna handlar om två utfall, ett "lyckat" och ett "misslyckat". Exempel är glad-sur, sjuk-frisk, stor-liten, etc. Binomialfördelningen använder vi när vi är säkra på att det ena utfallet inte påverkar det andra utfallet.

Ett rimligt antagande är att om vi singlar mynt så ökar/ minskar inte chansen att få klave i andra kastet, om vi fick klave i första. Om vi, utan för stora problem, kan anta att myntet är symmetriskt, och att den inte väger tyngre på den ena eller andra sidan, är det rimligt att tilldela sannolikheten att det blir klave, eller krona, 1/2.

Är vi däremot intresserade av att veta hur många knektar vi får i en slumpmässig pokerhand ur en kortlek med 52 kort, då påverkar det första utfallet det andra. Säg att vi har 52 kort och du skall tilldelas 5 kort, en pokerhand. Sannolikheten att du får en knekt i första försöket är, enligt klassisk sannolikhetsdefinition, antalet gynnsamma utfall g delat med antalet möjliga utfall N.

Vi är intresserade av knektar, det finns 4 knektar i en standardkortlek om 52 kort, alltså är g=4; en kortlek består av 52 kort, så N=52. Sannolikheten att vi får en knekt på vårt första drag av en pokerhand om 5 kort är alltså g/N=4/52=0.0769231. Anta nu att vi ska dra vårt andra kort. Sannolikheten att vi då får en knekt är g/N=(4-1)/(52-1)=0.0588235, eftersom både antalet gynnsamma och antalet möjliga utfall minskar med 1.

Vår sannolikhet att dra knekt en andra gång minskar. En liknande analys ger att vår sannolikhet att dra knekt en andra gång ökar om vi inte fick knekt i första draget. Sannolikheten att få 1, 2, 3, eller 4 knektar (eller andra valörer) i en pokerhand ur en slumpmässig kortlek om 52 kort är alltså hypergeometriskt fördelad.

Det som väsentligen skiljer den hypergeometriska fördelningen från binomialfördelningen är att i första fördelningen har vi dragning utan återläggning (vi lägger inte tillbaks knekten när vi väl fått den!), och i andra fördelningen har vi dragning med återläggning (vi fortsätter använda samma symmetriska krona!).

Venn A intersect B.svg Matematikportalen – portalen för matematik på svenskspråkiga Wikipedia.