Normalfördelning

Från Wikipedia
Hoppa till: navigering, sök
Normalfördelningen

Normalfördelningen är en viktig fördelning inom sannolikhetsteori och statistik. En normalfördelad variabel antar ofta värden som ligger nära medelvärdet och mycket sällan värden som har en stor avvikelse. Därför påminner normalfördelningen om en kulle eller en klocka och i engelskan används ofta beteckningen bell curve.

Normalfördelningens betydelse framgår av den centrala gränsvärdessatsen enligt vilken summan av ett stort antal oberoende slumpmässiga variabler är approximativt normalfördelad under vissa allmänna förutsättningar oavsett vilken fördelning dessa variabler hade från början. Normalfördelningen är därför betydelsefull för beskrivningar av företeelser i naturen och i samhällen då flertalet skeenden kan beskrivas med stor noggrannhet av normalfördelningen.

Det är vanligt att fördelningen av en studerad parameter är okänd. Normalfördelningen kan då användas som en preliminär beskrivning av parametern då mätningar av parametrar ofta är behäftade med många mindre, oberoende och slumpmässiga variationer.

Exempel – singla slant[redigera | redigera wikitext]

Om en slant singlas 100 gånger kommer antalet kronor att vara binomialfördelat. Men eftersom varje slantsingling är oberoende av de övriga kommer summan att vara ungefär normalfördelad med väntevärdet 50.

Ofta är det mycket enklare att approximera en slumpmässig variabel med en normalfördelning än att beräkna enskilda sannolikheter och då många slumpmässiga fenomen är summor av många små slumpmässiga tillskott fungerar det vanligtvis väl. Historiskt sett var möjligheten att approximera stora binomialfördelningar det första tillämpningsområdet för normalfördelningen.

Definition[redigera | redigera wikitext]

Normalfördelningen har täthetsfunktionen

Normalfördelningen för olika värden på μ och σ²
f(x) = {1 \over \sigma\sqrt{2\pi} }\,e^{-{(x-\mu )^2 \over 2\sigma^2}},

där μ och σ är normalfördelningens karakteristiska konstanter: μ är väntevärdet och σ är standardavvikelsen för fördelningen. Denna normalfördelning betecknas med N(\mu,\sigma)\,.

Normalfördelningens täthetsfunktion kan inte integreras med vanliga endimensionella metoder eftersom den inte har någon primitiv funktion som kan uttryckas analytiskt. Arean under kurvan kan emellertid med andra metoder visas vara 1, vilket den måste vara för att vara en sannolikhetsfördelning.

En standardiserad normalfördelning har μ = 0 och σ = 1.

Fördelningsfunktion för normalfördelning

Fördelningsfunktionen för en standardiserad normalfördelning brukar betecknas med \Phi\, och sambandet mellan fördelningsfunktion och täthetsfunktion är

\Phi(x) = \int_{-\infty}^x f(z) dz.

Fördelningsfunktionen anger sannolikheten för att en normalfördelad variablel Y är mindre än eller lika med ett visst tal a:

P(Y < a) = \Phi(a)\,.

Sannolikheten att en normalfördelad variabel Y hamnar i ett interval [a,b] är

P(a < Y < b) = \Phi(b) - \Phi(a)\,.

Normalfördelningars egenskaper[redigera | redigera wikitext]

Fördelningsfunktion[redigera | redigera wikitext]

Fördelningsfunktionen för en godtycklig normalfördelad variabel X\in N(\mu,\sigma) kan erhållas från fördelningsfunktionen för en standardnormalfördelad variabel:

P(X<a)=\Phi\left(\frac{a-\mu}{\sigma}\right).

Denna egenskap medför att tabeller för normalfördelningar bara redovisar fördelningsfunktionen \Phi\,, eftersom alla andra normalfördelningar på detta sätt kan översättas till en normalfördelning med väntevärdet 0 och standardavvikelsen 1.

Symmetri[redigera | redigera wikitext]

\Phi(x) = 1 - \Phi(-x)\,.

Denna symmetri medför att tabeller bara behöver redovisa \Phi(x)\, för positiva tal x.

Linjär förändring[redigera | redigera wikitext]

Om

X\in N(\mu,\sigma)

och a, b är konstanter så gäller att den linjära formen

aX + b \in N(a\mu+b,a\sigma),

det vill säga, väntevärdet förändras på samma linjära sätt och standardavvikelsen ökar med faktorn a.

Summa av två oberoende normalfördelade variabler[redigera | redigera wikitext]

Om

X \in N(\mu_X, \sigma_X)

och

Y \in N(\mu_Y, \sigma_Y)

är oberoende så gäller att deras summa

X+Y \in N\left(\mu_X+\mu_Y, \sqrt{\sigma^2_X + \sigma^2_Y}\right)

Motsvarande gäller för differenser av oberoende normalfördelade variabler.

Se även[redigera | redigera wikitext]

Externa länkar[redigera | redigera wikitext]

Venn A intersect B.svg Matematikportalen – portalen för matematik på svenskspråkiga Wikipedia.