Standardavvikelse

Från Wikipedia
Hoppa till: navigering, sök
Diagram över en normalfördelning, där varje färgat band har en bredd lika med en standardavvikelse σ. De mörkaste bandens area representerar sannolikheten (cirka 68 %) för att ett slumpmässigt utfall befinner sig inom en standardavvikelse från medelvärdet.

Standardavvikelse är ett statistiskt mått på hur mycket de olika värdena i en population avviker från medelvärdet. Om de olika värdena ligger samlade nära medelvärdet blir standardavvikelsen låg, medan värden som är spridda långt över och under medelvärdet ger en hög standardavvikelse. Begreppet används inom sannolikhetslära, statistik, forskning och matematisk statistik.

Formler[redigera | redigera wikitext]

I tekniska termer är standardavvikelsen (σ) en egenskap hos en sannolikhetsfördelning och definieras som kvadratroten ur variansen för fördelningen:

\sigma = \sqrt{Var(X)}

För en diskret sannolikhetsfördelning blir formeln

\sigma = \sqrt{\sum_{i=1}^N P(x_i)(x_i-\mu)^{2}}

där μ är fördelningens väntevärde och summeringen görs över alla x i utfallsrummet Ω.
För en kontinuerlig sannolikhetsfördelning blir formeln

\sigma = \sqrt{\int_{-\infty}^{\infty} (x-\mu)^{2}f(x)\,dx}

där f(x) är fördelningens täthetsfunktion (frekvensfunktion).

Både standardavvikelsen och variansen är exempel på spridningsmått för fördelningen, det vill säga ett mått på hur utspridd fördelningen är kring väntevärdet. Eftersom avvikelsen från medelvärdet kvadreras blir också standardavvikelsen känslig för ett enstaka värde som ligger särskilt långt från medel, vilket då ger ett betydelsefullt bidrag till summan och i värsta fall blir den helt dominerande termen. I data där man kan betvivla relevansen för vissa extrema fall stryker man eventuellt dessa avvikande värden från listan av värden innan man beräknar standardavvikelsen.

Man kan också definiera standardavvikelsen med hjälp av begreppet väntevärde (E(X)):

\sigma = \sqrt{E((X - E(X))^2)}

d.v.s. roten ur väntevärdet för den kvadrerade avvikelsen från väntevärdet.

Ett besläktat spridningsmått är variationskoefficienten som är standardavvikelsen dividerad med fördelningens medelvärde; den uttrycks ofta i procent.

Externa länkar[redigera | redigera wikitext]