Standardavvikelse

Från Wikipedia
Hoppa till: navigering, sök
Diagram över en normalfördelning, där varje färgat band har en bredd lika med en standardavvikelse σ. De mörkaste bandens area representerar sannolikheten (cirka 68 %) för att ett slumpmässigt utfall befinner sig inom en standardavvikelse från medelvärdet

Standardavvikelse är ett statistiskt mått på hur mycket de olika värdena för en population avviker från medelvärdet. Om de olika värdena ligger samlade nära medelvärdet blir standardavvikelsen låg, medan värden som är spridda långt över och under medelvärdet bidrar till en hög standardavvikelse. Standardavvikelser används inom statistik, forskning och matematisk statistik.

Definitioner[redigera | redigera wikitext]

Låt X vara en stokastisk variabel med medelvärdet μ enligt

\operatorname{E}[X] = \mu

där operatorn E betecknar medelvärdet eller väntevärdet av X. Då är standardavvikelsen av X

\sigma = \sqrt{\operatorname E[(X - \mu)^2]} =\sqrt{\operatorname E[X^2]-(\operatorname E[X])^2}

Variansen för X definieras som

\operatorname{Var}(X) = \operatorname{E}[(X - \mu)^2]

och således är standardavvikelsen σ (sigma) kvadratroten av variansen för X, det vill säga är kvadratroten av medelvärdet av (X − μ)2.

En fördel med kvadratrotsbildningen är att standardavvikelsen fås i samma enhet som mätvärdena.

Diskret slumpvariabel[redigera | redigera wikitext]

Om X består av slumpvisa värden x1, x2, ..., xN, med likformig sannolikhetsfördelning, är standardavvikelsen för dessa

\sigma = \sqrt{\frac{1}{N}\left((x_1-\mu)^2 + (x_2-\mu)^2 + \cdots + (x_N - \mu)^2\right)}

där

\mu = \frac{1}{N} (x_1 + \cdots + x_N)

eller, med annan notation

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2};\qquad\mu = \frac{1}{N} \sum_{i=1}^N x_i.

Detta är korrekt om de N värdena utgör hela populationen. Om däremot värdena är en delmängd av en större population och används som estimat av den större populationen, ger division med N - 1 i stället för N, ett bättre estimat (Bessels korrektion).[1]

Om sannolikhetsfördelningen inte är likformig, antag att xk har sannolikheten pk och standardavvikelsen kan i detta fall skrivas

\sigma = \sqrt{\sum_{i=1}^N p_i(x_i - \mu)^2};\qquad\mu = \sum_{i=1}^N p_i x_i

Kontinuerlig slumpvariabel[redigera | redigera wikitext]

Standardavvikelsen för en kontinuerlig stokastisk variabel X med täthetsfunktionen p(x) är

\sigma = \sqrt{\int_\mathbf{X} (x-\mu)^2 \, p(x) \, dx}

med

\mu = \int_\mathbf{X} x\ p(x)\ dx

där integralerna är begränsade och där x antar alla värden som är möjliga för den stokastiska variabeln X.

Exempel[redigera | redigera wikitext]

Antag att en population representeras av

2,\  4,\  4,\  4,\  5,\  5,\  7,\  9

De åtta datapunkterna har medelvärdet

\frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5

Först beräknas skillnaden för varje datapunkt och medelvärdet och sedan kvadreras resultaten:


    \begin{array}{lll}
    (2-5)^2 = (-3)^2 = 9  &&  (5-5)^2 = 0^2 = 0 \\
    (4-5)^2 = (-1)^2 = 1  &&  (5-5)^2 = 0^2 = 0 \\
    (4-5)^2 = (-1)^2 = 1  &&  (7-5)^2 = 2^2 = 4 \\
    (4-5)^2 = (-1)^2 = 1  &&  (9-5)^2 = 4^2 = 16\\
    \end{array}

Variansen är medelvärdet av dessa värden:

\frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8} = 4

och populationens standardavvikelse är lika med variansens kvadratrot:

\sqrt{4} = 2

Referenser[redigera | redigera wikitext]

Noter[redigera | redigera wikitext]

  1. ^ Weisstein, Eric W., "Bessel's Correction", MathWorld. (engelska)

Externa länkar[redigera | redigera wikitext]