Konfidensintervall

Från Wikipedia
Hoppa till: navigering, sök
Staplarna anger observerade väntevärden och det röda linjesegmentet representerar konfidensintervallet som innesluter dem.

Konfidensintervall är inom matematisk statistik en skattning av osäkerheten associerad med skattningar av populationsparametrar som har tagits fram med hjälp av stickprovsdata. Konfidensintervallet bestäms för en given konfidensgrad. Exempelvis så kan ett konfidensintervall bestämmas för konfidensgraden 95 % vilken bestäms i förväg av användaren.

För att förstå innebörden av det som konfidensintervallet anger, betrakta en population för vilken man vill skatta någon förbestämd parameter utifrån stickprovsdata. Den givna populationen kommer att samplas upprepade gånger, varpå intervallskattningar för den givna parametern bestäms. Då är konfidensintervallet det intervall som kommer att innesluta populationsparametern för den andel av samplingarna som bestäms av konfidensgraden. Exempelvis om konfidensgraden är 95 % så kommer konfidensintervallet innesluta populationsparametern 95 % av samplingarna.

Ett ensidigt konfidensintervall kommer att begränsa populationsparametern från ett håll, antingen från ovanifrån eller underifrån. Detta erbjuder alltså antingen en övre eller undre begränsning för populationsparameterns magnitud. Ett tvåsidigt konfidensintervall innesluter populationsparametern både ovanifrån och underifrån.

Definition[redigera | redigera wikitext]

Ett konfidensintervall för en populationsparameter \theta är ett stokastiskt intervall I(X_{1}, ..., X_{n}) som täcker \theta med en given sannolikhet:

P(\theta \in I(X_{1}, ..., X_{n}))=1-\alpha.

Där 1-\alpha är konfidensgraden.

Konfidensintervall för olika fördelningar[redigera | redigera wikitext]

Normalfördelning[redigera | redigera wikitext]

Antag att X~N(\mu,\sigma^{2}), att \mu är okänt, samt att \sigma^{2} är känt. Då ges konfidensintervallet för \mu vid enbart ett stickprov av

I_{\mu}=(\bar{x}-\frac{\lambda_{\alpha/2}\sigma}{\sqrt{n}},\bar{x}+\frac{\lambda_{\alpha/2}\sigma}{\sqrt{n}}). [1]

Binomialfördelning[redigera | redigera wikitext]

Låt X~Bin(n,p) samt antag att n är givet. Antag också att n är stor så att man kan använda normalapproximationen. p*=X/n är approximativt normalfördelad med väntevärdet p och standardavvikelsen \sqrt{p(1-p)/n}. Konfidensintervallet för p som beror på bara en observation ges av

I_{p}=(p^{*}_{obs}-\lambda_{\alpha/2}d,p^{*}_{obs}+\lambda_{\alpha/2}d),

där

d=\sqrt{p^{*}_{obs}(1-p^{*}_{obs})/n}. [1]

Poissonfördelning[redigera | redigera wikitext]

För en Poissionfördelning Po(\mu) så anges konfidensintervallet för \mu som beror på bara en observation av

I_{\mu}=(x-\lambda_{\alpha/2}\sqrt{x},x+\lambda_{\alpha/2}\sqrt{x}).

Dess konfidensgrad är approximativt 1-\alpha och approximationen är bättre ju större \mu är. [1]


Svagheter[redigera | redigera wikitext]

En av de mest uppenbara svårigheter med konfidensintervall ligger i hur man tolkar det som konfidensuttalandet säger. Exempelvis, ett 95 % konfidensintervall för en andel innebär inte att sannolikheten för att populationsandelens värde ska ligga innanför det givna konfidensintervallet är lika med 0,95. 95 % konfidens refererar istället till den förväntade andelen av ett sådant intervall som innehåller populationsvärdet, om man fler gånger tog slumpmässiga stickprov av samma storlek från samma population under identiska villkor. [2]

Referenser[redigera | redigera wikitext]

  1. ^ [a b c] http://www.mai.liu.se/~julob/kurser/TAMS24/v37.pdf, 2010-01-24.
  2. ^ Confidence intervals, Michael Smithson, Quantitative applications in the social sciences, Sage publications Inc., 2003