Hypotesprövning

Från Wikipedia
Hoppa till: navigering, sök

Hypotesprövning är inom matematisk statistik en vetenskaplig metod, som används då man vill göra uttalanden om en viss parameter, fysikalisk storhet eller en stor mängd individer, baserat på experiment eller en liten delmängd av dessa individer. Den stora mängden, som man är intresserad av att uttala sig om, kallas population och den lilla delmängden som man undersöker, kallas för ett stickprov av populationen.

Exempel: Population och stickprov[redigera | redigera wikitext]

Låt populationen vara samtliga svenska medborgare som är röstberättigade. Vi väljer ut 90 individer ur denna population; dessa individer utgör ett stickprov.

Exempel: Opinionsundersökning[redigera | redigera wikitext]

Man är intresserad av att studera andelen röstberättigade svenska medborgare som sympatiserar med partiet P. Låt symbolen p beteckna denna andel. För att helt säkert veta värdet på p måste vi veta vad varje röstberättigad svensk medborgare har för partisympati; att ta reda på detta är i praktiken omöjligt. Istället för att fråga alla, frågar man ett litet antal utvalda människor (som ska spegla populationens sammansättning) och försöker använda deras svar för att besvara den ursprungliga frågan om andelen p.

Man har en förutfattad mening att hälften av den röstberättigade svenska befolkningen sympatiserar med partiet P. Denna förutfattade mening kallar man för en nollhypotes, och betecknar på följande sätt:

H_0 : p = 0,5.\,

Efter att ha uttalat denna förutfattade mening intervjuar man 90 människor om deras partisympatier. När intervjuerna var avklarade sammanställde man intervjusvaren och noterade att 30 personer sympatiserade med P. Hur väl stämmer detta överens med den förutfattade meningen så som den är uttryckt i nollhypotesen? Enligt denna förväntar vi oss att hälften av de intervjuade personerna skall sympatisera med P, vilket i det aktuella fallet motsvaras av 45 P-sympatisörer bland de 90 intervjuade.

Den fråga som vi nu ställer oss är: Avviker talet 30 tillräckligt mycket från talet 45 för att vi skall betvivla att H0 är sann?

För att besvara denna fråga skall vi använda oss av tekniken för hypotesprövning. Kortfattat talar den om för oss hur stor avvikelsen mellan det vi observerar och det vi förväntar oss att få skall vara, för att vi skall betvivla att nollhypotesen är sann; Detta uttrycks med ett så kallat kritiskt värde, cα.

Säg att det kritiska värdet är talet sju. Detta innebär att om avvikelsen mellan det observerade antalet P-sympatisörer avviker med mer än sju personer från det förväntade värdet (45), så kan vi förkasta den förutfattade meningen att hälften av befolkningen är P-sympatisörer. Man har observerat 30 P-sympatisörer och avvikelsen mellan talen 30 och 45 är större än det kritiska värdet cα = 7. Våra data stödjer därför inte den förutfattade meningen att p = 0,5.

Notera att vår slutsats är helt och hållet baserad på intervjuerna med de utvalda 90 personerna. Kom ihåg att vi var intresserade av att undersöka en egenskap hos hela den svenska befolkningen; Det kan hända att de personerna som blev intervjuade inte var representativa. Det finns därför en viss osäkerhet i vårt beslut att förkasta den förutfattade meningen att p = 0,5. Osäkerheten ligger i det att vårt stickprov kan få oss att förkasta den förutfattade meningen, fastän den i själva verket är sann. Denna osäkerhet kallar man för signifikansnivå och betecknar med symbolen α (alfa).

Signifikansnivån är sannolikheten att få ett stickprov som föranleder oss att förkasta nollhypotesen, då i själva verket H0 är sann:
\alpha = Prob(H_0\,\mbox{förkastas}) \quad \mbox{trots att} \, H_0 \, \mbox{är sann.}

Man väljer en (låg) signifikansnivå, vanligtvis α = 0,05, och beräknar därefter ett motsvarande kritiskt värde cα, som får avgöra om mätdata stödjer den förutfattade meningen. Om man använder sig av detta kritiska värde kommer man att i genomsnitt dra felaktiga slutsatser om populationen i 5 av 100 tagna stickprov (om man har valt α = 0,05).

Referenser[redigera | redigera wikitext]

  • J.S. Milton och J.C. Arnold, Introduction to Probability and Statistics, fourth edition, (2003), McGraw-Hill
  • G. Blom, et al., Sannolikhetsteori och Statistikteori med tillämpningar, (2005), Studentlitteratur
  • L. Råde och M. Rudemo, Sannolikhetslära och Statistik för teknisk högskola, andra upplagan, (1994), Studentlitteratur

Se även[redigera | redigera wikitext]