Reliabilitet

Från Wikipedia
Hoppa till: navigering, sök

Reliabilitet är tillförlitlighet hos en mätning. Begreppet används ofta inom exempelvis mätteknik och psykometri. Till exempel skall resultatet vara detsamma vid upprepade mätningar ("test–retest-reliabilitet"), och oberoende av vem som utför testet ("interbedömarreliabilitet"). Av reliabilitet följer inte att man har validitet, som innebär att testet mäter det som det är avsett att mäta. Däremot kan ett test eller en mätning inte ha högre validitet än reliabilitet.

Reliabilitet avseende tester kan mätas på flera olika sätt. Vid test-retest-reliabilitet utför man upprepade mätningar på samma sätt, och mäter sedan korrelationen mellan de olika mättillfällena. Det kan gälla antingen en persons svar på ett formulär, vilket är en typ av test-retest-reliabilitet, eller en bedömares skattning av någonting (intrabedömarreliabilitet).

En annan form av reliabilitet, intern konsistens (egentligen borde det heta intern konsekvens, men det engelska internal consistency har kommit att översättas så), avser hur väl olika delar av måttet mäter samma sak. Till exempel kan man önska att de olika frågorna ("items") i ett intelligenstest mäter intelligens på samma sätt. En metod för att mäta detta är split-half-metoden, som innebär att man delar upp frågorna i två hälfter - till exempel varannan fråga eller första och andra hälften av testet - och beräknar sedan korrelationen mellan de båda hälfterna. Ett annat mått på den interna konsistensen är Cronbach's α (alfa), som är ett sammanfattande korrelationsmått mellan samtliga items. I teorin är Cronbach's α ett mått på alla split-half utförda på en gång.

Klassisk testteori[redigera | redigera wikitext]

Inom klassisk testteori definieras reliabiliteten matematiskt som andelen av den totala poängens varians som utgörs av den sanna poängens varians eller, annorlunda uttryckt, ett minus andelen av den totalpoängsvariansen som utgörs av felvariansen:

{\rho}_{xx'}=\frac{{\sigma}^2_T}{{\sigma}^2_X}=1-\frac{{\sigma}^2_E}{{\sigma}^2_X}

där

  • {\rho}_{xx'} är reliabiliteten för det uppmätta värdet X,
  • {\sigma}^2_X är variansen i den totala (uppmätta) poängen,
  • {\sigma}^2_T är variansen i den sanna poängen och
  • {\sigma}^2_E är felvariansen.

Den sanna poängen kan ju dock aldrig observeras direkt eller beräknas, så därför används olika metoder för uppskattning av reliabiliteten, som test-retest-reliabilitet, parallella test och intern konsistens. Varje sådan metod bygger på något skilda källor till felvarians.

Se även[redigera | redigera wikitext]