H-index

Från Wikipedia
Hoppa till navigering Hoppa till sök

h-index är ett mått för citeringsanalys, som beskriver både produktivitet och räckvidd i publicering för en forskare eller akademiker.

Kortfattat innebär ett h-index på 10 att en person är medförfattare till minst 10 artiklar som alla blivit citerade minst 10 gånger.

Bakgrund[redigera | redigera wikitext]

Indexet föreslogs 2005 av Jorge E. Hirsch, en fysiker vid UCSD, University of California, San Diego, som ett verktyg för att jämföra omfattning och kvalitet i publicering för teoretiska fysiker[1] och kallas ibland för "The Hirsch index" eller Hirsch number.

Indexet har fått en viss spridning, och redovisas till exempel automatiskt för den som skapar en profil i Google Scholar, samt för andra vetenskapliga bibliotekstjänster, till exempel Scopus, Elsevier’s databas för artiklar och citeringar.

Definition[redigera | redigera wikitext]

En forskare tar fram kunskap och producerar artiklar, som huvud- eller medförfattare, som sänds till vetenskapliga tidskrifter. Efter granskning kan en artikel accepteras och publiceras. Andra forskare läser artikeln, och kan välja att citera denna artikel i andra artiklar. Ett enkelt mått på den enskilda artikelns "kvalitet" eller "avtryck" är antalet citeringar, .

Enkla mått på forskarens produktivitet eller "avtryck" är det totala antalet artiklar , samt det totala antalet citeringar

För att beräkna h-index sorteras artiklarna i fallande ordning efter antalet citeringar, så att är artikeln med störst antal citeringar , den med näst störst antal citeringar , och den med minst antal citeringar .

h-index är då ordningsnumret för den sista artikel där antalet citeringar är större än eller lika med ordningsnumret, det vill säga .

Annorlunda uttryckt så innebär till exempel ett h-index på 10 att en person är medförfattare till minst 10 publicerade artiklar som samtliga är citerade minst 10 gånger.

Exempel[redigera | redigera wikitext]

En forskare har publicerat 12 artiklar. I tabellen visas antalet citeringar i fallande ordning:

Exempel 1
Artikel nr 1 2 3 4 5 6 7 8 9 10 11 12 Tot
Citeringar 20 14 11 9 7 6 5 3 2 1 0 0 78

Den 6:e artikeln har 6 citeringar varför h-index blir 6.

En annan forskare har också publicerat 12 artiklar, och fått stor publicitet för en av sina artiklar som fått 50 citeringar, och i övrigt enligt tabellen nedan:

Exempel 2
Artikel nr 1 2 3 4 5 6 7 8 9 10 11 12 Tot
Citeringar 50 8 6 5 3 2 2 1 1 0 0 0 78

Den 4:e artikeln har 5 citeringar, men den 5:e har 3, varför h-index blir 4.

De båda forskarna har samma antal publicerade artiklar, och samma totala antal citeringar, men den förste får ett högre h-index på grund av en jämnare fördelning över sina artiklar av antalet citeringar.

Avgränsningar[redigera | redigera wikitext]

Om inget annat angives är h-indexet förmodligen beräknat på personens samtliga artiklar, men det förekommer avgränsningar i urvalet av artiklar som att:

  • självciteringar undantas (där forskaren refererar till sina egna artiklar)
  • urvalet av artiklar begränsas till en viss tidsperiod (till exempel "de sista 5 åren")
  • urvalet begränsas till en viss disciplin eller till vissa tidskrifter

En sådan avgränsning minskar antalet artiklar och därmed också det beräknade h-indexet, men kan då göra måttet mer relevant och underlätta jämförelser med andra personer om samma avgränsning gjorts för dem.

Diskussion[redigera | redigera wikitext]

Varje försök att skapa mått på vetenskaplig publicering har svagheter och måste tolkas med försiktighet.

En svaghet är att olika discipliner har olika mönster eller rutiner för hur publicering sker. Det kan finnas avsevärda skillnader mellan vilken mängd arbete som ligger bakom en enskild artikel, vilket kan ge stora skillnader i antalet publicerade artiklar. Det kan också finnas avsevärda skillnader mellan vad som krävs för att få stå med som medförfattare i en artikel - har artikeln ett stort antal medförfattare kan även detta påverka antalet publicerade artiklar för de enskilda medförfattarna. h-index beaktar inte hur författaren är placerad i författarlistan vilket ibland är en indikation på graden av medverkan i artikeln. Dessa svagheter har dock h-index gemensamt med till exempel måtten "antal artiklar" och "antal citeringar". Olika vetenskapliga tidskrifter har olika rykte eller "impact factor" och det kan vara lättare att få sina artiklar accepterade i en mindre prestigefylld tidskrift.

Sammantaget innebär detta att alla mått inklusive h-index, "antalet publiceringar" eller "antalet citeringar" blir trubbiga speciellt om man försöker jämföra över disciplingränser och länder.

h-index kan i viss mån bemöta dessa svagheter genom att det både återger att författaren har många publiceringar, och att många av dessa måste ha många citeringar. Att till exempel publicera i mindre kända tidskrifter må vara en "genväg" att få ett stort antal publiceringar, men om dessa tidskrifter har få läsare så kommer responsen i form av citeringar att bli begränsad, och begränsa möjligt h-index.

Verkligt höga h-index kräver ett betydligt större antal citeringar än låga. Implicit innebär ett h-index på till exempel 10 att en har minst 10 artiklar med 10 citeringar eller fler, det vill säga minst 100 citeringar, medan ett h-index på 20 innebär att en har minst 20 artiklar med 20 citeringar eller fler, det vill säga minst 400 citeringar.

Ett högt h-index blir därför ett mått på att det inte bara har publicerats artiklar, utan att de verkligen befunnits läsvärda av ett stort antal personer. Det krävs också att många artiklar är citerade - en enstaka "succe-artikel" med ett stort antal citeringar kan inte ensam ge ett högt h-index.

Exempel[redigera | redigera wikitext]

En av de genom tiderna mest produktiva matematikerna är Paul Erdős (1913-1996) som producerade omkring 1 500 matematiska uppsatser. Enligt Google Scholar[2] har han (2018) över 73 000 citeringar och ett h-index på 116. Det kan vara värt att notera att Erdős h-index fortsätter att öka över tjugo år efter hans bortgång då det alltjämt skrivs nya artiklar där han citeras.

En välkänd svensk fysiker med en mycket omfattande publicering är Max Tegmark. Enligt Google Scholar[3] har han (2018) närmare 60 000 citeringar och ett h-index på 106.

En välkänd svensk professor med en betydande men ändå mer "normal" publicering är Christian Azar. Enligt Google Scholar[4] har han (2018) drygt 6 000 citeringar och ett h-index på 42.

För att bli docent förekommer det att ett av kraven är att ha publicerat 15 artiklar i "välrenommerade, internationella engelsk-språkiga tidskrifter med peer-review-system".[5] En nybliven docent som nyss publicerat sin 15:e artikel kan per definition inte ha ett h-index över 15, och har knappast hunnit få några citeringar alls på sina sista artiklar och har mer troligt ett h-index på högst 10.

Referenser[redigera | redigera wikitext]

  1. ^ Hirsch, J. E. (15 November 2005). ”An index to quantify an individual's scientific research output”. PNAS 102 (46): sid. 16569–72. doi:10.1073/pnas.0507655102. PMID 16275915. Bibcode2005PNAS..10216569H. 
  2. ^ ”Google Scholar - Profil - Paul Erdős”. https://scholar.google.se/citations?user=cVeVZ1YAAAAJ&hl=sv&oi=ao. Läst 13 mars 2018. 
  3. ^ ”Google Scholar - Profil - Max Tegmark”. https://scholar.google.com/citations?user=eBXEZxgAAAAJ&hl=en. Läst 10 februari 2018. 
  4. ^ ”Google Scholar - Profil - Christian Azar”. https://scholar.google.com/citations?user=z0x7ig4AAAAJ&hl=en. Läst 19 februari 2018. 
  5. ^ ”Regler för docentur vid Sahlgrenska akademin”. Sahlgrenska Akademin. 24 augusti 2016. https://sahlgrenska.gu.se/forskning/docentur/regler. Läst 19 februari 2018. 

Externa länkar[redigera | redigera wikitext]