Scale-invariant feature transform

Nyckelpunkter av samma scen, men från ett annat håll. SIFT används till att hitta korrespondenser.

Scale-invariant feature transform (SIFT) är en algoritm i datorseende för att extrahera intressepunkter med associerade lokala histogram över lokala gradientriktningar, vilka är rimligt väl opåverkade av skala, rotation och belysning. Algoritmen presenterades 1999 av David Lowe. De s.k. intressepunkterna, som möjliggör skalinvarians, extraheras på ett sätt som utgör en approximation till intressepunktsoperatorer som tidigare utvecklats inom skalrumsteori (se nedan).

Tillämpningar[redigera | redigera wikitext]

SIFT används till att finna korrespondenser mellan punkter i två eller flera bilder; matchning. Detta kan användas inom flera tillämpningar, till exempel bildregistrering.

Objektigenkänning[redigera | redigera wikitext]

Genom att för ett objekt bygga upp en databas med tillhörande SIFT-punkter kan objektet hittas i en godtycklig bild.^[1] Träffar mellan bildens och objektets punkter kan hittas och verifieras genom en kontroll mot objektets geometri.

Panorama[redigera | redigera wikitext]

Genom att hitta korrespondenser mellan två delvis överlappande bilder kan avbildningen mellan bilderna uppskattas. Efter att avbildningen är uppskattad kan bilderna sys ihop till en enda stor bild. SIFT har framgångsrikt använts till att skapa panoraman helt automatiskt. ^[2]

Se även[redigera | redigera wikitext]

SURF

Referenser[redigera | redigera wikitext]

Följande två artiklar beskriver i detalj hur SIFT fungerar och hur det kan tillämpas inom objektigenkänning.

Lowe, D. G., “Distinctive Image Features from Scale-Invariant Keypoints”, International Journal of Computer Vision, 60, 2, pp. 91-110, 2004.

Lowe, D. G., "Object recognition from local scale-invariant features," Proceedings of International Conference on Computer Vision, 1999, pp. 1150-1157

Följande artikel utgör originalreferens för att detektera skalinvarianta intressepunkter utifrån skalrumsextrema av det skalnormaliserade Laplace-svaret (Lowe använder en approximation till detta i termer av differenser mellan Gauss-utjämnade bilder):

Lindeberg, Tony (5 maj 1998). ”Feature detection with automatic scale selection”. International Journal of Computer Vision "30" (2): ss. 79–116. doi:10.1023/A:1008045108935. http://www.nada.kth.se/cvap/abstracts/cvap198.html.

Noter[redigera | redigera wikitext]

^ Lowe 2004
^ Recognising panoramas, Brown, M. Lowe, D.G. Dept. of Comput. Sci., British Columbia Univ., Vancouver, BC, Canada; [1]

[1] Lowe 2004

[2] Recognising panoramas, Brown, M. Lowe, D.G. Dept. of Comput. Sci., British Columbia Univ., Vancouver, BC, Canada; [1]

[1]

[2]