Skalrum

Från Wikipedia
Hoppa till: navigering, sök

Skalrum är ett ramverk för representation av bilder på multipla skalor som utvecklats inom områdena datorseende och bildbehandling.[1][2][3][4][5][6][7] Grundidén är att filtrera originalbilden med Gaussfunktioner av olika storlek så att strukturerna på olika skalor framhävs. I två dimensioner ges Gausskärnan av

G(x, y; t) = \frac{1}{2\pi t} e^{-(x^2 +y^2)/(2 t)}

där skalparametern t betecknar variansen. Motiveringen till att använda skalrumsrepresentation som ett första förbehandlingssteg till ett seende system består i att verkliga data, till skillnad från ideala matematiska storheter som punkter och linjer, kan uppfattas på olika sätt beroende på den skala de betraktas på. Genom att Gaussfiltrera bilden före vidare bearbetning undertrycks bildstrukturer som är mindre än filterkärnans karaktäristiska storlek \sigma = \sqrt{t}. Vidare om man uttycker bilddeskriptorer i form av Gaussderivator, så kommer dessa bilddeskriptorer att få en bandpasskaraktär som framhäver bildstrukturer av motsvarande storlek. Ett seende datorsystem kan dock i allmänhet inte förväntas att i förväg känna till vilka skalor som är relevanta för en given uppgift. Den enda rimliga strategin för ett seende system som betraktar en okänd scen är därför att betrakta bildrepresentationer på alla skalor, vilket är en av grundförutsättningarna i skalrumsteorin.

Det visar sig att skalrumsrepresentation med dess associerade Gaussderivator kan användas som bas för att uttrycka en rad olika typer av såväl linjära som icke-linjära visuella operationer[8][9], såsom särdragsdetektion (exempelvis detektion av kanter, regioner, hörn och åsar), klassifikation, matchning inom stereo och följning samt objektigenkänning. Skalrumsrepresentation är därför såväl ett flexibelt och kraftigt som ett robust verktyg för datorseende, bildanalys och bildbehandling.

Genom att studera hur bildstrukturer utvecklas över skala kan man generera hypoteser om vilka skalor som är relevanta för vidare bearbetning. Speciellt genom maximera normaliserade derivator över skala kan man detektera skalinvarianta intressepunkter och använda sådan information till att styra vidare bearbetning.[10][11][12][9] Denna metodik har använts för att extrahera skalinvarianta intressepunkter för följning och matchning samt för att beräkna skalinvarianta bilddeskriptorer för objektigenkänning.

Det finns stora likheter mellan skalrumsrepresentation, pyramider och vågelement. Det finns också nära kopplingar till biologiskt seende. En mer detaljerad beskrivning av ämnet med utförliga referenser finns på den engelskspråkiga Wikipedia-sidan scale-space.

Se även[redigera | redigera wikitext]

Referenser[redigera | redigera wikitext]

  1. ^ Witkin, A. P. "Scale-space filtering", Proc. 8th Int. Joint Conf. Art. Intell., Karlsruhe, Germany,1019–1022, 1983.
  2. ^ Koenderink, Jan "The structure of images", Biological Cybernetics, 50:363–370, 1984
  3. ^ Koenderink, Jan and van Doorn, Ans: "Generic neighbourhood operators", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol 14, pp 597-605, 1992
  4. ^ Lindeberg, Tony, Scale-Space Theory in Computer Vision, Kluwer Academic Publishers, 1994, ISBN 0-7923-9418-6
  5. ^ Florack, Luc, Image Structure, Kluwer Academic Publishers, 1997.
  6. ^ Sporring, Jon et al. (Eds), Gaussian Scale-Space Theory, Kluwer Academic Publishers, 1997.
  7. ^ Romeny, Bart ter Haar, Front-End Vision and Multi-Scale Image Analysis, Kluwer Academic Publishers, 2003.
  8. ^ Lindeberg, Tony, "Scale-space theory: A basic tool for analysing structures at different scales", J. of Applied Statistics, 21(2), pp. 224--270, 1994. (Supplement on Advances in Applied Statistics: Statistics and Images: 2).
  9. ^ [a b] *Lindeberg, Tony (2008). ”Scale-space”. Encyclopedia of Computer Science and Engineering (Benjamin Wah, ed), John Wiley and Sons IV: ss. 2495--2504. doi:10.1002/9780470050118.ecse609. http://www.nada.kth.se/~tony/abstracts/Lin08-EncCompSci.html. 
  10. ^ Lindeberg, Tony "Feature detection with automatic scale selection", International Journal of Computer Vision, 30, 2, pp 77–116, 1998.
  11. ^ Lindeberg, Tony "Edge detection and ridge detection with automatic scale selection", International Journal of Computer Vision, 30, 2, pp 117–154, 1998.
  12. ^ Lindeberg, Tony, "Principles for automatic scale selection" In: B. Jähne (et al., eds.), Handbook on Computer Vision and Applications,, volume 2, pp 239--274, Academic Press, Boston, USA, 1999.