Maskininlärning

Från Wikipedia
Hoppa till: navigering, sök

Maskininlärning är ett delområde inom datavetenskap som utvecklats från studier av mönsterigenkänning och "computational learning theory" inom artificiell intelligens. Maskininlärning har allt mer kommit att sammansmälta med ämnet statistik.[1] Maskininlärning utforskar och studerar konstruktion av algoritmer som kan lära sig av och göra förutsägelser gällande data, utan att explicit programmerats för ändamålet. Sådana algoritmer fungerar genom att konstruera modeller från exempelinmatningar, istället för att följa strikt statiska programinstruktioner.[2]

Maskininlärning används bland annat inom robotik, programvaruutveckling.

Översikt[redigera | redigera wikitext]

Ett av de mest använda definitionerna av maskininlärning har getts av Tom M. Mitchell[3]. Han definierar de algoritmer som studeras inom maskininlärning som "ett datorprogram sägs lära av erfarenhet E givet en uppgift T och ett prestandamått P om dess prestanda på uppgiften T, mätt med P, ökar med erfarenhet E"[3].

Typer av problem och uppgifter[redigera | redigera wikitext]

Problem inom maskininlärning delas ofta in i två breda kategorier beroende på om det finns en signal att "lära" eller en "feeback" att återge till systemet:

  • Övervakat lärande (supervised learning): Programmet får se exempel på indata och förväntad utdata som är givet av användaren. Målet är att programmet skall lära sig approximera en funktion som avbildar indata på utdata.
  • Oövervakat lärande (unsupervised learning): I detta fall finns det ingen förväntad utdata och den data som ges algoritmen är omärkt. Programmet får således lära sig underliggande strukturer endast via indatan (och inte genom given förväntad utdata).

En alternativ kategorisering av maskininlärning uppstår när man betraktar den utdata som är önskvärd:

  • Inom klassificering delas indata upp i en eller flera klasser, och maskininlärningsalgoritmen klassificerar tidigare osedd data till en eller flera av dessa klasser. Detta problem angrips ofta med hjälp av övervakat lärande. Exempel på klassificering är spamfiltrering, där indata är e-post-meddelanden och klasserna är "spam" och "inte spam".
  • Inom regression, också ofta tacklat med hjälp av övervakat lärande, är målvärdet kontinuerlig i stället för diskret.
  • Inom klustring är syftet att indata skall delas upp i flera grupper. En skillnaden mot klassificering är att man inte vet vilka grupper som finns i förväg. Detta är typiskt för oövervakat lärande.
  • Täthetsuppskattning identifierar distributionen av indata i någon rymd
  • Dimensionalitetsreduktion förenklar indata genom att överföra den till en rymd med lägre dimensionalitet. Exempelvis genom principalkomponentanalys.

Mjukvara[redigera | redigera wikitext]

Många maskininlärningsalgoritmer implementeras i öppna mjukvaruramverk

Öppen mjukvara[redigera | redigera wikitext]

Se även[redigera | redigera wikitext]

Referenser[redigera | redigera wikitext]

  1. ^ Efron, Bradley; Hastie, Trevor (2016). Computer Age Statistical Inference: Algorithms, Evidence and Data Science. https://web.stanford.edu/~hastie/pub.htm. Läst 7 september 2017 
  2. ^ ”Glossary of Terms Journal of Machine Learning”. ai.stanford.edu. http://ai.stanford.edu/~ronnyk/glossary.html. Läst 15 december 2015. 
  3. ^ [a b] Mitchell, T. (1997). Machine Learning. McGraw Hill. Sid. 2. ISBN 0-07-042807-7. 

Externa länkar[redigera | redigera wikitext]