Konvex funktion

Från Wikipedia
Hoppa till: navigering, sök
En funktion som är konvex på ett intervall.

En konvex funktion i en variabel är en matematisk funktion vars graf har ett speciellt utseende: Om man drar en rät linje mellan två valfria punkter på grafen, ska alla punkter på grafen mellan de två punkterna ligga på eller under linjen. Man säger att en linjär funktion ska överskatta funktionen. Ligger alla punkter under linjen oavsett hur man väljer att dra linjen kallas funktionen strikt konvex. Motsatsen är konkav funktion. För en konkav funktion ska alla mellanliggande punkter i exemplet ovan ligga på eller över linjen. Detta resonemang kan utökas till att gälla funktioner med godtyckligt antal variabler.

Detta kan formuleras som att en funktion f är konvex på sin definitionsmängd om för alla x och y i definitionsmängden och t i [0,1]:

f(tx + (1-t)y) \leq tf(x) + (1-t)f(y).

Om olikheten ovan är strikt är funktionen strikt konvext. Gäller den omvända olikheten är funktionen konkav.

Man kan även säga att en funktion är "konvex i ett begränsat intervall" eller "styckvis konvex" om den är konvex på en respektive flera delmängder av sin definitionsmängd.

Egenskaper[redigera | redigera wikitext]

Villkor för konvexitet[redigera | redigera wikitext]

Om funktionen har en andraderivata kan man avgöra konvexitet utan att rita upp grafen eller räkna med olikheten ovan. Det nödvändiga och tillräckliga villkoret är då att andraderivatan är \geq 0 överallt. Om andraderivatan är >0 överallt är funktionen strikt konvex. På motsvarande sätt är en konkav funktions andraderivata \leq 0 eller <0 (strikt).

För funktioner från ändligdimensionella vektorrum ska hessianen vara positivt semidefinit för att funktionen ska vara konvex och positivt definit för att funktionen ska vara strikt konvex.

Summor och sammansättningar[redigera | redigera wikitext]

Om f_1, f_2, ..., f_n är konvexa funktioner från  S \subseteq \R^n och a_1, a_2, ..., a_n är positiva skalärer så är även

\sum_{k=1}^n a_k f_k

en konvex funktion.

Låt  S \subset \R^n och P \subset \R. Om f:P \to \R är konvex och icke-minskande och g:S \to \R är konvex så är den sammansatta funktionen

(f \circ g)(x) = f(g(x))

konvex.

Kontinuitet och minimum[redigera | redigera wikitext]

En konvex funktion definierad på ett öppet intervall är kontinuerlig på intervallet och deriverbar på alla utom högst ett uppräkneligt antal punkter. Om intervallet är slutet kan funktionen vara diskontinuerlig vid ändpunkterna.

Varje lokalt minimum till en konvex funktion på en konvex mängd är även globalt minimum. En strikt konvex funktion har som mest ett globalt minimum.

Exempel[redigera | redigera wikitext]

  • Varje affin avbildning från \R^n till \R (funktioner på formen f(x)=a^Tx+b) är både konkav och konvex.
  • f(x) = x^2\, har andraderivatan f''(x) = 2>0\, och är därmed strikt konvex på hela \R.
  • f(x) = e^x\, har andraderivatan f''(x) = e^x>0\, är därmed strikt konvex på hela \R
  • f(x) = |x|\, är konvex och kontinuerlig överallt men har ingen derivata i x=0.
  • Triangelolikheten ger att varje norm är konvex: om (X,\|\cdot\|) är ett normrum, 0 \leq t \leq 1 \, och x,y \in X så är
\|tx + (1-t)y\|  \stackrel{\mathrm{triang.}}{\leq} \|tx\|+\|(1-t)y\| \ \stackrel{\mathrm{0 \leq t \leq 1}}{=} \ t\|x\|+(1-t)\|y\| .

Se även[redigera | redigera wikitext]

Referenser[redigera | redigera wikitext]