Wishartfördelning

Från Wikipedia
Hoppa till: navigering, sök

Inom statistiken är Wishartfördelningen en generalisering till flera dimensioner av chitvåfördelningen eller till gammafördelningen då det är fråga om icke-heltal i frihetsgrader. Metoden är uppkallad efter John Wishart som tog fram den och först använde sig av den år 1928.

Definition[redigera | redigera wikitext]

Antag att X är en n \times p -matris, där varje rad är oberoende av varandra med ett p-variatvärde med medelvärdet 0:

X_{(i)} {=} (x_i^1, \dots, x_i^p) ^T\sim N_p(0,V)

Wishartfördelningen är då den sannolikhetsfördelningen av p \times p-matrisen i den slumpmässiga matrisen S=X^TX, även känd som spridningsmatrisen. Sannolikhetsfördelningen för S visas genom formeln

S\sim W_p(V,n)

Det positiva heltalet n är antalet frihetsgrader i matrisen, detta visas som W(V, p, n). Då n≥p är S inverterbar med sannolikhet 1, antaget att V är inverterbar.

Förekomster[redigera | redigera wikitext]

Wishartfördelningen kan ses som fördelningen av delarna till en kovariantmatris som i sig är en del av en multivariant normal fördelning. Den förekommer ofta i ratio-test inom den multivarianta statistiska analysen och även i teorin om slumpmässiga matriser.

Metoden används också vid trådlös kommunikation då den spelar stor roll för att analysera digitala signaler för MIMO-kanaler.

Egenskaper[redigera | redigera wikitext]

Log-förväntan[redigera | redigera wikitext]

Utgå från följande formel:

\operatorname{E}[\ln|\mathbf{X}|] = \sum_{i=1}^p \psi\left(\frac{n+1-i}{2}\right) + p\ln(2) + \ln|\mathbf{V}|

där  \psi är digammafunktionen. Denna funktion som inkluderar Wishartfördelningen hittas då ett bayesiskt nätverk tas fram.

Entropi[redigera | redigera wikitext]

Inom entropin, som är ett begrepp inom informationsteorin, har följande formel av fördelningen:

\operatorname{H}[\mathbf{X}] = -\ln \left (B(\mathbf{V},n) \right ) -\frac{n-p-1}{2} \operatorname{E}[\ln|\mathbf{X}|] + \frac{np}{2}

där B(\mathbf{V},n) är en normaliserande konstant i fördelningen:

B(\mathbf{V},n)=\frac{1}{\left|\mathbf{V}\right|^\frac{n}{2} 2^\frac{np}{2}\Gamma_p(\frac{n}{2})}

Detta visas i följande uträkning:

\begin{align}
\operatorname{H}[\mathbf{X}] &= \tfrac{n}{2}\ln|\mathbf{V}| +\tfrac{np}{2}\ln(2) + \ln\left (\Gamma_p(\tfrac{n}{2}) \right ) -\frac{n-p-1}{2} \operatorname{E}[\ln|\mathbf{X}|] + \tfrac{np}{2} \\
&= \tfrac{n}{2}\ln|\mathbf{V}| + \tfrac{np}{2}\ln(2) + \frac{p(p-1) \ln(\pi)}{4} + \sum_{i=1}^p \ln \left (\Gamma\left ( \tfrac{n+1-i}{2}\right ) \right ) -\frac{n-p-1}{2}\left(\sum_{i=1}^p \psi\left(\tfrac{n+1-i}{2}\right) + p\ln(2) + \ln|\mathbf{V}|\right) + \tfrac{np}{2} \\
&= \tfrac{n}{2}\ln|\mathbf{V}| + \tfrac{np}{2}\ln(2) + \frac{p(p-1) \ln(\pi)}{4} + \sum_{i=1}^p \ln \left (\Gamma\left ( \tfrac{n+1-i}{2}\right ) \right) - \frac{n-p-1}{2}\sum_{i=1}^p \psi\left(\tfrac{n+1-i}{2}\right) - \frac{n-p-1}{2} \left(p\ln(2) +\ln|\mathbf{V}| \right ) + \tfrac{np}{2} \\
&= \tfrac{p+1}{2}\ln|\mathbf{V}| + \tfrac{1}{2}p(p+1)\ln(2) + \frac{p(p-1) \ln(\pi)}{4} + \sum_{i=1}^p \ln \left (\Gamma\left ( \tfrac{n+1-i}{2} \right) \right ) - \frac{n-p-1}{2}\sum_{i=1}^p \psi\left(\tfrac{n+1-i}{2}\right) + \tfrac{np}{2}
\end{align}

Karakteristisk funktion[redigera | redigera wikitext]

Wishartfördelningens karakteristiska funktion är

\Theta \mapsto \left|{\mathbf I} - 2i\,{\mathbf\Theta}{\mathbf V}\right|^{-\frac{n}{2}}

Med andra ord

\Theta \mapsto \operatorname{E}\left [ \mathrm{exp}\left (i \mathrm{tr}(\mathbf{X}{\mathbf\Theta})\right )\right ] = \left|{\mathbf I} - 2i{\mathbf\Theta}{\mathbf V}\right|^{-\frac{n}{2}}

där E visar vad som förväntas.

Sats[redigera | redigera wikitext]

Om en pxp slumpmässig matris X har en Wishartfördelning med m frihetsgrader och variansmatrisen V, d.v.s X≈Wp(V,m), och C är en qxp-matris med rank q, i så fall kan de skrivas som

CXT^T \sim W_q(CVC^T,m).

Referenser[redigera | redigera wikitext]

  • Wishart, J. (1928). "The generalised product moment distribution in samples from a normal multivariate population". Biometrika 20A (1–2): 32–52. doi:10.1093/biomet/20A.1-2.32. JFM 54.0565.02.JSTOR 2331939.
  • Zanella, A.; Chiani, M.; Win, M.Z. (April 2009). "On the marginal distribution of the eigenvalues of wishart matrices". IEEE Transactions on Communications 57 (4): 1050–1060.doi:10.1109/TCOMM.2009.04.070143.
  • C.M. Bishop, Pattern Recognition and Machine Learning, Springer 2006, p. 693.
  • Anderson, T. W. (2003). An Introduction to Multivariate Statistical Analysis (3rd ed.). Hoboken, N. J.: Wiley Interscience. p. 259. ISBN 0-471-36091-0.
  • Rao, C. R., Linear statistical inference and its applications, Wiley 1965, p. 535
Venn A intersect B.svg Matematikportalen – portalen för matematik på svenskspråkiga Wikipedia.