Födelsedagsparadoxen

Från Wikipedia
Hoppa till: navigering, sök
Grafen visar sannolikheten, för att minst två personer i en grupp har samma födelsedag, som funktion av gruppens storlek.

Födelsedagsparadoxen kallas det, för de flesta överraskande, faktum att i en grupp om 23 slumpmässigt utvalda personer, sannolikheten för att åtminstone två personer har samma födelsedag är större än 50 procent.[1]

Om det i gruppen finns minst 57 personer, så är motsvarande sannolikhet större än 99 procent. Med hjälp av den så kallade brevlådeprincipen kan man dra slutsatsen att den aktuella sannolikheten är lika med 100 procent först då gruppen består av 367 personer. Beräkningarna är gjorda under förutsättning att året maximalt har 366 dagar och att antalet födda en viss dag inte är större än antalet någon annan dag.

En frågeställning av mer generellt slag är det så kallade födelsedagsproblemet, som i sannolikhetsteorin handlar om att finna sannolikheten för att inget par i en grupp om n personer har matchande födelsedagar av d lika sannolika födelsedagar.[2]

Ett än mer generellt problem om sammanträffanden av detta slag har lagts fram av matematikern de Montmort.


Att förstå paradoxen[redigera | redigera wikitext]

För underlätta förståelsen av paradoxen, kan man närma sig problemet genom att beräkna sannolikheten för att ingen har samma födelsedag som någon annan i gruppen, det vill säga: "Vad är sannolikheten för att person 1 har en viss födelsedag, person 2 en annan och person 3 ytterligare en annan" etcetera. Varje gång man betraktar en ny person, blir sannolikheten mindre för att denne inte har samma födelsedag, som någon annan. Den första personen har således 366 dagar att "välja" mellan, person 2 har 365, person 3 har 364, och så vidare.

Ett av de problem, som kan lägga hinder i vägen för förståelsen av paradoxen, är att man inte uppfattat att frågan gäller om någon i rummet har samma födelsedag som någon annan, det vill säga att det inte handlar om huruvida en viss preciserad person har samma födelsedag som någon annan i gruppen.

Matematisk beskrivning[redigera | redigera wikitext]

Födelsedagsproblemet har formulerats på många olika sätt. I följande beskrivning av problemet, hämtat ur läroboken Stokastik[3], utgår vi från frågan: Vad är sannolikheten att det i en klass på n elever finns några som har samma födelsedag? Ordet några är skrivit i fetstil, då en förekommande missuppfattning är att födelsedagsproblemet handlar om en specifik födelsedag, eller en specifik person.

Första antagandet är att elevernas födelsedagar är oberoende. Beroende uppkommer bara då det finns tvillingar; så vi har ett rimligt antagande, som alltså är att det inte finns några tvillingar. Andra antagandet är att året har 365 dagar (skottdagen förekommer ej). Tredje antagandet är att födelsedagar är jämnt spridda över året (t.ex. antas att födelsedagar i januari är lika sannolika som födelsedagar i september).

Under dessa antaganden vill vi beräkna sannolikheten att några, av n elever, har samma födelsedag; beteckna denna händelse med A. Om det är svårt att beräkna P(A) kan vipröva att beräkna P(A^\complement), vilket är vad vi ska göra. För om vi beräknat P(A^\complement) vet vi att P(A)=1-P(A^\complement) (se Kolmogorovs axiom).

P(A^\complement) betyder sannolikheten att ingen har någon gemensam födelsedag (att alla har olika födelsedagar). Om nu alla måste ha olika födelsedagar kan första eleven ha en födelsedag, vilken dag som helst, detta sker med sannolikheten 1. Om nu nästa person måste ha en annan födelsedag kan han välja en av återstående 364 dagar. Sannolikheten att den andra personen har någon av resterande dagar som födelsedag är därför \frac{364}{365}.

Låt oss skriva första sannolikheten som (1-\frac{0}{365}) och andra som (1-\frac{1}{365}). Nu har vi ett tydligt mönster. Sannolikheten att den tredje personen har en annan födelsedag är (1-\frac{2}{365}), fjärde är (1-\frac{3}{365}), och så vidare tills n:te personen har en annan födelsedag med sannolikheten (1-\frac{n-1}{365}) (om n \geq 365 är P(A)=1). Enligt definitionen av oberoende händelser har vi.

P(A^\complement)=(1-\frac{0}{365}) \cdot (1-\frac{1}{365}) \cdot (1-\frac{2}{365}) \cdots (1-\frac{n-2}{365}) \cdot (1-\frac{n-1}{365})
=\prod_{i=0}^{n-1} (1-\frac{i}{365})

Svaret på frågan är således

P(A)=1-P(A^\complement)=1-\prod_{i=0}^{n-1} (1-\frac{i}{365})[4]

Tabellen nedan visar sannolikheten för några värden, n. Beräkningen bortser från skottår:


n p(n)
10 11,7 %
20 41,1 %
23 50,7 %
30 70,6 %
50 97,0 %
57 99,0 %
100 99,99997 %
200 99,9999999999999999999999999998 %
300 (100 − (6×10−80)) %
350 (100 − (3×10−129)) %
365 (100 − (1,45×10−155)) %
367 100 %


Approximering av svaret[redigera | redigera wikitext]

Det är möjligt att approximera produkten med (1-\frac{i}{365}) \approx e^{-i/365} (se e (tal) för definitionen av e).

\prod_{i=0}^{n-1} (1-\frac{i}{365})= \prod_{i=1}^{n-1} (1-\frac{i}{365}) \approx \prod_{i=1}^{n-1} e^{-\frac{i}{365}}

=e^{-\sum_{i=1}^{n-1} \frac{i}{365}} = e^{-\frac{n(n-1)}{2} \cdot \frac{1}{365}}

Där vi i sista likheten använt formeln för aritmetisk summa.

Se även[redigera | redigera wikitext]

Referenser[redigera | redigera wikitext]

Noter[redigera | redigera wikitext]

  1. ^ William Feller, An Introduction Probability Theory and Its Applications, Wiley International, New York 1950.
  2. ^ ”Birthday Problem”. WolframMathWorld. http://mathworld.wolfram.com/BirthdayProblem.html. Läst 11 april 2013. 
  3. ^ Britton 2012, s. 27-29
  4. ^ Lennart Råde, Sannolikhetslära och Statistik, Biblioteksförlaget Stockholm 1963.

Tryckta källor[redigera | redigera wikitext]

  • William Feller, An Introduction to Probability Theory and Its Applications, Wiley International Edition, New York 1950.
  • Gunnar Blom, Sannolikhetsteori och statistikteori med tillämpningar, Studentlittratur Lund 1972.


Britton, Tom; Alm, Sven Erick (2008), Stokastik (1), Sverige: Liber, ISBN 978-0-19-850718-5