Bayes’ læresetning i en vanlig formulering:
P(H|D) = P(D|H)P(H) / P(D|H)P(H) + P(D|¬H)P(¬H)
P står for probabilitet, eller sannsynlighet. Leddet til venstre for likhetstegnet kalles gjerne den a posteriori-sannsynligheten. Det leses som «Sannsynligheten for hypotesen, gitt data». Det er denne vi til slutt vil fram til. I uttrykket til høyre for likhetstegnet er P(H) den såkalte a priori-sannsynligheten, altså den sannsynligheten vi tilskriver hypotesen før vi har tatt hensyn til nye data. P(¬H) er 1 – P(H), eller altså a priori-sannsynligheten for at hypotesen ikke er sann. P(D|H) leses som «Sannsynligheten for data, gitt hypotesen», og P(D|¬H) leses som «Sannsynligheten for data, gitt at hypotesen ikke er sann».
Anvendt på Eddys mammografiproblem
I Eddys mammografiproblem ønsker vi å finne sannsynligheten for at en bestemt kvinne har brystkreft. ‘Kvinnen har brystkreft’ er hypotesen vi vil evaluere. Før vi vet noe annet, vet vi bare at kvinnen er en av mange i et utvalg hvor forekomsten av brystkreft er 1 %. Dermed er P(H) = 0,01 i dette scenarioet. Det medfører at P(¬H) = 0,99. Resultatet av mammografiundersøkelsen er data vi vil bruke til å justere vår opprinnelige sannsynlighet.
I dette oppsettet lar vi D = positiv mammografiundersøkelse. Vi får opplyst at dersom en kvinne har brystkreft, så er det en 80 % sannsynlighet for at hun også har en positiv mammografiundersøkelse (dette kalles sensitivitet). Med andre ord, gitt at hypotesen er sann, så vil data inntreffe med 80 % sannsynlighet. Dermed har vi at P(D|H) = 0,8.
Vi får også opplyst at selv om en kvinne ikke har brystkreft, så er det allikevel en 10 % sannsynlighet for at hun har en positiv mammografiundersøkelse (dette kalles falskt-positiv-raten). Altså, P(D|¬H) = 0,1.
Nå kan vi bare sette disse verdiene inn i formelen og regne ut svaret:
P(H|D) = 0,8 x 0,01 / 0,8 x 0,01 + 0,1 x 0,99 = 0,008 / 0,008 + 0,099 = 0,008 / 0,107 = 0,075
Bayes’ regel vil være nyttig i de fleste diagnostiske vurderinger, forutsatt at vi har noenlunde gode anslag på forekomst/grunnfrekvens, sensitivitet og falskt-positiv-rate.
Anvendt på Monty Hall-problemet
I Monty Hall-problemet har vi i utgangspunktet tre hypoteser: Bilen er bak dør 1 (H1), bilen er bak dør 2 (H2) og bilen er bak dør 3 (H3). Sannsynligheten for hver av dem er i utgangspunktet like stor. Vi har altså at P(H1) = 0,333, P(H2) = 0,333 og P(H3) = 0,333. Som vi kanskje husker, er situasjonen den at vi har valgt å satse på dør 1, og at Monty åpner dør 3. Det at Monty åpner dør 3, er den hendelsen vi vil justere hypotesene vår i lys av. Den er data i dette oppsettet, altså D = Monty åpner dør nr. 3.
Vi skal vurdere om det lønner seg å bytte til dør 2. Vi er altså ute etter å finne sannsynligheten for P(H1|D) og for P(H2|D), slik at vi kan avgjøre hvilken av de to dørene vi skal satse på. Husk at det svaret de fleste tror er riktig, er at det er likegyldig om vi bytter eller ikke.
Med definisjonene over kan vi nå tilpasse læresetningen øverst på siden til akkurat denne situasjonen:
P(H1|D) = P(D|H1)P(H1) / P(D|H1)P(H1) + P(D|H2)P(H2) + P(D|H3)P(H3)
og
P(H2|D) = P(D|H2)P(H2) / P(D|H2)P(H2) + P(D|H1)P(H1) + P(D|H3)P(H3)
Nå må vi finne opplysningene som skal erstatte P(D|H1), P(D|H2) og P(D|H3). Hva er sannsynligheten for at Monty åpner dør nr. 3, gitt at bilen står bak dør nr. 1? Hvis H1 er sann, så er det tilfeldig hvilken av de to andre dørene Monty åpner. Altså har vi at P(D|H1) = 0,5. Hva er sannsynligheten for at Monty åpner dør 3 dersom bilen er bak dør nr. 2?
Jo, siden han under denne forutsetningen ikke kan åpne verken dør 1 (den vi har valgt) eller dør 2, så må han åpne dør 3. Dermed har vi at P(D|H2) = 1. Hva er sannsynligheten for at Monty åpner dør 3, gitt at bilen er bak dør 3? Det kan han jo ikke gjøre, så dermed har vi at P(D|H3) = 0. Nå har vi alle verdiene vi trenger for å gjør utregningene:
P(H1|D) = 0,5 x 0,333 / 0,5 x 0,333 + 1 x 0,333 + 0 x 0,33 = 0,167 / 0,167 + 0,333 + 0 = 0,167 / 0,5 = 0,333
og
P(H2|D) = 1 x 0,333 / 1 x 0,333 + 0,5 x 0,333 + 0 x 0,333 = 0,333 / 0,333 + 0,167 + 0 = 0,333 / 0,5 = 0,667
Det er altså dobbelt så stor sannsynlighet for at vi finner bilen om vi bytter til dør 2.
Legg merke til at bruken av formelen her nærmest tvinger oss til å ta Montys perspektiv og til å se de mulighetene som fins. Bayes’ prinsipp er altså noe av en mental krykke når den anvendes i relevante sammenhenger.