2-1 Judgement call. Sæson 2 første udsendelse.

Hej Bloggere.
Så kom vi endelig igang med sæson 2.
Der var igen en del matematik (og forviklinger i Dons og Charlies forhold til kvinder, men det blander vi os ikke i her på bloggen).
Jeg så noget om eksponentiel vækst, origami, Bayesiansk filtrering og beslutningsstøtte og noget om pi. Eksponentiel vækst har været på bloggen før, så det tager jeg ikke med i aften, men måske senere. Origami venter jeg også med (de utålmodige kan google origami og mathematics sammen – det giver spændende links). Så det bliver noget om Bayes og noget om pi.

Bayes’ formel og beslutninger.
Charlie og Megan Reeves – ny i serien – vil gerne finde de mest sandsynlige mistænkte blandt en lang række, der kunne have motiv til at slå dommerens kone ihjel. Han ved altså, der er begået et mord, og skal finde morderen eller en række personer, som med en vis sandsynlighed har gjort det. Men sagsmapperne siger jo noget andet, i hvert fald i første omgang.
Lad os gøre det meget simpelt, og nej, så simpelt var det ikke i udsendelsen: Hvis Olsen har begået mange mord, eller hvis han er medlem af en bestemt bande, eller har særlig grund til at være vred på dommeren eller hans kone etc. er der en vis sandsynlighed for, at han har gjort det. Man mener måske, at sandsynligheden for, at Olsen begår et mord, hvis Olsen begår noget kriminelt, er 2%. Det er en betinget sandsynlighed: P(M|O), hvor M står for Mord, O står for “Olsen har gjort noget kriminelt”. (Den slags sandsynligheder er selvfølgelig svære at finde, og bygger på diverse skøn, som Megan kan fortælle Charlie om; men nu har jeg jo også forsimplet det ganske enormt her, så vi går lystigt videre). Det er jo omvendt: Vi ved, at der er begået et mord. Vi ved ikke, om Olsen har gjort noget. Og hvad med alle de andre kriminelle.
Faktisk vil vi hellere kende P(O|M), sandsynligheden for, at Olsen har gjort det, givet “det” er et mord.

Lad os sige, at der kun er tre kriminelle i denne verden, Olsen, Hansen og Jensen. Fra deres tidligere gerninger har vi sandsynlighederne for, at det, de har begået, hvis de har begået noget kriminelt, er er et mord; ADVARSEL – her kommer formler- spring over dem, hvis det er for meget-
P(M|O)=2%=0,02
P(M|H)=2%=0,02 og
P(M|J)=3%=0,03
Vi ved måske også noget om sandsynligheden for, at de hver for sig begår en forbrydelse
P(O)=1/2
P(H)=1/4
P(J)=1/4
(Samlet 1, for vi ved, der er begået noget.)
Sandsynligheden, for at Olsen begår et mord, er P(M|O)P(O)=0,02×0,5=0,01
Sandsynligheden, for at Hansen begår et mord, er
P(M|H)P(H)=0,02×0,25=0,005
og for Jensen får vi
P(M|J)P(J)=0,03×0,25=0,0075

Så sandsynligheden for, at der bliver begået et mord, er
P(M)=0,01+0,005+0,0075=0,0225
Jamen der ER jo begået et mord, så hvad skal vi bruge det til? Jo, Bayes’ formel siger, hvordan man “vender det om”:
P(O|M) er sandsynligheden for, at det er Olsen, der har gjort det, givet “det” er et mord.
Den finder man ifølge Bayes’ formel som
P(O|M)=P(M|O)P(O)/P(M)=0.01/0,0225=4/9

Tilsvarende har vi
P(H|M)=0,005/0,0225=2/9
P(J|M)=0,0075/0,0225=3/9
Så det er mest sandsynligt, at Olsen har gjort det. (Eksemplet her er planket fra min amerikanske blogkollega, se link til højre – så slap jeg for at regne…)

Man kan jo ikke gå ud og anholde Olsen på det grundlag; en udregning af denne type (eller rettere en kombination af en hel masse udregninger) indgår i et beslutningsstøttesystem. Man kan bruge den slags systemer som en støtte, men de kan naturligvis ikke stå alene.

Beslutningsstøttesystemer bruges mange steder. At finde sandsynlige årsager ud af en stribe mulige årsager er forbavsende nyttigt: Hvorfor hoster patienten? Er det lungebetændelse, forkølelse, tuberkulose, rygerlunger,… Vi ved noget om hvor mange patienter med lungebetændelse, der hoster, hvor mange (procentdel) der har lungebetændelse (og forkølelse…) Og vi skal have vendt det om. Det kan være meget mere indviklet med en lang stribe: A kan forårsage B, som kan forårsage C… og der er andre mulige årsgaer til B, C,… (Charlie tegnede en figur med pile mellem diverse cirkler – pilene indikerer hvad der kan forårsage hvad). Man kan læse mere om især landbrugets brug af beslutningsstøtte i en artikel fra Naturens Verden fra 1998. Steffen Lauritzen, som er den ene af forfatterne, lavede sammen med David Spiegelhalter en algoritme, som gør, at Bayesianske beslutningsstøttesystemer virker. I princippet skal computerne bare regne og bruge Bayes’ formel rigtig mange gange, men hvis ikke det organiseres intelligent, tager det alt alt for lang tid, selv for en hurtig computer. Steffen var professor i statistik i Aalborg indtil 2004, hvor han blev professor i Oxford.
Bemærk, hvordan den matematik, der bruges til beslutningsstøtte, er den samme i landbrug, af FBI, i retsgenetik,… Det er da smart!

Om pi og dets opdukken mange steder
Charlie snakker om, at pi (det græske bogstav, men det kan man ikke skrive i bloggen) dukker op i uventede sammenhænge. Pi er jo forholdet mellem omkreds og diameter af en cirkel, men det ses mange andre steder. Charlie nævner Buffons nåleproblem.
Spørgsmålet er simpelt: Hvis man har et bræddegulv med 10 cm brede brædder og man kaster en 10 cm lang pind. Hvad er sandsynligheden for, at den lander, så den krydser fra et brædt til et andet? Svaret er 2/pi. Eller sagt på en anden måde: 2(antal kast)/(antal gange, man rammer stregen mellem to brædder) nærmer sig pi, jo flere gange, man kaster.
Martin Bøgsted Hansen har skrevet om en anden synsvinkel på det samme i denne pdf-fil, “Et party trick”. Der kan I også læse om praktiske anvendelser – jo, sådan nogen findes skam. Man kan jo vende problemet om: hvis man smider pinden 10 gange, og den så skærer stregerne 7 af gangene, hvor lang er den mon så? Hvad nu, hvis det ikke er en pind, men et langt DNA-molekyle, man kigger på i et mikroskop, og det er krøllet, men man har lagt det oveni et linieret net, kan man så finde ud af, hvor langt det er, ved at se, hvor mange gange det skærer linierne? Ved at “smide det linierede net” 17 gange tilfældigt og tælle skæringspunkter med DNA’et hver gang?
I øvrigt er det ikke specielt mystisk, at pi optræder her – der er jo klart noget med vinkler involveret – hvis pinden rammer parallelt med gulvbrædderne vil den jo ikke krydse mellem to.
Man kan læse mere om, hvordan man finder sandsynligheden 2/pi, her: http://www.mste.uiuc.edu/reese/buffon/buffon.html

Hilsner
Lisbeth www.math.aau.dk/~fajstrup
numb3rs@math.aau.dk
Husk, man kan ikke efterlade kommentarer direkte – I skal sende en mail.

This entry was posted in Blog. Bookmark the permalink.