Det var dog et ubehageligt Numb3rs- afsnit. Med en undertone af, at det var godt, de nåede at tage livet af den dødsdømte, inden Don og co. kunne bevise, han var dømt for noget, han ikke havde gjort.
Nå, men matematikken: Der var noget om at finde noget utydeligt skrevet ved at bruge Gaussisk “Blur”(Gaussisk filter). Der var en oversættelse fra et fodaftryk til højde og drøjde af den, der havde sat det. Om analyse af talemønster for at afsløre løgn. Om DNA-analyse. Og en hel del basketball-matematik.
DNA-analyse
DNA-analyse bruges meget i opklaring af forbrydelser. (Og i f.eks. faderskabssager, til at forudsige arvelige sygdomme og meget andet). Og der skrives mange tvivlsomme tal i den forbindelse a la “sandsynligheden for, at han ikke har gjort det, er 1:1.000.000”.
En DNA analyse af et spor i en forbrydelse er en analyse af nogle kortere stykker et antal steder (loci) på DNA – lige nu er det i Danmark 10-15 steder. Det er altså ikke hele DNA, man ser på.
Her er et kromosom. Fra Wikipedia. Jeg mener, det er ved at dele sig i to, men det må I spørge en biolog om…
Og her er ale kromosomerne hos en mand. Der er 23 par. Et sted kunne så f.eks. være på kromosom nummer 10.
Hvert af disse steder på DNA består af en række gentagelser (Short Tandem Repeats, STR) af nogle kortere stykker (et kort stykke er 4 basepar – eksempelvis AGCT). Der er to parallelle steder (fra mor og fra far), så man får to tal, eksempelvis 11,12 for et af disse steder; svarende til 11 STR i den ene side og 12 i den anden.
For en person, Kurt, har man altså 10 sådanne par (eller flere, men lad os sige 10). Og man har et spor fra gerningsstedet- lad os sig blod- som man også analyserer. Hvis bare et af talparrene fra sporet IKKE matcher det tilsvarende fra Kurt, kan man afvise, at det er Kurts blod. (OBS: Parret (11,12) og parret (12,11) er i denne sammenhæng ens.) Her kan man naturligvis have fejl i analysen, så det alligevel er Kurt, så man skal passe på med at drage konklusioner alene udfra DNA.
Hvad nu, hvis de er ens. Er det så sikkert, at det er Kurts blod? Nej! Men man kan udtale sig om sandsynligheder. Man kan for eksempel spørge, hvor sandsynligt det er, at en tilfældig anden person matcher sporet. Og nu bliver det vanskeligt, for hvad er en tilfældig anden person? Disse tal kender man for f.eks. Danmarks befolkning – eller rettere, man har jo ikke DNA-testet os allesammen, så man har estimater for fordelingen i befolkningen.
Lad os nu sige, at der er sandsynlighed 1:1.000.000 for, at en tilfældig person har det fundne DNA. Hvis vi nu ikke har anden grund til at tro, det er Kurt, der har gjort det, end at hans DNA matcher, og det lige så godt kunne have været en hvilken som helst anden dansker, så kan vi næppe dømme ham på dette grundlag. For vi er jo 5 millioner, og der kunne jo så nemt være 4 andre, der havde denne profil. Men der er forhåbentlig andre grunde til, at vi tror, det er ham. Og disse bliver så støttet af DNA analysen.
Omvendt kan man overhovedet ikke sige, der er sandsynlighed 1:1.000.000 for, at det ikke er Kurt (og dermed 99,9999 % sandsynlighed for, at han har gjort det. Det er noget virkelig gedigent vrøvl. Tallet 1:1.000.000 er sandsynligheden for at finde dette blodspor givet det ikke er Kurt, der har gjort det. (Og at det lige så vel kunne være en hvilken som helst anden.)
Med formler: H0 er hypotesen “Kurt har gjort det”, E er evidensen, altså blodsporet. H1 er den modsatte hypotese. “En anden end Kurt har gjort det”. Den betingede sandsynlighed, P(E|H1) er 1:1.000.000.
Og man kan IKKE vende den om. Der gælder IKKE P(H1|E)=P(E|H1). Vi har Bayes’ formel til at beskrive relationen:
P(H1|E)=P(E|H1)P(H1)/P(E)
Man formulerer det også som likelihoodratioer eller odds:
L(H1|E)=P(E|H1)/P(E|H0)
eller den omvendte:
L(H0|E)=P(E|H0)/P(E|H1)
Hvis nu det slet ikke er den generelle befolkning, der kan være tale om, men man for eksempel ved, det er en fra en bestemt familie, så ligner deres DNA hinanden. Lad os sige Kurt har en onkel, som kunne have gjort det, men som vi ikke kan finde/fange. Selvom Kurt så matcher er der en noget større sandsynlighed for, at onklen også matcher, end for at en hvilken som helst anden gør det, og altså ikke helt så god grund til at dømme Kurt. (Man kan regne præcist ud, hvad denne sandsynlighed er, men det gør jeg ikke her). Er den anden mulighed, at Kurts bror har gjort det, er der en ny beregning.
I mange sager er det DNA, man finder, en sammenblanding af flere. Og så bliver det mere indviklet at uddrage profilerne. Det har PhD-studerende Torben Tvedebrink lavet en algoritme til – se Videnskab.dk.