2-21 Rampage

Charlie taler om en Brownsk bevægelse til at beskrive, hvordan skyderiet foregik. Han beskriver forløbet i 4 dimensioner, rum og tid, og snakker om en tesseract, en 4-dimensional kube. Brownske bevægelser må I vente med, eller søge i bloggen.

Flerdimensionale rum.

I fysik har man ofte brug for at beskrive en partikel ved både sted (x,y,z), tid, t og hastighed, (u,v,w). det giver ialt 7 koordinater: (x,y,z,t,u,v,w). Og voila er vi i et 7-dimensionalt rum. Og andet er der sådan set ikke i det.

og så alligevel: Kan man se højere dimensionale objekter for sig? Hvordan ser en 4-dimensional kube ud?.

Et kvadrat kan beskrives som de punkter (x,y), der opfylder [tex]0leq x leq 1[/tex] og [tex]0leq y leq 1[/tex].
En 3D kube er punkter (x,y,z), som opfylder [tex]0leq x leq 1[/tex] , [tex]0leq y leq 1[/tex] og [tex]0leq z leq 1[/tex].
Dens sideflader er kvadrater givet ved f.eks. x=0 og [tex]0leq y leq 1[/tex] og [tex]0leq z leq 1[/tex]. Der er 6 sådanne kvadratiske sideflader.
Man kan danne sig 2-dimensionale billeder af 3-kuben ved at se på dens skæring med diverse planer eller ved at se på den fra siden som f.eks. i dette billede fra Wikipedia
hexahedron.gif

En 4-dimensional kube kan beskrives som de punkter (x,y,z,t), som opfylder [tex]0leq x leq 1[/tex] , [tex]0leq y leq 1[/tex], [tex]0leq z leq 1 [/tex] og [tex]0leq tleq 1[/tex].

Den har tredimensionale side “flader”: F.eks. punkter x=1 og [tex]0leq y leq 1[/tex], [tex]0leq z leq 1 [/tex] og [tex]0leq tleq 1[/tex].

Der er 8 sådanne kuber Hver af disse kuber har 6 kvadratiske sideflader, som den deler med nogen af de andre kuber: Der er et kvadrat (0,1,z,t). I alt er der 24 kvadrater, eller 2-dimensionale sider af 4-kuben.

Den har kanter f.eks. punkterne (1,0,1,t) hvor [tex]0leq tleq 1[/tex]. Dem er der 32 af.

Og der er 16 hjørner (0,0,0,0), (1,0,0,0), (0,1,0,0), (0,0,1,0), (0,0,0,1), (1,1,0,0) etc.

Den tredimensionale figur Charlie viste frem, så ud nogenlunde som

pictureframe1.jpg

denne her (som jeg selv har tegnet…). Man kan se de 16 hjørner og de 32 kanter. Man kan også godt forestille sig, at der er en 3-kube “i midten”, der er 6 rundt om hullet i midten, og så er der en til, som ikke rigtig kan være i vores 3d billede, nemlig den hvis hjørner er yderst på figuren. Den dækker alt det andet.

Alex Bogomolnys klummeside hos MAA, Mathematical Association of America, kan man lege med en Java model af en 4-kube. Man kan lave snit i den med en hyperplan (hyperplaner er givet ved en lineær ligning Ax+By+Cz+Dt=E, ligesom planer i det tredimensionale rum er givet ved en lineær ligning)
der er også et link til en side, hvo man kan se et stereografisk billede af en 4D kube. Har man ingen 3d briller, kan man klikke to gange og gøre sig skeløjet for at se det i 3D…
her er det. Klik på stereo knappen to gange, og gør dig så skeløjet. man burde kunne se et 3d-billede i midten mellem de to. (Jeg kan ikke).

Der er også skrevet en skønlitterær bog, der hedder Tesseract, forfatter Alex garland. Udkommet på Rosinante.

Og til sidst en lille reklame: Jeg holder foredrag om Store uløste problemer i matematikken. Mandag klokken 19.30 i Videnskabernes Selskabs foredragsrække Nyt fra forskningen . Mere info her

Posted in Blog | Leave a comment

2-20 Pistoler og Roser (Guns n’ Roses)

Charlie omtaler sit arbejde med kognitiv emergensteori og regner på risikoen for, at bestemte personer vil begå selvmord. Hans test er bedre, siger han, end den af Holmes og Rahe, som man kan finde flere steder på nettet. Den er fra en artikel – Holmes, TH & Rahe, RH (1967) The Social Readjustment Scale, Journal of Psychomatic Research, 11, 213-218, og man vægter forskellige begivenheder i folks liv, for at måle, hvor stressede de er. Man kan tage den på nettet og for eksempel se, om man bør være stresset, hvis man lige er blevet gift og har fået en parkeringsbøde samt taget lån til en ny fryser… Den slags skal nok tages med et gran salt eller to.


Akustisk Fingeraftryk

Et skud afgiver en meget koncentreret lyd: Den udgår fra et lille område (mundingen), og den er i et meget kort tidsinterval.
Det betyder, at der i “fingeraftrykket” af den lyd indgår meget høje frekvenser.
I “fingeraftrykket” af en lyd, beskriver man lyden som en sum af sinusfunktioner. Lyd er trykbølger – luftens molekyler trykkes skiftevis tættere på hinanden og længere fra hinanden, ligesom man ser, hvis man sender en bevægelse langs en fjeder – pres den sammen i den ene ende, og se det forplante sig. Se en animation her Jeg har snuppet den fra en meget let tilgængelig introduktion til lyd på Glenbrook Highschool Illinois.

Frekvensen målt i Hertz er antal gange denne skiftevis sammenpresning og udvidelse sker pr. sekund. “Pæne” toner, som dem man laver med et stryge- eller blæseinstrument, er en sum af et antal trykbølger med forskellig frekvens. Der er typisk en grundtone og et antal overtoner, og det kan beskrives ved en sum af endelig mange sinus funktioner:

sinuskurver

Her er den grønne kurve grafen for sin(t), den blå er 1/2 sin(3t), og den røde er summen af de to. Det svarer til en lydbølge, hvor positive værdier er sammenpresning, mens negative er udvidelse. Bølgen er altså stadig i længderetningen, og ikke op og ned, som grafen måske kunne forlede til at tro.

Lyden af et skud kan også skrives som en sum af sinuskurver (og cosinus, men dem kan man tænke på, som forskudte sinuskurver). Ovenfor startede jeg med to sinus kurver og lagde dem sammen. Men det omvendte, at opsplitte et lydsignal i en sum af sinuskurver, kan også lade sig gøre. Det gør man i Fourieranalyse eller, mere avanceret, Fouriertransformation. En periodisk funktion kan skrives

f(x)==1/2a_0+sum_(n==1)^inftya_ncos(nx)+sum_(n==1)^inftyb_nsin(nx),

 

 

hvor koefficienterne (a’er og b’er ) kan findes udfra f(x) ved integration:

a_0 = 1/piint_(-pi)^pif(x)dx

 

a_n = 1/piint_(-pi)^pif(x)cos(nx)dx

 

b_n = 1/piint_(-pi)^pif(x)sin(nx)dx

(formlerne er sakset på Eric Weissteins Mathworld, mathworld.wolfram.com/FourierSeries.html, så slap jeg for at skrive dem selv)

Grafen for et skud er, som Larry siger, en meget skarp graf – fra ingen lyd til megen lyd til ingen lyd. Når man opløser sådan en lyd i sinuskurver, får man uendelig mange led med, og for en graf med et hop (en diskontinuitet), vil de led, der svarer til høje frekvenser optræde med ganske stor vægt.

fourierkasse.gif

Fra Eric Weissteins Mathworld, mathworld.wolfram.com

En “kasseformet” funktion som ovenfor kan for eksempel opløses i

f(x)==4/pisum_(n==1,3,5,...)^infty1/nsin((npix)/L).

og, som man kan se, indgår sin(nx) med vægt 1/n (der er grænser for, hvor stor vægt, man kan have af de høje led, når man samtidig ved, at uendelig mange led skal give noget endeligt tilsammen, så 1/n er en høj vægt). Et pistolskud giver lignende fænomener.

Refleksion af lydbølger sker forskelligt og afhænger af dels det stof, man reflekterer i, og dels frekvensen. En højfrekvent lyd reflekteres godt, og det er derfor, man kan gøre sig håb om at se et refleksionsmønster, som Larry og Charlie jo gør. Det er generelt meget svært at “regne baglæns” fra refleksionsmøsteret til, hvordan rummet ser ud (løse det inverse problem), men det gør de heller ikke. De sammenligner det “rigtige” skud med et, de selv affyrer, og ser, at mønstrene er forskellige og at der må have været noget andet i rummet, da offeret blev skudt, end under testskydningen.

Man har (selvfølgelig) analyseret de lydbånd, der er fra mordet på John F. Kennedy, for at se, om der mon er flere, der skyder – f.eks. fra den berømte “grassy knoll” (græsknolden…). Her er en artikel om sådan en undersøgelse. Jeg har lige læst i bogen “The numbers behind numb3rs”, som jeg har omtalt tidligere, at man har lavet billedanalyse på nogen af de billeder fra mordet, hvor man efter sigende skulle kunne se en stå på græsknolden, og billedanalysen viser, at hvis der står en, er vedkommende højst en meter høj. Men en god konspirationsteori skal man ikke ødelægge, og heldigvis siger artiklen om skuddet, at der sandsynligvis var skud andre steder fra.

I sidte nummer af Illustreret Videnskab beskrives ShotSpotter, som er et kommercielt system, der bl.a. udfra lyden af et skud identificerer våbnet, det er affyret med. Det finder også stedet, hvor der er affyret skud, og de påstår på hjemmesiden, at de kan sortere fyrværkeri og lignende lyde fra. Det bruges til at overvåge områder, hvor der tit bliver skudt, så politiet kan komme hurtigt til gerningsstedet. Artiklen i Illustreret Videnskab hedder “Politiet lytter med”, men man har kun adgang til den, hvis man er abonnent. Til gengæld kan man få adgang til artiklen om ShotSpotter i Wired. Der forklares lidt mere om, hvordan det virker: Lyden fra skuddet opfanges af et antal mikrofoner, som er anbragt i området. De er alle udstyret med en GPS-modtager, hvilket udover positionsbestemmelse også betyder, at de har et meget præcist fælles ur, i.e., fælles tidsbestemmelse via GPS-systemets tid. Udfra det tidspunkt, hvor lyden ankommer til forskellige mikrofoner, og kendskab til lydens hastighed netop den dag (afhænger f.eks. af temperaturen), kan man regne ud, hvor langt væk fra hver mikrofon, det er, og dermed hvor det præcis må være affyret.

Haplotyper:

Charlie vil analysere DNA og finde ud af, hvilken afstamning moderen har, og han nævner Haplotyper. Det kan man læse om i denne artikel fra Aktuel Naturvidenskab. Der indgår naturligvis statistiske metoder til at fastslå, hvad man mener med, at to befolkningsgruppers DNA ligner hinanden eller ikke gør det. Men det bliver ikke denne gang, I får noget om det. I artiklen ovenfor er et MDS-plot, Multidimensional Scaling. det kan I Google, indtil jeg får skrevet om det… Om man kan finde ud af, hvordan folk ser ud, udfra deres DNA, ved at sammenligne med en database af billeder af folk, koblet til deres DNA, ved jeg ikke. Måske er der en biolog, der vil fortælle om det. Skriv endelig.

Posted in Blog | 2 Comments

2-19 Mørkt stof (Dark Matter)

Der var matematik i brug på flere måder: Alle gymnasieelever havde en RFID (Radio Frequency IDentifier) i deres studiekort, så man kunne følge dem rundt på gymnasiet. Og Charlie brugte “Pursuit Evasion pattern” til at konkludere, hvor dem, der skød, var; udfra hvor dem, der blev skudt efter, befandt sig.

Om RFID

Der er et helt website: RFID-vidensbank under Teknologisk Institut, hvor man kan læse om denne teknologi, som åbenbart er i brug mange steder og er på vej frem. Grundlæggende er princippet, at man kan aflæse data fra en RFID-tag, når den kommer forbi en RFID-læser. Data i taggen er en slags identification af netop den tag, som så kan oversættes i det underliggende computersystem til, at det er mig, der går forbi, at det er en kasse med vin indkøbt til Føtex, at det er et brev på vej til Randers eller hvad man nu forestiller sig. Det er altså en slags stregkode, som man kan aflæse, når den passerer forbi. Hvor tæt , man skal passere forbi en læser, afhænger af typen af RFID, og ændrer sig vel også med tiden, efterhånden som teknologien udvikler sig.

Personligt får jeg kuldegysninger ved tanken om så megen overvågning af mig og alt fra mine nye sko til mine børn. Men som med al den slags teknologi, handler det om balance mellem privatlivets fred og ønsket om effektivitet, og måske også sikkerhed – man bruger også RFID i pas. Læs mere på ovennævnte site om både pro og contra vedr. RFID. Se under artikler.
Matematikken kommer ind, når man f.eks. skal sikre, at den information, der er i RFID’en også er den, der opfattes af læseren – det er området kodningsteori. Og der er også matematik i sikkerheden bag systemerne: Hvem har adgang til information om, at jeg bruger størrelse 39 i sko, og kan den information samkøres med, hvilke bøger, jeg låner på biblioteket, eller hvordan sikrer vi, at det ikke kan ske. Der er meget om RFID-sikkerhed på nettet, for eksempel her . Sikkerhed dækker ofte over, at der er problemer i matematik, som er vanskelige at løse. Og at man, for at bryde ind i systemet skal gøre noget, der er lige så svært som at løse et af disse svære problemer. Se for eksempel dette tidligere indlæg på bloggen, hvor kryptering behandles.
I øvrigt har jeg lige læste en artikel i Notices of the American Mathematical Society, hvor Neil Koblitz beskriver forholdet mellem kryptografi og matematik, herunder “beviser” for sikkerhed. Han nævner “the Rump sessions” ved Crypto konferencerne. Det er korte underholdende præsentationer, hvor man i år havde mulighed for at få sit indlæg optaget til Journal of Craptology(!). I starten blev de ledet af Whitfield Diffie, som er en af de to ophavsmænd til kryptering med offentlig nøgle. Han måtte bl.a. specificere, hvilke ting, det var ok at kaste efter foredragsholderen. Det lyder ret morsomt, og samtidig er det seriøse resultater. Jeg overvejer, om ikke jeg har valgt den forkerte gren af matematikken.

Pursuit Evation eller røvere og soldater.

Der er en hel problemkreds, som kaldes Pursuit evasion problems. Generelt er problemet at give algoritmer til at “fange så mange som muligt”. Man kan spørge, hvor mange, der skal til, for at fange alle, der er trængt ind. Hvor hurtigt, man kan gøre det. Kan man sikre, at der ikke har gemt sig nogen bag en, når man er gået igennem et område. Etc. Man kan have forskellige forudsætninger: Hvor stort synsfelt har forfølgerne, hvor hurtigt bevæger de to parter sig, hvad bevæger de sig rundt i etc.
Tidligere på bloggen har jeg vist eksempler på “hund og kat” problemet, hvor en hund jager en kat, og man specificerer noget om kattens bane og hundens hastighed. Og man kan benytte spilteori i det såkaldte gemmeleg eller hide and seek problem, søg selv i bloggen. Det er klart, at den slags spørgsmål er interessante for militæret, men mere fredelige anvendelser kan også være målet. Find selv på nogen.

Charlie nævner rovdyr-byttedyr modeller kombineret med “pursuit-evasion”.
Rovdyr-byttedyr modeller er differentialligningsmodeller, hvor ændringen i antal af en art afhænger af dels, hvor mange, der er af den ene og dels hvor mange der er af den anden. Rovdyr formerer sig knap så hurtigt, hvis der er få byttedyr, B(t), og hvis der er mange rovdyr i forvejen. Og der bliver færre (eller i hvert fald en mindre vækst af) byttedyr, hvis der er mange rovdyr R(t).
[tex] R'(t)=-aR(t)+bB(t)R(t)[/tex]
[tex] B'(t)=cB(t)-dR(t)B(t)[/tex]
hvor vi har taget med, at hvor mange, der bliver blive spist/får noget at spise afhænger af produktet R(t)B(t), for de to arter skal jo mødes.

Kombineret med Pursuit evasion, tager man hensyn til, hvor i planen (eller rummet) de to arter befinder sig. Man beskriver altså ikke kun, hvor mange, men også hvor de er. Og byttedyrene flytter sig, når de bliver forfulgt. Det bliver det meget mere indviklet af. Modellen kan f.eks. ligne den, Charlie brugte til at beskrive immigranterne fra Mexico i forrige afsnit.
Byttedyrenes bevægelse modelleres ved, at deres acceleration (i.e., ændring i hastighed) er givet ved
[tex] m vec{v}^{prime}(t)=vec{f}^{align}+vec{f}^{att}-vec{f}^{avoid}-vec{f}^{fric}-vec{f}^{rep}+vec{e}(t)[/tex]

hvor kraft-vektorerne “align” er tendens til at løbe i samme retning “att” er tiltrækning “rep” er frastødning (løb sammen, men ikke oveni hinanden) “fric” er gnidning og “avoid” er undgå forfølgere. det sidste led er et støjled, et stokastisk led.

Man kan så sætte de forskellige kræfter til at afhænge af positionen af alle de andre bytte- eller rovdyr, det kan være ret komplicerede funktioner. Og til sidst sætte en computer til at simulere hele systemet. Jeg fandt en artikel “Dynamics of prey-flock escaping behaviour in response to predator’s attack”, Lee, Pak og Chon. I Journal of Theoretical Biology, vol. 240. Men der er mange andre referencer. Det er en væsentlig pointe, at selve implementationen, altså det at få en computer til at “regne det ud”, er en stor del af arbejdet. Det er ikke bare at trykke på en knap på lommeregneren. Man kan bruge modellen ovenfor til at se, hvordan fisk danner stimer (også hvis der ikke er rovdyr) og fugle flyver i flok (når de er mange nok, som Benny Andersen siger). Det er altså et eksempel på, at mange individer kan give kollektiv opførsel, hvis de hver for sig reagerer på de nærmeste naboer – det, vi tidligere har set som emergensteori.

Charlie illustrerer princippet ved at strø peber på en vandoverflade og der efter hælde sæbe i. Så “flygter” peberet (fordi overfladespændingen ændres). Modeller af denne type bruges også på mindre skala om systemer i kemi eller fysik.
Charlie kombinerer med at eleverne løber rundt på skolen, så der er begrænsninger på bevægelserne. Og man kan ikke se om hjørner, så det giver yderligere komplikationer. Godt, Charlie og Amita er så snu, som de er, for det er bestemt ikke nemt. Og så skal de ovenikøbet regne baglæns og finde forfølgerne udfra, hvor byttet løber hen – et inverst problem.

Posted in Blog | 1 Comment

Bog om Numb3rs-matematikken

Der er kommet en bog om matematikken bag opklaring af forbrydelserne i Numb3rs:

“The numbers behind Numb3rs, solving crime with mathematics” af Keith Devlin og Gary Lorden.Devlin har skrevet mange gode populariseringer af matematik og Gary Lorden har været matematikrådgiver på Numb3rs helt fra starten af, så det er sikkert en god bog. Jeg har bestilt den hjem, og I hører mere, når jeg har læst den.

Posted in Blog | Leave a comment

2-18 All’s fair

Sikken et herligt Numb3rs afsnit! Men jeg holder mig til matematikken i det.

Charlie brugte Logistisk regression for at finde ud af, hvem blandt eksil-irakerne, der med størst sandsynlighed kunne være morderen. Mere nedenfor.

Fodaftryk

Larry analyserer fodaftryk og henviser til Petr Hlavacek, som ikke er matematiker, men en tjekkisk ekspert i fodtøj. Han er bl.a. kendt for at have analyseret Oetzi’s fodtøj. Oetzi er den 5000 år gamle mumificerede mand, der blev fundet i isen i de italienske alper i 1991. The Telegraph havde en artikel om Oetzi og hans fodtøj, der skulle være vældig komfortabelt – de tjekkiske skoeksperter rekonstruerede støvlerne (bl.a. noget med at garve med rå grisehjerne…) og vandrede rundt med dem i bjergene, så det er ganske vist. Hlavacek har også bidraget til at designe bedre sko til diabetikere, så de undgår koldbrand. Som sagt er han ikke matematiker, men som Numb3rs indledes med: “We all use math every day”, og det gør han vel også i sine analyser af fodtøj. Hvorvidt han virkelig kan sige, hvor høj man er, udfra fodaftryk, ved jeg ikke, men der er andre, der har lavet den slags analyser, og statistisk set hænger skostørrelse og højde jo sammen, så alene der er der en sammenhæng. Søg på forensic analysis og footprint. Der er en hel del hits. Larry siger i øvrigt også, at Hlavacek har analyseret Albrecht von Wallensteins støvler og set, at han havde syfilis.

Logistisk regression:

Charlie mener, at sandsynligheden for, at en given person er morderen, afhænger af en række data: alder, tidligere straffe,…

Den simpleste form for regression er den, mange har prøvet, når man finder “bedste rette linie” gennem nogen punkter. Man har par af punkter (x1,y1), (x2,y2), (x3,y3),… og mener, at sammenhængen er y=ax+b+et støjled der ikke er alt for stort.

Altså at der er en ret linie, der passerer tæt forbi punkterne. For at finde a og b, skal man overveje, hvad man mener med tæt forbi, og det kan f.eks. være mindste kvadraters metode. For et valg af a og b, ser man på [tex](a x_1 +b -y_1)^2[/tex], altså kvadratet på den lodrette afstand fra punktet (x1,y1) til linien. Det gør man for alle de datapunkter, man har. Den bedste rette linie (det bedste valg af a og b) er den, hvor summen af alle disse afstande er mindst mulig.

Men hvad nu, hvis de data, man har, ikke passer ind på en linie? Der er jo mange muligheder: Parabler, eksponentialfunktioner,…

I logistisk regression, som bruges i mange anvendelser, er det sandsynligheder, der afhænger af en stribe data. Sandsynligheden for, at man er den skyldige i et mord i Charlies tilfælde. For at bruge logistisk regression skal man studere et binært problem: Er man skyldig eller ej. Har man tuberkulose eller ej, har tabt sig eller ej, er ryger eller ej,…

Den sammenhæng, man forventer, er, at sandsynligheden [tex]p[/tex] opfylder ligningen [tex]ln(p/(1-p))=b_0+b_1x_1+b_2x_2+cdots+b_nx_n[/tex]
hvor [tex]x_j[/tex]’erne er alle de parametre: tidligere straffe, alder,…, man har for den mistænkte, vi kigger på. Man siger altså, at logaritmen til odds’ene er en lineær funktion af de forklarende variable, altså x’erne.
Nu skal man så have bestemt b_j’erne, og igen er det et spørgsmål om at få det til at passe med data, man kender, altså tidligere mord. Metoder til det kan for eksempel være maximum likelihood. Princippet er stadig, at man skal matche tidligere data bedst muligt med den model, man laver. Og at man antager, at det er en bestemt type model hvori man så skal bestemme de relevante parametre. Jo mere indviklet model, jo flere parametre. For eksemplet med bedste rette linie var der kun to, nemlig a og b.

Man bruger logistisk regression i biologi, medicin, sociologi og mange andre steder. Analysen laves normalt i et statistikprogram, ligesom vi jo laver bedste rette linie på lommeregneren eller i et regneark.

Posted in Blog | 1 Comment

Er matematik sjovt?

I onsdags blev jeg citeret i gratisavisen 24 timer for, at matematik er sjovt. Det er jeg faktisk ikke sikker på, jeg synes, og jeg tror heller ikke, jeg har sagt det, men pyt nu med det – PR for matematik kan man ikke få for meget af. Hvis jeg havde kunnet bestemme overskriften til det indlæg havde den være “Matematik er effektiv”, for det er jo det, man kan se i Numb3rs uge efter uge: Det er enormt effektivt at bruge matematiske værktøjer og at tænke systematisk, som vi jo gør. Og det er en fornøjelse at se, hvordan Numb3rs synliggør matematikkens anvendelser, uden at det bliver til matematikforelæsninger, for det er i hvert fald ikke sjovt 🙂

Matematik er skam en alvorlig sag, men matematik er spændende, fascinerende, udfordrende og hvis man arbejder sammen med nogen, er det også tit sjovt, men matematik i sig selv er vel egentlig ikke særlig sjov?

Mere matematik på onsdag efter Numb3rs, hvor vi blandt andet møder Charlies tidligere kæreste…

Posted in Blog | Leave a comment

2-17 “Mind Games”

OBS, dette blogindlæg er om udsendelsen på onsdag, 16-10. Da er jeg på ferie, så jeg har set udsendelsen på DVD og arbejdet lidt forud med bloggen. Men lad nu være med at læse dette til efter udsendelsen. Så er den nok ikke så spændende.

Nå så vi skulle lige have en clairvoyant med i Numb3rs. Se det er der jo ikke noget matematik i, men jeg kan da henvise til en artikel i Dansk Politi, hvor Kurt Kragh fra rejseholdet fortæller, at de jo ikke vil afvise information, for den kunne jo komme et andet sted fra. Men at de i øvrigt aldrig har fået et tip, de kunne bruge til noget, fra en clairvoyant.
Se også Skeptica hjemmesiden. Det projekt, Projekt Stargate, som “mediet” i udsendelsen påstår at have været med i, er faktisk virkeligt. Se på Wikipedia.
Charlie og Larry er temmelig uenige om, hvorvidt der findes en sjette sans. Deres diskussion ligner lidt en diskussion mellem fysiker og matematiker Freeman Dyson og Michael Shermer her. Larry gentager lidt Dysons argumenter, mens Charlie er på Shermers side. Nå, nu må vi over til matematikken.

Charlie bruger Fokker-Planck ligningen til at studere opførsel af en flok (af immigranter). Det er en meget generel ligning, som med de rette parametre kan beskrive rigtig mange systemer. Den bruges bl.a. til modellering af partikler, f.eks. Brownske bevægelser, men mon ikke Charlie er inspireret af denne artikel af David Brillinger fra Berkeley, eller måske denne . Der er eksempler på elges vandring og en slags sæler – elefantsæler, hvad så end det er. En af referencerne er i øvrigt til Søren Asmussen, som er professor ved Århus Universitet. Og der er referencer til Freeman Dyson, som jeg nævnte ovenfor. Artiklerne modellerer også hvilken indflydelse det mon har på elgene, at mennesker cykler mere eller mindre rundt i området – smart…

Charlie modellerer først kvindernes vandring rundt i terrænet med en stokastisk differentialligning. Stokastiske differentialligninger beskriver ændring af et system som funktion af, hvilken tilstand systemet er i (det er det, differentialligninger gør), og desuden indgår der et “støjled”, noget mere tilfældig variation i bevægelsen, som f.eks. skyldes, at vi ikke har alle parametre med i modellen.
Man har normalt en ide om, hvor sandsynlig støj af forskellig størrelse er, støjen er en stokastisk variabel.
Stokastiske differentialligninger bruges rigtig mange steder, og vi har haft dem på bloggen før, i forbindelse med finansiering

I Langevin ligninger, som så vidt jeg forstod var det, Charlie brugte, f.eks. denne
[tex]mmathbf{a} = mfrac{dmathbf{v}}{dt} = F(mathbf{x}) – beta mathbf{v} + eta(t). [/tex]

er der en kraft (tyngdekraft, et magnetfelt,..), der er noget “gnidning”, en vis modstand, som kan variere – er der buskads, er det opad eller nedad,…, og der kan være rovdyr, siger Charlie – det kan jeg ikke helt se i modellerne, men man kan vel modellere tilfældige møder med rovdyr i den stokastiske del. Og måske er Charlies model mere avanceret – det skulle ikke undre mig!
Fokker-Planck ligningen er en differentialligning, som udledes fra en stokastisk differentialligning. Fokker Planck har ikke noget stokastisk led, det er en deterministisk ligning. Og løsningen giver en sandsynlighedsfordeling (tidsafhængig), som opfylder Langevinligningen, eller hvad det nu er, vi vil løse.

Det er sådan, Charlie finder ud af, hvor resten af immigranterne sikkert er – med stor sandsynlighed – lige nu. Hvordan han finder parametrene til ligningen, har jeg ingen anelse om. Måske fra tidligere kortlægning af immigranters bevægelser?

Posted in Blog | Leave a comment

Protest. 2-16

Denne gang var matematikken mest i branchen grafteori. Om at analysere netværk og finde ledere. Det er højaktuelt med de store mængder data, man indsamler via diverse aflytninger og overvågninger – i USA kaldet Homeland Security. Aalborg Universitets afdeling i Esbjerg har forskning i den type “datamining”, og jeg vil se, om jeg kan få dem til at skrive lidt på bloggen. Men idag får i noget om Social Netværks analyse.  

SNA, Analyse af Sociale netværk (Social Network Analysis)

Et social netværk kan i denne sammenhæng være mange forskellige ting. Man repræsenterer forbindelser mellem individer som en graf. For hvert individ har man en liste over andre individer, dette individ er forbundet til. Og denne samling af informationer kan så repræsenteres grafisk som en graf:
Socialt netværk

(Hentet fra den amerikanske numb3rsblog, ved Mark Bridger)

En graf er den matematiske version af et netværk. Man laver forbindelseslinier, hvor der er forbindelser i netværket – og det kan igen dække over, at folk ringer til hinanden, at de har skrevet artikler sammen, er blevet anholdt sammen, eller hvad man nu har brug for at repræsentere. Internettet er for eksempel en kæmpegraf via links.

Nu har vi netværkene ovre i matematikken, og så kan vi se på dem med matematikværktøjer. Man kan, i samarbejde med sociologer og andre anvendere, definere, hvad det betyder at have et godt netværk, at to netværk er næsten ens, at et (socialt) netværk er skrøbeligt, at en person er central i et netværk etc. Og det er præcis det, SNA går ud på.

Man kan for eksempel se på

Valens: Hvor mange forbindelseslinier går der ud fra en givet knude? Knuderne B, D og E har valens 5, mens K har valens 2.

Tæthed: Hvor tæt ligger en knude på de andre knuder. Afstanden fra K til H (Hvor mange kanter skal man gå ad) er 3, men afstanden fra F til en anden knude er aldrig større end 2. Man definerer tætheden (closeness) for en knude, som den gennemsnitlige afstand til alle andre knuder. For F får man 1,6 hvis jeg har regnet rigtigt (10 andre knuder, og direkte forbundet til B, D, I og K, giver afstandene 4×1+6×2=16, som delse med 10). Mens man for A får 2,3

Kliker: En klike er en mængde knuder, som er parvis forbundet direkte: Knuderne A, B, C, D og E er en klike, og det er G, H, I og J også. (Det er NP-fuldstændigt at finde de(n) maksimale klike i en graf).

Uafhængig mængde: Det “omvendte” af en klike, nemlig en mængde knuder, hvor ingen er forbundet med en kant. For eksempel A, K, I. (Det er NP-fuldstændigt at finde de(n) maksimale uafhængige mængde i en graf).

Mellemliggenhed (Betweenness): I hvor høj grad ligger en knude “imellem” andre knuder. Vælg en knude, v. Lad p og q være to andre knuder. Se på antallet af stier mellem p og q med kortest afstand. Antallet af disse, som går via v, divideres med det samlede antal. Gør det for alle par af andre knuder og læg hele molevitten sammen.

For eksempel er der, hvis vi ser på knuden H ovenfor, ingen korteste stier, der går via H, så mellemliggenhed for H er 0.

Men knuden I ligger på enhver korteste sti mellem en af A, B, C, D, E, F, K og en af G, H, J, så mellemliggenhed for I er 3×7=21.

Knuden F ligger på enhver korteste sti mellem en af A,B,C,D,E,K og en af G,H,I,J, så mellemliggnehed er (mindst) 6×4=24. Desuden ligger F på den eneste korteste vej fra K til B, og på en af de to fra K til D og måske mere, jeg ikke lige har set, så mellemliggenhed af F er mindst 25,5.

Man kan se, at F er central. Selvom valensen kun var 4, og der er andre knuder med valens 5. Og det kan betyde mange ting, alt efter, hvad man har modelleret: Hvis det er smitteveje, vil F blive hurtigt smittet, hvis de andre bliver det, og det er omvendt smart at vaccinere F. Hvis det er et socialt netværk, er mange afhængige af F, så det er sårbart overfor, at F flytter, bliver syg eller måske bare bliver sur på de andre. Hvis det er et terrornetværk er det en god ide at fjerne F, hvad så end det indebærer.

Et andet mål for centralitet eller vigtigheden af en knude, er “egenvektorcentralitet”, hvor man vægter hjørner baseret på, hvor mange andre hjørner, de er forbundet til, og hvor mange disse igen er forbundet til. Det er det, Google gør, i PageRank algoritmen.

Charlie foreslår en “bipartite analysis”.

En todelt (bipartite) graf er en graf, der kan deles op i to mængder af knuder, som hver for sig er uafhængige. der er altså ikke nogen indbyrdes kanter i de to mængder, men kun kanter imellem dem. Grafen ovenfor kan ikke todeles: Antag vi har delt hjørnerne i mængderne M og N. Hvis A er med i den mængden M, kan B, C, D ikke være i M, men hvis B er i N, kan C og D ikke være der. Så C og D kan ikke være i hverken M eller N.

I en bipartite analysis leder man formentlig efter delgrafer, som kan 2-deles. Det har jeg ikke kunnet finde noget litteratur om.

I den matematiske tilgang til grafer, er det ofte nyttigt at se på “adjacency” matricen eller nabomatricen. For dem, der kender matricer, er det nemt at forstå, og andre kan springe over… For en graf med n knuder nummereret fra 1 til n er nabomatricen en nxn matrix med 1 i indgang ij, hvis der er en kant mellem knude i og j, og 0 ellers. (Generelt er det antallet af kanter fra i til j). For grafen ovenfor er den i denne fil matrice2.pdf

Man kan nu manipulere matricen: Benytte matrixmultiplikation, regne egenværdier ud etc. Matricen ganget med sig selv repræsenterer antallet af forbindelser via to kanter. Men det kan I selv lege med…

Man har analyseret forbindelser (ægteskabelig) i de italienske fyrstedømmer og set, at Medicierne spillede en central rolle som forbindelsesled, forbindelser mellem folk, der arbejder på OpenSource programmer, terrornetværk,…

Lidt bonusinformation: 

I udsendelsen nævnes The Weather Underground. Det var en voldelig protestbevægelse i 70’erne, og er altså ikke noget, man har fundet på til serien. Se for eksempel denne omtale af en Dokumentarfilm på IMDB. (Googler man, finder man også en vejrtjeneste under weather underground…) Derimod er organisationen Californians for Peace vist frit opfundet til lejligheden. Men lignende protestbevægelser fandtes.

Posted in Blog | 6 Comments

Numb3rs mailadressen og ny amerikansk numb3rs website

Der har været problemer med mailadressen numb3rs@math.aau.dk, men den skulle virke igen nu. Jeg håber ikke, der er nogen, der har skrevet forgæves.

Jeg surfede lige forbi CBS numb3rs hjemmesiden, og der fandt jeg en ny side om matematikken bag numb3rs. Den laves af folkene bag Eric Weissteins matematikleksikon, og det er rigtig flot. Det starter fra sæson 4, så der er længe til, vi når dertil i danmark. Men I kan jo klikke lidt rundt. den flotte grafik er lavet i matematikprogrammet Mathematica, som igen produceres af sponsoren af Eric Weissteins leksikon, nemlig Wolfram.

Eric Weisstein startede i sin tid et matematikleksikon på nettet via frivillig arbejdskraft – en slags wiki, men med ham selv som editor og hovedskribent; hans udgangspunkt var en hel masse facts om matematik og fysik, som han selv havde samlet sammen under sit astronomistudium. Det lagde han nu i en html fil og lagde det på CalTech’s server (Ja, Caltech, som Numb3rs kalder CalSci). Der var også et fysikleksikon. Han kaldte begge dele Eric’s Treasure Trove (skattekiste). Da det var blevet rigtig stort, blev det købt af CRC (Chemical Rubber Company) som i første omgang ville tage penge for adgang til det. Og lave en bog. Det blev der en del ballade over, for mange havde jo også bidraget frivilligt. Faktisk var MathWorld lukket i et helt år. Nu er det offentligt og Eric Weisstein er ansat af Wolfram til at lave netop det. Og formentlig forpligtet til at bruge Mathematica så tit om muligt….

Posted in Blog | Leave a comment

The Running man/Løberen 2-15

Der var ikke så meget brug af matematik i opklaringen af forbrydelser idag, men Charlie nævnte heldigvis Benfords lov. Han lavede et lidt kringlet argument udfra den, som var nyttigt i opklaringen, og det er faktisk en ret overraskende lovmæssighed, så den vil jeg fortælle om. Desuden foregik en del af udsendelsen i LIGO lab, så det får I også lidt om.

Charlie var lidt trist over, at han ikke er så feteret, som da han var ung, hvor han var det store håb i matematikken. Men sådan er det jo at blive voksen. Til gengæld må vi da sige, at han er ret god til at opklare forbrydelser med matematik…

Benfords lov

Ser man på det første ciffer i tabeller over for eksempel længden af verdens floder, indbyggertal i verdens lande, atomvægt, tal, der har stået på forsiden af en avis… og meget andet, vil det første ciffer med sandsynlighed ca. 0,30 være tallet 1. Umiddelbart skulle man jo tro, at alle tal mellem 1 og 9 optrådte med lige stor sandsynlighed, (altså 0,111) men det er fordi, man lader sig snyde af, hvad tilfældighed betyder i denne sammenhæng.

Denne regelmæssighed blev først observeret af Simon Newcomb i 1881. Han bemærkede, at de første sider i logaritmetabellerne (som man brugte før lommeregneren kom) var meget mere slidt end de sidste. Det er der, man har tal med første betydende ciffer 1. Men en rigtig forklaring fulgte først i 1995, i en stribe artikler af T.P.Hill. Jeg har fundet dem i JStor, hvor gamle artikler fra mange områder, herunder matematik, er scannet ind og kan hentes i pdf- gratis! Vil man virkelig vide, hvad Benfords lov siger, kan man kigge i Hills artikler
Base invariance implies Benfords Law
og i A Statistical Derivation of the significant-digit law Men det er hård kost.
Fænomenet er opkaldt efter en fysiker Frank Benford, som bemærkede det i 1938 og lavede lange lister over data fra baseballstatistik til husnumre.

Andelen af tal med første ciffer n, hvor n=1,2,3,4,5,6,7,8,9 er [tex]log(frac{(n+1)}{n})[/tex], hvor log er titalslogaritmen.

Et argument for, hvorfor fordelingen må være sådan, skyldes Roger Pinkham og er fra 1961. Hans argument er : HVIS der er en lovmæssighed for første ciffer i samlinger af data, så må det være uafhængigt af, om vi måler afstande i meter eller mil, vægt i kilo eller pund etc. Man skal altså få den samme fordeling, hvis man ganger alle sine data med det samme tal.

Først kan vi konstatere, at en jævn (uniform) fordeling af cifrene ikke opfylder det kriterium: Lad os sige, vi har en samling data, hvor alle 9 cifre optræder lige hyppigt som første betydende ciffer. Nu ganger vi alle vores data med 2. De data, der havde 1 som første ciffer, får nu enten 2 eller 3. De data, der havde første ciffer 5, 6, 7, 8 eller 9, vil nu have første ciffer 1, (tænk over det – man kan højst få en i mente); der er faktisk 10 gange så mange tal, der har første ciffer 1, som noget andet tal. Så det går ikke.

Argumentet for, at det bliver fordelingen ovenfor, er, for dem, der kender logaritmer: Skriv data som [tex]xtimes 10^n[/tex] hvor [tex]1leq x < 10[/tex]. Eksempelvis har 0.345 og 3450 begge x=3.45. Så er første betydende ciffer det første ciffer i x. Hvis fordelingen af x’erne er invariant under at gange med et tal (forbliver den samme, hvis vi ganger med et tal), er fordelingen af log(x) invariant når vi lægger et tal til. Hvorfor? Jo, log(ax)=log(a)+log(x). Kald de data, vi får som log(x) for y.Vi ved nu, at [tex]0leq y < 1[/tex] (fordi vi havde begrænsninger på x som ovenfor.
Den fordeling af y, der er invariant, når man lægger et tal til, er den uniforme fordeling.
Sandsynligheden for, at første ciffer i x er 1, er sandsynligheden for, at [tex]1leq x < 2 [/tex], og det er sandsynligheden for, at [tex]0leq y < log{2}[/tex] og den er log 2, da y er uniformt fordelt mellem 0 og 1. På samme maner ser man sandsynligheden for de andre cifre: x mellem n og n+1 svarer til y mellem log(n) og log (n+1).
Nå, det blev måske lidt langhåret.

Benfords lov og forfalskede data

Man bruger Benfords lov til at opdage forfalskede data. De færreste vil vælge deres falske data, så de følger Benfords lov, og der vil typisk være for mange med 4, 5 og 6 som første ciffer. Det bruges bl.a. af revisorer og skattevæsen. I hvert fald i USA, men også i Danmark. Se revisorinformatik programmet her.
Nu er det ikke alle data, der følger Benfords lov. For eksempel højde af voksne – der vil være rigtig mange med første ciffer 1, hvis man måler i meter. Så det er ikke tilfældigt nok – det er nok normalfordelt. Omvendt ved vi, at uniform fordeling heller ikke adlyder Benford. Det, Hill viste, var, at hvis man blander data, som har forskellig fordeling, som f.eks. dem på forsiden af avisen, vil sammenblandingen følge Benfords lov. Den præcise formulering kan I se i artiklerne ovenfor.

Man kan læse mere i Plus Magazine, på Wikipedia og mange andre steder på nettet.

Et eksempel på data, der følger Benfords lov, er dem, der er i databasen under Inverse Symbolic Calculator hvor man kan indtaste mærkelige tal, man er faldet over, og så få at vide, at det minsandten er logaritmen til pi eller noget i den retning. Jeg kunne kun få det til at virke, hvis jeg indsatte et punktum et sted i det tal, jeg tastede ind, men det kan I jo prøve jer frem med.

LIGO

Eller Laser Interferometer Gravitational-Wave Observatory er et virkeligt projekt ved CalTech som jo er det universitet, man har brugt som model for CalSci i Numb3rs. Det drives af CalTech og MIT og der er, så vidt jeg kan se, observatorier i Washington (staten) og i Louisiana. Man kan se på projektets hjemmeside hvor man også finder en beskrivelse af, hvad de leder efter – bølger i rum-tid, gravitationsbølger. Spændende. Man kan finde danske kilder om det via Google – jeg søgte på gravitationsbølger. For eksempel Ekkoer fra Big Bang, (oversat fra Scientific American) hvor LIGO også omtales. De har ikke fundet nogen gravitationsbølger endnu.

Posted in Blog | 1 Comment