3-14 Take Out

Jeg så mange matematikanvendelser her:

Charlie analyserede pengestrøm til en bank på en Stillehavsø ved at bruge Outlier detection.

Millie foreslog, at Charlie skulle bruge en trusselsmatrix (threat matrix) til at analysere de mange røverier.

Charlie skulle lave pharmacokinetik for et stort medicinalvarefirma.
Og Millie snakkede om Syzygies – jeg kan ikke lige huske i hvilken forbindelse, men noget med planeterne perfekt på linie…. Det har også en præcis matematisk betydning, men den får I ikke idag.

Outlier detection

I et stort datamateriale med en vis underliggende struktur (tænk på bedste rette linie) kan der være visse datapunkter, der ligger meget langt fra den fælles struktur. Det kaldes outliers. I visse sammenhænge, vil manb fjerne outliers, før man f.eks. laver bedste rette linie, fordi man simpelthen tror, det er fejlagtig data. Men det kan også være tegn på, at noget skal undersøges nærmere.

I artiklen “Phony Prices May Hide Import-Export Profits From IRS”, Jonathan Weisman
Washington Post Staff Writer
Friday, November 1, 2002;

beskrives, hvordan man kan hvidvaske penge ved at camouflere dem som eksport eller import af en vare med fiktiv pris.

I 2000 eksporterede nogen 182509 kilo honning til Yemen, hvor man ved, Bin Laden har forbindelse til tre honningfirmaer. Prisen var $2,63 pr kilo. Det er 38 procent over gennemsnitsprisen på honning i 2000, 1,91 $. Det giver 131406 $ for meget, som altså er penge bragt ind i USA fra Yemen, før 11. september 2001.

Ved at analysere enorme datamængder for import og eksport, opdelt i kategorier, udregner John Zdanowicz og Simon Pak gennemsnitspriser (eller rettere medianpriser) og udskiller de transaktioner, der ligger for langt fra (25% over eller under). De vurderer, at manipulation med import og eksportpriser snød den amerikanske stat for mere end 50 milliarder dollars i 2001. Ideen er, at man køber en vare i Indien for 100 dollars, påstår, den koster 199, sælger den for 200. Og man skal kun betale skat af fortjenesten, som reelt var 100 dollars, men i regnskabet ser ud til at være 1 dollar.
Generelt er analysen noget mere indviklet, end bare at kigge på medianpriser. mMen det er da fint, at man kan sige noget med så simpel en tilgang.

Og der er mange andre eksempler. Pointen er, at man skal holde øje med det usandsynlige. At outliers kan være tegn på andet end fejlindtastninger. Forsikringsselskaber leder efter svindel med den type metoder og kreditkortfirmaer holder øje med usædvanlige transaktioner som tegn på, at nogen misbruger et kreditkort.
Problemet er at finde ud af, hvad usædvanligt skal betyde. For kreditkort vil det afhænge af den, der sædvanligvis bruger det: Hvor bruges det, hvor store beløb, hvor tit,… Og man vil nødig mistænke en kunde, der en enkelt gang bruger kreditkortet til at købe en stor ting. Den gren af matematik, statistik og datalogi, der beskæftiger sig med den slags, kaldes Data Mining.

Trusselsmatrix
Jeg ved ikke helt, hvad Charlie og Millie gjorde her, men en Trussels matrix er en opstilling af trusler og vurdering af dem på systematisk facon. Her er en trusselsmatrix om narkotika i USA.

Pharmakokinetik
Pharmacokinetik drejer sig om, hvordan medicin (og andet, vil jeg tro) udbredes i kroppen. Hvis man spiser det, hvis man sprøjter det ind under huden, i en vene, …
Hos Novo har de for eksempel en hel afdeling for pharmakokinetik. En anden vigtig gren af studiet af medicin i kroppen er pharmakodynamik, som vist nok mere handler om, hvordan medicinen så optages eller reagerer med andet i kroppen. PK/PD er pharmakokinetik og pharmakodynamik.
Matematikken bag kommer fra mange brancher. Statistiske metoder er en stor del af det, men også differentialligninger – kompartmentmodeller, hvor man f.eks. beskriver, hvordan mængden af insulin og glucose forskellige steder i kroppen influerer på hinanden.
I Bergmans minimalmodel for vekselvirkning mellem glucose og insulin, kan Glucose være enten i væv (leveren) eller i plasma, og insulin kan have to former, hvoraf kun den ene er aktiv i at udskille glucose. Det er det, der er de fire “compartments”. Meget glukose i blodet sætter insulinproduktionen i vejret, hvis ikke der allerede er meget insulin. Og omvendt er insulin (det aktive) medvirkende til at udskille glucose. Alt ialt får man tre differentialligninger, der beskriver vækst af glucose, aktivt insulin og (inaktivt?)insulin. Se f.eks. denne poster (af Malene Højbjerre og Kim Emil Andersen) om at bruge Bayesiansk statistik til at analysere minimal modellen. Man kan finde både compartmentmodellen og differentialligningerne.

This entry was posted in Blog. Bookmark the permalink.