Monets malerier af katedralen i Rouen blev brugt som eksempel på noget, der er næsten ens, men ikke, når man kigger nærmere efter. Charlie sagde, det drejede sig om forskellige penselstrøg, men de er nu mere forskellige end det – de er malet på forskellige tider af døgnet og har ret forskellige farver. Der er godt 30, og man kan se de 16 på Wikipedia. Charlie brugte analogien for at tale om audiosignatur eller akustisk signatur. Det er der matematik i. Der var noget om DNA – den kidnappede pige var en klon (!).
Akustisk signatur
Charlie og Amita følger en bil gennem LA ved at genkende dens akustiske signatur i de forskellige overvågningssystemer, der findes i USA. Vi har set på akustisk signatur af et skud tidligere på bloggen.
En akustisk signatur er et uddrag af karakteristiske egenskaber ved et lydsignal: Lyden af en ubåd, lyden af patientens lunger i et stetoskop, lyden af bestemte bilmærker (en Porsche lyder anderledes end en Ferrari), menneskestemmer, find selv på flere. Lyden af forsnævrede kranspulsårer har en anden signatur end sunde kranspulsårer; det kan man høre, men man kan også uddrage de karakteristiske forskelle og få en automatisk registrering af problemer – meget før, vi ville kunne høre det med ørerne.
Karakteristiske egenskaber ved lyd kan være frekvenser. Dem kan man uddrage ved Fourieranalyse. Et lydsignal tager en vis tid, og man taler om tids og frekvensdomæne. Her er en lyd, som er en sum af to sinus kurver:
Den røde kurve er summen af den blå og den grønne. Grafen viser ampituden (lydtryk) som funktion af tiden. En frekvensanalyse ville give to toppe: En ved frekvensen for den grønne og en ved frekvensen for den blå. Igen vil højden af toppene indikere, hvor meget energi, der er i lyd med netop den frekvens.
Frekvenserne og den energi, de optræder med, kaldes spektret for lyden. Her er et eksempel fra Wikipedia:
Lyden af en bil varierer som tiden går, så man er interesseret i både frekvensbillede og tidsbillede, altså, hvordan spektret (frekvenserne) varierer, som tiden går. En tids-frevens- repræsentation af lyden.
Billedet her er en tids-frekvensplans repræsentation af John F. Kennedy, der siger “Ich bin ein Berliner” De røde punkter svarer til høj energi, de blå er lav. Tak til Anders La Cour for billedet, som også er i denne artikel om wavelets i Aktuel Naturvidenskab.
I afsnittet her vil man genkende en bestemt bil blandt mange. Det har jeg ikke fundet referencer til, men man kan udmærket forestille sig, at en bestemt bil har en karakteristisk lyd. Om man kan genkende den blandt mange andre, ved jeg ikke.
Jeg har fundet en hel del artikler om at genkende køretøjer i bevægelse – med henblik på alarmsystemer. Der er mange lyde – vind, regn, tale, fly, skridt,…, problemet er så at finde lyden af (motor)køretøjer blandt alle disse. I artiklen Wavelet based acoustic detection of moving vehicles. (A.Averbuch, N.Rabin, A. Schclar) beskrives en algoritme, der gør det. Den er, som titlen siger, baseret på wavelets. Wavelets har vi haft tidligere på bloggen her forklarer Arne Jensen om wavelets.
1) Algoritmen skal først selv uddrage karakteristika ved køretøjer (V) og ikke-køretøjer (N). Derfor analyseres en lang række lyde, som allerede er klassificeret som V eller N. Analysen bruger wavelet filtre. Så kaldes proceduren RSNOFP (Random Search for Near Optimal Footprint). Denne søger efter den beskrivelse af egenskaber ved de to typer signaler, som bedst skiller dem ad i to grupper.
2) Der bygges et CART, Classification and regression Tree, se tidligere på bloggen. Det er et beslutningsstøttetræ.
3) Nu kan man identificere om et nyt signal er V eller N ved først at dele det op i komponenter via en waveletanalyse og så se, hvor langt det ligger fra hhv. karakteristika for N og for V. (Her skal man bruge et afstandsmål.)
Om kloner og DNA
Den bortførte pige har præcis samme DNA-profil som en kvinde, de finder i databasen over DNA-profiler.
Det betyder ikke nødvendigvis, at pigen har samme DNA som kvinden. En DNA profil er ikke en registrering af hele DNA og det er simpelthen noget vrøvl, at man kan konkludere, at de to har ens DNA og dermed, at pigen er en klon. En DNA-profil giver information om en lille del af DNA. Se mere på bloggen om, hvad man registrerer i en DNA-profil.
Hvis databasen er stor nok, så vil der med stor sandsynlighed være profiler, der er ens (og ikke kommer fra enæggede tvillinger eller kloner). Det er en udbredt misforståelse, at en DNA profil er en kortlægning af hele DNA, men det er det på ingen måde.
Projektet 1000 genomes er en kortlægning af 1000 personers DNA. En del af projektet er lige blevet færdigt 27 oktober 2010 og resultaterne er offentliggjort i Nature. Det er en kæmpeopgave. Et mål er at se på variation i DNA, sammenhæng mellem genotype og fænotype og på mutation (man har to mor, far, barn tripler med) . Det kan også give en ide om, hvor gode DNA-profilerne er – hvor forskellige, vi faktisk er.
Faktisk er 1000genome ved at kortlægge 2500 personers DNA. Det er mange, men ikke i forhold til al den information, der er i hver enkelts DNA.