4-17 Pay to Play

Charlie og Larry analyserer musik for at se, om det har hit-potentiale. Der er noget med en “stringmetric”. Desuden bruger Larry og Charlie Kodningsteori for at gendanne tabt information i den computer, der bliver skadet, da en bil ryger i luften; Larry nævner Gröbner baser i den forbindelse Så der var rigtig meget matematik!

Matematik og hits
Der er flere firmaer, der analyserer musik for at forudse, om de bliver hits, og – vel mere nyttigt for pladeindustrien – siger noget om, hvordan man kan ændre et nummer for at give det mere hit-potentiale.

Firmaerne vil naturligvis ikke afsløre, hvad de helt præcist gør, men noget kan man finde ud af.

Platinum Blue (som nu hedder Music XRay), grundlagt af Mike McCready m.fl. omtales i The New Yorker i en artikel af Malcolm Gladwell (ham med “The tipping Point”). Et andet firma er uPlaya, hvis teknologi kaldes Hit Song Science.
Overordnet er pointen, at musik på digital form naturligvis kan analyseres med matematisk/statistiske/ datalogiske værktøjer. Feltet kalde Music Information Retrieval (MIR) og er beskrevet i Music Retrieval, A tutorial and Review.
Men hvad skal man kigge efter? Et digitaliseret musiknummer er en (meget lang) stribe 0’er og 1’er.
Firmaerne har studeret tidligere hits. Analyseret dem for tredive forskellige parametre (og det er nok hemmeligt hvilke) og derefter konstateret, at de samler sig i klumper i det 30-dimensionale rum. Og at numre, som ikke har været hits, typisk ikke ligger i disse klumper. Begge ovenstående firmaer hævder i øvrigt at have forudsagt, at Norah Jones ville få succes.

I artiklen om MIR nævnes mange parametre, som kunne indgå i analyserne: Rytme, tempo, tonehøjde (pitch), volumen, “timbre” – det, der gør, at man kan høre, at en tone spilles på en saxofon og ikke en trompet, tonalitet (er det A-dur eller C-mol – for den slags musik, hvor det giver mening), orkestrering (hvilke instrumenter spiller hvad), melodi, harmonier, struktur på langs: gentagelser, pauser, hvordan temaer fletter ind i hinanden, skift i rytme, volumen og alle de andre parametre.

Det gælder så om at genkende alle disse egenskaber i musikken udfra de lange strenge af 0’er og 1’er.
Her kommer “stringmetrics” ind i billedet.

Strengmetrikker
Skal man sammenligne to strenge af 0’er og 1’er – binære strenge – kræver det et mål for, hvor forskellige de er.
Er de lige lange kan man f.eks. sige, at afstanden er antallet af pladser, hvor de er forskellige: Afstanden mellem 0001 og 0010 er 2, fordi de er forskellige på de to sidste pladser. Dette afstandsmål kaldes Hamming-afstand.
Der er et hav af strengmetrikker. Her er en lang liste. Man tænker generelt på strenge af ikke bare 0 og 1, men med andre “alfabeter” – som f.eks. ordene i en ordbog, hvor alfabetet er det sædvanlige. Når Google finder stavefjel og spørger “Mente du stavefejl”, er der en strengmetrik i spil.

Levenshtein-afstanden mellem to strenge er det mindste antal basale ændringer, man skal lave for at komme fra det ene ord til det andet. De basale ændringer er 1) Indsæt et bogstav 2) Fjern et bogstav 3) Erstat et bogstav med et andet.
Eksempel: fra mandag til tirsdag
Mandag -> Mansdag ->Tansdag ->Tinsdag->Tirsdag
Affstanden er altså 4, hvis man tror på der ikke er en smartere måde at gøre det på. Der er algoritmer, der finder Levenshtein-afstanden – se linket ovenfor eller Wikipedia.
Der er afstandsmål, der tager hensyn til almindelige stavefejl, til bogstaver, der udtales nogenlunde ens (så afstanden mellem d og t er kortere end mellem d og k) og mange andre variationer.

Et afstandsmål kan ikke være hvad som helst. Man har helt generelt afstand mellem elementer i en mængde M (som så kan være strenge, punkter i planen, andengradspolynomier, billeder,… alt efter den ønskede anvendelse.
Et afstandsmål (kaldes også en metrik) skal opfylde følgende simple regler, hvor d(x,y) betyder afstanden mellem x og y og d(x,y) altid er et reelt tal:
d(x,y)=0 hvis og kun hvis x=y (og d(x,y) er aldrig negativ)
d(x,y)=d(y,x) (Symmetri)
d(x,y) <= d(x,z)+d(z,y)

Den sidste kaldes trekantsuligheden og siger, at afstanden direkte fra x til y er mindre end eller lig med afstanden fra x til y via z. Man behøver faktisk ikke sige, at d(x,y) ikke er negativ, for 2d(x,y)=d(x,y)+d(y,x)>=d(x,x)=0 hvor vi bruger symmetri og trekantsuligheden.

Det er fantastisk effektivt at have et sådant generelt afstandsbegreb. Hver gang, man bruger de generelle egenskaber til at argumentere for, at noget gælder, så gælder det for alle de afstandsmål, man kan finde på.
En mængde med et afstandsmål kaldes et metrisk rum, og vi kan definere

  • kontinuerte funktioner mellem to metriske rum
  • Det metriske rum (M,d) er begrænset, hvis d(x,y)<=R for et fast R og for alle x,y i M
  • En sti eller kurve i et metrisk rum er en kontinuert afbildning s:[0,1] ->M hvor [0,1] er intervallet med sædvanligt afstandsmål.
  • Kuglen omkring m med radius r er alle de x i M, som opfylder d(x,m)<r (OBS: Kugler kan se meget mærkelige ud. Tænk på strengmetrikkerne ovenfor)

og meget mere.

Kodningsteori må I vente med til en anden gang.

men her er et klip med Bobby McFerrin, der illustrerer, hvordan vi har et fælles tonesprog i den pentatone skala:

This entry was posted in Blog. Bookmark the permalink.