Kan man gennemskue, om en baseballspiller er dopet udfra deres præstationer? Det kan man da forhåbentlig – ellers var det vel dumt at dope sig. Men hvor sikker er man på, om det er steroider og ikke bare tilfældigheder.
Der var en del matematik i dette afsnit, “avanceret Sabermetrik”, som jeg vil fortælle lidt om. Charlie nævnte Shiryayev-Roberts changepointdetection. Det bliver vist for langhåret for bloggen, men overordnet set handler det om at se, hvornår man ser et skift i, hvilken fordeling, data “følger”. For eksempel kan man skifte fra at ligge på en normalfordeling med en middelværdi til en normalfordeling med en anden middelværdi. Change point detection er meget væsentligt i mange anvendelser: Er der sket et skift i aktiemarkedet, er patientens vejrtrækning virkelig ændret radikalt, er der en epidemi på vej,… Men her er det altså baseballspillere og deres præstationer, man ser på.
Sabermetrik
Sabermetrik er baseballstatistik. Det er opkaldt efter SABR, Society for American Baseball Research. Spillernes præstationer kvantificeres – antal homeruns, hurtighed, etc. Man sammenligner dem med hinanden og forsøger at forudsige, hvordan de vil præstere i næste sæson. Det kan man så bruge til at gætte (og spille) på, om det ene eller det andet hold vil vinde. Jeg ved for lidt om Baseball til at kunne forklare de forskellige mål for præstation, men Wikipedia giver flere eksempler. I Numb3rs bruger Bill Waldo statistikken til at sammensætte “Fantasy” baseballteams. (Lidt ligesom sofacykelholdene i Tour de France). Man sætter et hold af spillere fra forskellige hold, og så bruger man deres præstationer i sæsonen til at se på, hvilket Fantasy hold, der ville have vundet, altså sabermetriske metoder.
I dette afsnit af numb3rs har man fundet en formel, der kan se, at en spiller bruger steroider.
Det kan man jo nok ikke se med 100% sikkerhed, men hvis en spiller pludselig begynder at præstere meget bedre i forhold til et af de mange mål – løber hurtigere, slår hårdere, … og det passer med, hvad man kan forvente ved brug af steroider, kan man nok få en mistanke.
Steroider og home runs
I 2007 skrev en fysiker, Roger Tobin, en artikel “On the potential of a chemical Bonds: Possible effects of steroids on home run production in baseball” til American Journal of Physics. Se pressemeddelelsen . I 1927 satte Babe Ruth rekord med 60 home runs i en sæson, og den rekord holdt til 1961, hvor Roger Maris havde 61 home runs. I de efterfølgende 35 år var der ikke nogen, der havde mere end 52 home runs, men i perioden 1998-2006 var der 6 spillere, der havde mere end 60 home runs på en sæson. Faktisk havde Barry Bonds 73 home runs i 2001. I 2003 indførte Baseballturneringerne test for steroider, og antallet af home runs faldt drastisk. Der har ialt været 20 spillere, der har slået mere end 50 home runs på en sæson, og det er altså ret dramatiske, at man pludselig har 6, der slår mere end 60.
Tobin regner på effekten af at kunne slå hårdere og finder, at steroider kan forklare det meste af det øgede antal home runs. Omvendt kan mange home runs måske være et tegn på brug af steroider.
Tom Tango og Derek Zumsteg har studeret Barry Bonds’ præstationer og afhængigheden af steroider (ham med de 73 home runs). Der er en periodisk svingning i præstationerne svarende til at bruge steroider i 3 uger og holde en uges pause. Han bruger flere mål, men et af dem er HR-rate=Antal Homerun/Antal slag. Eller rettere antal slag, fraregnet “walks” (hvor man måske bare går hen til første base eller hvad? Jeg har spillet en meget lille smule base ball for rigtig mange år siden, og jeg husker det mest som en avanceret form for rundbold…)
I de uger, hvor han er på steroider, er hans HR-rate i 2002 9,8%, når han er på steroider og 3,9% når han ikke er det. Og der er tilsvarende afvigelser i de andre år med steroider.
For at se, om det nu er dramatiske afvigelser, har man brug for statistik. Der er en lang diskussion af det på denne blog
Man kan f.eks. finde links til regneark med diverse data.
Man kan spørge om flere ting:
Man tager en tilfældig spiller og deler sæsonen op i 4 ugers blokke (3 med steroider, 1 uden), og man ser på alle de 28 mulige opdelinger (start på sæsonens dag 1, start på dag 2,…start på dag 28) Så vælger man den, hvor der er størst udsving mellem 3-ugers perioderne og 1 ugers perioderne. Så vil man altid finde en afvigelse, der ser mystisk ud – det er jo det, man har udvalgt opdelingen efter. Men
hvor meget værre er det, man ser hos Bonds, end hos de andre?
Hvor meget værre er det i årene med steroider end i årene uden?
Man ser altså på, om udsvingene i Bonds’ præstationer kunne være tilfældigheder. Mere præcist: Hvor sandsynligt er det at se de data for Bonds’, hvis han nu ikke var på steroider?
Hvis man har normalfordelte data, måler man det i standardafvigelser, altså hvor langt væk fra middelværdien data ligger: 68% af data ligger indenfor 1 standardafvigelse, 95% indenfor 2 standardafvigelser og 99,7% indenfor 3 standardafvigelser. Så hvis man finder data, der ligger mere end 3 standardafvigelser væk, er det meget usandsynlige data. Og man må genoverveje sin hypotese om normalfordelte data med den middelværdi og den spredning. I tilfældet med Bonds: Mon ikke han er på steroider, når hans data er blandt de meget usandsynlige, hvis han ikke var det.
Shoeless Joe Jackson og the Black Sox skandalen.
Larry nævner Black Sox skandalen: I en artikel “Did Shoeless Joe Jackson Throw the 1919 World Series?”, The American Statistician, Vol 47, no.4, pp. 241+250 af Jay Bennett, bruges statistiske metoder til at analysere Baseballskandalen fra 1919, hvor Chicago White Sox bevidst tabte til Cincinnati Reds og dermed gav dem, der spillede på kampen og vidste det, en fordel. (Det var mafiaen, der havde sat det i værk. Og der hentydes til skandalen i Godfatherfilmene)
Spørgsmålet er, om Joe Jackson var med til det. Hvis ikke, skulle han måske inkluderes i baseball Hall of Fame…
Konklusionen er, udfra statistisk analyse af kampene og hans præstationer, at han spillede så godt, at han formentlig ikke var med til at lade dem tabe. Faktisk spillede han bedre i World series end alle andre og bedre end forventet udfra hans egne tidligere præstationer. Man laver en hypotesetest: Hvor sandsynlige er de data, man ser, hvis han rent faktisk spiller dårligere end forventet. Og afviser hypotesen med meget stor sandsynlighed.