Alla som läst statistik har lärt sig att korrelation inte implicerar kausalitet. En korrelation säger till exempel inget om orsakssambandets riktning. Att människor använder paraplyn när det regnar, skulle kunna bero på att regn orsakar paraplyanvändande, eller det motsatta, att paraplyanvändande orsakar regnande. Att sjukhus är fulla av sjuka människor och en hel del till och med dör där, säger inte något om huruvida sjukhus gör människor sjuka, eller om det är sjuka människor som besöker sjukhus. I de här fallen vet vi naturligtvis orsakssambandens riktning, men i många andra fall är de mycket svårare att fastställa.
Korrelation implicerar alltså inte kausalitet, men implicerar kausalitet korrelation? Många, inklusive vissa ekonomipristagare, tycks ha en intuitiv magkänsla att kausalitet måste motsvaras av någon slags korrelation i data. Så är det dock inte nödvändigtvis. Mina standardexempel för att illustrera detta när jag undervisar är en person som styr en segelbåt och kompenserar för vind och vågor genom att hela tiden svänga till höger och vänster. På detta sätt kan båten hålla en stadig kurs. Den som observerar kaptenen skulle dock notera att båten rör sig rakt framåt trots att kapten styr flitigt åt olika håll hela tiden. Ett liknande exempel är centralbank som följer ett inflationsmål – om de helt lyckades med att pricka inflationsmålet skulle styrräntan och inflationen inte vara korrelerade.
Jaja, tänker nu den kritiska läsaren, det där må vara intressanta påhittade exempel, men det är specialfall utan praktisk relevans. Men det finns verkliga exempel, till exempel uppenbarade sig ett sådant för mig häromdagen. På den senaste duggan i min ekonometrikurs frågade jag studenterna hur många föreläsningar de varit på för att kunna studera sambandet mellan deltagande på föreläsningar och resultat på duggan. I det här fallet “vet” vi naturligtvis att deltagande på mina föreläsningar är lärorikt, det finns alltså ett positivt orsakssamband. Figuren nedan visar genomsnittligt antal rätt (av maximalt åtta) beroende på hur många föreläsningar studenterna närvarade vid. Antalet observationer är cirka 60. Som synes av figuren är korrelationen mellan antalet rätt på duggan och antalet föreläsningar närmast obefintlig (om något negativ, men ej statistiskt signifikant).
Nu tänker dock den vakna läsaren att en alternativ förklaring är att mina föreläsningar är så usla att man inte lär sig något av att gå på dem. Det är en rimlig hypotes som jag inte kan falsifiera med den data jag har. Men däremot kanske vi kan enas om att studera fler timmar inför en dugga borde öka duggaresultatet? Så måste det rimligtvis vara. Figuren nedan visar hur många timmar per vecka som studenterna uppgav att de har pluggat på egen hand veckorna innan duggan. Som synes är korrelationssambandet med duggaresultatet närmast obefintligt även i detta fall (och inte statistiskt signifikant).
Att döma av korrelationen mellan pluggande och resultat ser det ut som pluggande inte lönar sig alls. Detta kan rimligtvis inte stämma. Mer troligt är att studievana studenter väljer hur många föreläsningar de går på och hur mycket de pluggar hemma utifrån förkunskaper, hur svårt de tycker ämnet är, hur mycket de föredrar att plugga på egen hand osv. Om alla studenterna likt en centralbankir siktar på ett visst resultat på duggan och rationellt anpassar studierna därefter, ja, då skulle vi observera mönstret i figurerna ovan – stor variation i hur mycket de pluggar, men liknande resultat på tentan. Kausalitet utan korrelation alltså.
(I det här fallet är frånvaron av korrelation inte alls självklar, vi skulle kunna ha föreställt oss både en positiv och negativ korrelation, men exemplen illustrerar att vi måste vara ytterst försiktiga när vi försöker dra slutsatser om orsakssamband utifrån data som bygger på människors val. Den som studerat ekonometri vet att det finns flera sätt att ta reda på vad det underliggande orsakssambandet är i ett fall som detta. Vi kan till exempel genom regressionsanalys försöka kontrollera för de bestämningsfaktorer som ligger bakom varför vissa väljer att gå på föreläsningar, eller så kan man frikoppla valet att gå på föreläsningar från studenternas bevekelsegrunder genom att randomisera hur många föreläsningar de måste delta på.)
Senaste kommentarer