Är det forskarnas välvilja som gör forskningen pålitlig?

Det går förmodligen inte att genomgå en utbildning i nationalekonomi utan att ett par gånger stöta på Adam Smiths berömda citat om att det inte är bagarens välvilja som ger oss bröd på bordet, utan hens omtanke om sig själv. Citatet brukar användas för att trumma in den paradoxala poängen att varje individs strävan efter egen vinning kan leda till det bästa tänkbara utfallet för samhället. Det är dock sällan nationalekonomer tillämpar samma resonemang när det gäller det egna forskaryrket (undantag finns dock). Skulle vi verkligen våga förlita oss helt på forskarnas egenintresse på samma sätt som vi kan lita på själviska bagare?

Forskaryrket erbjuder ständiga frestelser att med hjälp av olika former av intellektuell ohederlighet armbåga sig fram. Det kan gälla allt från forskares ”vardagssynder” som att citera tidigare litteratur selektivt till ”kardinalsynder” som manipulation av data. En forskare som hade som enda mål att publicera så mycket som möjligt (och därmed få en finare position och högre inkomst) skulle naturligtvis använda sig av sådana knep närhelst det lönade sig och risken för upptäckt är tillräckligt liten. Det skulle leda till en ganska flitig användning av sådana metoder och att många forskningsresultat inte skulle vara särskilt pålitliga. Mitt intryck av mina forskarkollegor är dock att de flesta inte fuskar närhelst det är möjligt — det finns en stark yrkesmoral som förordar intellektuell hederlighet och som gör forskningsresultat mer pålitliga än de hade varit annars.

Likväl förekommer olika grader av fusk. I en uppsats som är under utgivning i Psychological Science undersöks i vilken utsträckning forskare i psykologi ägnar sig åt ”questionable research practices” (QRP). Studien bygger på en enkätundersökning bland tusentals forskare i psykologi. Forskarna använde sig av Drazen Prelecs ”sanningsserum” — en belöningsalgoritm för att belöna sanningssägande (läs mer om denna metod här) — för att förmå forskarna att svara ärligt. Nedan listas hur står andel som angav att de någon gång använt sig av respektive QRP.

1. In a paper, failing to report all of a study’s dependent measures. (66.5%)
2. Deciding whether to collect more data after looking to see whether the results were significant. (58.0%)
3. In a paper, failing to report all of a study’s conditions. (27.4%)
4. Stopping collecting data earlier than planned because one found the result that one had been looking for. (22.5%)
5. In a paper, ―rounding off a p value (e.g., reporting that a p value of .054 is less than .05). (23.3%)
6. In a paper, selectively reporting studies. (50.0%)
7. Deciding whether to exclude data after looking at the impact of doing so on the results. (43.4%)
8. In a paper, reporting an unexpected finding as having been predicted from the start. (35.0%)
9. In a paper, claiming that results are unaffected by demographic variables (e.g., gender) when one is actually unsure (or knows that they do). (4.5%)
10. Falsifying data. (1.7%)

De flesta av dessa QRP:s kan naturligtvis vara rättfärdigade i enskilda fall, men det är inte svårt att hålla med om att de generellt bör undvikas. Siffrorna ovan är också inte helt lättolkade, men de förefaller ändå oroväckande. Det är också svårt att se någon anledning till att situationen skulle vara annorlunda bland t.ex. nationalekonomer (se till exempel den här studien).

Något som också är oroande är att frågan om forskarnas yrkesetik diskuteras så lite — i alla fall bland nationalekonomer. Det borde vara högsta prioritet på doktorandprogram att skola in framtida forskare i den yrkesetik som är så viktig för forskningens pålitlighet (jmf. läkare och läkareden). I min egen utbildning har jag dock helt lämnats åt att ”uppfostra mig själv” och jag tror dessvärre att jag är långt ifrån ensam om denna erfarenhet. Samtidigt förefaller yrkesetiken sättas på allt hårdare prov genom att konkurrensen mellan forskare och kraven på att publicera forskningsresultat ökat.

Innebär smarta telefoner slutet för mobiltelefonin?

Att allt fler skaffar sig smarta telefoner, till exempel iPhone, innebär en stor utmaning för mobiltelefonoperatörerna. Alla som har iPhone sms:ar till exempelvis redan automatiskt gratis till varandra i och med den senaste verisonen av iOS. Samma sak gäller telefoni — med tjänster som Skype, Freephoo och Viber kan man ringa gratis till andra som använder samma tjänst. (Apple skulle mer eller mindre med en knapptryckning kunna göra så att alla med iPhone ringer gratis till varandra.) Mobiltelefonioperatörerna försöker motverka detta genom att avtalsvägen förbjuda oss att använda sådana tjänster, men gissningsvis kommer detta bara tillfälligt att stämma i bäcken. Enligt en artikel i Svenska Dagbladet kontrollerar operatörerna inte att avtalsvillkoret upplevs. Det är inte ens säkert att det är tekniskt möjligt att helt blockera IP-telefoni. Frågan är också om konsumenterna skulle acceptera att operatörerna övervakar innehållet i datatrafiken. Gissningsvis innebär det här att operatörerna inom en snar framtid bara kommer att kunna ta betalt för datatrafik och inte alls (eller mycket lite) för sms, öppningsavgifter och minutavgifter.

Vad kommer i så fall detta innebära för mobiltelefonoperatörena? Mobiltelefonoperatörerna har hittills lyckats upprätthålla lönsamheten på grund av att det är så få verksamma aktörer och för att efterfrågan ökat så snabbt under lång tid. Ytterligare en faktor är att prissättningen varit väldigt komplicerad och gjort det svårt att jämföra priser, vilket förmodligen hämmat konkurrensen. Men om mobiltelefonianvändandet nu övergår helt till datatrafik och därmed en betydligt mer transparent prissättning borde konkurrensen också skärpas. Detta borde leda till lägre lönsamhet för mobiltelefonoperatörerna, och därmed att de inte kommer vara lika villiga att bygga ut 3G-nätet ytterligare (redan i dagsläget hörs klagomål om att kapaciteten inte räcker till på vissa håll, till exempel i Stockholms kollektivtrafik).

En sak är i alla fall säker. Som konsument skulle jag tänka mig noggrant för innan jag idag tecknar ett 24 månaders mobiltelefoniabonnemang där jag binder mig vid en hög fast kostnad för ”fria sms” och ”gratis telefonsamtal”. Men vore jag mobiltelefonoperatör skulle jag naturligtvis göra allt jag kunde för att sälja just sådana abonnemang.

Dags att återinföra fastighetsskatten?

I debatten som föranledde slopandet av fastighetsskatten 2008 var ett ofta återkommande argument att äldre människor som under lång tid ägt hus i attraktiva lägen kunde tvingas från hus och hem på grund av fastighetsskatten. Det uppenbara motargumentet var naturligtvis att dessa personer har en stor förmögenhet bunden i sitt boende och att de skulle kunna belåna en del av sin bostad för att betala skatten. Motståndare till skatten invände då att denna typ av finansiella lösningar inte erbjöds på marknaden. Men idag är situationen en annan (p.g.a. förändrat regelverk?).

Att döma av en artikel i DN häromdagen erbjuder banker och försäkringsbolag numera en uppsjö av möjligheter för äldre att belåna sitt boende och använda detta för konsumtion. Lånet kan betalas ut direkt, betalas ut månatligen under en viss period eller kombineras med en försäkringslösning som garanterar ett visst månatligt belopp under den resterande livstiden. För många äldre med lågt belånade boenden förefaller detta kunna vara en mycket attraktiv lösning för att till exempel ha råd att resa på ålderns höst eller kanske köpa ett nytt lyxigt bridgebord. (De som förlorar på detta är förstås arvingarna, men i de flesta fall har dessa redan uppnått en ålder då man förväntas kunna försörja sig själv.)

Med andra ord har ett av de vanligaste argumenten mot en fastighetsskatt rämnat. Rika bostadsägare med låga inkomster, t. ex. garantipensioner, kan idag enkelt betala en fastighetskatt utan att tvingas flytta. Är det dags att börja diskutera en återinförd fastighetsskatt?

Patriarkatets förtryck

Förra veckan skrev jag om den dansk-norska doktoranden Jonas Hjorts forskning om sambandet mellan etnisk sammansättning och produktivitet. Att döma av diskussionen i kommentarstråden har detta ämne en väldig politisk sprängkraft. Minst lika kontroversiella är dock två andra studier av Hjort som bygger på en än mer osannolik randomisering — Hjort lyckades övertyga fem företag (blomsterplantager i Etiopien) att slumpa ut jobberbjudanden till jobbsökande!

I den ena studien visar Hjort tillsammans med sin medförfattare att kvinnor som (slumpmässigt) fick jobb löpte en större risk att bli misshandlade och psykiskt trakasserade av sina män. Sannolikheten att bli fysiskt misshandlad ökade med 8 procentenheter (eller 13 procent) och sannolikheten att bli psykiskt trakasserad ökade med 19 procentenheter (eller 34 procent). Författarna argumenterar vidare att effekten inte verkar bero på att män försöker stärka sin förhandlingsposition inom äktenskapet när kvinnan får ett jobb och därmed mer resurser, utan de drar slutsatsen att det beror på att männen blir provocerade av det brott mot rådande könsstrukturer som det innebär när kvinnan börjar förvärvsarbeta.

I den andra studien (se abstract här) studeras effekten av att män respektive kvinnor får anställningar. När kvinnor får en anställning leder det till att döttrarna tar över hushållsarbetet och ägnar 24 procent mindre tid i skolan, men däremot uppstår ingen sådan effekt när pappan får ett jobb. Sönerna däremot ägnar 10 procent mer tid i skolan oavsett om det är mamman eller pappan som får ett jobb (förmodligen på grund av familjens högre inkomst).

Detta är sannerligen inga upplyftande forskningsresultat och de visar med all tydlighet hur skoningslösa könstrukturerna i ett land som Etiopien kan vara.

Lika arbetare jobbar bäst?

Det finns numera ganska många nationalekonomiska studier som fokuserar på effekten av etnisk mångfald på olika ekonomiska utfall. Till exempel finns det studier som visar att etnisk mångfald verkar minska stödet för omfördelning (även om resultaten inte är helt entydiga, se den här genomgången av forskningen). Den stora merparten av alla studier bygger dock på korrelationer och kan inte säkert säga något om orsakssambandet (med vissa undantag). Jonas Hjort, en dansk-norsk doktorand på Berkeley, lyckas dock med konststycket att på ett mycket övertygande sätt visa hur spänningar mellan etniska grupper påverkar produktiviteten vid en blomsterpackningsfabrik i Kenya negativt.

I fabriken jobbar arbetarna med att packa blommor inför vidare transport i arbetslag om tre. Arbetarna får dock inte bestämma själva vem de ska jobba tillsammans med, utan fördelningen till de olika arbetslagen sker slumpmässigt. Det är just denna slumpmässighet som gör att Hjort med stor säkerhet kan uttala sig om effekten av den etniska sammansättningen på arbetslagets produktivitet. Hjort hade också ”turen” att studera en period då det genomfördes ett val med efterföljande våldsamma konflikter mellan de två dominerande etniska grupperna. Därmed kan Hjort även studera effekten av förvärrade etniska konflikter på produktiviteten.

Som synes av bilden nedan så var produktiviteten markant lägre i etniskt blandade arbetslag än i etniskt homogena arbetslag. Produktiviteten i etniskt blandade arbetslag försämrades betydligt efter valet, en nedgång som senare dämpades av att företaget ändrade arbetarnas belöningssystem. Hjort utvecklar en modell baserad på preferens-baserad diskriminering (d.v.s. att människor vill gynna sin egen etniska grupp) och argumenterar för att denna modell kan fånga precis det mönster som syns i bilden nedan.

Hjorts studie är mycket väl genomförd och det är svårt att hitta några uppenbara alternativa förklaringar till hans resultat. Däremot är det förstås — som så ofta — en öppen fråga i vilken utsträckning resultaten går att generalisera till andra sammanhang.

Mer om publiceringsbias

Häromveckan skrev jag om en ny studie som tyder på att publiceringsbias gjort att publicerad forskning om gener och intelligens sammantaget verkar ha givit en missvisande bild av verkligheten. Ett ännu tydligare tecken på förekomsten av publiceringsbias är nedanstående diagram (knyckt från den här artikeln) som visar z-värdena för resultat publicerade i två ledande statsvetenskapliga tidskrifter (APSR och AJPS) mellan 1995 och 2007. Det är en markant ökning när z är 1.96, vilket motsvarar 5 procents signifikansnivå för två-sidiga test. Om artiklar skickades in och publicerades i vetenskapliga tidskrifter oberoende av om resultaten är statistiskt signifikanta eller ej skulle vi förvänta oss lika många z-värden strax ovanför som strax under 1.96.

För er som föredrar en mer skämtsam illustration av fenomenet publiceringsbias rekommenderas den här seriestrippen.

Fyraårsjubileum!

Idag är det fyra år sedan vi startade Ekonomistas. Glädjande nog har antalet besök fortsatt att öka. Under 2011 hade vi 36 procent fler sidvisningar än under 2010. Det mest lästa inlägget under det senaste året var Stefan de Vylders recension av boken Nationalekonomi för vänstern. Det mest kommenterade inlägget (120 st kommentarer!) under året var Mats Perssons gästinlägg om att humaniora (snarare än mer yrkesinriktade utbildningar) bör subventioneras. Flest besökare hade vi i sedvanlig ordning den 10:e oktober då årets ekonomipristagare tillkännagavs.

Vi är förstås oerhört glada att intresset för bloggen fortsätter att växa och att det är så många som bidrar till bloggen genom att kommentera våra inlägg!

Opålitliga forskningsresultat om intelligens

Hur pålitliga är vetenskapliga resultat? Felkällorna är många och gäller allt från medveten manipulation av data till mer vardagliga synder som att inte rapportera motsägande resultat. Ett av de allra största problemen är förmodligen publiceringsbias, d.v.s. att det är betydligt svårare att publicera nollresultat. Detta gör både att nollresultat inte uppmärksammas tillräckligt, men också att forskare helt enkelt undviker att studera områden där de riskerar att hitta nollresultat. Detta kan i värsta fall leda till att publicerade forskningsresultat kan bli mycket missvisande.

En kommande artikel i Psychological Science — där bland andra de svenska nationalekonomerna Magnus Johannesson och David Cesarini medverkar — visar att publiceringsbias tycks vara ett problem när det gäller forskning som försöker hitta genetiska markörer för intelligens. Författarna bakom studien har satt samman ett jämförelsevis väldigt stort datamaterial för övertygande kunna påvisa sina nollresultat.

De undersöker 12 kandidatgener som tidigare visats samvariera med intelligens (med fantasieggande namn som rs2766011), men hittar bara en enda statistiskt signifikant genetisk markör (på 5-procentsnivån före korrigering för att man testat flera hypoteser!). Detta ska inte tolkas som att gener inte spelar roll för intelligens. Intelligens är ett komplext fenomen som beror på samverkan mellan en mängd olika genetiska och miljöfaktorer och inflytandet av enskilda gener är därför litet.

Budskapet när det gäller publiceringsbias är tydligt. Tidigare studier — som bygger på ett mycket mindre antal försökspersoner — har helt enkelt inte haft tillräcklig statistisk styrka för att tillförlitligt kunna belägga de svaga samband de är intresserade av. Slumpen har dock gjort att vissa resultat visat sig vara statistiskt signifikanta och det är dessa resultat som har publicerats. Förmodligen har man undersökt ett stort antal tänkbara gener, men bara rapporterat de som visat positiva resultat. Detta har resulterat i att en stor mängd publicerad forskning sammantaget givit en helt missvisande bild av verkligheten.

Subtila effekter av subtila signaler

För något år sedan skrev jag om experiment som visar att vårt beteende påverkas av att observeras av andra så till den grad att en bild på ett par ögon påverkar hur generösa vi är. Laboratorieexperiment har visat att det till och med räcker med tre prickar som är placerade som ett par ögon och en näsa för att påverka vårt beteeende. Den närmast liggande tolkningen av detta är att vi är programmerade att reagera instinktivt när vi observeras av andra.

Trots att det finns ett par studier som finner en sådan effekt verkar sista ordet inte vara sagt. I en ny studie (gratisversion här) som är under publicering i Experimental Economics visar nationalekonomidoktoranden Mathias Ekström att en bild på ett par ögon inte påverkar huruvida vi väljer att skänka pengar till välgörenhet när vi pantar tomburkar. Mathias satte slumpmässigt upp bilder på ett par ögon på pantmaskiner i ett flertal Konsum-butiker i Stockholmsområdet. På pantmaskinerna finns sedan ett antal år två valmöjligheter efter att man petat in burkar och glas — en knapp om man vill ha ett tillgodokvitto på slantarna och en annan knapp om man vill skänka pengarna till välgörenhet. Med hjälp data från 16775 knapptryckningar från pantmaskinsföretaget kunde Mathias konstatera att andelen som skänkte till välgörenhet inte påverkades av ögonmanipulationen.

En tänkbar förklaring till varför ögonen inte hade någon effekt i den här studien är att det beror på att man redan känner sig observerad i livsmedelsaffärer (trots att pantmaskiner ofta brukar vara ganska avsides belägna i butikerna). I linje med denna förklaring antyder data att ögonen hade en effekt under dagar då det var få andra som pantade (och förmodligen färre personer i butiken), men den effekten är mindre än i tidigare studier och inte helt tillförlitlig.

En annan tänkbar förklaring är att bilden på ögonen i tidigare studier snarare påmint om mottagaren för ens välgärning än känslan av att vara observerad (i pantstudien är mottagaren en organisation som bland annat planterar träd). För att utröna den saken krävs dock mer forskning och fler experiment. Och just det är ju den bekväma slutsats som vi forskare alltid brukar komma dragandes med.

Varför alla dessa bindningstider?

När jag nyligen skulle bestämma mig för en ny elleverantör upptäckte jag att elbolagen börjat erbjuda abonnemang med bindningstid (även om priset är rörligt). Detta försvårade jämförelsen avsevärt och det slutade med att jag stannade kvar hos min gamla leverantör. Bindningstider förefaller dock vara allra vanligast på telekommarknaderna. I en ny rapport från Konsumentverket (se även artikel på DN Debatt) belyses att konsumenterna är missnöjda med bindningstider och att det försvårar jämförelser mellan olika leverantörer på telekommarknaderna. Det är numera förbjudet att ha bindningstider som är längre än 24 månader, men i rapporten föreslår Konsumentverket att detta eventuellt bör skärpas till 12 månader.

Varför är det då så vanligt med bindningstider för vissa typer av abonnemang? Jag misstänker att det främst handlar om att företagen försöker utnyttja våra mänskliga brister: att vi är tidsinkonsistenta och helst skjuter kostnader på framtiden och att vi har svårt att förutse sina framtida behov i synnerhet på en så föränderlig marknad som telekommarknaden. Dessutom utnyttjar de säkerligen att vi helt enkelt har svårt att överblicka vad kostnaden är för olika typer av abonnemang.

Om leverantörer inte hade bindningstider skulle de behöva ta ut en högre inträdesavgift för att täcka kostnader för administration och anslutning av en ny kund. Detta ogillas av tidsinkonsistenta konsumenter som hellre ser att kostnaden sprids ut under bindningstiden och som inte korrekt förutser det eventuella behovet av att byta abonnemang innan bindningstidens slut. (I mitt eget fall var jag nära att teckna ett långt abonnemang för mobilt bredband, vilket kort därefter skulle varit helt onödigt eftersom möjligheten att använda telefonen som mobilt bredband introducerades.)

Jag har svårt att se hur bindningstider kan vara till nytta för konsumenten (men jag ser fram emot motargument i kommentarstråden!). Denna slutsats verkar delas av Stefano DellaVigna och Ulrike Malmendier som analyserar frågan teoretiskt i en artikel från 2004 (se sektion IV) under förutsättning att konsumenterna är tidsinkonsistenta. Min förståelse av den tidigare litteraturen är att det är svårt att förstå varför företag har bindningstider om konsumenter är helt rationella (se t.ex. den här artikeln). Ytterligare en negativ aspekt av bindningstider är att det förmodligen hämmar konkurrensen — konsumenterna blir inlåsta och kan inte byta till en billigare och bättre leverantör under bindningstiden (en fråga som jag f.ö. inte tror har analyserats ordentligt i litteraturen).

Rapporten från Konsumentverket innehåller även många andra intressanta uppgifter om telekommarknaderna ur konsumentperspektiv. Den enskilt kanske mest uppseendeväckande uppgiften är att 46 procent inte alls höll med om att de jämfört flera olika alternativ innan de tecknade ett abonnemang. Med tanke på den höga förändringstakten på telekommarknaden och den stora prisvariation som finns på t.ex. mobiltelefonmarknaden (vilket en snabb titt på telepriskollen.se avslöjar) förefaller det som svenska konsumenter skulle ha mycket att tjäna på att noggrannare jämföra fler alternativ innan abonnemang tecknas.