Ett bättre SCB: Tre förslag

Forskare lever på teoretiska kunskaper, tekniska färdigheter, kreativitet och inspiration. Samt på sina datamateriel. I och med våra omfattande och detaljerade register har svenska forskare i en bred uppsättning discipliner goda möjligheter att bedriva viktig och omdanande forskning. Tyvärr förvaltas den guldgruva som Sverige sitter på inte alltid på sätt som gynnar forskningen.

Det kanske största problemet när det gäller att arbeta med registerdata är att tillgängligheten från andra länder är begränsad. I min absoluta närhet finns forskare som avbrutit vistelser vid utländska universitet i förtid och doktorander som tvekar inför att förlägga delar av sina studier vid amerikanska toppuniversitet. Orsaken är gemensam: SCB tillåter inte forskarna att arbeta med sina datamaterial från vissa länder, däribland USA.

Problemet märks även på andra sätt. Medan forskningssamarbeten mellan utländska toppforskare och norska och danska forskare blir allt vanligare, är det svårt att se samma trend i Sverige. Liksom Sverige har Norge och Danmark detaljerade register över befolkningen, men synen på tillgänglighet för forskare är annorlunda. Det sätter avtryck i vilka internationella samarbeten som kommer tillstånd.

Medan både högskoleväsendet och staten på många olika sätt försöka göra forskningen mer internationell så sätter alltså SCB käppar i hjulet. Varför, kan man undra? Den grundläggande orsaken är sekretess och risken för läckor av känsliga uppgifter. Detta är något som bör tas på största allvar. SCB har därför byggt upp en välfungerande servercentral mot vilken de flesta forskare arbetar. Data ligger alltså inte på hundratals laptops som följer med på konferensresor världen över, utan bakom skyddade väggar genom vilka bara betrodda släpps igenom.

Naturligtvis kan data från dessa servrar läcka ändå – inga system är hundraprocentigt säkra – men risken är inte större om man arbetar från en dator som står i Uppsala än från en som står i Berkeley. Eventuella säkerhetsproblem åtgärdas därför betydligt bättre av SCBs IT-avdelning än genom att begränsa varifrån forskarna får arbeta.

Ett annat problem är SCBs prissättning när forskare ska ha tag på data. Det rimliga vore att forskare fick betala för den arbetskostnad som det innebär att plocka fram relevanta filer ur registren. Istället betalar forskare hundratusentals, ibland miljontals, kronor för en arbetsinsats som är tämligen begränsad. Anslag vandrar därför från forskningsfinansiärerna, via forskarna och in i SCBs budget.

Det är svårt att se värdet av denna rundgång. Enligt ryktet ligger en nationalekonom bakom SCBs prissättningsmodell, men modellen missar ändå en fundamental nationalekonomisk insikt: data är en kollektiv vara där den enes användning inte begränsar andras tillgång. Att prissätta ett datamaterial som om det vore en knapp resurs är ineffektivt och leder till ett för lågt resursutnyttjande. Forskare arbetar därför med sämre och mindre datamaterial än vad som vore möjligt; ett helt onödigt slöseri.

Förutom en mer accepterande inställning till forskningens internationella karaktär och en annorlunda prissättning av datamaterialen, så kan SCB även låta sig inspireras av sina nordiska grannmyndigheter på andra sätt. Även om SCB redan idag levererar en del intressanta analyser med hjälp av våra register så skulle analysavdelningen kunna förstärkas. Genom att anställa kanske 30 kvantitativt inriktade forskare i olika discipliner skulle mycket intressant forskning kunna produceras, av personer med full tillgång till SCBs alla datamängder.

Genom att skaffa sig gedigen forskarkapacitet skulle SCB även få en direkt uppfattning om styrkor och svagheter med det egna arbetssättet. Vilka svårigheter stöter användarna på när de möter SCBs register? Hur påverkar nya definitioner och redovisningssätt jämförbarheten över tid? Finns det värdefulla datamaterial i pappersformat som borde digitaliseras och därmed göras mer tillgängligt? En egen forskningsavdelning skulle kunna besvara dylika frågor betydligt mer träffsäkert än trubbiga användarenkäter och tolkningar av användarnas betalningsvilja.

Sverige har länge haft en välorganiserad och effektiv statsmakt, med stort förtroende hos allmänheten. Detta har skapat en nästintill unik resurs i form av datamaterial över individer, företag, församlingar och kommuner som kan användas för att analysera många av samhällets fundamentala frågor. Resurser som dessa måste emellertid förvaltas väl för att komma till nytta och SCB behöver en mindre njugg inställning till forskningens villkor och internationalisering.

Comments

  1. Johan X says:

    Som forskare och väl insatt i SCB:s verksamhet vet jag att de visst tar betalt utifrån arbetskostnaden. Ryktet om att någon nationalekonom skulle ligga bakom en prissättningsmodell stämmer inte alls. Däremot kan jag till viss del hålla med om att data borde vara mer lättillgängligt.

    • Om vi antar en lönekostnad på 75000 kronor per månad så innebär det att tämligen rutinmässiga datautlämningar skulle kräva ett inte obetydande antal heltidsmånader. Det förefaller osannolikt, men om någon kan presentera en faktiskt tidsåtgång för datauttagen som styrker detta så får jag ta och omvärdera.

    • Martin says:

      Det finns inte en chans att SCB tar betalt utifrån faktisk arbetskostnad.

      Lite olika observationer:

      1. Jag har varit med om att snacka ner priset. SCB kan ju knappast justera sin nedlagda arbetstid i efterhand.

      2. Prisvariationerna har inte gått att begripa. SCB kan heller inte redovisa hur mycket tid vissa delar har tagit (trots att man efterfrågat detta), eller vad olika delar kostar. Plockar man bort saker ur sin beställning så kan priset minska på ett helt oförutsägbart sätt. Beställer man samma saker flera gånger (eller från olika handläggare) varierar priset betänkligt. SCB kanske inte tror att vi forskare snackar om vad vi betalat för något som t ex LISA 1990-2010, men det gör vi…

      3. Den mest banala utlämningen jag varit med om, några årgångar av ULF, tog de 20,000 eller 25,000 för. Om jag ansträngde mig för att ta tid på mig skulle det ta mig en halvtimme att välja ut variabler ur två datafiler och bränna på en CD och skicka iväg. Blir en ganska bra timpenning.

      4. SCB tar ofta betalt vad forskare ansökt om som kostnad för data hos finansiärer. Detta bygger i sin tur på en ad hoc prisuppgift man fått från SCB. Det är förvisso skönt att SCB håller fast vid sina första uppskattningar, men dessa gissningar om framtida arbetstid måste ha ett ganska stort fel, särskilt som SCB haft stor personalomsättning och man knappast kan veta framtida personals produktivitet med någon större exakthet.

  2. Johan X says:

    Jag har den uppfattningen att tämligen rutinmässiga datautlämningar i praktiken kan vara rätt så krångliga, speciellt när vi talar om långa tidsserier och data från olika register. Å andra sidan kan på papperet krångliga beställningar vara betydligt enklare i praktiken för SCB att ta fram. Jag har erfarenhet från båda dessa sidor, där ett uppdrag blev betydligt dyrare än jag först trodde medan det andra blev betydligt billigare än jag befarade från början.

    • Kalle says:

      Prata du rent databasmässigt med processtid för själva sammanställningen av data eller pratar du det rent administrativa att berätta vilka tabeller som ska slås ihop för aktuell data?

      Så mycket data har nämligen inte SCB. Men klart, allt hänger ju ihop med inom vilket område man jobbar. Det är trots allt bara död data, som sällan uppdateras.

      Personligen har jag inte jobbat mot dem, men jag hade ställt en burk i Sverige och använt remote desktop från aktuellt land för att sedan accessa SCB. Skulle SCB göra det seriöst hade de tillhandahållit en egen VPN lösning.

  3. Lars Hultkrantz says:

    Jag gjorde för fyra år sedan en utredning på uppdrag av SCB och lämnade ett liknande förslag. Jag pekade då förutom forskningens behov även på SCBs eget behov av att med en egen analysenhet som bedriver samarbeten med forskare, efter norsk förebild, få bättre marknadskontakt och därmed hjälp att utveckla ny statistik som det kan finnas högre betalningsvilja för.

    • Tack Lars! Jag var medveten om att det fanns någon utredning på detta tema men visste inte var den stod att finna (och jag orkade inte leta). Om du har en länk får du gärna lämna den som kommentar!

    • Ytterligare en kommentar: är verkligen betalningsviljan för statistiken det avgörande? Även om samhällsnyttan av statistiken är svår att mäta så är det väl den som SCB borde försöka fånga, snarare än betalningsviljan. SCB är trots allt inte ett affärsdrivande verk.

      • Lars Hultkrantz says:

        Där har du fel. SCB är till stor del en utförarorganisation som får uppdrag i anbudskonkurrens av de statistikansvariga myndigheterna. Det innebär bl a en kostnadspress som SCB skulle kunna motverka genom utvecklingsarbete som innebär att man kan erbjuda beställarna statistik som är mer värdefull än plain vanilla. Men då behöver man ligga i framkant på användningssidan.

      • Oklart vari jag har fel. Om att SCB inte är ett affärsverk? Det är SCB inte, även om de utför uppdrag i anbudskonkurrens. Vad vi talar om är dessutom i hög grad vad som förefaller vara monopolprissättning av ”plain vanilla”. Risken förefaller uppenbar att SCB utnyttjar monopolvinster för vissa produkter för att korssubventionera andra.

  4. Mounir says:

    Det är inte bara SCB som tar bra betalt för data. Hos Riksarkivet fick jag betala 10,000 kr för digitala kopior på två rundor av folkräkningarna, samtidigt som de säljs på cd-skiva för sammanlagt 1055 kronor på deras hemsidan (de skivorna får man dock inte extrahera data från).

  5. Pär Nyman says:

    Bra inlägg! Jag håller med om allt, men det tycks finnas en hund begraven kring SCBs prissättning. Med reservation för att det var ett par år sedan jag läste utredningarna och kan minnas lite fel:

    På pappret tror jag inte att SCBs principer skiljer sig så mycket från det du förespråkar, även om utfallet av varje princip i slutändan beror på hur man definierar olika typer av OH-kostnader (det rimliga är väl att även fortsättningsvis finansiera lokaler och personalrelaterade kostnader med avgifter, medan infrastruktur som är oberoende av antalet användare borde finansieras med anslag). Prissättningen ska i alla fall utgå från arbetstimmar och ingen avgift ska tas ut för redan insamlad och registrerad data.

    Samtidigt verkar alla beställare ha uppfattningen att priserna är omotiverat höga, icke-transparenta och att de inte står i proportion till antalet arbetstimmar som uppdraget rimligtvis kan kräva. Stora registerutdrag är väl typexemplet.

    Det främsta argumentet emot ökad anslagsfinansiering verkar förövrigt vara konkurrenslagstiftningen (marknaden för offentlig statistik är ju så stor och viktig). Se till exempel nedanstående länkar.

    Statistikutredningen från 2012
    http://www.regeringen.se/rattsdokument/statens-offentliga-utredningar/2012/12/sou-201283/

    ESVs underlag om prissättningsmodeller
    http://www.esv.se/contentassets/bc2ad66d12874ec0b36fa2dbef28f561/prisattning-av-statistik.pdf

  6. Torberg Falch says:

    En liten kommentar fra Norge. Her er systemet slik at forskerne får data for lagring på sikre systemer til en forskningsinstitusjon/universitet. Det er ikke lov å ta med data ut av Norge, men det er mulig å jobbe mot server som er plassert i Norge og gjøre analysene på denne serveren. Jeg tror den vanligste måten er at data er lagret på server på forskerens institusjon og ikke på PC. Dette ser ut som et litt mer forskervennlig system enn det svenske og fungerer veldig bra for meg i hvert fall.

    Men det er arbeidskrevende og kostbart å ”leie” data (det kan ikke kjøpes, bare leies). Prisen som SSB tar har økt dramatisk de siste årene, og synes ofte helt ute av proporsjoner. Jeg vet ikke hvordan SSB beregner prisen, men de sier at det skal være ut fra arbeidskostnad. Data får man kun leie så lenge det er knyttet til et bestemt forskningsprosjekt, og prosjektet skal ha en sluttdato. Ved sluttdato skal data slettes. Dette har blitt en utfordring fordi det vanskeliggjør nysgjerrighetsdrevet forskning. Og det blir så godt som umulig å supplere med nye data underveis i prosjektet. Ofte er ikke forskningsarbeidet publisert internasjonalt når prosjektet er ferdig, og da skal likevel data slettes. Det er mulig å søke om forlenging av leie av data, men praktiseringen av dette er uklar for meg.

    SSB i Norge har for øvrig en stor forskningsavdeling. Men regelverket er slik at tilgang til registerdata ikke skal være bedre for ansatte i SSB enn for forskere på andre institusjoner. Dette skal sikre lik konkurranse om eksterne forskningsmidler. Ansatte i SSB må dermed også finne finansiering for å tilrettelegge data til forskningsprosjekt, og de skal ikke ha tilgang til data før de vanlige betingelsene som gjelder for alle forskere er oppfylt.

    • Tack för denna inblick i det norska systemet Torberg! Jag håller med om att frågan om forskningsavdelningens villkor måste betraktas lite djupare än vad jag gjorde. I Sverige har vi situationen där en forskningsmyndighet, IFAU, har tillgång till data på andra villkor än andra forskare. Det kan skapa viss obalans i konkurrenssituationen mellan forskare och institutioner. Frågan är dock om det är ett problem för samhället i stort? Men, som sagt, frågan tål att tänkas på.

  7. Martin Kolk says:

    MONA-systemet är utmärkt och fungerar mycket väl, det är en utmärkt lösning för registerforskning som SCB ska ha en eloge för. Tyvärr så säger de senaste användaravtalen att man inte ens får använda systemet inom Europa, vilket är mycket olyckligt. Eftersom data alltid befinner sig på SCB:s servrar håller jag med om att detta borde kunna omtolkas eftersom data faktiskt aldrig lämnar Sverige. Kanske kunde man enbart tillåta att MONA körs från betrodda IP-nummer i utlandet eller liknande.

    Beställningar av SCB tar också enormt mycket betald arbetstid och energi. Det är en minst lika stor kostnad (även i pengar) som de ibland svårförståeliga kostnaderna SCB tar ut. Det är tid som kunde gå till forskning och utbildning.

    Beställningar från SCB kan ta enormt lång tid (2+ år). Detta gör det mycket svårt för forskare tidigt i karriären att beställa data för ett forskningsprojekt inom ett projekt. Ett projekt för till exempel en post-dock är helt enkelt inte möjligt. Större uttag är i praktiken enbart möjliga för stabila forskningsmiljöer med långsiktig finansiering (och även dessa kan få stora problem, som ALC i Umeå). Detta verkar relaterat till ett bristande antal personer som jobbar med registeruttag hos SCB.

    Jag misstänker att SCB skulle kunna göra mycket stora rationaliseringar i sin process om de kunde återanvända mer av sitt arbete. Idag är min uppfattning att de lämnar ut nästan identiska material till olika forskare i Sverige där man gör om arbetet med uttaget många gånger om. Detta skulle nog kraftigt få ned kostnaden och administrationen för ett uttag. Det finns säkert legala och administrative anledningar att SCB tvingas gör detta, men detta kanske i viss mån går att lösa.

    • Jag håller med om att detta med de ibland långa och osäkra leveranstiderna är ett stort problem, även det. Givet de enorma personalresurser som (enligt priset) läggs på dessa beställningar så borde det kunna gå snabbare.

      Detta med den internationella accessen är märkligt. Jag har svårt att se att det finns några logiska skäl bakom dagens ordning, men det kanske finns några.

      • Mattias Persson says:

        Jag vet ju att den internationella accessen inom Europa av mikrodata har varit i blickfånget i EU projektet Data without Boundaries (http://www.dwbproject.org/). Det finns väl ett ramverk för att öka möjligheten till att få access till både andra nationers data och tillgång till mikrodata från Sverige inom Europa.

  8. Rasmus F says:

    Ytterligare en förbättring av SCB vore att införa ordentliga arkivrutiner för den egna verksamheten. Såvitt jag har förstått är det mycket dåligt ställt med den saken i dagsläget. Man kan tycka att en myndighet som bevakar prisförändringar borde ha ett fantastiskt arkiv över historiska prisuppgifter på olika varor. Men den som frågar SCB vilka varor som faktiskt funnits i varukorgarna som använts för att beräkna KPI, så kan du få svaret att dessa uppgifter har slängts. (Detta innebär f.ö. stora principiella svårigheter att använda KPI i forskning med källkritiska ambitioner, men det behöver vi inte gå in på här…)

  9. Lars Hultkrantz says:

    Det är riktigt att SCB för forskarvärlden framstår som ett monopol. Men den svenska produktionen av officiell statistik organiserades redan för två decennier sedan om till en beställar-utförarstruktur som omfattar en stor del, men inte hela, den officiella statistiken . Ett stort antal myndigheter är statistikansvariga myndigheter. Dessa upphandlar statistik inom sina områden. SCB får på dessa områden därför i bästa fall uppdrag i anbudskonkurrens. Beställarna å sin sidan kan förvänta sig att att få precis det de har beställt till lägsta kostnad. Man kan befara att beställarna ofta inte vet så mycket om vilken ny statistik som är möjlig att ta fram, t ex genom samproduktion med annan statistik, så det finns risk att man förlorar innovationsmöjligheter om SCB inte självt skaffar sig kunskap om nya användningsmöjligheter, t ex genom samarbeten med forskare. Samtidigt pressar systemet SCBs kostnader vilket gör det i vart fall svårt att korssubventionera forskning och kanske frestande att höja marginalerna där det går (inte tillåtet, men det finns ju inga regler för hur man ska beräkna OH).

    Mer info om de statistikansvariga myndigheterna finns på denna länk:
    http://www.scb.se/sv_/Om-SCB/Sveriges-officiella-statistik/Statistikansvariga-myndigheter/

Trackbacks

  1. […] Bristerna i SCBs arbete med dataproduktion och tjänster till forskare har påpekats i ett flertal utredningar. Kända exempel är SCBs förre gd Svante Öbergs Utredningen om översyn av den ekonomiska statistiken (SOU 2002:118) och Bengt Westerbergs Unik kunskap genom registerforskning (SOU 2014:45), och även Lars Hultkrantz opublicerade Förslag till förändrad organisation och inriktning för SCBs ekonomiska analysenhet. Vi på Ekonomistas har tidigare skrivit om dessa utredningar (t ex här, här) och även andra inlägg om hur SCB kan förbättras. […]

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com Logo

Du kommenterar med ditt WordPress.com-konto. Logga ut / Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut / Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut / Ändra )

Google+ photo

Du kommenterar med ditt Google+-konto. Logga ut / Ändra )

Ansluter till %s