Sveriges registerbaserade forskningsdatabaser erbjuder unika möjligheter till samhällsanalys och politikutvärdering. Nyligen beslutade dock SCB att lägga ned en sina kändaste databaser, den så kallade LINDA-databasen. Beslutet är bekymmersamt eftersom LINDA är unik i flera avseenden: den täcker hela perioden av svenska registerdatabaser sedan 1968 vilket är en unik kontinuitet, den består av ett representativt men ändå storleksmässigt begränsat urval av befolkningen vilket underlättar hantering för forskare, utredare och studenter. Detta inlägg diskuterar SCBs argument för sitt beslut och pekar på möjliga lösningar för databasens fortlevnad.
Sverige övergick 1968 till databaserad lagring av taxerings- och befolkningsregister. Länge utgjorde dock enkätundersökningar basen för analyser av olika befolkningsutfall eftersom någon hanterlig databasmiljö saknades.
I början av 1990-talet tog SCB och Uppsala universitet initiativet till en ny databas, LINDA (Longitudinell INdivid-DAtabas), baserat på ett representativt urval av drygt tre procent av befolkningen. Unikt med LINDA var inte dess representativitet utan att individerna följdes över tid, ända tillbaka till 1968. Övriga hushållsmedlemmar lades till urvalet, och senare år tillfördes även ett särskilt invandrarurval för att förbättra representativiteten och analyskraften av just invandrare.
LINDA innehåller uppgifter om en rad viktiga socioekonomiska utfall såsom inkomster, skatter, transfereringar, utbildning, yrke, fastighetsägande. Antalet variabler har vuxit över tid i takt med att allt fler myndighetsregister tillkommit, och LINDA erbjuder därför en viktig bild av variablers tillgång och beskaffenhet under olika år.
En rad myndigheter, intresseorganisationer och universitet använder LINDA sedan 1990-talet, och databasen är en självklar gemensam referenspunkt inom såväl forsknings- och utredningsväsendet. LINDA används även inom undervisningen så att studenter lär sig hantera aktuella och historiska registerdata.
Nu vill SCB ändå lägga ned LINDA-databasen. I en skrivelse ”Hantering av LINDA-databasen” från juni 2020 anges ett antal skäl till nedläggningen, men det viktigaste skälet är att SCBs insamling av löneuppgifter från Medlingsinstitutet saknar rättsligt stöd. Anledningen är att dessa löneuppgifter inte används av SCB för att producera offentlig statistik, utan enbart lägga in dem i en databas, och SCB har inte tillstånd till det senare. Av denna anledning upphör SCB med att producera LINDA.
SCB diskuterar i skrivelsen att LINDA används alltmer sällan eftersom bättre dataresurser idag möjliggör analyser av större befolkningsurval eller rentav hela befolkningen. Detta stämmer förmodligen, och här finns givetvis en avvägning mellan resursåtgång och användarnytta som måste göras. Men klart är ändå att LINDA fortfarande används i utredning, forskning och undervisning, och ingen av de andra databaser som SCB nämner täcker in hela perioden tillbaka till 1968.
Men går det alls att stoppa nedläggningen av den viktiga LINDA-databasen? Självklart går det. Det kanske enklaste vore att helt enkelt utelämna löneuppgifter från LINDA, vilka verkar vara förknippade med särskilda insamlingsproblem. LINDA har hundratals andra viktiga variabler som motiverar dess fortlevnad. Ännu bättre vore dock om SCBs ledning tog initiativ till en ändrad rättslig situation, vilket innebär en omtolkning av vad som är officiell statistik och databaser. Knappast någon skulle invända mot en sådan läsning av gällande föreskrifter.
En statistikmyndighet som SCB måste vara proaktiv och stå upp för en svensk statistik av hög kvalitet som är tillgänglig för såväl lagstiftare som forskarsamhälle. Att bevara den viktiga kontinuitet och användarvänlighet som LINDA utgör borde vara en självklar prioritet för en statistikmyndighet.
Bra inlägg, och det känns oroande att en här typen av resurser läggs ned. SCB lade tidigare ned sitt fantastiska bibliotek med liknande argument, att för få utnyttjade det. Detta är väldigt enögt. På bibliotekt var böckerna lättillgängliga. Även om mycket kan läggas ut på nätet, kunde man ju inte lägga ut alla statistiska publikationerna från andra länder. SCB kan inte heller lägga ut statistiska publikationer från andra svenska aktörer. Här bör man inte bara titta på antalet användare utan också på kvalitén. De som besökte biblioteket var bla forskare, studenter, journalister, och det de senare sedan skrev hade mycket större samhällsnytta än exempelvis släktforskare på arkiv.
Utmärkt att uppmärksamma detta! Jag tror som Daniel Waldenström att ” Ännu bättre vore dock om SCBs ledning tog initiativ till en ändrad rättslig situation, vilket innebär en omtolkning av vad som är officiell statistik och databaser. Knappast någon skulle invända mot en sådan läsning av gällande föreskrifter. En statistikmyndighet som SCB måste vara proaktiv och stå upp för en svensk statistik av hög kvalitet som är tillgänglig för såväl lagstiftare som forskarsamhälle. Att bevara den viktiga kontinuitet och användarvänlighet som LINDA utgör borde vara en självklar prioritet för en statistikmyndighet.”
Ett lång citat men fångar det väsentliga. SCB har under senare år pressats till dystra nedbantningar av inte minst sitt bibliotek.
Idag gäller det att värna den empiriska forskningen där SCB utgör en tung instans. Här vilar ansvaret tungt hos regering och riksdag.
Bra inlägg av Daniel och bra kommentarer. Jag håller med om allt som har sagts, men vill gärna lägga till någon kommentar.
Utmaningen är att få SCB att arbeta för att statistiken får största möjliga samhällsnytta. Här ingår självfallet SCBs egna produkter i form av så kallad officiell statistik. Men här ingår också den registerinformation som formar basen för en numera mycket omfattande empirisk forskning (och utredningsverksamhet). SCB, och Finansdepartementet som styr SCB, måste arbeta så att den samlade nyttan av dessa data blir så stor som möjligt.
Ibland hänför SCB formella argument mot att göra data tillgängliga för forskning och att utveckla datas egenskaper så att forskningen blir bättre. Det är då rimligen Finansdepartementet som ska ge SCB direktiv att arbeta så att statistiken kommer till bästa användning totalt sett.
Men under mina år som ordförande för olika användarråd inom SCB upptäckte jag också att många tjänstemän inom SCB känner en slags konkurrens från forskningen som ibland får större uppmärksamhet för sina resultat än vad presentationer av den officiella statistiken får. Denna inställning är självfallet mycket olycklig.
Någon gång kring millennieskiftet deltog jag på ett möte på Karolinska Institutet där ämnet var just användningen av registerdata. SCBs dåvarande GD Svante Öberg höll ett mycket fint anförande där han prisade registerdatas användbarhet. Han hoppades också att en dag få uppleva att forskning med sådana data belönas med ett Nobelpris.
Den är en sådan anda som måste ligga bakom SCBs beslut kring olika datamängder. Då skulle säkert LINDA-databasen överleva och troligen också den komplettering med lönedata som funnits för hela LINDA-urvalet under ganska många år nu. Med den njugga inställning till att utveckla registerdata som SCB och Finansdepartementet har idag är det mer sannolikt att den banbrytande empiriska forskningen görs med norska data än med svenska.