Om Big Data och infrastruktur – växer den oss över huvudet?

Kommer vi att dränkas av data inom den samhällsvetenskapliga forskningen? I fakultetens handlingsplan lyfter vi fram stöd till infrastruktur som något som lämpligen ligger på fakultetsnivå, ett område där överblick och samarbete ger mer än individuella insatser. Vid Göteborgs universitet pågår en översyn och diskussion kring infrastruktur vars primära syfte är att skapa större tillgänglighet, transparens och samverkan mellan både forskare och mellan allmänhet och forskning.

Koncentrationen blir oftast på statistiska data, men infrastruktur är också arkivering och tillgängliggörande av olika former av forskningsmaterial av helt annat slag; dokument, brev, intervjuer, programtexter, bilder m m. Den typen av data är svårare att systematisera idag, men forskningsinriktningar som främst använder sådant material samlar också in det på annat sätt. Forskningsproblemet och materialet har ett starkare samband, tillgängligheten kan finnas men frågan är hur många andra som kan tillgodogöra sig t ex intervjusvar insamlade för ett särskilt syfte. Vi bör dock inte räkna bort sådant forskningsmaterial eftersom det i sig leder till en fokusering på en typ av data som är bra på att svara på vissa frågor – men knappast alls på andra.

Men det som idag benämns ”Big Data” är statistiska data, förment neutrala och möjliga att använda som svar på många frågor. Mängden och tillgängligheten till sådana data har ökat exponentiellt de sista tio åren.  Vad gör vi med den utvecklingen?

Den mest genomgripande förändringen som big data innebär för vårt sätt att förstå världen är att vi alltmer kommer att förlita oss på statistiska samband. Vi är annars skolade att söka förståelse i form av orsakssamband. Det är djupt rotat i oss: en sak leder till en annan – därför. Big data nöjer sig med en sak, en annan – och sannolikheten att de förekommer tillsammans. Big data-analys kan förvisso bidra till förståelse av orsak och verkan, men i första hand visar den inte på kausalitet utan på korrelation.

I Svenska Dagbladet hade i april Sam Sundberg en intressant understreckare ur vilken citatet ovan är hämtat. Avslutningen av den texten är också värd att citera: ”Ren information är alltid neutral. Frågorna vi ställer är alltid ledande.”

Samhällsvetenskapens styrka är att kunna ställa rätt frågor. Forskningsproblemen är något som aldrig kan formuleras annat än av människor, av samhällsvarelser som interagerar med varandra och som skapar teorier, modeller och förklaringar. Det är vår styrka och vår egenart.

Även i Foreign Affairs kan man läsa en text på samma tema.