tisdag, oktober 01, 2013

Mot en Big data-värld

Kultursidan Västerbottens-Kuriren 131001

Svenska lagar som syftar till att skydda medborgare från otillbörlig hantering av personuppgifter med hjälp av informationsteknik, har alltid stått på en fast grund: en teleologisk utgångspunkt. Teleologi är ett begrepp som går tillbaka till Aristoteles och innebär ändamålstolkning. För att förstå en social företeelse, utgår man från dess syfte, dess mål.

           Inom datalagstiftning tillämpas teleologin genom att reglering av personuppgifters hantering sker med utgångspunkt i det angivna syftet. I 1973 års datalag var varje organisation som önskade upprätta ett personregister tvungen att ha ett angivet ändamål med registret och personuppgifterna fick enbart användas för det angivna ändamålet.
           Den nuvarande Personuppgiftslagen har samma utgångspunkt: Personuppgifter får behandlas enbart för uttryckligt angivna och berättigade ändamål. Till detta lades att den som avser att upprätta personregister och utföra någon form av behandling av personuppgifter måste inhämta ett samtycke från de personer som registreras.
           Tesen för denna essä är att denna teleologiska grundbult håller på att bli delvis obsolet. I december 2011 förbjöd Datainspektionen Karolinska institutet att samla in personuppgifter inom forskningsprojektet LifeGene. Projektet avsåg att samla in ett flertal medicinska uppgifter (allt från hörseltester till blodprover) från ett stort antal individer.
           Skälet till Datainspektionens beslut var att LifeGene-projektet inte kunde ange tillräckligt precisa ändamål med insamlingen av medicinska data. LifeGene-projektet hade angivit "framtida forskning" som ändamål, det vill säga samla in data för framtida forskningsfrågor som ännu inte har formulerats.
           Datainspektionens förbud föranledde regeringen att snabbt fatta beslut om att detta forskningsprojekt är av så stor betydelse för medicinsk vetenskap att nya regler för forskningsregister formulerades. LifeGene fick fortsätta sin datainsamling med "framtida forskning" som angivet ändamål.

LifeGene-projektet är delvis ett exempel på det accelererande fenomenet som kallas Big data. Någon svensk översättning av Big data har jag inte sett, och det är inte självklart att någon sådan kommer att formuleras. Det handlar om att företag, organisationer och myndigheter samlar in enorma mängder med datauppgifter och använder nya analysverktyg.

           Boken Big Data (Houghton Mifflin Harcourt, 2013) av Viktor Mayer-Schönberger, professor vid Oxford Internet Institute, och Kenneth Cukier, redaktör på The Economist, är en utmärkt introduktion till denna företeelse. Anslaget är storvulet. Underrubriken skvallrar om att Big data kommer att revolutionera hur vi lever, arbetar och tänker.
           Såväl Google som Amazon som Facebook och andra företag som med sina internettjänster samlar in mängder av uppgifter om sina kunders användning av tjänsterna, ned till minsta klick, har tillämpat Big data-analys en tid. Avslöjandet av NSA:s övervakningsprogram PRISM antyder att det är Big data-analys det handlar om.
           När företag som inte är så kallade internetföretag börjar anamma denna analysmetod, blir det än mer intressant. Författarna tar den amerikanska handelskedjan Walmart som exempel på hur man samlar in så mycket data som möjligt om kundbeteenden för att optimera försäljning. I Sverige rapporterar Computer Sweden att Coop borrar allt djupare i de mängder av kunddata som ständigt samlas in, med syftet att öka handeln och kundgenomströmningen.

Det som enligt Mayer-Schönberger och Cukier utgör den revolutionära förändringen är att vi med Big data-analyser allt mer förlitar oss på statistiska samband framför kausala samband. Enkelt uttryckt innebär det att statistiska samband påvisar exempelvis att två händelser samvarierar över tid, medan kausala samband påvisar att en händelse utgör en orsak till en annan. Ännu enklare uttryckt innbär statistiska samband svar på frågan "Vad?", medan kausala samband ger svar på frågan "Varför?".

           Traditionen är att formulera en hypotes om någon del av verkligheten, för att sedan genom ett slumpässigt urval samla in data för att undersöka om hypotesen stämmer. Syftet med datainsamlingen bestäms av hypotesen. I en Big data-värld samlar man in så mycket data som bara är möjligt utan något syfte och ställer frågor till datamaterialet i efterhand.
           Ett forskarlag i USA har utvecklat programvara för behandling av för tidigt födda barn, för att öka kvaliteten i diagnostisering. I stället för att arbeta hypotesprövande, installerar forskarna en mängd mätinstrument på och kring nyfödda barn som mäter deras tillstånd varje sekund. Det blir enorma mängder data. Med den speciella programvaran kan man upptäcka subtila förändringar i dessa barns tillstånd och signalera misstänkta infektioner redan ett dygn innan symptomen framträder på vanligt sätt.
           Tekniken kan dock enbart ge svaret att en infektion håller på att uppstå, inte varför den uppstår. Många gånger räcker det. Det är lätt att ana vilken enorm betydelse denna teknik skulle kunna få om den sprids inom andra delar av vården.

Det är också lätt att föreställa sig hur Big data-analyser kan ge positiva effekter för andra aktörer i samhället. Samtidigt bör vi reflektera lite djupare över vad det är för slags analysverktyg som utvecklas. Grundidén med datorstödda analyser borde vara att stödja människors beslutsfattande – och det som föregår beslutsfattandet: kunskap om och förståelse för en viss situation samt konsekvenser av olika beslut.

           Mot den grundidén kan vi ta till oss psykologen Daniel Kahnemans bok Tänka snabbt och långsamt (Volante, 2012). Människans intellekt, menar han, består av två system: ett snabbt, intuitivt system som utan kognitiv ansträngning tolkar omvärlden närmast automatiskt och ett långsamt, genomtänkt system som aktivt, medvetet och koncentrerat bearbetar sinnesintryck och erfarenheter. Bägge systemen är nödvändiga för att vi ska kunna agera rationellt.
           Det säger sig självt att det andra systemet är betydligt mer ansträngande för hjärnan, vilket leder till att vi gärna förenklar problemsituationer med intuitionen som grund, i stället för att göra de nödvändiga bearbetningarna. En tolkning av Big data är att det är ett datorstöd för det snabba tänkandet, ett stöd för vår snabba och intuitiva förståelse av världen. Men är det det tänkandet vi behöver bättre stöd för?
           Är det inte datorstöd för det andra systemet i vårt intellekt vi bäst behöver, det vi använder för att bättre förstå världen på ett djupare plan, hur tillvaron hänger ihop, varför människor beter sig på vissa sätt, varför vissa beslut fattas, varför saker sker?

Inga kommentarer: