Big Data – på godt og vondt

Store datamengder kan gi oss nyttig informasjon, men samtidig bli et problem når datakilder samstilles og brukes kommersielt. Foto: Istock photo

8. mai 2013

Gemini.no

90 prosent av alt som finnes av data i verden har kommet de siste to årene. Nettselskapene vasser i data som kan stilles sammen og utnyttes. Er det bra?

Stadig mer data blir tilgjengelig på nettet. Hver og en av oss produserer og gir fra oss data om oss selv hele tiden. Enten ved at vi beveger oss passivt rundt – og atferden vår registreres via kamera eller kortbruk. Eller at vi logger oss på en pc og surfer på nettet.

Datamengdene utgjør det som har fått benevnelsen “big data”- der data om enkeltindivider, grupper og perioder, er kombinert eller slått sammen til større grupper eller lengre tidsperioder.

EN NY ANALFABETISME? SINTEF-forsker Petter Brandtzæg hevder at det å kunne betjene pc og Internett snart er like viktig som å kunne lese. Viktig informasjon flyttes i et ekstremt tempo over på nett, stadig flere tjenester automatiseres, og det forventes at folk skal betjene seg selv. – Allerede nå ser vi at mange som ikke kan bruke den nye teknologien, er blitt totalt hjelpeløse, sier han. Foto: Studio Lasse Berre

SINTEF-forsker Petter Brandtzæg sier Big Data gir store muligheter på forskningsfronten, siden det er mulig å lage grundige analyser og sammenligninger som spenner vidt.
Foto: Studio Lasse Berre

Forskningsfortrinn

Petter Bae Brandtzæg på SINTEF IKT, forteller om store forskningsavdelinger som har utviklet seg innen nettselskap som Facebook og Google.
–Fortinnet deres er de enorme datamengdene som andre samfunnsforskere bare kan drømme om, sier han.

Men også SINTEF-forskerens hverdag har endret seg. Det finnes muligheter for å få tak i “big data” selv om man ikke jobber i et stort nettselskap.

I delTA-prosjekt om ung samfunnsdeltakelse på nett, har Brandtzæg satt seg inn i – og bruker et verktøy kalt Wisdom fra det amerikansk baserte selskapet MicroStrategy.

–Her har jeg tilgang på data fra over 20 millioner mennesker – uten å ha gjort en eneste undersøkelse. Jeg kan analysere ulike preferanser på Facebook, og se på alders- og kjønnsforskjeller mellom ulike grupper og på tvers av land i hele verden. Til nå har jeg sammenlignet kjønnsforskjeller i samfunnsengasjement på Facebook mellom mennesker i Norge, Spania, England, USA, Russland, Egypt, India og Kina.

Personvern er ofte et problem man assosierer til Big Data, men data fra Wisdom er begrenset til større grupper og går ikke ned på “individ nivå”, i følge Brandtzæg. Derfor kan han sammenligne store grupper uten at personvern blir et problem.

Kort og flyktig informasjon

Gjennom Big Data kan man oppnå forskningsresultater som spenner vidt og kan si mye om utviklingen i verden på mange forskjellige områder. Det er mulig å lage grundige analyser og sammenligninger mellom land og ulike kjønn.

Forskere ved Facebooks egen forskningsavdeling har for eksempel undersøkt hvordan folk i verden oppdaterer meldingene sine og hva de legger ut av informasjon om seg selv og livene sine.
–Undersøkelsene viste at meldingene som legges ut har blitt stadig kortere for hvert år, sier Brandtzæg. –De gjenspeiler økningen i hurtige kommunikasjonen ellers ute i samfunnet der for eksempel Twitter oppnår stor popularitet fordi det handler om å utrykke seg konsist og kjapt på max 140 tegn. En trend i samme retning er at ungdom viser sine historier gjennom bilder i stedet for en tekst. Instagram –feberen kan ha utspring i at man slipper å skrive.

Samstilling av data

Datamengdene kan altså gi oss nyttig informasjon. Samtidig kan Big data bli et problem når ulike datakilder samstilles for å brukes kommersielt og drive målrettet reklame.

I stadig større grad kan data om hvor du befinner deg, kobles mot kjøpereferanser vi har, hva vil liker og ikke liker. Dette har Facebook kommet langt med.

Sårbarhet og personvern er skyggesider i den nye situasjonen der folk begynner å komme inn i store datasett og registre.
–Hvem vet – om to år kan kanskje skatteregisteret kobles til helse og forsikringsregisteret? sier Petter Bae Brandtzæg. –Det har jo vist seg før at skattedata har kommet på avveie.

Les også: Den digitale kløften

Hvilke meninger formidles?

Med den overveldende mengden av data som produseres, kommer også spørsmålet om innhold i all denne informasjonen. Hva er det som formidles?

Forskningsavdelingen Nettbaserte systemer og tjeneste ved SINTEF, som Petter Bae Brandtzæg er tilknyttet, har nylig fått tilslag på et nytt EU-prosjekt som bærer navnet REVEAL (avsløre). Her skal forskerne se på kombinasjoner av ulike datakilder og finne ut uttrykksevne, kvalitet og graden av sannhetsgehalt i data fra sosiale medier. Hva inneholder mediene? Hvem er avsendere? Hvem andre har sagt det som sies?
–Vi skal sette ulike kilder i sammenheng, og for eksempel finne ut hvor troverdig Twitter-meldingene er, sier Brandtzæg. Han trekker også fram trenden med hvordan vi fragmenterer informasjonen vår i mange kanaler – som Facebook, sms, mail, blogger, Twitter og Instagram.

Hvor troverdig er mediene?

Muligheten til å spre informasjon til store grupper i sanntid, har gjort Twitter og Facebook til viktige formidlingsverktøy ved store nyhetshendelser.

I jakten på Boston-terroristene brukte også politi, myndigheter og tradisjonelle medier sosiale medier som Twitter, Instragram, Reddit og Facebook til aktivt å hente inn og dele ut informasjon om hendelsen. Flere frivillige grupper ble også satt opp i sosiale medier for å forsøke å hjelpe politiet. Men, det viste seg at sosiale medier som kommunikasjonskanal ikke bare er til stor hjelp, men også en stor kilde til forvirring og feilinformasjon.

Kan Big Data utnyttes som en ressurs for journalister, og hvor troverdige er informasjonen på sosiale medier? Også dette emnet skal SINTEF-forskerne undersøke i EU-prosjektet REVEAL.

Kontaktperson

Petter Bae Brandtzæg

Sjefforsker

Kontakt oss

Tjenester

Rapporter og publikasjoner

Forskningssenter og samarbeid

Karriere

Bærekraft

Institutter

Andre enheter

Ledelse og organisering

Om oss

Følg oss