Big Data – kilde til innovasjon og konkurransefortrinn
Big Data går ut på å samle inn og analysere store mengder rådata for å hente ut ny innsikt fra data som man tidligere ikke har hatt tilgang til eller oversett. Dersom dataene gjøres lett tilgjengelig vil beslutningstakere kunne benytte denne informasjon som støtte til sentrale strategiske og operative beslutninger.
Hva er Big Data?
La oss starte med EU-kommisjonens rådgivende organ i personvernspørsmål sin definisjon av Big Data:
“Data refererer til den enorme økningen i tilgang til, og automatiserte bruk av, opplysninger: det refererer til gigantiske mengder digitale data som er kontrollert av selskap, myndigheter og andre store organisasjoner, og som gjøres til gjenstand for omfattende analyse ved bruk av algoritmer. Big Data kan bli brukt til å identifisere generelle trender og sammenhenger, men kan også bli benyttet slik at det berører enkeltindivider direkte”
Dette er egentlig ingen definisjon, men en kort beskrivelse av hva Big Data er.
Det første forsøket på en definisjon av Big Data ble lansert i 2001:
“Big Data er data som kjennetegnes ved tre V’er, Volume (volum), Variety (variasjon) og Velocity (hastighet)”.
- Volume (volum): Tilgjengelig data øker i omfang – IBM estimerer at det innen 2020 kommer til å genereres 2,3 trillioner gigabyte data hver dag, som tilsvarer 107 millioner blue-ray disker eller 4,2 milliarder fulle CD’er
- Variety (variasjon): Ulike typer data er tilgjengelig fra en rekke ulike datakilder – 400 millioner Twitter-meldinger sendes hver dag, og stadig flere datakilder kobles opp mot internett og genererer informasjon
- Velocity (hastighet): Data er tilgjengelig raskere enn før og vi ønsker at dataene er tilgjengelige i tilnærmet sanntid
IBM har valgt å ta med enda en V i sin definisjon av Big Data: