Big Data går ut på å samle inn og analysere store mengder rådata for å hente ut ny innsikt fra data som man tidligere ikke har hatt tilgang til eller oversett. Dersom dataene gjøres lett tilgjengelig vil beslutningstakere kunne benytte denne informasjon som støtte til sentrale strategiske og operative beslutninger.
Hva er Big Data?
Big data er et begrep vi bruker på store, komplekse og varierte datasett som genereres i raskt tempo fra ulike kilder, og som krever avanserte teknologier og teknikker for å bli lagret, prosessert og analysert effektivt. Bruken av big data har blitt stadig mer relevant innenfor en rekke bransjer, og det er en viktig drivkraft bak mange innovasjoner innenfor kunstig intelligens (AI), maskinlæring (ML), forretningsanalyser, og beslutningsstøtte.
Definisjon
Det første forsøket på en definisjon av Big Data ble lansert i 2001:
“Big Data er data som kjennetegnes ved tre V’er, Volume (volum), Variety (variasjon) og Velocity (hastighet)”.
- Volume (volum): Mengden data som samles fra forskjellige kilder som sensorer, sosiale medier, blogger, logger, mobilapper, transaksjoner osv øker konstant. I 2022 ble det generert mer enn 2,3 trillioner gigabyte data hver dag.
- Variety (variasjon): Big data inkluderer mange forskjellige typer data, både strukturerte data (for eksempel databaser) og ustrukturerte data (som tekst, bilder, video og lyd). F.eks. sendes det 400 millioner X-meldinger hver dag.
- Velocity (hastighet): Dataene genereres og behandles i sanntid eller nesten sanntid, noe som krever rask prosessering.
Senere er det blitt langt til 2 ekstra V-er:
- Veracity (pålitelighet): usikkerhet knyttet til kvalitet i dataene, og viktigheten av å kunne stole på dataene.
- Verdi: Selv om dataene i seg selv ikke har noen verdi før de blir analysert, gir de stor innsikt og verdi når de analyseres riktig. Dette innebærer å oppdage mønstre, trender, og informasjon som kan brukes til å forbedre beslutningstaking.
I 2012 spisset Gartner denne definisjonen ytterligere: