Flytt ditt nettsted til våre Lightspeed webhotell, med cPanel, og
få 3-6 ganger raskere nettsider enn i dag. Pris: fra kr. 119/pr. år.

Beskyttet innhold!

For å lese denne og våre øvrige sider må du tegne et årsabonnement og være logget inn.

Som abonnent/medlem får du tilgang til alt innholdet på sidene våre, og skulle sidene våre ikke leve opp til forventningene dine har vi en "Pengene tilbake garanti" du kan benytte.

Tegn abonnement!

    Denne artikkelen er del 1 av 14 artikler om Big Data

    Denne artikkelen er del 8 av 16 artikler om Innovasjonkilder

I denne artikkelserien går vi gjennom hva Big Data er, hvordan den innhentes og brukes, samt hvordan Big Data kan brukes som en kilde til innovasjon og konkurransefortrinn.

Big Data går ut på å samle inn og analysere store mengder rådata for å hente ut ny innsikt fra data som man tidligere ikke har hatt tilgang til eller oversett. Dersom dataene gjøres lett tilgjengelig vil beslutningstakere kunne benytte denne informasjon som støtte til sentrale strategiske og operative beslutninger.


Hva er Big Data?

La oss starte med EU-kommisjonens rådgivende organ i personvernspørsmål sin definisjon av Big Data:

“Data refererer til den enorme økningen i tilgang til, og automatiserte bruk av, opplysninger: det refererer til gigantiske mengder digitale data som er kontrollert av selskap, myndigheter og andre store organisasjoner, og som gjøres til gjenstand for omfattende analyse ved bruk av algoritmer. Big Data kan bli brukt til å identifisere generelle trender og sammenhenger, men kan også bli benyttet slik at det berører enkeltindivider direkte”

Dette er egentlig ingen definisjon, men en kort beskrivelse av hva Big Data er.

Det første forsøket på en definisjon av Big Data ble lansert i 2001:

“Big Data er data som kjennetegnes ved tre V’er, Volume (volum), Variety (variasjon) og Velocity (hastighet)”.

  • Volume (volum): Tilgjengelig data øker i omfang – IBM estimerer at det innen 2020 kommer til å genereres 2,3 trillioner gigabyte data hver dag, som tilsvarer 107 millioner blue-ray disker eller 4,2 milliarder fulle CD’er
  • Variety (variasjon): Ulike typer data er tilgjengelig fra en rekke ulike datakilder – 400 millioner Twitter-meldinger sendes hver dag, og stadig flere datakilder kobles opp mot internett og genererer informasjon
  • Velocity (hastighet): Data er tilgjengelig raskere enn før og vi ønsker at dataene er tilgjengelige i tilnærmet sanntid

IBM har valgt å ta med enda en V i sin definisjon av Big Data:

  • Veracity (pålitelighet): usikkerhet knyttet til kvalitet i dataene, og viktigheten av å kunne stole på dataene.

I 2012 spisset Gartner denne definisjonen ytterligere:

Big Data er informasjon som kjennetegnes ved høyt volum, høy hastighet og/eller høy grad av variasjon, og som krever nye metoder for prosessering og tilrettelegging for å kunne fungere som grunnlag for forbedrede beslutninger, økt innsikt og optimalisering av prosesser.

Big Data er, forenklet sagt, ny teknologi som gjør det mulig å analysere større og mer komplekse datamengder hurtigere og mer nøyaktig enn tidligere. Big Data kan også betraktes som datasett som er så store eller komplekse at de er vanskelige å analysere med vanlige dataprosesseringsverktøy.

Mange selskaper sitter på enorme datamengder om kunder, produkter, transaksjoner, osv., men mangler en plan for hvordan dataene kan benyttes til å få ny innsikt som grunnlag for beslutningsstøtte. Samtidig genereres det enorme mengder data fra ulike eksterne kilder, som kombinert med interne data kan gi et bredere analysegrunnlag og ny informasjon. Det er i mange virksomheter et stort behov for å etablere en god plan for hvordan de kan hente ut verdi fra disse dataene gjennom analyse og hvordan de kan utnytte den nye innsikten i forretningsprosessene, sier PWC.

Grunnlag for stordata

Det er minst fem teknologiske utviklinger som sammen har lagt grunnlaget for fremveksten av Big Data:

  • Prosesseringskraften har øket enormt de siste tiårene samtidig som prisen har gått ned.
  • Lagringskapasitet har også øket enormt de siste tiårene. Datalagring er blitt langt billigere, raskere og mer pålitelig. I tillegg kommer nye teknologier som lagring på grid i skyen og nye NOSQL-databaser.
  • Kommunikasjonskapasitet har også øket enormt og blitt billigere, ikke minst pga fiberoptiske kabler. De kraftigste kablene i dag kan overføre på ett sekund all datatrafikk som ble overført på internettet i løpet av en hel måned på slutten av 1990-tallet.
  • Allestedsnærværende og gjennomtrengende databehandling vil si at vi i stadig større grad omgis av datainnsamlende og -behandlende apparater, både dem vi bærer med oss (de allestedsnærværende, som mobiltelefoner og smartklokker) og dem som bygges inn i omgivelsene våre (de gjennomtrengende, som smarte hus og byer). I tillegg til at vi omgis av stadig flere datainnsamlende og -behandlende apparater, blir hver av dem stadig mer digitale, nettverkstilknyttede og smarte, og dermed mer egnet for stordatafangst.
  • Standardidentifikatorer gjør det mulig å identifisere fenomener som personer, gjenstander, informasjon og lokasjoner unikt. Eksempler på slike identifikatorer er: personnummer, førerkortnummer, passnummer, kontonavn osv for personer; produkt- og RFID-koder for kommersielle produkter; kjennemerke og autopass-ID for biler; MAC-adresser for datautstyr; IMEI-nummer for mobiltelefoner; IMSI-nummer for SIM-kort; ISBN-, ISSN- og DOI-numre for ulike typer publikasjoner; URI/IRI-er for vevressurser; gateadresser, postnumre og geokoordinater for geografiske lokasjoner. Det finnes mange, mange flere. Identifikatorene gjør det mulig å knytte sammen data som kommer fra ulike kilder men som handler om samme fenomen, f eks om samme person, eller som handler om relatert fenomener, f eks at en person er eier av en gjenstand og holder til på et bestemt sted.

Hva er driverne bak Big Data?

Big Data kan sies å være summen av store mengder strukturerte og ustrukturerte data.

  • Strukturerte data: Transaksjonsdata som vi typisk finner i tradisjonelle datavarehus, økonomisystemer (ERP), kundedatabaser (CRM), osv.
  • Ustrukturerte data: Data som typisk ikke kan struktureres i tabeller – Twitter-meldinger, bilder, tekst, osv.

I tillegg til å være en kombinasjon av strukturerte og ustrukturerte data, så kommer data i enorme mengder fra en rekke ulike kilder – Internet of Things. Dette begrepet er sentralt når vi snakker om Big Data – alt er på internett og kan knyttes sammen ved hjelp av data. Nye biler er koblet mot internett og genererer enorme mengder informasjon om alt fra kjøremønster til når sentrale komponenter i bilen må repareres eller skiftes ut. Telefonene våre er konstant på nett og bruk av apper generer data om våre nettvaner, kjøpsvaner, hvor vi befinner oss og private interesser og meninger. Smart TV’en din er koblet opp mot internett slik at Netflix kan lage analyser basert på dine TV-vaner. Til og med huset eller leiligheten din er på internett – du kan bruke egne apper til å styre strømforbruket i boligen din. Slik kan vi fortsette.

PWC sier at en vanlig misforståelse er at Big Data kun handler om ustrukturerte data, som det genereres trillioner av gigabyte av hver eneste dag, og som er majoriteten av all tilgjengelig informasjon. Big Data handler om hvordan vi setter sammen informasjon fra interne og strukturerte datakilder med ustrukturert informasjon for å skape ny innsikt, hevder de.

Den største og viktigste årsaken til at vi nå kan snakke om Big Data som et viktig beslutningsgrunnlag er i følge PWC at det nå finnes tilgjengelig teknologi som gjør det mulig å samle inn og lagre enorme datamengder raskt og kostnadseffektivt. Vi kan sette sammen strukturert og ustrukturert informasjon og bruke denne informasjonen til å se sammenhenger, lage analyser og generere innsikt som vi tidligere ikke trodde var mulig

Figuren under gir et forenklet bilde av hvordan man kan samle sammen informasjon fra ustrukturerte og strukturerte datakilder og hente ut informasjon som grunnlag for relevante analyser. Big Data i seg selv gir ingen verdi. Verdien genereres når vi klarer å analysere de riktige dataene og gi ny innsikt og bedre beslutningsgrunnlag for virksomheten, påpeker PWC. Den største verdien fra en Big Data-plattform oppnås når man klarer å lage gode visualiseringer og presentasjoner basert på komplekse analyser på relevant informasjon.

big-data

Data Lake

Data lake omhandler en ny type tilnærming innen databehandling, og er et steg i arbeidet med å analysere og hente ut innsikt fra større og ofte ustrukturerte datamengder. Tidligere opererte selskaper med datavarehus, der man oppbevarte og strukturerte forretningsinformasjon for analyse og rapportering. I datavarehuset plasserte man tradisjonelt sett kun data som hadde et tydelig bruksområde og verdi, dette fordi kostnaden for å oppbevare og strukturere denne dataen var så stor. Data lake representerer på mange måter en motsetning, ved at man her oppbevarer rå, ustrukturerte data som ikke har et tydelig bruksområde eller verdi på nåværende tidspunkt (PWC).

På denne måten sikrer man tilgang til en rekke data som over tid kan analyseres, og gjennom denne analysen kan man avdekke nye bruksområder og potensielt svært verdifull informasjon. Denne ukritiske tilnærmingen til oppbevaring av data kan man tillate seg fordi kostnaden for datalagring har blitt dramatisk redusert (PWC). 

Big Data – en kilde til innovasjon og konkurransefortrinn

Bruk av Big Data kan utvilsomt brukes som en kilde for såvel innovasjon som konkurransefortrinn. Mange har hatt suksess med bruken av Big Data så lang, f.eks. styres annonseinntektene til såvel Facebook som Google av bruk av Big Data for å finne og treffe annonsørenes målgruppe for annonsen. Noen har imidlertid ikke vært like etiske i sin bruk av Big Data og har gått konkurs av den grunn. F.eks. gjaldt dette Cambride Analytica som samlet inn og brukte data fra 87 millioner Facebook brukere uten deres tillatelse for å selge denne informasjonen til Donald Trumph sin valgkampanje for å treffe deres velgere mer målrettet enn andre mediekanaler kunne gjøre.

Lærdommen av dette er dermed at bruk av Big Data er en enorm kilde til innovasjon, men skal dette gi suksess må dette gjøres på en etisk måte og i full åpenhet med brukerne dataene hentes inn fra.

For å utnytte det fulle potensialet som ligger i bruk av Big Data må disse dataene kobles opp mot andre teknologier som er istand til å nyttiggjøre seg av denne informasjonen om den enkelte bruker og skape et sluttprodukt som dekker sluttbrukerens behov eller løser deres problemer på en bedre måte enn det dagens løsninger gjør. Først da blir Big Data en kilde til varige konkurransefortrinn.

Kilde:

  • https://www.pwc.no/no/publikasjoner/information-management/big-data.pdf
  • https://no.wikipedia.org/wiki/Stordata
  • https://www.datatilsynet.no/globalassets/global/04_planer_rapporter/big-data_web.pdf
  • https://www.pwc.no/no/tjenester/digitalisering-pa-1-2-3/big-data—data-lake.html
Fant du ikke svaret? Spør redaksjonen!

Fant du ikke svaret?

Fyll ut skjemaet under hvis du har et spørsmål knyttet til denne artikkelen.

Ditt spørsmål:

Ditt navn:

E-post:

Rapporter en feil, mangel eller savn

Rapporter en feil, mangel eller et savn

Benytt skjemaet under hvis du finner en feil eller mangel i en av våre artikler. Uten tilbakemeldinger fra våre lesere er det umulig for oss å forbedre våre artikler.

Jeg ønsker å rapportere inn en:

En feilEn mangelEt savn

Angi en feil, mangel eller savn:

Ditt navn:

E-post:

Du kan også laste ned denne artikkelen og resten av artikkelserien som en e-bok Artikkelserien fortsetter under.

Topp20 artikler
Siste 20 artikler
Nye artikkelserier
Du leser nå artikkelserien: Big Data

  Gå til neste / forrige artikkel i artikkelserien: Kilder til Big Data >>
    Andre artikler i serien er: 
  • Big Data – kilde til innovasjon og konkurransefortrinn
  • Kilder til Big Data
  • Egenskaper ved Big Data
  • Hvordan utnytte Big Data?
  • Data mining gir nye muligheter
  • Hvordan brukes Big Data idag?
  • Verdikjeden til Big Data
  • Big Data verdikjeden -> Innsamling av data
  • Big Data verdikjeden -> Lagring og aggregering
  • Big Data verdikjeden -> Analyse
  • Big Data verdikjeden -> Brukere og bruksområder
  • Big Data – personvernprinsipper under press
  • Big Data og sikkerhet
  • Big Data plan
  • Du leser nå artikkelserien: Innovasjonkilder

      Gå til neste / forrige artikkel i artikkelserien: << 5G nettverk – vil løse dagens nettverksproblemerBlockchain >>
        Andre artikler i serien er: 
  • Innovasjonkilder i jakten på den gode ideen!
  • Teknologidrevet innovasjon (teknologideterminisme)
  • Industri 4.0 – den fjerde industrielle revolusjon
  • Automatisering
  • 3D-printing
  • Tingenes Internett («Internet of Things»)
  • 5G nettverk – vil løse dagens nettverksproblemer
  • Big Data – kilde til innovasjon og konkurransefortrinn
  • Blockchain
  • Virtuell virkelighet (Virtual Reality – VR)
  • Kunstig intelligens
  • Maskinlæring
  • Økologi – fremtidens konkurransefortrinn
  • Workshop (arbeidsmøte, arbeidsseminar og arbeidsgruppe)
  • Brainstorming ( Idédugnad )
  • Foreløbig vurdering av ideen