Innholdsfortegnelse
Hva er maskinlæring?
Maskinlæring er en gren innen innen kunstig intelligens og refererer til datamaskinens evne til å lære uten å følge spesifikke, forhåndsprogrammerte instrukser (Laurent, Chollet og Herzberg 2015, 3). Litt mer spesifikt kan vi si at maskinlæring er en vitenskapelig disiplin som går ut på å designe og utvikle algoritmer som gjør datamaskiner i stand å lære fra empiriske data. Disse empiriske dataene er normalt basert på analyser av Big data.
Microsoft Azure forklarer begrepet slik:
“Maskinlæring (ML) er prosessen med å bruke matematiske datamodeller til å hjelpe en datamaskin med å lære uten direkte instruksjon. Maskinlæring bruker algoritmer for å identifisere mønstre i data, og disse mønstrene blir deretter brukt til å lage en datamodell som kan gjøre forutsigelser. Med økt data og erfaring blir resultatene fra maskinlæring mer nøyaktige, omtrent slik mennesker forbedrer seg ved øvelse”.
At datamaskinen “lærer” vil si at dataprogrammet omprogrammerer seg selv (via algoritmer) for å bli bedre i stand til å utføre ønsket atferd (resultat). Denne læringen skjer kontinuerlig gjennom å analysere store mengder historiske data som datamaskinen har tilgang til. Alt dette skjer automatisk ved å bruke ulike algoritmer som prøver å finne ulike mønstre i datamaterialet datamaskinen har tilgang til. Med algoritmer menes en beskrivelse av hvilke handlinger som må utføres for å løse et spesifikt problem og rekkefølgen disse handlingene må utføres i. En algoritme er med andre ord en “oppskrift” på hvordan et problem skal løses, basert på tidligere erfaringer fra lignende problem.
Ikke det samme som kunstig intelligens
Maskinlæring er ikke det samme som kunstig intelligens som omfatter alle intelligente systemer, deriblant regelbasert læring. Regelbaserte læringsmodeller tolker data gjennom å følge forhåndsprogrammerte regler. Dette er ikke maskinlæring.
Datadrevne modeller har ingen regler som er programmert inn på forhånd, i stedet lærer modellen slike regler på egen hånd. Forskjellen er at disse reglene ofte ikke er forståelige for mennesker, og derfor kalles modellene ofte for svarte bokser (SNL.no).
Teknikk for å lære av empiriske data
Maskinlæring kan ses på som en teknikk for å lage forutsigbare modeller for å ta en beslutning. Dette gjøres i maskinlæring ved å lage algoritmer som automatisk lærer å gjenkjenne komplekse mønstre i store datasett av informasjon for så å ta intelligente beslutninger basert på disse empiriske dataene.
Målet med denne læringen er å lære fra historiske data for å kunne forutsi fremtidige hendelser og utfall (Russel og Norvig, 1995:527).
Tre læringsmetoder
Datamaskiner kan idag oppnå maskinlæring ved bruk en av tre ulike metoder:
- veiledende læring
- ikke-veiledende læring
- læring med forsterkning