Domene og webhotell fra OnNet.no

    Denne artikkelen er del 19 av 18 artikler om Bivariat analyse

Lesetid (240 ord/min): 3 minutter
Variasjonsanalyse
Photo by Chris Ried

Hva er ANOVA (Analysis of Variance)?

ANOVA, som står for Analysis of Variance eller variansanalyse på norsk, er en statistisk metode som brukes i en dataanalyse for å sammenligne middelverdier (gjennomsnitt) mellom tre eller flere grupper for å avgjøre om det er en signifikant forskjell mellom dem. ANOVA er en bivariat analyse som hjelper med å identifisere om variasjonen mellom gruppene er større enn variasjonen innenfor gruppene, noe som indikerer at minst én av gruppene har en middelverdi som er signifikant forskjellig fra de andre.

Hovedtyper av ANOVA (variansanalyse)

Vi skiller mellom følgende typer variansanalyser:

  1. Enveis ANOVA (One-Way ANOVA):

    • Brukes når vi sammenligner middelverdier på tvers av tre eller flere grupper basert på én enkelt faktor eller uavhengig variabel.
    • Eksempel: Hvis du ønsker å sammenligne middelverdien av blodtrykk mellom tre forskjellige aldersgrupper (20-30, 30-40, 40-50 år), vil enveis ANOVA være passende.
  2. Toveis ANOVA (Two-Way ANOVA):

    • Brukes når man undersøker effekten av to uavhengige variabler samtidig, og hvordan disse variablene kan interagere med hverandre.
    • Eksempel: Hvis du ønsker å undersøke effekten av både kjønn (mann/kvinne) og kostholdstype (vegetarisk/ikke-vegetarisk) på blodtrykk, vil toveis ANOVA være passende.
  3. Repeterte målinger ANOVA (Repeated Measures ANOVA):

    • Brukes når de samme individene måles under forskjellige forhold eller på forskjellige tidspunkter.
    • Eksempel: Hvis du måler en persons blodtrykk før, under og etter en behandling, og ønsker å se om det er en signifikant endring over tid, kan du bruke repeterte målinger ANOVA.

Hvordan fungerer ANOVA?

ANOVA deler den totale variasjonen i dataene (Total Sum of Squares) inn i to deler:

  • Variasjon mellom grupper (Between Groups): Dette representerer variasjonen i middelverdier mellom gruppene og kalles også behandlingseffekt.
  • Variasjon innenfor grupper (Within Groups): Dette representerer variasjonen innenfor hver gruppe, som skyldes individuelle forskjeller eller målefeil.

Hypotesetesting i ANOVA

  • Nullhypotese (H₀): Antagelsen om at det ikke er noen signifikante forskjeller mellom gruppenes middelverdier (alle grupper har samme gjennomsnitt).
  • Alternativ hypotese (H₁): Antagelsen om at minst én gruppes middelverdi er signifikant forskjellig fra de andre.

F-statistikk

ANOVA bruker en F-statistikk for å bestemme om variasjonen mellom gruppene er signifikant større enn variasjonen innenfor gruppene. F-statistikken er forholdet mellom variansen mellom gruppene og variansen innenfor gruppene:

F = Mellom-gruppe varians​ / Inner-gruppe varians

Hvis F-verdien er høy, er det større sannsynlighet for at forskjellene mellom gruppenes middelverdier er statistisk signifikante.

ANOVA i praksis

  1. Beregn F-verdien: Basert på dataene, beregnes F-verdien som sammenligner mellom-gruppe variansen med innen-gruppe variansen.

  2. Sammenlign med kritisk verdi: F-verdien sammenlignes med en kritisk F-verdi fra F-fordelingstabeller (basert på antall grupper og prøvestørrelse). Hvis den beregnede F-verdien er større enn den kritiske verdien, avvises nullhypotesen.

  3. Post-hoc tester: Hvis ANOVA viser at det er signifikante forskjeller mellom gruppene, utføres post-hoc tester (som Tukey’s HSD eller Bonferroni) for å finne ut nøyaktig hvilke grupper som er forskjellige.

Eksempel

Hvis en forsker ønsker å undersøke om tre forskjellige treningsprogrammer har ulike effekter på vekttap, kan de bruke enveis ANOVA til å sammenligne gjennomsnittlig vekttap mellom de tre gruppene som deltar i de forskjellige programmene. Hvis ANOVA-resultatene viser en signifikant F-verdi, kan forskeren konkludere med at det er forskjeller mellom minst én av gruppene, og de vil deretter utføre post-hoc tester for å finne ut hvilke grupper som er forskjellige.

Fordeler ved variansanalyse

De største fordelene med en variansanalyse er:

  • ANOVA kan analysere mer enn to grupper samtidig, i motsetning til t-tester som bare sammenligner to grupper.
  • Toveis ANOVA kan vurdere interaksjonseffekter mellom to faktorer.

Begrensninger ved variansanalyse

De største begrensningene med en variasjonsanalyse er:

  • ANOVA antar at dataene er normalfordelt og at gruppene har lik varians (homogen varians).
  • Det kan ikke identifisere hvilken gruppe som er forskjellig; post-hoc tester er nødvendig for dette.

Oppsummering

ANOVA er et kraftig verktøy for å analysere forskjeller mellom grupper, spesielt når det er mer enn to grupper, og det brukes mye i eksperimentell forskning, medisin, psykologi, og andre felt.

Du leser nå artikkelserien: Bivariat analyse

  Gå til neste / forrige artikkel i artikkelserien: << Logistisk regresjonsanalyse
    Andre artikler i serien er: 
  • Bivariat analyse – analyse av to variabler
  • Krysstabulering og marginalfordeling
  • Parallellplott og trend
  • Trender og trendforlengelse (kurvefremskrivning)
  • Gruppegjennomsnitt og mediandifferanse
  • Mann – Whitney observator
  • Sammenligning av to medianer (Mann-Whitney-metoden)
  • Parvise sammenligninger (Fortegntest og Wilcoxons tegnrangtest)
  • Kovarians
  • Korrelasjon
  • Priselastisitet
  • Krysspriselastisitet
  • Inntektselasitisitet
  • T-test (Students t-test)
  • Kjikvadrattest
  • Enkel lineær regresjon
  • Logistisk regresjonsanalyse
  • ANOVA – Analysis of Variance (variansanalyse)