Flytt ditt nettsted til våre Lightspeed webhotell, med cPanel, og
få 3-6 ganger raskere nettsider enn i dag. Pris: fra kr. 119/pr. år.

    Denne artikkelen er del 1 av 14 artikler om Bivariat analyse

    Denne artikkelen er del 9 av 17 artikler om Dataanalyse

Vi kommer ikke utover det beskrivende planet om man nøyer seg med å analysere hver variabel for seg i form av univariat analyser. Som regel ønsker vi å så i noe om relasjonen (samvariasjon) mellom to variabler og finne mulige årsakssammenhenger. Slike analyser kaller vi for bivariate analyser og betyr:

“Analyse av sammenhengen mellom to variabler, f.eks. mellom X og Y”

For å kunne analysere sammenhengen mellom to variabler må vi koble sammen to frekvensfordelinger ved å krysstabulere dem. Vi får da en helt ny tabell vi kan analysere videre for å finne ut hvordan variablene står i forhold til hverandre. Vi er her interessert i å finne samvariasjon.

Bivariatanalyse er en av de enkleste formene for kvantitativ (statistisk) analyse, og forteller oss noe om det empiriske forholdet mellom to variabler. Bivariatanalyse kan være nyttig for å teste enkle hypoteser om tilknytning, og de kan vise i hvilken grad vi kan  forutsi verdien til en variabel (f.eks. en avhengig variabel) hvis vi kjenner verdien til den andre variabelen (f.eks. en uavhengig variabel).

I likhet med univariat analyse, kan bivariate analyser være beskrivende eller inferensielle.

Måten vi analyserer samvariasjon på avhenger av variabelens målenivå. Ulike typer data medfører at det er ulike måter å beskrive sammenhengen på, og ulike tall for å oppsummere den, akkurat som for deskriptiv statistikk. Vi kan alltid behandle variabler med høyere målenivå med teknikker for lavere målenivå, men vi kan ikke gå motsatt vei. Binære variabler/dummyvariabler kan behandles på samtlige måter.

Når begge variablene er kategoriske

Vi kan lage krysstabeller hvor vi viser frekvensen (antall enheter) som har hver spesifikke verdikombinasjon. Eksempel: En tabell som viser hvor mange studenter med karkteren A på særemne som går lærerlinjen, hvor mange med karakteren B… osv. Med flere studieretninger vil vi få flere kolonner i tabellen vår.


Når en variabel er kategorisk og den andre er metrisk (eller blir behandlet som metrisk)

Her kan vi beregne gjennomsnitlig verdi for den metriske variabelen i hver kategori av den kategoriske variabelen. Eksempel: Gjennomsnitlig forventet lønn for studenter med karakteren A i særemne, gjennomsnitlig lønn for studenter med karakteren B… osv.

Når det er en avhengig variabel

Hvis den avhengige variabelen er en kategorisk variabel probit eller logit regresjon (eller multinomial probit eller multinomial logit) brukes. Dersom begge variablene er på ordinal nivå kan en rang korrelasjon koeffisient beregnes. Hvis bare den avhengige variabelen er ordinær, kan probit eller ordnet logit brukes. Hvis den avhengige variabelen er kontinuerlig – enten intervallnivå eller forholdsnivå, for eksempel en temperaturskala eller en inntektsskala – kan enkel regresjon brukes.

Hvis begge variablene er tidsserier, kan en bestemt type kausalitet, kjent som Granger-kausalitet, testes. Likledes kan vektorautoregresjon utføres for å undersøke intertemporale koblinger mellom variablene.

Når det ikke er en avhengig variabel

Når ingen variabler kan betraktes som avhengige av den andre, er ikke regresjon hensiktsmessig, men det kan være en eller annen form for korrelasjonsanalyse.

Grafiske metoder

Grafer som er passende for bivariate analyser, avhenger av typen variabel. For to kontinuerlige variabler er en scatterplot en vanlig graf. Når en variabel er kategorisk og den andre kontinuerlig, er en boksplott vanlig, og når begge er kategoriske, er en mosaikkplott vanlig. Disse grafene er en del av beskrivende statistikk .

Vi skal her se litt på de analysemetodene som her kan være aktuelle.

Kilder:

  • Earl R. Babbie, The Practice of Social Research, 12. utgave, Wadsworth Publishing, 2009
Du leser nå artikkelserien: Bivariat analyse

  Gå til neste / forrige artikkel i artikkelserien: Krysstabulering og marginalfordeling >>
    Andre artikler i serien er: 
  • Bivariat analyse – analyse av to variabler
  • Krysstabulering og marginalfordeling
  • Epsilon – et mål for samvariasjonens styrke og retning
  • Parallell plott og trend
  • Trender og trendforlengelse (kurvefremskrivning)
  • Gruppegjennomsnitt og mediandifferanse
  • Mann – Whitney observator
  • Sammenligning av to medianer (Mann-Whitney-metoden)
  • Parvise sammenligninger
  • Kovarians
  • Korrelasjon
  • Priselastisitet
  • Krysspriselastisitet
  • Inntektselasitisitet
  • Du leser nå artikkelserien: Dataanalyse

      Gå til neste / forrige artikkel i artikkelserien: << Univariat analyse og deskriptiv statistikkMultivariat analyse >>
        Andre artikler i serien er: 
  • Dataanalyse
  • Kvantitativ dataanalyse
  • Observasjonsprotokoll
  • Transkripsjon og transkribering
  • Kategorisering, koding og indekseringsspråk
  • Synkron og diakron analyse
  • Analyseteknikker for dataanalysen
  • Univariat analyse og deskriptiv statistikk
  • Bivariat analyse – analyse av to variabler
  • Multivariat analyse
  • Hypoteseprøving
  • Generalisering og estimering av en stikkprøve
  • Sannsynlighet og sannsynlighetsregning
  • Fenomenologisk hermeneutisk analyse
  • Den hermeneutiske spiral
  • Diskursanalyse
  • Narrativ metode og analyse