Korrelasjon og kovarians


   Domene + webhotell + epost = kr. 198/år
   Tast inn domene du ønsker å bestille webhotell til:
   http://www.


    Denne artikkelen er del 20 av 40 artikler om Dataanalyse
     Hvordan lese artiklene og -seriene?


Korrelasjon og kovarians er to statistisk mål vi kan beregne for å finne ut om det er en lineær samvariasjon mellom to variabler.

Kovarians og korrelasjon er styrkemål som indikerer hvordan to variabler henger sammen. Er det f.eks. en sammenheng mellom reklameinnsatsen og fortjenesten eller omsetningen ?

Kovarians

La oss si at vi har benyttet et statestikkprogram og kommet frem til at kovariansen mellom X – og Y – variablen er 453. Hva sier denne verdien (kovariansen) oss ? Ved fullstendig samvariasjon mellom X og Y variablene vil kovariansen være lik summen av variansen til X og Y variablen. Hvis X har en varians på 250, mens y har en varians på 203 vil dette gi en kovarians på 453 – altså en perfekt samvariasjon. Ved fullstendig uavhengighet vil kovariansen bli lik 0.

Perfekt avhengighet:    Kovarians = X-variabelens varians + Y-variabelens varians

Perfekt uavhengighet:  Kovarians = 0
Positiv samvariasjon:   Kovarians > 0
Negativ samvariasjon:  Kovarians < 0

Formelen for å regne ut kovariansen mellom to variabler i en stikkprøve er:

Korrelasjon

Metoden går ut på å beregne en korrelasjonskoeffisient mellom de to variablene som skal måles. Denne koeffisienten kan variere mellom -1.0 og +1.0. En høy korrelasjonskoeffisient mellom f.eks. alder og inntekt forteller oss at det er en sterk samvariasjon mellom variablene. Jo elder man blir, jo sikrere er det at man har en høy inntekt. Vi kan imidlertid ikke si noe om størrelsen på effekten av en økning i en av variabelen ved hjelp av korrelasjonskoeffisienten.

Korrelasjonskoeffisient = +1 – Perfekt linær samvariasjon
Korrelasjonskoeffisient = 0 – Ingen linær sammenheng
Korrelasjonskoeffisient = – 1 – Perfekt negativ samvariasjon

Korrelasjonskoeffisienten ( r ) beregnes slik:

Tegnforklaring:

n =antall observasjoner (utvalget/stikkprøvens størrelse)

=X – variablens verdi (den observerte verdien)

= X – variablens gjennomsnittsverdi

= Y – variablens verdi (den observerte verdien)

= Y – variablens gjennomsnittsverdi

= X – variablens absolutte avvik fra gjennomsnittet


Svakheten med å bruke korrelasjon er at metoden forutsetter at variablene er på intervall- eller forholdstallsnivå.

Klikk her hvis du ikke fant svaret på det du lurte på
Topp20
Siste 20
Nye serier
  Gå til neste/forrige artikkel i denne artikkelserien:  << Mann – Whitney observatorKrysspriselastisitet >>
    Andre artikler i serien er: 
  • Hva er en dataanalyse?
  • Arbeidsmodell for dataanalysen
  • Den analytiske vitenskaplige metode
  • Kategorisering, koding og indekseringsspråk
  • Inndelingskriverier for dataanalysen
  • Antall kategorier (dataanalyse)
  • Protokoll, ordningsobservatorer og notasjon
  • Beskrivelse av utvalget, med fordelingsanalyse og frekvensfordeling
  • Utvalget/stikkprøvens midtpunkt (Median, gjennomsnitt og modus)
  • Prosentil og kvartil
  • Variasjonsbredde i utvalget (stikkprøven)
  • Standardavvik og varians
  • Skjevhet og normalfordeling
  • Analyse av to variabler
  • Krysstabulering og marginalfordeling
  • Epsilon – et mål for samvariasjonens styrke og retning
  • Parallell plott og trend
  • Gruppegjennomsnitt og mediandifferanse
  • Mann – Whitney observator
  • Korrelasjon og kovarians
  • Krysspriselastisitet
  • Inntektselasitisitet
  • Generalisering og estimering av en stikkprøve
  • Konfidensintervall
  • Trangere konfidensintervall
  • Hypoteseprøving
  • Parvise sammenligninger
  • Sammenligning av to medianer (Mann-Whitney-metoden)
  • Sannsynlighet og sannsynlighetsregning
  • Sannsynlighet som relativ hyppighet i det lange løp (de store talls lov)
  • Kombinatorikk (statistikk)
  • Beregning av sannsynligheten av et snitt
  • Aksiomatisk definisjon av sannsynlighet
  • Betinget sannsynlighet
  • Multivariate analyser
  • Multivariate metoder
  • Multippel regresjon
  • Diskriminantanalyse
  • Clusteranalyse
  • Faktoranalyse
  • Andre artikler i samme kategori er:

    Krysstabulering og marginalfordeling
    Krysstabeller er sannsynligvis den analysemetoden som er best brukt innen markedsforskningen. Metoden stiller ikke krav til målenivå.
    Epsilon - et mål for samvariasjonens styrke og retning
    Epsilon sier noe om samvariasjonens styrke og fortegnet (+ eller -) som indikerer dens retning.
    Parallell plott og trend
    Hva er en parallell plott og en trend, og hva brukes de til? Og ikke minst; - Hvordan finne dem?
    Gruppegjennomsnitt og mediandifferanse
    Hva menes med gruppegjennomsnitt og mediandifferanse, og hvordan beregne dette gjennomsnittet eller denne medianen?
    Mann - Whitney observator
    Hva er og hvordan beregne Mann - Whitney observator (er)?
    Priselastisitet
    Hva er priselastisitet, hvordan beregne den og hva sier den meg?
    Krysspriselastisitet
    Hva er krysspriselastisitet, hva brukes den til, hva sier den og hvordan beregne den?
    Inntektselasitisitet
    Hva er inntektselasitisitet, hva sier den deg og hvordan beregne den?
    DEL
    Entrepenør og forretningsutvikler med mer enn 20 års erfaring og 14 selskaper bak seg. Utdannet Diplom økonom / markedsfører fra BI/NMH. Jobber som daglig leder i OnNet og er ansvarlig redaktør for IKTnytt.no og eStudie.no. I tillegg er han styremedlem i 4 andre selskaper. Les mer.