Flytt ditt nettsted til våre Lightspeed webhotell, med cPanel, og
få 3-6 ganger raskere nettsider enn i dag. Pris: fra kr. 119/pr. år.

Beskyttet innhold!

For å lese denne og våre øvrige sider må du tegne et årsabonnement og være logget inn.

Som abonnent/medlem får du tilgang til alt innholdet på sidene våre, og skulle sidene våre ikke leve opp til forventningene dine har vi en "Pengene tilbake garanti" du kan benytte.

Tegn abonnement!

    Denne artikkelen er del 6 av 7 artikler om Univariat analyse

Standardavvik er:

et mål på verdiens avvik fra gjennomsnittet.

Standardavviket viser hvor mye en serie med verdier avviker fra seriens gjennomsnitt.

Standardavviket sier med andre ord noe om hvor stor spredning (variasjon) det er i datamaterialet (utvalget) eller verdiene i et datasett eller av verdien av en stokastisk variabel. 

Standardavviket gir verdienes gjennomsnittlige avstand fra gjennomsnittet. Den er definert som kvadratroten av variansen.

En av grunnene til at standardavviket er en viktig parameter, er Tsjebysjevs ulikhet som sier at de fleste verdiene i et datasett av tilfeldige variabler vil ligge i nærheten av gjennomsnittet, hvor «i nærheten» er definert ved hjelp av standardavviket. Standardavviket ligger på det punktet hvor kurven i normalfordelingen endrer retning.

Før man bruker standardavvik bør man bruke et histogram eller en frekvenstabell for å undersøke om datasettet er normalfordelt da mange statistiske metoder ikke kan stoles på om datasettet har skjevhet eller ekstremverdier.


Formler

Med en gitt en populasjon x1, …, xN av reelle tall, er gjennomsnittet gitt ved

{\displaystyle {\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i},}

og standardavviket definert som

{\displaystyle \sigma ={\sqrt {{\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}}}

Standardavviket til en stokastisk variabel X er definert som

{\displaystyle \sigma ={\sqrt {\operatorname {E} ((X-\operatorname {E} (X))^{2})}}={\sqrt {\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}}}}

hvor E(X) er forventningsverdien til X.

Hvis man har stikkprøver x1,…,xn fra en større populasjon, defineres det empiriske standardavviket som

{\displaystyle s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}{n-1}}}.}

Det finnes flere måter å beregne standardavviket i utvalget/stikkprøven.

Eksempel:

La oss ta utgangspunkt i følgende verdier i en stikkprøve:

4,5     2,3     6,6     4,9      og     2,7 m.

Dette gir et gjennomsnitt på: (4,5+2,3+6,6+4,9+2,7)/5 = 4,2 m

En fremgangsmåte er å beregne seriens gjennomsnittlig absoluttavvik. Dette gjøres ved å først beregne avviket til de enkelte observasjonene. Avviket for observasjon nr. 1 er 4,5 – 4,2 = 0,3, mens avviket til observasjon nr. 2 er 2,3 – 4,2 = 1,9) Ved å summere alle disse avvikene, uten å ta hensyn til fortegn, finner vi summen av avvikene. Deretter kan vi bruke følgende formel for å beregne det gjennomsnittlige absoluttavviket:

For våre data vil dette avviket være:

(0,3 + 1,9 + 2,4 + 0,7 + 1,5) /5 = 1,36 m

Dette er et fullt bruktbart mål for variabilitet i utvalget.

Mange velger imidlertid å bruke et mer indirekte mål for å beregne avviket. En metode som viser seg å ha store fordeler i en del sammenhenger er å beregne gjennomsnittlig kvadratavvik. Gjennomsnittlig kvadratavvik beregnes ved å gjøre om hvert enkelt absolutt avvik (0,3, 1,9…. osv) til kvadratverdier (0, *0,3 =0,09, 1,9*1,9 = 3,61…osv). Ved å summere disse avvikene finner vi gjennomsnittlig kvadratavvik.

Et annet mål for avvik i utvalget er verdienes varians. Variansen gir et uttrykk for mengden av variasjon mellom observasjonene, og beregnes ved å sette inn det gjennomsnittlige kvadratavviket i formelen under. Denne formelen er den samme som vi brukte for å beregne gjennomsnittlig absolutt avvik. Forskjellen er at vi har byttet ut summen av avvikene med gjennomsnittlig kvadratavvik. Dvs. summen av elle kvadratavvikene.

Utvalgsvarians

Stikkprøvens varians kan beregnes slik:

Populasjonsvarians

Populasjonsvariansen kan også regnes ut etter følgende formel:

Hadde verdiene vært kroner i stedet for meter ville vi fått betegnelser som kvadratkroner o.l. For å få et mål for variabilitet som gir et mer direkte uttrykk for hvor store avvikene er, har man innført standardavviket som er kvadratroten av variansen (F. Wenstrøp – 94).

En enklere måte å beregne standardavviket til populasjonen er å benytte følgende formel:

Standardavviket for utvalget/stikkprøven beregnes slik:

Standardavviket for utvalget

I eksemplet over blir standardavviket for kurs 1 = 14,18, mens det blir -3 for kurs 2.. Standardavviket viser at oppslutningen fra gang til gang har vært jevnere på kurs 2 og -3 enn på kurs 1. Men verken standardavviket eller det aritmetiske gjennomsnittet viser at oppslutningen til kurs 1 hele tiden har vært fallende. Vi ser altså at et mål på sentraltendens, f.eks. gjennomsnittlig oppmøte på kurs 1 ikke forteller hele sannheten (Halvorsen – 93).

Kilder:

  • F. Wenstrøp, 1994 – Statistikk og Dataanalyse
  • K. Halvorsen, 1993 – Å forske på samfunnet
  • https://no.wikipedia.org/wiki/Standardavvik
Du leser nå artikkelserien: Univariat analyse

  Gå til neste / forrige artikkel i artikkelserien: << Prosentil og kvartilSkjevhet og normalfordeling >>
    Andre artikler i serien er: 
  • Univariat analyse og deskriptiv statistikk
  • Fordelingsanalyse og frekvensfordeling
  • Utvalget/stikkprøvens midtpunkt (Median, gjennomsnitt og modus)
  • Variasjonsbredde i utvalget (stikkprøven)
  • Prosentil og kvartil
  • Standardavvik og varians
  • Skjevhet og normalfordeling