Innholdsfortegnelse
Hva er frekvensfordeling og fordelingsanalyse?
Frekvensfordeling og fordelingsanalyse er to nært beslektede konsepter i statistikk som begge brukes for å forstå og visualisere hvordan dataene i et datasett er fordelt. Selv om de overlapper på mange områder, har de hver sine spesifikke formål og metoder.
Frekvensfordeling
En frekvensfordeling viser hvor mange som har besvart de forskjellige svaralternativene i et spørsmål (den relative fordelingen).
Skal vi f.eks. lage en frekvensfordeling av forrige stortingsvalg, vil det være naturlig å sette opp en datamatrisen som inneholde alle partiene det er mulig å stemme på, sammen med en kolonne som viser hvor mange stemmer de fikk.
Frekvensfordelingen av et tidligere Stortingsvalg kan se slik ut:
Politisk parti | Antall stemmer |
Arbeiderpartiet Høyre Fremskrittspartiet Senterpartiet Sosialistisk venstreparti Kristlig folkeparti Rød Valgallianse Venstre Andre partier | 850. 000 390. 500 101. 000 98. 000 95. 000 75. 000 20. 000 20. 000 15. 000 |
Sum totalt (N) | 1. 664. 500 |
Komponenter i frekvensfordeling
Frekvens (f): Antallet ganger en bestemt verdi eller et intervall av verdier forekommer i datasettet.
Relativ frekvens: Prosentandelen av den totale mengden data som hver verdi eller hvert intervall representerer. Den beregnes slik: Relativ frekvens = Frekvens/Totalt antall observaskjoner.
Kumulativ frekvens: Summen av frekvensene for alle verdier eller intervaller som er mindre enn eller lik en bestemt verdi eller et intervall. Kumulativ frekvens viser hvordan frekvensen bygger seg opp over verdiene.
Klasser/intervaller: Når dataene har et stort antall forskjellige verdier, spesielt når de er kontinuerlige, kan de grupperes i klasser eller intervaller for å gjøre frekvensfordelingen mer oversiktlig.
Eksempel
Hvor fornøyd er du med produkt X ?
Svaralternativ | Antall | I % |
Svært fornøyd Nokså fornøyd Verken eller Nokså misfornøyd Svært misfornøyd n = | 20 50 100 20 10 200 | 10% 25% 50% 10 % 5 % 100 % |
En frekvensfordeling som er vist i eksemplet over kalles for en råtabell. Det er en god regel å oppgi verdiene i både absolutte tall og prosentandeler. Dette fordi prosenttall ofte er lettere å vurdere enn absolutte tall. Man skal dog være forsiktig med å bruke prosentandeler ved svært små absolutte verdier, idet man lett kan overvurdere holdbarheten av dataene (F.Selnes -94).
Det er en god regel å lage en råtabell for alle undersøkelsesvariablene i undersøkelsen. De råtabellene som er selve grunnlaget for den videre analysen bør i tillegg være tilgjengelig for leseren av forskningsrapporten, f.eks. i form av et vedlegg. Før en kjører ut en relativ fordeling, er det ofte vanlig at en kutter ut utelatesesverdier som “vet ikke”, “ubesvart”, “uaktuelt” osv.
Grovt sett kan vi si at vi utarbeider slike frekvensfordelinger av to årsaker: