Innholdsfortegnelse
Hva er krysstabulering og marginalfordeling?
Krysstabulering og marginalfordeling er to viktige bivariate analyser i statistikk og dataanalyse som brukes til å undersøke og presentere forholdet mellom to eller flere kategoriske variabler. Disse teknikkene gir en strukturert måte å organisere data på, noe som gjør det enklere å identifisere mønstre, sammenhenger og forskjeller mellom variabler.
Krysstabulering
Kobler vi sammen to frekvensfordelinger får vi en ny tabell som vi kaller for en krysstabell, kontingenstabell eller krysstabulering. Dette er en metode for å presentere frekvensfordelingen av to eller flere kategoriske variabler. Krysstabellen viser hvordan dataene er fordelt på tvers av kombinasjoner av kategorier for variablene.
Kobling av to frekvensfordelinger = krysstabulering
Slik fungerer krysstabulering
- Radene i tabellen representerer kategoriene for én variabel.
- Kolonnene representerer kategoriene for en annen variabel.
- Hver celle i tabellen viser frekvensen (antall observasjoner) som faller inn i den kombinerte kategorien av rad- og kolonnevariabelen.
Eksempel på krysstabulering
La oss si at du har data om kjønn (mann/kvinne) og røykevaner (røyker/ikke-røyker) for en gruppe personer. En krysstabell kan se slik ut:
Kjønn \ Røykevaner | Røyker | Ikke-røyker | Totalt |
---|---|---|---|
Mann | 30 | 70 | 100 |
Kvinne | 20 | 80 | 100 |
Totalt | 50 | 150 | 200 |
- Rader: Representerer kjønn (Mann og Kvinne).
- Kolonner: Representerer røykevaner (Røyker og Ikke-røyker).
- Celler: Representerer antall personer som faller inn i hver kombinasjon av kjønn og røykevaner.