Lesetid (240 ord/min): 6 minutter
Hva er en faktoranalyse?
Faktoranalyse er ikke en selvstendig analysemetode, men en samlebetegnelse for ulike multivariate analyser som går ut på å analysere avhengighetsforholdet mellom et stort antall variabler, for deretter å forklare deres felles underliggende dimensjoner (faktorer).
Metoden brukes for å identifisere underliggende strukturer eller faktorer i et stort datasett, gjennom å redusere antall variabler ved å gruppere de som er sterkt korrelert med hverandre, slik at de kan representeres ved færre, underliggende faktorer. Ut i fra f.eks. 50 indikatorer som tar sikte på å forklare en fler-dimensjonal variabel, kan vi gjennom en faktoranalyse redusere dem til noen få. F.eks. til 5 – 6 faktorer. Dette hjelper forskere med å forstå hvilke dimensjoner eller latente variabler som forklarer sammenhengene mellom de observerte variablene.
Faktoranalysen som en matematisk prosedyre søker å forklare mønsteret av samvariasjon mellom observasjoner med utgangspunkt i et minimalt antall grunnleggende dimensjoner. Derfor er faktoranalysen et egnet verktøy for redusere kompleksitet, samt et redskap for å avdekke mulige meningsfulle (tolkbare) og forenklede mønstre i data. Gjennom faktoranalysen forsøker vi å identifisere de grunnleggende dimensjonene eller latente forhold fra klynger (“clusters”) av atferdsformer som er høyt korrelert med hverandre.
Hovedtyper av faktoranalyse
Vi skiller mellom to undergrener av faktoranalysen:
- Eksplorerende faktoranalyse
- Bekreftende faktoranalyse
Eksplorerende faktoranalyse (EFA)
Gjennomføres med data som utgangspunkt, ofte uten bestemt teori, og kan ses som en metode man kan bruke for å forenkle data. Brukes når forskeren ikke har en forhåndsbestemt hypotese om strukturen blant variablene. EFA utforsker datasettet for å identifisere mulige faktorer.
Eksempel: En psykolog ønsker å forstå de underliggende dimensjonene av en personlighetstest med 50 spørsmål. EFA kan brukes til å avdekke om spørsmålene grupperer seg rundt noen få brede personlighetstrekk, som f.eks. ekstroversjon eller nevrotisisme.
Bekreftende faktoranalyse (CFA)
Gjennomføres med teori eller bestemte forventninger som utgangspunkt, og undersøker om en bestemt struktur i data foreligger. Den svenske statistikeren K. G. Jöreskog har gitt viktige bidrag til denne metoden. Brukes når forskeren har en forhåndsbestemt hypotese eller modell som beskriver hvordan variablene skal grupperes. CFA tester om dataene passer til denne modellen.
Eksempel: I en studie basert på tidligere forskning, tester en forsker om spørsmålene i en spørreundersøkelse om jobbtilfredshet grupperer seg i de forventede faktorene: “arbeidsmiljø”, “ledelse”, og “personlig utvikling”.
Faktoranalysens logikk bygger på en ambisjon om å kartlegge latente forhold ved et fenomen og er i den forstand tilpasset vitenskapelig “realisme“. Tankegangen er at en observert struktur av fremtredelser eller korrelasjoner er generert av en serie underliggende størrelser bygget opp av mekanismer, som potensielt genererer en følge av hendelser (“events”). Både den eksplorerende og konfirmerende faktoranalysen er knyttet til logikken om at enkeltfaktorer eller dimensjoner tilpasses bestemte sammensetninger (konstellasjoner) av variabler
Viktige begreper
Noen viktige begreper i forbindelse med en faktoranalyse er:
Korrelasjonsmatrisen
Korrelasjonsmatrisen er en visualisering av variablenes innbyrdes korrelasjon i et systematisk organisert diagram. Disse variablenes korrelasjon er faktoranalysens utgangspunkt.
Faktorskårene er de enhetsbaserte estimerte verdiene som knyttes til en faktor. Faktorladningene er korrelasjoner mellom variabler og faktorskårer. Disse verdiene er utgangspunkt for tolkning av faktorene, hvor de høyeste korrelasjonene er retningsgivende for tolkningen.
Egenverdi
En egenverdi er den andelen av variablenes totale varians som forklares av en faktor. Enhver variabel har varians lik én og således et standardavvik av samme størrelse. Egenverdien dividert med antall variabler gir andel forklart varians. Vanligvis genereres faktorløsninger for egenverdier større enn én, noe som medfører at faktorer som forklarer mindre enn variansen på en variabel inngår ikke i faktorløsningen. Dette kan tolkes som en eliminasjonsmetode for å “rense” data for unødige overlappende faktorer, slik at kun de særpregede variabel-kjennetegnene inngår i faktorløsningen.
Kommunalitet
Kommunalitet vil si den andelen av en bestemt variabels varians som forklares av en faktorløsning. Albuekurve er et plott av egenverdier som utgjør et hjelpemiddel til å avgrense eller flate ut faktorløsningen.
Ortogonal og oblikk rotasjon
I faktoranalysen skiller man mellom ortogonal og oblikk rotasjon. Ved ortogonal rotasjon er faktorene ikke korrelert med hverandre, mens faktorene er korrelert ved oblikk rotasjon.
Denne teknikken kan visualiseres grafisk og virker som et hjelpemiddel til å forenkle, altså styrke fortolkningspotensialet og forklaringskraften. Faktoranalysen verdi som empirisk hjelpemiddel hviler på dens evne til å kunne generere meningsfulle utfall og videre presentere en overbevisende fortolkning. Slik sett risikerer man at faktoranalysen ikke er noe mer enn en ren matematisk-statistisk øvelse.
Trinn i faktoranalyse
Datainnsamling:
- Før faktoranalyse kan utføres, må dataene samles inn, ofte gjennom spørreskjemaer, tester, eller andre måleinstrumenter som inneholder mange variabler.
Vurdering av egnethet for faktoranalyse:
- KMO-test (Kaiser-Meyer-Olkin): Måler hvor egnet dataene er for faktoranalyse ved å vurdere om de observerte variablene kan grupperes sammen. En KMO-verdi over 0,6 anses som akseptabel.
- Bartletts test for sfærisitet: Tester om korrelasjonsmatrisen er enhetsmatrisen (dvs. om det ikke er korrelasjoner mellom variablene). En signifikant Bartletts test indikerer at faktoranalyse kan være passende.
Ekstraksjon av faktorer:
- Faktorer trekkes ut fra korrelasjonsmatrisen. Det finnes flere metoder for faktorekstaksjon:
- Hovedkomponentanalyse (PCA): Ofte brukt for å redusere dataenes dimensjonalitet.
- Maksimum likelihood: Brukes når man antar at dataene følger en normalfordeling og ønsker å gjøre statistiske inferenser om faktorene.
- Principal Axis Factoring (PAF): Brukes når man ønsker å fokusere på de underliggende strukturene i dataene.
- Faktorer trekkes ut fra korrelasjonsmatrisen. Det finnes flere metoder for faktorekstaksjon:
Bestemmelse av antall faktorer:
- Egenverdier (Eigenvalues): Faktorer med egenverdier over 1 anses ofte som viktige og beholdes i analysen.
- Scree plot: En grafisk metode der man plotter egenverdiene mot faktorene. Knekkpunktet der kurven begynner å flate ut indikerer antall faktorer som bør beholdes.
- Forklart varians: Man ønsker vanligvis å beholde faktorer som samlet forklarer en betydelig del av variansen i datasettet (ofte minst 60-70 %).
Rotasjon av faktorer:
- Etter ekstraksjonen roteres faktorene for å gjøre dem mer tolkbare. Rotasjon kan være:
- Ortogonal rotasjon (f.eks. varimax): Holder faktorene ukorrelerte.
- Oblik rotasjon (f.eks. oblimin): Tillater faktorene å være korrelerte.
- Eksempel: Etter rotasjon kan det være lettere å se hvilke spørsmål som hører sammen med hvilke faktorer i en spørreundersøkelse.
- Etter ekstraksjonen roteres faktorene for å gjøre dem mer tolkbare. Rotasjon kan være:
Tolkning av faktorer:
- Hver faktor tolkes basert på de variablene som har høy lading på denne faktoren. Variabler med høye ladinger på en faktor antas å representere et felles underliggende begrep.
- Eksempel: I en personlighetstest kan en faktor som inkluderer høye ladinger fra variabler som “sosial”, “utadvendt”, og “snakkesalig” tolkes som “ekstroversjon”.
Bruk av faktorverdier:
- Faktorverdier kan beregnes for hvert tilfelle i datasettet, noe som gir en poengsum for hver faktor. Disse verdiene kan brukes i videre analyser, som regresjonsanalyser eller klyngeanalyser.
Eksempel på bruk av faktoranalyse
Tenk deg at du forsker på kundetilfredshet og har samlet inn data ved hjelp av en spørreundersøkelse med 20 spørsmål. Spørsmålene dekker ulike aspekter av kundetilfredshet, som produktkvalitet, kundeservice, pris, og merkevarelojalitet. Men i stedet for å analysere alle 20 spørsmålene separat, kan du bruke faktoranalyse for å redusere antallet til noen få underliggende faktorer:
- Faktor 1: Produktkvalitet (kombinerer spørsmål om holdbarhet, funksjonalitet og estetikk).
- Faktor 2: Kundeservice (inkluderer spørsmål om responstid, profesjonalitet og løsningsorientering).
- Faktor 3: Prisfølsomhet (inkluderer spørsmål om pris, verdi for pengene, og betalingsvilje).
Disse faktorene gir en mer oversiktlig måte å forstå de viktigste dimensjonene som påvirker kundetilfredshet.
Fordeler med faktoranalyse
De viktigste fordelene med en faktoranalyse er:
- Reduksjon av Datakompleksitet: Faktoranalyse reduserer antall variabler, noe som gjør dataene enklere å analysere og tolke.
- Identifisering av Latente Variabler: Hjelper med å avdekke underliggende faktorer som ikke er direkte observerbare, men som påvirker de observerte variablene.
- Bedre Modellering: Ved å bruke faktorene i stedet for de opprinnelige variablene kan man forbedre modellens presisjon og redusere risikoen for multikollinearitet i regresjonsanalyser.
Begrensninger med en faktoranalyse
De største begrensningene med en faktoranalyse er:
- Subjektivitet i Tolkning: Valget av antall faktorer og tolkningen av dem kan være subjektiv og variere mellom forskere.
- Forutsetninger: Faktoranalyse krever at dataene er normalfordelte og lineært relaterte, og er følsom for multikollinearitet.
- Krav til Store Utvalg: For å få pålitelige resultater, krever faktoranalyse vanligvis store utvalg.
Oppsummering
Faktoranalyse er i utgangspunktet en matematisk tung og regnemessig krevende metode. Den voldsomme økningen av datamaskiners hastighet og tilgjengelighet, samt utviklingen av et utall brukervennlige statistiske programpakker har ført til at metoden i langt større grad enn før er tilgjengelig for forskere.
Faktoranalyse er et kraftig verktøy for å utforske og modellere komplekse datasett, og er spesielt nyttig i forskning hvor det er mange korrelerte variabler. Det brukes mye i psykologi, markedsføring, sosiologi, og andre felt hvor forskere ønsker å avdekke underliggende strukturer eller dimensjoner i dataene.
Kilde:
- Wikipedia, “Faktoranalyse”. Hentet 02.03.2018: https://no.wikipedia.org/wiki/Faktoranalyse
- Store Norske Leksikon, “Faktoranalyse”. Hentet 03.03.2018: https://snl.no/faktoranalyse
- ChatGPT, “Faktoranalyse”. Hentet 09.09.2024: https://chatgpt.com/