Hjem Dataanalyse Bivariat analyse Enkel lineær regresjon

Enkel lineær regresjon

11/08/2024

Innholdsfortegnelse

Hva er enkel lineær regresjon?

Enkel lineær regresjon brukes til å estimere sammenhengen mellom to kontinuerlige variabler. For eksempel bruker vi enkel lineær regresjon når vi ønsker å vite:

Hvor sterk sammenheng er mellom to variabler (f.eks. forholdet mellom IQ og lønnsinntekt).
Verdien av den avhengige variabelen (f.eks. lønnsinntekt) ved en viss verdi av den uavhengige variabelen (f.eks. IQ).

Enkel lineær regresjon er en statistisk metode som brukes til å modellere forholdet mellom to kontinuerlige variabler. Den ene variabelen betraktes som avhengig variabel (responsvariabel), og den andre som uavhengig variabel (forklaringsvariabel eller prediktor). I en enkel lineær regresjon beskriver vi forholdet mellom variabler ved å tilpasse en rett linje (Ya + bx) til de observerte dataene. Regresjonsmodellen gjør det mulig for oss å estimere hvordan en avhengig variabel endres når den eller de uavhengige variablene endres.

Målet med enkel lineær regresjon er å finne den beste rette linjen som beskriver forholdet mellom disse to variablene, slik at man kan bruke denne linjen til å forutsi verdier av den avhengige variabelen basert på den uavhengige variabelen.

Forutsetninger om enkel lineær regresjon

Enkel lineær regresjon er en parametrisk test, noe som betyr at den gjør visse antakelser om dataene. Disse forutsetningene er:

Varianshomogenitet (homoskedastisitet) : størrelsen på feilen i vår prediksjon endres ikke nevneverdig på tvers av verdiene til den uavhengige variabelen.
Uavhengighet av observasjoner : observasjonene i datasettet ble samlet inn ved hjelp av statistisk gyldige prøvetakingsmetoder, og det er ingen skjulte sammenhenger mellom observasjoner.
Normalitet : Dataene følger en normalfordeling.

Lineær regresjon inneholder en ekstra antagelse:

Lineær sammenheng: Forholdet mellom den uavhengige og avhengige variabelen er lineær : linjen som passer best gjennom datapunktene er en rett linje (i stedet for en kurve eller en slags grupperingsfaktor).

Hvis dataene dine ikke oppfyller forutsetningene om homoskedastisitet eller normalitet, kan du kanskje bruke en ikke-parametrisk test i stedet, for eksempel Spearman-rangtesten.

Grunnleggende konsepter

Avhengig Variabel (Y): Dette er variabelen vi ønsker å forutsi eller forklare. Den avhenger av den uavhengige variabelen. F.eks. boligpris.
Uavhengig Variabel (X): Dette er variabelen som brukes til å gjøre forutsigelser. Den antas å påvirke eller forklare den avhengige variabelen. F.eks. boligens areal (kvadratmeter).
Regresjonslinje: Den lineære regresjonslinjen er den beste tilpassede linjen som minimerer summen av kvadrerte avvik mellom de faktiske verdiene og de predikerte verdiene fra modellen. Linjen har formelen:
Residualer (Feiltermer): Residualene er forskjellen mellom de faktiske verdiene og de predikerte verdiene. I en enkel lineær regresjon prøver vi å minimere summen av kvadrerte residualer (dvs. forskjellen mellom de faktiske og predikerte verdiene) for å finne den best passende linjen.

Hvordan utføre en enkel lineær regresjon?

You need to be logged in to view the rest of the content. Vennligst . Ikke medlem? Bli med oss

Infokapsel	Varighet	Beskrivelse
nsid	session	This cookie is set by the provider PayPal to enable the PayPal payment service in the website.
tsrce	3 days	PayPal sets this cookie to enable the PayPal payment service in the website.
x-pp-s	session	PayPal sets this cookie to process payments on the site.

Infokapsel	Varighet	Beskrivelse
d	3 months	Quantserve sets this cookie to anonymously track information on how visitors use the website.
l7_az	30 minutes	This cookie is necessary for the PayPal login-function on the website.
swpm_session	session	This cookie is set by the Simple WordPress Membership Plugin. This cookie is used for membership login session and to provide access to the protected content on the website.This cookie keeps the login records so user don't want to authorise each time while moving to next page.
_gat	1 minute	This cookie is installed by Google Universal Analytics to restrain request rate and thus limit the collection of data on high traffic sites.

Infokapsel	Varighet	Beskrivelse
_ga	2 years	The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gid	1 day	Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.
__gads	1 year 24 days	The __gads cookie, set by Google, is stored under DoubleClick domain and tracks the number of times users see an advert, measures the success of the campaign and calculates its revenue. This cookie can only be read from the domain they are set on and will not track any data while browsing through other sites.

Infokapsel	Varighet	Beskrivelse
anj	3 months	AppNexus sets the anj cookie that contains data stating whether a cookie ID is synced with partners.
c	20 years	This cookie is set by Rubicon Project to control synchronization of user identification and exchange of user data between various ad services.
CMID	1 year	Casale Media sets this cookie to collect information on user behavior, for targeted advertising.
CMPRO	3 months	CMPRO cookie is set by CasaleMedia for anonymous user tracking, and for targeted advertising.
CMPS	3 months	CMPS cookie is set by CasaleMedia for anonymous user tracking based on user's website visits, for displaying targeted ads.
IDE	1 year 24 days	Google DoubleClick IDE cookies are used to store information about how the user uses the website to present them with relevant ads and according to the user profile.
mc	1 year 1 month	Quantserve sets the mc cookie to anonymously track user behaviour on the website.
test_cookie	15 minutes	The test_cookie is set by doubleclick.net and is used to determine if the user's browser supports cookies.
uuid	3 months	MediaMath sets this cookie to avoid the same ads from being shown repeatedly and for relevant advertising.
uuid2	3 months	The uuid2 cookie is set by AppNexus and records information that helps in differentiating between devices and browsers. This information is used to pick out ads delivered by the platform and assess the ad performance and its attribute payment.

Infokapsel	Varighet	Beskrivelse
CMTS	3 months	No description
cocat1	session	No description
cscat1	session	No description
KHcl0EuY7AKSMgfvHl7J5E7hPtK	20 years	No description available.
LANG	9 hours	No description
sc_f	5 years	No description available.