Regresjon vs korrelasjon
I statistikk er det viktig å bestemme forholdet mellom to tilfeldige variabler. Det gir muligheten til å gjøre spådommer om en variabel i forhold til andre. Regresjonsanalyse og korrelasjon brukes i værmeldinger, økonomisk markedsadferd, etablering av fysiske forhold ved eksperimenter og i mye mer virkelige verdensscenarier.
Hva er regresjon?
Regresjon er en statistisk metode som brukes til å tegne forholdet mellom to variabler. Ofte når data samles inn, kan det være variabler som er avhengige av andre. Det nøyaktige forholdet mellom disse variablene kan kun etableres ved hjelp av regresjonsmetodene. Å bestemme dette forholdet bidrar til å forstå og forutsi atferden til en variabel til den andre.
Mest vanlig anvendelse av regresjonsanalysen er å estimere verdien av den avhengige variabelen for en gitt verdi eller verdiområde av de uavhengige variablene. Ved hjelp av regresjon kan vi for eksempel fastslå forholdet mellom råvarepris og forbruk, basert på data samlet fra et tilfeldig utvalg. Regresjonsanalyse gir regresjonsfunksjonen til et datasett, som er en matematisk modell som best passer til de tilgjengelige dataene. Dette kan lett bli representert ved en scatterplot. Grafisk regresjon er ekvivalent med å finne den beste passende kurven for det givne datasettet. Kurvens funksjon er regresjonsfunksjonen. Ved hjelp av matematisk modell kan etterspørselen av en vare forutsies for en gitt pris.
Derfor er regresjonsanalysen mye brukt i å forutse og prognose. Det brukes også til å etablere relasjoner i eksperimentelle data innen fysikk, kjemi og mange naturvitenskapelige og tekniske disipliner. Hvis forholdet eller regresjonsfunksjonen er en lineær funksjon, er prosessen kjent som en lineær regresjon. I spredningsdiagrammet kan den representeres som en rett linje. Hvis funksjonen ikke er en lineær kombinasjon av parametrene, er regresjonen ikke-lineær.
Hva er korrelasjon?
Korrelasjon er et mål for styrken av forholdet mellom to variabler. Korrelasjonskoeffisienten kvantifiserer graden av endring i en variabel basert på endringen i den andre variabelen. I statistikk er korrelasjon knyttet til begrepet avhengighet, som er det statistiske forholdet mellom to variabler.
Pearsons korrelasjonskoeffisient eller bare korrelasjonskoeffisienten r er en verdi mellom -1 og 1 (-1≤r≤ + 1). Det er den mest brukte korrelasjonskoeffisienten og gjelder bare for et lineært forhold mellom variablene. Hvis r = 0, eksisterer ikke noe forhold, og hvis r≥0 er forholdet direkte proporsjonalt; dvs. verdien av en variabel øker med økningen av den andre. Hvis r≤0 er forholdet omvendt proporsjonalt; det vil si en variabel reduseres etter hvert som den andre øker.
På grunn av linearitetsbetingelsen kan korrelasjonskoeffisienten r også brukes til å etablere tilstedeværelsen av et lineært forhold mellom variablene.
Hva er forskjellen mellom regresjon og korrelasjon?
Regresjon gir formen av forholdet mellom to tilfeldige variabler, og korrelasjonen gir graden av styrke i forholdet.
Regresjonsanalyse gir en regresjonsfunksjon, noe som bidrar til å ekstrapolere og forutsi resultater mens korrelasjon bare kan gi informasjon om hvilken retning den kan endre.
De mer nøyaktige lineære regresjonsmodellene er gitt ved analysen, dersom korrelasjonskoeffisienten er høyere. (| R | ≥0.8)