Korrelasjon vs Covariance
Korrelasjon og kovarians er nært beslektede begreper i teoretisk statistikk. De er viktige for å bestemme forholdet mellom to tilfeldige variabler.
Hva er korrelasjon?
Korrelasjon er et mål på styrken av forholdet mellom to variabler. Korrelasjonskoeffisienten kvantifiserer graden av endring av en variabel basert på endringen av den andre variabelen. I statistikk er korrelasjon knyttet til begrepet avhengighet, som er det statistiske forholdet mellom to variabler
Pearsons korrelasjonskoeffisient eller bare korrelasjonskoeffisienten r er en verdi mellom -1 og 1 (-1≤r≤ + 1). Det er den mest brukte korrelasjonskoeffisienten og gjelder bare for et lineært forhold mellom variablene. Hvis r = 0 er det ikke noe forhold, og hvis r≥0 er forholdet direkte proporsjonalt; verdien av en variabel øker med økningen av den andre. Hvis r≤0 er forholdet omvendt proporsjonalt; en variabel reduseres etter hvert som den andre øker.
På grunn av linearitetsbetingelsen kan korrelasjonskoeffisienten r også brukes til å etablere tilstedeværelsen av et lineært forhold mellom variablene.
Hva er Covariance?
I statistisk teori er kovarians et mål på hvor mye to tilfeldige variabler endres sammen. Kovarians er med andre ord et mål på styrken av korrelasjonen mellom to tilfeldige variabler.
I et annet perspektiv kan det ses at korrelasjon bare er den normaliserte versjonen av kovarians, hvor kovariansen er delt av produktet av standardavvikene til de to tilfeldige variablene. Utvalget av kovarians kan være stort; derfor er det ikke lett å sammenligne. Denne vanskeligheten blir overvunnet ved å bringe kovariansverdiene til et område hvor det kan sammenlignes ved å normalisere det (som det som z-score gjør). Selv om kovariansen og variansen er koblet til hverandre på ovennevnte måte, er deres sannsynlighetsfordelinger ikke festet til hverandre på en enkel måte og må behandles hver for seg.
Hva er forskjellen mellom Korrelasjon og Covariance?
• Både korrelasjon og kovarians er forholdsforhold mellom to tilfeldige variabler. Korrelasjon er mål for styrke av lineariteten av de to variablene og kovarians er et mål på styrken av korrelasjonen.
• Korrelasjonskoeffisientverdier er en verdi mellom -1 og +1, mens kovariansområdet ikke er konstant, men kan enten være positivt eller negativt. Men hvis de tilfeldige variablene er standardiserte før kovariansen beregnes, er kovariansen lik korrelasjonen og har en verdi mellom -1 og +1.