Varians vs Covariance
Varians og kovarians er to målinger som brukes i statistikk. Variansen er et mål for spredning av dataene, og kovarians indikerer graden av endring av to tilfeldige variabler sammen. Variansen er ganske et intuitivt konsept, men kovarians er definert matematisk i det ikke intuitivt først.
Mer om variasjon
Variansen er et mål for spredning av dataene fra middelverdien av fordelingen. Det forteller hvor langt datapunktene ligger fra gjennomsnittet av distribusjonen. Det er en av de primære beskrivelsene av sannsynlighetsfordelingen og en av øyeblikkene i distribusjonen. Også variansen er en parameter av befolkningen, og variansen av en prøve fra befolkningen fungerer som en estimator for variansen av befolkningen. Fra et perspektiv er det definert som kvadratet av standardavviket.
I vanlig språk kan det beskrives som gjennomsnittet av rutene i avstanden mellom hvert datapunkt og gjennomsnittet av fordelingen. Følgende formel brukes til å beregne variansen.
Var (X) = E [(X-μ)2 ] for en befolkning, og
Var (X) = E [(X-~x)2 ] for en prøve
Det kan videre forenkles for å gi Var (X) = E [X2 ] - (E [X])2.
Variansen har noen signaturegenskaper, og brukes ofte i statistikk for å gjøre bruken enklere. Variansen er ikke-negativ fordi det er kvadratet av avstandene. Imidlertid er variansen ikke begrenset og avhenger av den bestemte fordeling. Variansen av en konstant tilfeldig variabel er null, og variansen endres ikke med hensyn til en lokaliseringsparameter.
Mer om Covariance
I statistisk teori er kovarians et mål på hvor mye to tilfeldige variabler endres sammen. Kovarians er med andre ord et mål på styrken av korrelasjonen mellom to tilfeldige variabler. Det kan også betraktes som en generalisering av begrepet varians av to tilfeldige variabler.
Covariance av to tilfeldige variabler X og Y, som er fellesfordelt med endelig andre momentum, kalles σXY= E [(X-E [X]), (Y-E [y])]. Fra dette kan variansen ses som et spesielt tilfelle av kovarians, hvor to variabler er de samme. Cov (X, X) = Var (X)
Ved normalisering av kovariansen kan den lineære korrelasjonskoeffisienten eller Pearson korrelasjonskoeffisient oppnås, som er definert som p = E [(X-E [X]) (Y-E [Y])] / (σX σY ) = (Cov (X, Y)) / (σX σY)
Grafisk kan kovarians mellom et par datapunkter ses som rektangelområdet med datapunktene i motsatt hjørner. Det kan tolkes som et mål på størrelsen på separasjonen mellom de to datapunktene. Med tanke på rektanglene for hele befolkningen, kan overlappingen av rektanglene som svarer til alle datapunktene betraktes som separasjonsstyrken. varians av de to variablene. Covarians er i to dimensjoner, på grunn av to variabler, men forenkling av den til en variabel gir variansen av en enkelt som separasjonen i en dimensjon.
Hva er forskjellen mellom Varians og Covariance?
• Variasjon er måling av spredning / spredning i en befolkning mens kovarians anses som et mål for variasjon av to tilfeldige variabler eller styrken av korrelasjonen.
• Variasjon kan betraktes som et spesielt tilfelle av kovarians.
• Variasjon og kovarians er avhengig av størrelsen på dataverdiene, og kan ikke sammenlignes; derfor er de normalisert. Covariance normaliseres i korrelasjonskoeffisienten (dividere ved produktet av standardavvikene til de to tilfeldige variablene) og variansen normaliseres i standardavviket (ved å ta kvadratroten)