Standard Avvik vs Betydning
I beskrivende og inferensiell statistikk brukes flere indekser til å beskrive et datasett som svarer til dets sentrale tendens, spredning og skråhet. I statistisk innledning er disse kjent som estimatorer siden de anslår populasjonsparameterverdiene.
Sentral tendens refererer til og lokaliserer sentrum av verdifordelingen. Middel, modus og median er de mest brukte indeksene i å beskrive den sentrale tendensen til et datasett. Dispersjon er mengden av spredning av data fra sentrum av distribusjonen. Omfang og standardavvik er de mest brukte målene for dispersjon. Pearsons skævhetskoeffisienter brukes til å beskrive skjevhet av en fordeling av data. Her refererer skjevhet til om datasettet er symmetrisk om midten eller ikke, og om ikke hvor skjev det er.
Hva er sant?
Gjennomsnitt er den mest brukte indeksen for sentral tendens. Gitt et datasett beregnes gjennomsnittet ved å ta summen av alle dataverdiene og deretter dele den med antall data. For eksempel blir vektene på 10 personer (i kilo) målt til å være 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Da kan gjennomsnittlig vekt på de ti personer (i kilo) være beregnet som følger. Summen av vekter er 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Gjennomsnitt = (sum) / (antall data) = 710/10 = 71 (i kilo).
Som i dette spesielle eksempelet, er gjennomsnittsverdien av et datasett kanskje ikke et datapunkt for settet, men vil være unikt for et gitt datasett. Mean vil ha de samme enhetene som de opprinnelige dataene. Derfor kan den merkes på samme akse som dataene og kan brukes i sammenligninger. Dessuten er det ingen tegnbegrensning for gjennomsnittet av et datasett. Det kan være negativt, null eller positivt, da summen av datasettet kan være negativt, null eller positivt.
Hva er standardavvik?
Standardavvik er den mest brukte indeksen for dispersjon. For å beregne standardavviket beregnes først avvikene av dataverdier fra gjennomsnittet. Rotenfeltet betyr avvigelser kalles standardavviket.
I det foregående eksempel er de respektive avvikene fra middelene (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 og (79-71) = 8. Summen av kvadrater av avvik er (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. Standardavviket er √ (366/10) = 6,05 (i kilo). Herfra kan det konkluderes med at flertallet av dataene ligger i intervallet 71 ± 6,05, forutsatt at datasettet ikke er svært skjevt, og det er faktisk slik i dette spesielle eksempelet.
Siden standardavviket har de samme enhetene som de opprinnelige dataene, gir det oss et mål på hvor mye avviket dataene er fra sentrum; større standardavviket øker dispersjonen. Standardavviket vil også være en nonnegative verdi uavhengig av datatype i datasettet.
Hva er forskjellen mellom standardavvik og gjennomsnitt? • Standardavvik er et mål for spredning fra midten, mens gjennomsnittet måler plasseringen av sentrum av et datasett. • Standardavvik er alltid en ikke-negativ verdi, men gjennomsnittlig kan ta noen reell verdi.
|