Befolkning vs prøve Standardavvik
I statistikk brukes flere indekser til å beskrive et datasett som svarer til dens sentrale tendens, spredning og skråhet. Standardavvik er en av de mest vanlige måtene for spredning av data fra datasettets sentrum.
På grunn av praktiske vanskeligheter vil det ikke være mulig å benytte data fra hele befolkningen når en hypotese blir testet. Derfor bruker vi dataverdier fra prøver for å gi innflytelser om befolkningen. I en slik situasjon kalles disse estimatene siden de anslår populasjonsparameterverdiene.
Det er ekstremt viktig å bruke objektive estimatorer i inferansen. En estimator sies å være upartisk dersom forventet verdi av estimatoren er lik populasjonsparameteren. For eksempel bruker vi sample mean som en objektiv estimator for populasjonsmiddelet. (Matematisk kan det påvises at den forventede verdien av prøve gjennomsnittet er lik populasjonsmiddelet). Ved estimering av populasjonsstandardavviket er prøvestandardavviket også en objektiv estimator.
Hva er populasjonsstandardavvik?
Når data fra hele befolkningen kan tas i bruk (for eksempel i tilfelle en folketelling), er det mulig å beregne populasjonsstandardavviket. For å beregne standardavviket for befolkningen, beregnes først avvikene fra dataverdier fra populasjonsmiddelet. Rotenes middelfirkant (kvadratisk gjennomsnitt) av avvik kalles populasjonsstandardavviket.
I en klasse på 10 studenter kan data om studentene enkelt samles inn. Hvis en hypotese blir testet på denne populasjonen av studenter, er det ikke nødvendig å bruke prøveverdier. Vektene til de 10 elevene (i kilo) måles for eksempel til 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Da er gjennomsnittlig vekt på de ti personer (i kilo) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, som er 71 (i kilo). Dette er populasjonsmiddelet.
Nå for å beregne populasjonsstandardavviket, beregner vi avvik fra gjennomsnittet. De respektive avvikene fra gjennomsnittet er (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 og (79 - 71) = 8. Summen av kvadrater av avvik er -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Befolkningsstandardavviket er √ (366/10) = 6,05 (i kilo). 71 er den eksakte middelvekten til elevene i klassen og 6.05 er den nøyaktige standardavviket fra vekt fra 71.
Hva er prøve standardavvik?
Når data fra en prøve (av størrelse n) brukes til å estimere parametere av befolkningen, beregnes standardavviket for prøven. For det første beregnes avvikene fra dataværdier fra prøvens gjennomsnitt. Siden prøven er brukt i stedet for populasjonsmiddelet (som er ukjent), er det ikke hensiktsmessig å ta kvadratisk gjennomsnitt. For å kompensere for bruk av sample mean, er summen av kvadratene av avvik delt mellom (n-1) i stedet for n. Prøvestandardavviket er kvadratroten av dette. I matematiske symboler, S = √ Σ (xJeg-x)2 / (n-1), hvor S er prøve standardavviket, er ẍ prøven gjennomsnitt og xJegDet er datapunktene.
Anta nå at befolkningen i det foregående eksempel er elevene i hele skolen. Da blir klassen bare et eksempel. Hvis denne prøven blir brukt i estimeringen, vil prøveavviket være √ (366/9) = 6,38 (i kilo) siden 366 ble delt med 9 i stedet for 10 (prøvestørrelsen). Faktum å observere er at dette ikke er garantert å være den nøyaktige standardavviksverdien for befolkningen. Det er bare et estimat for det.
Hva er forskjellen mellom populasjonsstandardavvik og standardavvik fra prøven? • Befolkningsstandardavvik er den nøyaktige parameterverdien som brukes til å måle dispersjonen fra midten, mens prøvestandardavviket er en objektiv estimator for det. • Befolkningsstandardavvik beregnes når alle dataene om hver enkelt befolkning er kjent. Ellers beregnes standardavviket for prøven. • Befolkningsstandardavvik er gitt av σ = √ Σ (xi-μ)2/ n hvor μ er populasjonsmidlet og n er populasjonsstørrelsen, men prøven standardavvik er gitt av S = √ Σ (xi-ẍ)2 / (n-1) hvor ẍ er prøven, og n er prøvestørrelsen.
|