Forskjellen mellom middel, median og modus

Mean vs Median vs Mode
 

Gjennomsnitt, median og modus er den primære tiltak av sentral tendens brukes i beskrivende statistikk. De er helt forskjellige fra hverandre, og tilfeller der de brukes til å oppsummere dataene, er også forskjellige.

Mener

Det aritmetiske gjennomsnittet er summen av dataverdiene dividert med antall dataverdier, dvs..

 

Hvis dataene er fra et prøverom, kalles det et sample mean (), som er en beskrivende statistikk for prøven. Selv om det er det mest brukte beskrivende målet for en prøve, er det ikke en robust statistikk. Det er svært følsomt for utjevnene og svingningene.

For eksempel vurdere gjennomsnittlig inntekt for innbyggerne i en bestemt by. Siden alle dataværdiene summeres og deles, påvirker inntektene til en ekstremt velstående person betydelige betydelige. Derfor er gjennomsnittsverdiene ikke en god representasjon av dataene alltid.

I tilfelle av et vekslende signal varierer også strømmen som går gjennom et element periodisk fra positiv retning til negativ retning og omvendt. Hvis vi tar gjennomsnittsstrømmen som går gjennom elementet i en enkelt periode, vil det gi en 0, noe som betyr at ingen strøm har passert gjennom elementet, som åpenbart ikke er sant. Derfor, i dette tilfellet også, er aritmetisk middel ikke et godt mål.

Det aritmetiske gjennomsnittet er en god indikator når dataene er jevnt fordelt. For en normal fordeling er gjennomsnittet lik med modus og median. Den har også de laveste residualene når man vurderer rotenes gjennomsnittlige kvadratfeil; Derfor, det beste beskrivende tiltaket når det er nødvendig å representere et datasett med et enkelt nummer.

median

Verdiene av det midtre datapunktet etter å ha arrangert alle dataverdiene i stigende rekkefølge er definert som datasettets median. Median er 2. kvartil, 5. desil og 50. prosentil.

• Hvis antall observasjoner (datapunkter) er merkelig, er medianen observasjonen nøyaktig midt på den ordnede listen.

• Hvis antall observasjoner (datapunkter) er jevne, er medianen gjennomsnittet av de to midtobservasjonene i den ordnede listen.

Median deler observasjonen i to grupper; dvs. en gruppe (50%) verdier høyere og en gruppe (50%) verdier lavere enn medianen. Medianer brukes spesielt i skjevfordeling og representerer data ganske bedre enn det aritmetiske gjennomsnittet.

Modus

Modus er det mest forekommende tallet i et sett med observasjoner. Modus for et datasett beregnes ved å finne frekvensen til hvert element i settet.

• Hvis ingen verdi skjer mer enn en gang, har datasettet ingen modus.

• Ellers er enhver verdi som oppstår med den største frekvensen en modus for datasettet.

Mer enn 1 modus kan eksistere i et sett; Derfor er modus ikke en unik statistikk for et datasett. I en jevn fordeling er det en modus. Modellen til en diskret sannsynlighetsfordeling er det punktet hvor sannsynlighetsmassefunksjonen når sitt høyeste punkt. Gjenvinning fra ovennevnte tolkninger, kan vi si det globale maksima er moduser.

Vurder bruk av alle tre tiltakene til følgende datasett.

DATA: 1, 1, 2, 3, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15

Mean = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12

Median = 9 (13. element)

Modus = 9 (frekvens på 9 = 5)

Hva er forskjellen mellom middel, median og modus?

• Aritmetisk gjennomsnitt er summen av verdiene (observasjoner) dividert med antall observasjoner. Det er ikke en robust statistikk, og er sterkt avhengig av den normale fordelingskarakteren innenfor distribusjonen som vurderes. En enkelt outlier kan forårsake et betydelig skifte i gjennomsnittet som gir relativt misvisende verdier. Konseptet kan utvides til geometrisk gjennomsnittlig, harmonisk gjennomsnitt, vektet gjennomsnitt og så videre.

• Median er middelverdiene for settet av observasjoner, og det er relativt mindre påvirket av utjevnende. Det kan gi en god estimering som oppsummeringsstatistikken i svært skjeve tilfeller.

• Modus er de vanligste observasjonsverdiene i datasettet. Hvis fordelingen er positivt skjev, ligger modusen til medianen, og hvis den er negativt skjev, ligger modusen rett til medianen.

• Hvis det er skjevt, er gjennomsnittet riktig for medianen; hvis negativt skjev betyr er til venstre for medianen.

• I normalfordeling er alle tre, middel, modus og median like.