Sosialforskere konstruerer ofte en hypotese, der de antar at en bestemt generalisert regel kan brukes til en befolkning. De tester denne hypotesen ved å bruke tester som kan være enten parametriske eller nonparametriske. Parametriske tester er vanligvis vanligere og studeres mye tidligere som standardtester som brukes ved utførelse av forskning.
Prosessen med å utføre en forskning er relativt enkel - du bygger en hypotese og antar at en viss "lov" kan brukes på en befolkning. Du utfører deretter en test og samler data som du deretter analyserer statistisk. De innsamlede dataene kan vanligvis være representert som en graf, og den hypotese loven som gjennomsnittsverdien av dataene. Hvis den hypotese loven og middelverdienes lov samsvarer, er hypotesen bekreftet.
I noen tilfeller er det imidlertid ikke den mest hensiktsmessige måten å søke etter loven å finne middelverdien. Et godt eksempel er fordelingen av totalinntekt. Hvis du ikke har samsvarer med gjennomsnittsverdien, er det sannsynligvis fordi en eller to milliardærer forstyrrer dine gjennomsnittsverdier. Imidlertid vil en median gi et mye mer nøyaktig resultat på gjennomsnittlig inntekt som er mer sannsynlig å matche dataene dine.
Med andre ord, en parametrisk test vil bli brukt når antagelsene om befolkningen er klare, og det er mye tilgjengelig informasjon om det. Spørsmålene skal utformes for å måle disse spesifikke parametrene, slik at dataene kan deretter analyseres som beskrevet ovenfor. En nonparametrisk test brukes når den testede populasjonen ikke er helt kjent, og derfor er de undersøkte parametrene ukjente også. I tillegg, mens den parametriske testen bruker middelverdier som sine resultater, tar den nonparametriske testen medianen, og brukes derfor vanligvis når den opprinnelige hypotesen ikke passer til dataene.
En parametrisk test er en test designet for å gi dataene som vil bli analysert gjennom en gren av vitenskap kalt parametrisk statistikk. Parametrisk statistikk antar litt informasjon om at befolkningen allerede er kjent, nemlig sannsynlighetsfordelingen. For eksempel er fordelingen av kroppshøyde på hele verden beskrevet av en normal distribusjonsmodell. I likhet med det kan enhver kjent distribusjonsmodell påføres et sett med data. Imidlertid, forutsatt at en bestemt distribusjonsmodell passer til et datasett, betyr det at du i utgangspunktet antar at det er noe mer kjent med befolkningen, som jeg har nevnt. Sannsynlighetsfordelingen inneholder forskjellige parametere som beskriver den eksakte formen av fordelingen. Disse parameterne er hva parametriske tester gir - hvert spørsmål er skreddersydd for å gi en nøyaktig verdi av en bestemt parameter for hvert intervjuet individ. Kombinert blir gjennomsnittsverdien av parameteren brukt for sannsynlighetsfordelingen. Det betyr at de parametriske testene også tar på seg noe om befolkningen. Hvis forutsetningene er riktige, vil parametrisk statistikk brukt på data som er gitt av en parametrisk test gi resultater som er mye mer nøyaktige og presise enn for en nonparametrisk test og statistikk.
På samme måte som parametrisk test og statistikk, finnes en nonparametrisk test og statistikk. De brukes når de oppnådde dataene ikke forventes å passe til en normal distribusjonskurve eller ordinære data. Et godt eksempel på ordinære data er anmeldelsen du gir når du vurderer et bestemt produkt eller en tjeneste på en skala fra 1 til 5. Ordinære data generelt er hentet fra tester som bruker forskjellige rangeringer eller ordrer. Derfor er det ikke avhengig av tall eller eksakte verdier for parametrene som parametriske tester anførte. Faktisk bruker det ikke parametere på noen måte, fordi det ikke utgjør en viss distribusjon. Vanligvis foretrekkes en parametrisk analyse for en ikke-parametrisk, men hvis den parametriske testen ikke kan utføres på grunn av ukjent befolkning, er det nødvendig å benytte seg av ikke-parametriske tester..
Som jeg har nevnt, gjør parametriske test antagelser om befolkningen. Det trenger parametrene som er knyttet til den normale fordeling som brukes i analysen, og den eneste måten å kjenne disse parameterne på er å ha litt kunnskap om befolkningen. På den annen side er en ikke-parametrisk test, som navnet antyder, ikke avhengig av noen parametere og antar derfor ikke noe om befolkningen.
Grunnlaget for statistisk analyse som skal utføres på dataene, i tilfelle parametriske tester, er probabilistisk fordeling. På den annen side eksisterer ikke grunnlaget for ikke-parametriske tester - det er helt vilkårlig. Dette gir mer fleksibilitet og gjør det lettere å tilpasse hypotesen med de innsamlede dataene.
Målet for sentral tendens er en sentral verdi i en sannsynlighetsfordeling. Og selv om sannsynlighetsfordelingen i tilfelle av ikke-parametrisk statistikk er vilkårlig, eksisterer den fortsatt, og derfor gjør det også målet for sentral tendens. Imidlertid er disse tiltakene forskjellige. Ved parametriske tester blir det antatt å være middelverdien, mens i tilfelle ikke-parametriske tester er det tatt til å være medianverdien.
Som jeg har nevnt i den første forskjellen, varierer informasjonen om befolkningen mellom parametriske og ikke-parametriske tester og statistikk. Nemlig, viss kunnskap om befolkningen er absolutt nødvendig for en parametrisk analyse, fordi den krever befolkningsrelaterte parametere for å gi presise resultater. På den annen side kan en nonparametrisk tilnærming bli tatt uten tidligere kunnskap om befolkningen.