Kategorisk data versus numeriske data
Data er fakta eller informasjon samlet inn for referanse eller analyse. Disse dataene samles ofte som et attributt til det aktuelle emnet. Denne egenskapen kan variere fra den ene til den andre, derfor kan denne varierende attributten betraktes som en variabel. Variablene kan anta forskjellige former for verdier, og disse er iboende i de innsamlede dataene.
Variabler kan enten være kvalitative eller kvantitative; d.v.s. hvis variabelen er kvantitativ, er svarene tall og størrelsen på attributten målt kan oppgis med en viss grad av nøyaktighet. Den andre typen, de kvalitative variablene måler de kvalitative attributter, og verdiene som antas av variablene kan ikke gis når det gjelder størrelse eller størrelsesorden. Variablene i seg selv er kjent som kategoriske variabler, og dataene samlet ved hjelp av en kategorisk variabel er kategoriske data.
Mer om numeriske data
Numeriske data er i utgangspunktet de kvantitative dataene som er oppnådd fra en variabel, og verdien har en følelse av størrelse / størrelsesorden. De numeriske dataene som er oppnådd er videre delt inn i tre flere kategorier basert på teorien utviklet av Stanley Smith Stevens. Numeriske data kan enten være ordinære, intervall eller forhold. Datatypen bestemmes av metoden for måling av verdiene, og typene er kjent som målingsnivåer.
Vekten av en person, avstanden mellom to punkter, temperaturen og prisen på en aksje er eksempler på numeriske data.
I statistikk er flertallet av metodene avledet for analyse av numeriske data. Grunnleggende beskrivende statistikk og regresjon og andre inferensielle metoder brukes hovedsakelig til analyse av numeriske data.
Mer om kategoriske data
Kategoriske data er verdier for en kvalitativ variabel, ofte et tall, et ord eller et symbol. De bringer ut det faktum at variabelen i det vurderte tilfellet tilhører ett av de flere valgene som er tilgjengelige. Derfor tilhører de en av kategoriene; dermed navnet kategorisk.
Den politiske tilknytningen til en person, nasjonalitet til en person, en persons favorittfarge og blodgruppen av en pasient er kvalitative egenskaper. Noen ganger kan et tall oppnås som en kategorisk verdi, men selve tallet representerer ikke størrelsen på attributten målt. Postnummer er et eksempel.
Også noen kategoriske verdier tilhører den nominelle datatypen, som er en annen type basert på nivåene av målingene. Metoder som brukes til å analysere kategoriske data, er forskjellige fra tallverdier, men det underliggende prinsippet kan være det samme.
Hva er forskjellen mellom kategoriske og numeriske data?
• Numeriske data er verdier oppnådd for kvantitativ variabel, og har en følelsesnivå knyttet til konteksten til variabelen (derfor er de alltid tall eller symboler som har en numerisk verdi). Kategoriske data er verdier oppnådd for en kvalitativ variabel; kategoriske datanumre har ikke en følelsesmessig følelse.
• Numeriske data tilhører alltid ordinært, forhold eller intervalltype, mens kategoriske data tilhører nominell type.
• Metoder som brukes til å analysere kvantitative data, er forskjellige fra metodene som brukes til kategoriske data, selv om prinsippene er de samme, i det minste har søknaden betydelige forskjeller.
• Numeriske data analyseres ved hjelp av statistiske metoder i beskrivende statistikk, regresjon, tidsserier og mange flere.
• For kategoriske data benyttes vanligvis beskrivende metoder og grafiske metoder. Noen ikke-parametriske tester brukes også.