Tilfeldige Variabler vs Sannsynlighetsfordeling
Statistiske eksperimenter er tilfeldige eksperimenter som kan gjentas på ubestemt tid med et kjent sett med resultater. Både tilfeldige variabler og sannsynlighetsfordelinger er knyttet til slike eksperimenter. For hver tilfeldig variabel er det en tilknyttet sannsynlighetsfordeling definert av en funksjon kalt kumulativ distribusjonsfunksjon.
Hva er en tilfeldig variabel?
En tilfeldig variabel er en funksjon som tilordner numeriske verdier til resultatene av et statistisk eksperiment. Med andre ord er det en funksjon som er definert fra prøveområdet for et statistisk eksperiment i settet med reelle tall.
For eksempel, vurder et tilfeldig forsøk på å vende en mynt to ganger. De mulige utfallene er HH, HT, TH og TT (H - hoder, T - tales). La variabelen X være antall hoveder observert i eksperimentet. Da kan X ta verdiene 0, 1 eller 2, og det er en tilfeldig variabel. Her vil den tilfeldige variabelen X kartlegge settet S = HH, HT, TH, TT (prøveplassen) til settet 0, 1, 2 på en slik måte at HH er kartlagt til 2, HT og TH er kortlagt til 1 og TT er kartlagt til 0. I funksjonsnotasjon kan dette skrives som: X: S → R hvor X (HH) = 2, X (HT) = 1, X (TH) = 1 og X TT) = 0.
Det finnes to typer tilfeldige variabler: diskret og kontinuerlig, og derfor kan antall mulige verdier en tilfeldig variabel antar, være høyst tellbare eller ikke. I forrige eksempel er tilfeldig variabel X en diskret tilfeldig variabel siden 0, 1, 2 er et endelig sett. Tenk nå på det statistiske eksperimentet om å finne vekter av studenter i en klasse. La Y være tilfeldig variabel definert som en elevs vekt. Y kan ta noen reell verdi innenfor et bestemt intervall. Derfor er Y en kontinuerlig tilfeldig variabel.
Hva er en sannsynlighetsfordeling?
Sannsynlighetsfordeling er en funksjon som beskriver sannsynligheten for at en tilfeldig variabel tar visse verdier.
En funksjon kalt kumulativ distribusjonsfunksjon (F) kan defineres fra settet av reelle tall til settet av reelle tall som F (x) = P (X ≤ x) (sannsynligheten for at X er mindre enn eller lik x) for hvert mulig utfall x. Nå kan den kumulative fordelingsfunksjonen til X i det første eksemplet skrives som F (a) = 0, hvis a<0; F(a)=0.25, if 0≤a<1; F(a)=0.75, if 1≤a<2 and F(a)=1, if a≥2.
Ved diskrete tilfeldige variabler kan en funksjon defineres fra settet av mulige utfall til settet av reelle tall på en slik måte at ƒ (x) = P (X = x) (sannsynligheten for at X er lik x) for hvert mulig utfall x. Denne spesielle funksjonen ƒ kalles sannsynlighetsmassefunksjonen til den tilfeldige variabelen X. Nå kan sannsynlighetsmassefunksjonen til X i det første spesielle eksempel skrives som ƒ (0) = 0,25, ƒ (1) = 0,5, ƒ (2) = 0,25 og ƒ (x) = 0 ellers. Sannsynlighetsmassefunksjonen sammen med den kumulative fordelingsfunksjonen vil således beskrive sannsynlighetsfordelingen av X i det første eksempel.
For kontinuerlige tilfeldige variabler kan en funksjon kalt sannsynlighetsdensitetsfunksjonen (ƒ) defineres som ƒ (x) = dF (x) / dx for hver x hvor F er den kumulative fordelingsfunksjonen til den kontinuerlige tilfeldige variabelen. Det er lett å se at denne funksjonen tilfredsstiller ∫ƒ (x) dx = 1. Sannsynlighetsdensitetsfunksjonen sammen med den kumulative distribusjonsfunksjonen beskriver sannsynlighetsfordelingen av en kontinuerlig tilfeldig variabel. For eksempel beskrives normalfordeling (som er en kontinuerlig sannsynlighetsfordeling) ved bruk av sannsynlighetsdensitetsfunksjonen ƒ (x) = 1 / √ (2πσ2) e ^ ([(x-μ)]2/ (2σ2)).
Hva er forskjellen mellom tilfeldige variabler og sannsynlighetsfordeling? • Tilfeldig variabel er en funksjon som forbinder verdier av et prøverom til et reelt tall. • Sannsynlighetsfordeling er en funksjon som forbinder verdier som en tilfeldig variabel kan ta til den respektive sannsynligheten for forekomst.
|