Sannsynlighetsfordeling Funksjon vs Sannsynlighetsdensitetsfunksjon
Sannsynlighet er sannsynligheten for at en hendelse skal skje. Denne ideen er svært vanlig, og brukes ofte i det daglige livet når vi vurderer våre muligheter, transaksjon og mange andre ting. Utvide dette enkle konseptet til et større sett med hendelser er litt mer utfordrende. For eksempel kan vi ikke enkelt finne ut sjansene for å vinne et lotteri, men det er praktisk, ganske intuitivt å si at det er en sannsynlighet for en av seks at vi skal få nummer seks i en terning kastet.
Når antall hendelser som kan skje, blir større, eller antall individuelle muligheter er store, mislykkes denne ganske enkle ideen om sannsynlighet. Derfor må det gis en solid matematisk definisjon før du nærmer deg problemer med høyere kompleksitet.
Når antall hendelser som kan skje i en enkelt situasjon er stor, er det umulig å vurdere hver hendelse individuelt som i eksempelet på terningen kastet. Derfor er hele settet av hendelser oppsummert ved å introdusere begrepet tilfeldig variabel. Det er en variabel, som kan anta verdiene for ulike hendelser i den aktuelle situasjonen (eller prøveplassen). Det gir en matematisk følelse til enkle hendelser i situasjonen, og matematisk måte å adressere hendelsen på. Nærmere bestemt er en tilfeldig variabel en reell verdi-funksjon over elementene i prøveplassen. De tilfeldige variablene kan enten være diskrete eller kontinuerlige. De er vanligvis betegnet med store bokstaver i det engelske alfabetet.
Sannsynlighetsfordelingsfunksjon (eller bare sannsynlighetsfordelingen) er en funksjon som tildeler sannsynlighetsverdiene for hver hendelse; dvs. det gir et forhold til sannsynlighetene for verdiene som tilfeldig variabel kan ta. Sannsynlighetsfordelingsfunksjonen er definert for diskrete tilfeldige variabler.
Sannsynlighetsdensitetsfunksjon er ekvivalent av sannsynlighetsfordelingsfunksjonen for de kontinuerlige tilfeldige variablene, gir sannsynligheten for at en bestemt tilfeldig variabel antar en viss verdi.
Hvis X er en diskret tilfeldig variabel, funksjonen er gitt som f(x) = P(X = x) for hver x innen rekkevidde av X kalles sannsynlighetsfordelingsfunksjonen. En funksjon kan fungere som sannsynlighetsfordelingsfunksjonen hvis og bare hvis funksjonen tilfredsstiller følgende forhold.
1. f(x) ≥ 0
2. Σ f(x) = 1
En funksjon f(x) som er definert over settet av reelle tall kalles sannsynlighetsdensitetsfunksjonen for den kontinuerlige tilfeldige variabelen X, hvis og bare hvis,
P(en ≤ x ≤ b) = en∫b f(x) dx for noen ekte konstanter en og b.
Sannsynlighetstettheten skal også tilfredsstille følgende forhold.
1. f(x) ≥ 0 for alle x: -∞ < x < +∞
2. -∞∫+∞ f(x) dx = 1
Både sannsynlighetsfordelingsfunksjonen og sannsynlighetsdensitetsfunksjonen brukes til å representere fordelingen av sannsynligheter over prøveområdet. Vanligvis kalles disse sannsynlighetsfordelingene.
For statistisk modellering er standard sannsynlighetsdensitetsfunksjoner og sannsynlighetsfordelingsfunksjoner avledet. Den normale fordeling og standard normalfordeling er eksempler på de kontinuerlige sannsynlighetsfordelingene. Binomialfordeling og Poisson-distribusjon er eksempler på diskrete sannsynlighetsfordeler.
Hva er forskjellen mellom Sannsynlighetsfordeling og Sannsynlighetsdensitetsfunksjon?
• Sannsynlighetsfordelingsfunksjon og sannsynlighetsdensitetsfunksjon er funksjoner definert over prøveplassen, for å tildele den relevante sannsynlighetsverdien til hvert element.
• Sannsynlighetsfordelingsfunksjoner er definert for de diskrete tilfeldige variablene, mens sannsynlighetstetthetsfunksjonene er definert for de kontinuerlige tilfeldige variablene.
• Fordeling av sannsynlighetsverdier (dvs. sannsynlighetsfordeler) er best portrert av sannsynlighetsdensitetsfunksjonen og sannsynlighetsfordelingsfunksjonen.
• Sannsynlighetsfordelingsfunksjonen kan representeres som verdier i et bord, men det er ikke mulig for sannsynlighetsdensitetsfunksjonen fordi variabelen er kontinuerlig.
• Ved plotting gir sannsynlighetsfordelingsfunksjonen en stavplott mens sannsynlighetsdensitetsfunksjonen gir en kurve.
• Høyden / lengden på stolpene i sannsynlighetsfordelingsfunksjonen må legges til 1 mens området under kurven for sannsynlighetsdensitetsfunksjonen må legge til 1.
• I begge tilfeller må alle verdiene av funksjonen være ikke-negativ.