Kui veedate üldse palju aega tegeledes statistika, üsna varsti jõuate fraasini “tõenäosusjaotus”. Just siin saame tõesti näha, kui palju tõenäosuse ja statistika alad kattuvad. Ehkki see võib tunduda midagi tehnilist, on fraaside tõenäosusjaotus tõesti lihtsalt viis rääkida tõenäosuste loendi korraldamisest. Tõenäosusjaotus on funktsioon või reegel, mis omistab tõenäosused juhusliku muutuja igale väärtusele. Jaotuse võib mõnel juhul loetleda. Muudel juhtudel esitatakse see graafikuna.
Näide
Oletame, et meie veereta kaks täringut ja registreerige siis täringute summa. Võimalikud on summad vahemikus kaks kuni 12. Igal summal on konkreetne tõenäosus. Me võime need lihtsalt loetleda järgmiselt:
- Summa 2 tõenäosus on 1/36
- Summa 3 tõenäosus on 2/36
- Summa 4 tõenäosus on 3/36
- Summa 5 tõenäosus on 4/36
- Summa 6 tõenäosus on 5/36
- Summa 7 tõenäosus on 6/36
- Summa 8 tõenäosus on 5/36
- Summa 9 tõenäosus on 4/36
- Summa 10 tõenäosus on 3/36
- Summa 11 tõenäosus on 2/36
- Summa 12 tõenäosus on 1/36
See loetelu on tõenäosusjaotus kahe täringu veeretamise tõenäosuskatses. Samuti võime ülaltoodut vaadelda kui tõenäosusjaotust
juhuslik muutuja määratletakse kahe täringu summat vaadates.Graafik
Tõenäosusjaotuse saab joonistada ja mõnikord aitab see meile näidata jaotuse tunnuseid, mis ei ilmnenud lihtsalt tõenäosuste loendi lugemisest. Juhuslik muutuja kantakse graafikule x-aks ja vastav tõenäosus on joonestatud piki y-aks. Diskreetse juhusliku muutuja jaoks on meil a histogramm. Pideva juhusliku muutuja korral on meil sile kõver.
Tõenäosuse reeglid kehtivad endiselt ja need avalduvad mitmel viisil. Kuna tõenäosused on nullist suuremad või sellega võrdsed, peab tõenäosusjaotuse graafikul olema y- mittenegatiivsed koordinaadid. Veel üks tõenäosuste tunnusjoon, nimelt see, et üks on sündmuse tõenäosuse maksimum, ilmneb teisel viisil.
Pindala = tõenäosus
Tõenäosusjaotuse graafik on koostatud nii, et piirkonnad tähistavad tõenäosusi. Diskreetse tõenäosusjaotuse jaoks arvutame tegelikult ainult ristkülikute pindalad. Ülaltoodud graafikul vastavad kolmele ribale, mis vastavad neljale, viiele ja kuuele, pindala tõenäosus, et meie täringute summa on neli, viis või kuus. Kõigi ribade pindala moodustab kokku ühe.
Aastal tavaline normaaljaotus või kellakõver, on meil sarnane olukord. Kõvera alune pindala kahe vahel z väärtused vastavad tõenäosusele, et meie muutuja jääb nende kahe väärtuse vahele. Näiteks kella kõvera alune pindala -1 z.
Olulised jaotused
Seal on sõna otseses mõttes lõpmata palju tõenäosusjaotusi. Järgnevas loendis on mõned olulisemad jaotused:
- Binoomjaotus - annab kahe tulemusega iseseisvate katsete seeria edukuse arvu
- Chi-ruutjaotus - Kasutamiseks selleks, et kindlaks teha, kui lähedased kogused sobivad pakutud mudeliga
- F-jaotus - kasutatud dispersiooni analüüs (ANOVA)
- Normaalne jaotus - Helistas kella kõver ja seda leidub kogu statistikas.
- Õpilaste jaotus - kasutamiseks väikeste proovide korral normaaljaotusest