Mis on histogramm ja kuidas seda kasutatakse?

Histogramm on teatud tüüpi graafik, millel on statistikas laialdased rakendused. Histogrammid pakuvad visuaalset tõlgendust arvandmed väärtuste vahemikku jäävate andmepunktide arvu märkimisega. Neid väärtusvahemikke nimetatakse klassideks või prügikastideks. Igas klassis sisalduvate andmete sagedus on kujutatud riba abil. Mida kõrgem on riba, seda suurem on sagedus andmete väärtuste jaoks selles prügikastis.

Histogrammid vs. Tulpdiagrammid

Esmapilgul näevad histogrammid väga sarnased tulpdiagrammid. Mõlemad graafikud kasutavad andmete tähistamiseks vertikaalseid ribasid. Riba kõrgus vastab suhteline sagedus klassi andmete hulgast. Mida kõrgem on riba, seda suurem on andmete sagedus. Mida madalam riba, seda madalam on andmete sagedus. Kuid välimus võib olla petlik. Just siin lõpevad sarnasused kahte tüüpi graafide vahel.

Põhjus, miks sellised graafikud on erinevad, on seotud graafikuga andmete mõõtmise tase. Ühest küljest kasutatakse mõõtmise nominaalsel tasemel andmete jaoks tulpdiagramme.

instagram viewer
Tulpdiagrammid mõõta kategooriliste andmete sagedust ja tulpdiagrammi klassid on need kategooriad. Teisest küljest kasutatakse histogramme andmete jaoks, mis on vähemalt ordinaalne tase mõõtmine. Histogrammi klassid on väärtusvahemikud.

Teine peamine erinevus tulpdiagrammide ja histogrammide vahel on seotud tulpade järjestamisega. Tulpdiagrammil on tavaks ribade järjestus väheneva kõrguse järgi. Histogrammi ribasid ei saa siiski ümber korraldada. Neid tuleb kuvada klasside esinemise järjekorras.

Histogrammi näide

Ülaltoodud diagramm näitab meile histogrammi. Oletame, et neli münti pööratakse ümber ja tulemused registreeritakse. Kasutamine asjakohane binoomjaotustabel või binoomvalemiga tehtud sirgjoonelised arvutused näitavad, et tõenäosus, et ühtegi pead ei näidata, on 1/16, ühe pea näitamise tõenäosus on 4/16. Kahe pea tõenäosus on 6/16. Kolme pea tõenäosus on 4/16. Nelja pea tõenäosus on 1/16.

Ehitame kokku viis klassi, igaüks ühe laiusega. Need klassid vastavad võimalikule peade arvule: null, üks, kaks, kolm või neli. Iga klassi kohal joonistame vertikaalse riba või ristküliku. Nende vardade kõrgused vastavad tõenäosustele, mida on nimetatud meie tõenäosuskatses nelja münti ümberpööramiseks ja peade loendamiseks.

Histogrammid ja tõenäosused

Ülaltoodud näide mitte ainult ei kirjelda histogrammi konstrueerimist, vaid näitab ka seda diskreetne tõenäosusjaotus saab esitada histogrammiga. Tõepoolest, ja diskreetset tõenäosusjaotust saab esitada histogrammiga.

Histogrammi konstrueerimiseks, mis tähistab tõenäosusjaotust, alustame klasside valimisega. Need peaksid olema tõenäosuskatse tulemused. Nende klasside laius peaks olema üks ühik. Histogrammi tulpade kõrgused on iga tulemuse tõenäosused. Selliselt konstrueeritud histogrammi korral on ka tulpide pindalad tõenäosused.

Kuna selline histogramm annab meile tõenäosusi, on selle suhtes seatud paar tingimust. Üks tingimus on, et skaala jaoks, mis annab meile histogrammi teatava riba kõrguse, võib kasutada ainult mittenegatiivseid numbreid. Teine tingimus on see, et kuna tõenäosus on pindalaga võrdne, peavad kõik vardade pindalad kokku moodustama ühe, mis võrdub 100% -ga.

Histogrammid ja muud rakendused

Histogrammi tulbad ei pea olema tõenäosused. Histogrammidest on abi muudes valdkondades kui tõenäosus. Ainus kord, kui soovime võrrelda kvantitatiivsete andmete esinemissagedust, võib meie andmestiku kujutamiseks kasutada histogrammi.