Suhtelise sageduse histogrammide mõistmine

Sisse statistika, on palju termineid, millel on peened erinevused. Selle üheks näiteks on erinevus sagedus ja suhteline sagedus. Ehkki suhtelisi sagedusi on palju kasutada, on üks neist siiski selline, mis hõlmab suhtelise sageduse histogrammi. See on teatud tüüpi graafik, millel on ühendused statistika ja matemaatilise statistika muude teemadega.

Definitsioon

Histogrammid on statistilised graafikud, mis näevad välja tulpdiagrammid. Tavaliselt on histogramm siiski reserveeritud kvantitatiivne muutujad. Histogrammi horisontaaltelg on numbriline rida, mis sisaldab klassid või ühtlase pikkusega prügikastid. Need prügikastid on numbrirea intervallid, kus andmed võivad langeda ja koosneda ühest numbrist (tavaliselt diskreetne - suhteliselt väikesed andmekogumid) või väärtuste vahemik (suuremate diskreetsete andmekogumite ja pidev andmed).

Näiteks võime olla huvitatud kaaluma õpilaste klassi 50-punktilise viktoriini tulemuste jaotust. Üks võimalik viis prügikastide konstrueerimiseks oleks erinev prügikott iga 10 punkti jaoks.

instagram viewer

Histogrammi vertikaaltelg tähistab arvu või sagedust, mille korral andmeväärtus ilmneb igas prügikastis. Mida kõrgem on riba, seda rohkem andmeid sellesse prügikasti väärtuste vahemikku langeb. Naastes meie näite juurde, kui meil on viis õpilast, kes kogusid viktoriinil rohkem kui 40 punkti, siis 40–50 prügikastile vastav riba on viis ühikut.

Sageduse histogrammi võrdlus

Suhtelise sageduse histogramm on tüüpilise sageduse histogrammi väike modifikatsioon. Selle asemel, et kasutada antud prügikasti langevate andmeväärtuste loendamiseks vertikaalset telge, kasutame seda telge, et näidata sellesse prügikasti langevate andmeväärtuste üldist osakaalu. Kuna 100% = 1, peab kõigi ribade kõrgus olema 0 kuni 1. Lisaks peavad kõigi meie suhtelise sageduse histogrammi ribade kõrgused olema 1.

Seega oletame meie poolt vaadeldava jooksva näite korral, et meie klassis on 25 õpilast ja viis on andnud rohkem kui 40 punkti. Selle prügikasti jaoks viiekõrguse riba ehitamise asemel oleks meil riba 5/25 = 0,2.

Võrreldes histogrammi suhtelise sagedusega histogrammiga, millel kõigil on samad kastid, märkame midagi. Histogrammide üldine kuju on identne. Suhtelise sageduse histogramm ei rõhuta üldist loendit igas prügikastis. Selle asemel keskendub seda tüüpi graafik sellele, kuidas salongis olevate andmeväärtuste arv on seotud teiste prügikastidega. See seos kuvatakse protsendimäärana andmeväärtuste koguarvust.

Tõenäosus massfunktsioonid

Võib küsida, mis mõte on suhtelise sageduse histogrammi määratlemisel. Üks põhirakendus hõlmab diskreetseid juhuslikke muutujaid, kus meie prügikastid on laiusega üks ja nende keskmes on iga mittenegatiivne täisarv. Sel juhul saame määratleda tükkhaaval funktsiooni väärtustega, mis vastavad tulbade vertikaalsele kõrgusele meie suhtelise sageduse histogrammis.

Seda tüüpi funktsiooni nimetatakse tõenäosusmassi funktsiooniks. Funktsiooni sel viisil konstrueerimise põhjus on see, et funktsiooni määratletud kõver on otseselt seotud tõenäosus. Väärtustest kõvera all olev ala a kuni b on tõenäosus, et juhusliku muutuja väärtus on alates a kuni b.

Seos tõenäosuse ja kõvera aluse pindala vahel on selline, mida ilmneb korduvalt matemaatilises statistikas. Veel üks selline seos on tõenäosusmassi funktsiooni kasutamine suhtelise sageduse histogrammi modelleerimiseks.