Andmekogumi varieeruvuse mõõtmisel on sellega seotud kaks tihedalt seotud statistikat: dispersioon ja standardhälve, mis mõlemad näitavad andmete väärtuste jaotust ja hõlmavad nende arvutamisel sarnaseid samme. Nende kahe statistilise analüüsi peamine erinevus on siiski see, et standardhälve on dispersiooni ruutjuur.
Nende kahe statistilise leviku vaatluse erinevuste mõistmiseks tuleb kõigepealt aru saada, mida kumbki tähistab: dispersioon tähistab kõiki andmekogumi punkte ja arvutatakse iga keskmise ruuthälbe keskmistamise teel, samal ajal kui standardhälve on keskmise ümber jaotumise mõõt, kui keskmist tendentsi arvutatakse tähendama.
Selle tulemusel võib dispersiooni väljendada väärtuste keskmise ruutkeskmise kõrvalekaldumisena keskmistest või [ruudus keskmiste väärtuste kõrvalekalle], jagatud vaatluste arvuga ja standardhälvet võib väljendada ruutkeskmise ruutjuurena dispersioon.
Variandi konstrueerimine
Selle statistika erinevuse täielikuks mõistmiseks peame mõistma dispersiooni arvutamist. Valimi dispersiooni arvutamise sammud on järgmised:
- Arvutage andmete valimikeskmine.
- Leidke erinevus keskmise ja iga andmeväärtuse vahel.
- Ruudutage need erinevused ruuduks.
- Lisage ruutvahe erinevused.
- Jagage see summa ühega väiksemaks kui koguväärtus andmetes.
Kõigi nende toimingute põhjused on järgmised:
- Keskmine annab keskpunkti või keskmine andmetest.
- Erinevused keskmisest aitavad määrata kõrvalekaldeid keskmisest. Keskmisest kaugel olevad andmeväärtused annavad suurema kõrvalekalde kui need, mis on keskmisele lähedased.
- Erinevused on ruudus, sest kui erinevused lisatakse ruutumata, on see summa null.
- nende ruuthälvete liitmine annab koguhälbe mõõtmise.
- Jaotus ühega valimi suurusest väiksemaga annab omamoodi keskmise hälbe. See eitab mõju, kuna paljud andmepunktid aitaksid leviku mõõtmisele kaasa.
Nagu varem öeldud, arvutatakse standardhälve lihtsalt selle tulemuse ruutjuure leidmise teel, mis annab absoluutse standardhälbe, sõltumata andmeväärtuste koguarvust.
Variatsioon ja standardhälve
Kui arvestame dispersiooni, mõistame, et selle kasutamisel on üks suur puudus. Kui järgime dispersiooni arvutamise samme, näitab see, et dispersiooni mõõdetakse ruutühikutes, kuna liitsime arvutamisel ruudud erinevused. Näiteks kui meie valimi andmeid mõõdetakse meetrites, siis antakse dispersiooni ühikud ruutmeetrites.
Hajumise mõõtme standardiseerimiseks peame võtma dispersiooni ruutjuure. See kõrvaldab ruudukujuliste ühikute probleemi ja annab meile mõõtme leviku kohta, millel on samad ühikud kui meie algsel valimil.
Matemaatilises statistikas on palju valemeid, millel on kenama kujuga vormid, kui me need standardhälbe asemel välja arvutame dispersioonina.