Kirjeldav vs. Sissejuhatav statistika

Statistika valdkond jaguneb kaheks suureks jaotuseks: kirjeldav ja järeldatav. Kõik need segmendid on olulised, pakkudes erinevaid tehnikaid, mis võimaldavad saavutada erinevaid eesmärke. Kirjeldav statistika kirjeldab a-s toimuvat elanikkond või andmekogum. Inferentsstatistika seevastu võimaldab teadlastel võtta järeldused valikrühmast ja neid üldistada suuremale populatsioonile. Kahel statistikatüübil on mõned olulised erinevused.

Kirjeldav statistika

Kirjeldav statistika on statistika tüüp, mis tõenäoliselt enamiku inimeste mõtetes levib, kui nad kuulevad sõna “statistika”. Selles statistikaharu eesmärk on kirjeldada. Andmekogumi omaduste kirjeldamiseks kasutatakse arvulisi mõõtmeid. Sellesse statistika osasse kuulub mitu üksust, näiteks:

  • keskminevõi andmekogumi keskpunkti mõõt, mis koosneb keskmisest, mediaanist, režiimist või keskvahemikust
  • Andmekogumi levik, mida saab mõõta nupuga vahemik või standardhälve
  • Andmete üldised kirjeldused, näiteks viie numbri kokkuvõte
  • Mõõtmised nagu vildakus ja kurtoos
  • instagram viewer
  • Suhete uurimine ja korrelatsioon seotud andmete vahel
  • Statistiliste tulemuste esitamine graafiline vorm

Need meetmed on olulised ja kasulikud, kuna need võimaldavad teadlastel näha andmete hulgas mustreid ja seega neid andmeid mõistma hakata. Kirjeldavat statistikat saab kasutada ainult uuritava populatsiooni või andmekogumi kirjeldamiseks: tulemusi ei saa üldistada ühegi teise rühma ega populatsiooni suhtes.

Kirjeldava statistika liigid

Sotsiaalteadlased kasutavad kahte tüüpi kirjeldavat statistikat:

Tsentraalse kalduvuse mõõtmed kajastada andmete üldisi suundumusi ning need arvutatakse ja väljendatakse keskmise, mediaani ja režiimina. Keskmine tähendab teadlastele kõigi andmekogumite matemaatilist keskmist, näiteks keskmine vanus esimeses abielus; mediaan tähistab andmete jaotuse keskpunkti, nagu ka vanus, mis asub vanusevahemiku keskel, mil inimesed esimest korda abielluvad; ja režiim võib olla kõige tavalisem vanus, mil inimesed esimest korda abielluvad.

Levimõõdud kirjeldavad andmete jaotust ja omavahelist seost, sealhulgas:

  • Vahemik, kogu andmekogumis sisalduvate väärtuste vahemik
  • Sageduse jaotus, mis määratleb, mitu korda konkreetne väärtus andmekogumis toimub
  • Kvartalid, alarühmad, mis moodustatakse andmekogumis, kui kõik väärtused on jagatud vahemiku neljaks võrdseks osaks
  • Keskmine absoluutne kõrvalekalle, kui palju iga väärtus erineb keskmisest
  • Variatsioon, mis illustreerib, kui suur osa andmetes levib
  • Standardhälve, mis illustreerib andmete levikut keskmise suhtes

Leviku mõõtmed on sageli visuaalselt esindatud tabelites, sektordiagrammides ja tulpdiagrammides ning histogrammides, et hõlbustada andmete suundumuste mõistmist.

Sissejuhatav statistika

Eristusstatistika koostatakse keerukate matemaatiliste arvutuste abil, mis võimaldavad teadlastel sellest võetud proovi uuringu põhjal järeldada suurema rahvaarvu suundumusi. Teadlased kasutavad valimi muutujate vaheliste seoste uurimiseks järeldavat statistikat ja seejärel tehke üldistusi või ennustusi selle kohta, kuidas need muutujad suuremaga seostuvad elanikkond.

Tavaliselt on võimatu iga elanikkonna liiget eraldi uurida. Nii et teadlased valivad elanikkonna tüüpilise alamhulga, mida nimetatakse statistiliseks valimiks, ja selle analüüsi põhjal on nad võimelised ütlema midagi selle elanikkonna kohta, kellest valim tuli. Tegutsemisstatistikat on kahte peamist jaotust:

  • Usaldusvahemik annab statistilise valimi mõõtmise kaudu populatsiooni tundmatu parameetri väärtuste vahemiku. Seda väljendatakse intervalli ja usaldusnivoo astmena, et parameeter jääb vahemikku.
  • Olulised testid või hüpoteesi testimine kus teadlased esitavad statistilise valimi analüüsimisega väite elanikkonna kohta. Projekteerimise järgi on selles protsessis teatav ebakindlus. Seda saab väljendada olulisuse tasemel.

Tehnikad, mida sotsiaalteadlased kasutavad muutujate vaheliste seoste uurimiseks ja järeldusliku statistika loomiseks, hõlmavad järgmist lineaarse regressiooni analüüsid, logistiline regressioonanalüüs, ANOVA, korrelatsioonianalüüsid, struktuurvõrrandi modelleerimineja ellujäämise analüüs. Järelduslikku statistikat kasutavate uuringute läbiviimisel viivad teadlased läbi olulisuse testi, et teha kindlaks, kas nad suudavad oma tulemusi üldistada suuremale elanikkonnale. Tavalised olulisuse testid hõlmavad järgmist: chi-ruut ja t-test. Need näitavad teadlastele tõenäosust, et nende valimi analüüsi tulemused esindavad kogu populatsiooni.

Kirjeldav vs. Sissejuhatav statistika

Ehkki kirjeldav statistika on abiks selliste asjade õppimisel nagu andmete levik ja keskpunkt, ei saa kirjeldavas statistikas midagi üldistuste tegemiseks kasutada. Kirjeldavas statistikas on sellised mõõtmised nagu keskmine ja standardhälve esitatud täpsete arvudena.

Isegi kui järeldatav statistika kasutab mõnda sarnast arvutust - näiteks keskmist ja standardhälvet -, on järeldatava statistika puhul fookus erinev. Eristusstatistika algab valimist ja seejärel üldistatakse üldkogumina. See teave elanikkonna kohta ei ole numbriline. Selle asemel väljendavad teadlased neid parameetreid potentsiaalsete arvude vahemikuna koos usaldusnivooga.