Mis on kaldus statistikas?

Mõned andmejaotused, näiteks kella kõver või normaalne jaotus, on sümmeetrilised. See tähendab, et jaotus paremal ja vasakul on üksteise ideaalsed peegelpildid. Mitte iga andmete jaotus pole sümmeetriline. Andmekogumeid, mis ei ole sümmeetrilised, peetakse asümmeetrilisteks. Asümmeetrilise jaotuse suurust saab mõõta viltu.

Keskmine, mediaan ja režiim on kõik keskuse mõõtmed andmete kogumist. Andmete kallakuse saab kindlaks teha selle järgi, kuidas need kogused üksteisega seotud on.

Kaldus paremale

Paremale kalduvatel andmetel on pikk saba, mis ulatub paremale. Teine võimalus rääkida paremale kalduvast andmekogumist on öelda, et see on positiivselt viltu. Selles olukorras tähendab keskmine ja mediaan mõlemad on režiimist suuremad. Üldreeglina on suurem osa ajast paremale kalduvate andmete korral keskmine keskmisest suurem. Kokkuvõtlikult võib öelda, et paremale kaldu andmekogumi korral:

  • Alati: tähendab suuremat kui režiim
  • Alati: režiimist suurem mediaan
  • Enamasti: keskmine suurem kui mediaan

Kaldus vasakule

instagram viewer

Kui tegeleme vasakule kalduvate andmetega, on olukord vastupidine. Vasakule kalduvatel andmetel on pikk saba, mis ulatub vasakule. Teine võimalus rääkida vasakule kalduvast andmekogumist on öelda, et see on negatiivselt viltu. Selles olukorras on nii keskmine kui ka mediaan väiksem kui režiimis. Üldreeglina on suurem osa ajast vasakule kalduvate andmete korral keskmine kui mediaan. Kokkuvõtlikult võib öelda, et vasakule kalduvate andmekogumite korral:

  • Alati: tähendab vähem kui režiim
  • Alati: mediaan väiksem kui režiimis
  • Enamasti: tähendab vähem kui mediaan

Kalduse mõõtmed

Üks asi on vaadata kahte andmekogumit ja teha kindlaks, et üks on sümmeetriline, teine ​​aga asümmeetriline. Veel üks asi on vaadata kahte asümmeetriliste andmete komplekti ja öelda, et üks on rohkem viltu kui teine. Lihtsalt jaotuse graafikut vaadates võib olla väga subjektiivne otsustada, mis on viltu. Seetõttu on viltuuse arv arvutamiseks arvukalt võimalusi.

Üks viltuse mõõt, mida nimetatakse Pearsoni esimeseks viltuse koefitsiendiks, on režiimi keskmist lahutada ja jagada see erinevus standardhälve andmetest. Erinevuse jagamise põhjus on see, et meil on mõõtmeteta kogus. See selgitab, miks paremale kalduvatel andmetel on positiivne kaldus. Kui andmekogum on paremale kaldu, on keskmine suurem kui režiim ja seega annab režiimi lahutamine keskmisest positiivse arvu. Sarnane argument selgitab, miks vasakule kalduvatel andmetel on negatiivne kalduvus.

Pearsoni teist teravustegurit kasutatakse ka andmekogumi asümmeetria mõõtmiseks. Selle koguse jaoks lahutame režiimi mediaanist, korrutame selle arvu kolmega ja jagame siis standardhälbega.

Viltuste andmete rakendused

Viltused andmed tekivad erinevates olukordades üsna loomulikult. Sissetulekud on paremale kaldu, sest isegi vaid mõned miljonid dollareid teenivad isikud võivad keskmist suuresti mõjutada ja negatiivseid sissetulekuid pole. Sarnaselt on toote, näiteks lambipirni kaubamärgi, elueaga seotud andmed paremal. Väikseim, mis eluiga võib olla, on null ja pikaajalised lambipirnid annavad andmetele positiivse kalduvuse.