Kuidas leida sise- ja välistarad

Andmekogumi üks omadus, mida on oluline kindlaks teha, on see, kas see sisaldab mingeid kõrvalekaldeid. Kõrvalekaldeid peetakse intuitiivselt meie andmestikus väärtusteks, mis erinevad suuremas osas ülejäänud andmetest. Muidugi on see kõrvalnähtude mõistmine kahemõtteline. Kui palju tuleb väärtust ülejäänud andmetest erineda, et seda saaks pidada kõrvaliseks? Kas see, mida üks teadlane nimetab väliseks, sobib teisega? Mõnede järjepidevuse ja kvantitatiivse mõõtme tagamiseks kõrvalnäitajate määramiseks kasutame sise- ja välistara.

Andmekogumi sisemise ja välimise tara leidmiseks vajame kõigepealt mõnda muud kirjeldav statistika. Alustame kvartiilide arvutamisega. See viib kvartiilide vahemikku. Lõpuks saame nende arvutuste abil kindlaks teha sisemise ja välimise tara.

Kvartalid

esimene ja kolmas kvartiil on osa viie numbri kokkuvõte mis tahes kvantitatiivsete andmete kogumist. Alustame andmete keskmise või keskpunkti leidmisega pärast kõigi väärtuste loetlemist kasvavas järjekorras. Väärtused, mis on väiksemad kui mediaan, vastavad umbes poolele andmest. Leiame selle andmekogu poole keskmise ja see on esimene kvartiil.

instagram viewer

Sarnasel viisil käsitleme nüüd andmekogumi ülemist poolt. Kui leiame selle poole andmete mediaani, siis on meil kolmas kvartiil. Need kvartiilid saavad oma nime sellest, et nad jaotavad andmekogumi neljaks võrdse suurusega osaks või kvartaliks. Ehk teisisõnu: umbes 25% kõigist andmetest on väiksemad kui esimene kvartiil. Samal viisil on umbes 75% andmetest vähem kui kolmas kvartiil.

Kvartalitevaheline vahemik

Järgmisena peame leidma kvartiilidevaheline vahemik (IQR). Seda on lihtsam arvutada kui esimest kvartiili q1 ja kolmas kvartiil q3. Peame vaid võtma arvesse nende kahe kvartiili erinevust. See annab meile valemi:

IQR = Q3 - Q1

IQR annab meile teada, kui lai on meie andmekogumi keskmine pool.

Leidke Sisetarad

Nüüd võime leida sisemised tarad. Alustame IQR-ist ja korrutame selle arvu 1,5-ga. Seejärel lahutame selle arvu esimesest kvartiilist. Lisame selle numbri ka kolmandasse kvartalisse. Need kaks numbrit moodustavad meie sisemise tara.

Leidke välimised tarad

Väliste tarade jaoks alustame IQR-ga ja korrutame selle arvu 3-ga. Seejärel lahutame selle arvu esimesest kvartiilist ja liidame selle kolmandaks kvartiiliks. Need kaks numbrit on meie välised tarad.

Kõrvaliste tuvastamine

Avastamine kõrvalnähud Nüüd on sama lihtne kui andmete sisend- ja välimistes piirides andmete väärtuste määramine. Kui üksainus andmeväärtus on ekstreemsem kui ükski meie välimistest taradest, siis on see välismõju ja seda nimetatakse mõnikord ka tugevaks väliseks. Kui meie andmeväärtus on vastava sisemise ja välimise tara vahel, siis on see väärtus arvatavalt kõrvaline või nõrk. Näeme, kuidas see toimib allpool toodud näite abil.

Näide

Oletame, et oleme arvutanud oma andmete esimese ja kolmanda kvartiili ning leidnud, et need väärtused on vastavalt 50 ja 60. Kvartalidevaheline vahemik IQR = 60 - 50 = 10. Järgmisena näeme, et 1,5 x IQR = 15. See tähendab, et sisemised tarad asuvad 50 - 15 = 35 ja 60 + 15 = 75. See on 1,5x IQR vähem kui esimene kvartiil ja rohkem kui kolmas kvartiil.

Nüüd arvutame 3 x IQR ja näeme, et see on 3 x 10 = 30. Välised tarad on 3 x IQR-st ekstreemsemad kui esimene ja kolmas kvartiil. See tähendab, et välimised tarad on 50 - 30 = 20 ja 60 + 30 = 90.

Kõiki andmeväärtusi, mis on väiksemad kui 20 või suuremad kui 90, loetakse ületatud väärtusteks. Andmete väärtused, mis jäävad vahemikku 29–35 või vahemikus 75–90, on arvatavalt ületatud.

instagram story viewer