Mis on hajumise graafik statistikas?

Statistika üks eesmärke on andmete korrastamine ja kuvamine. Mitu korda on üks viis selleks kasutada a graafik, tabel või tabel. Kui töötate koos paarisandmed, on kasulikku tüüpi graafik hajutatud graafik. Seda tüüpi graafik võimaldab meil oma andmeid hõlpsalt ja tõhusalt uurida, uurides punktide hajumist tasapinnas.

Paarisandmed

Väärib esiletõstmist, et hajutatud graafik on teatud tüüpi graafik, mida kasutatakse paarisandmete jaoks. See on teatud tüüpi andmekogum, milles igal meie andmepunktil on sellega seotud kaks numbrit. Selliste sidumiste tavalised näited on järgmised:

  • Mõõtmine enne ja pärast ravi. See võib toimuda õpilase etenduse vormis eeltestil ja seejärel hiljem järeltestil.
  • Sobitatud paaride eksperimentaalne kujundus. Siin on üks indiviid kontrollrühmas ja teine ​​sarnane isik ravirühmas.
  • Kaks mõõtmist samalt isikult. Näiteks võime registreerida 100 inimese kaalu ja pikkuse.

2D graafikud

Tühi lõuend, millest me oma hajusa joonise jaoks alustame, on Cartesiuse koordinaatsüsteem. Seda nimetatakse ka ristkülikukujuliseks koordinaatsüsteemiks, kuna iga punkti saab leida konkreetse ristküliku joonistamise teel. Ristkülikukujulise koordinaatsüsteemi saab seadistada järgmiselt:

instagram viewer

  1. Alustades horisontaalsest numbrireast. Seda nimetatakse x-aks.
  2. Lisage vertikaalne numbririda. Ristke rist x-telge selliselt, et mõlema sirge nullpunkt ristub. Seda teist numbririda nimetatakse y-aks.
  3. Punkti, kus meie numbrirea nullpunktid ristuvad, nimetatakse lähteks.

Nüüd saame oma andmepunktid joonistada. Esimene number meie paaris on x-koordinaat. See on horisontaalkaugus y-teljest ja seega ka lähtepunkt. Liigume paremale, et saavutada x ja allapoole vasakul negatiivsete väärtuste suhtes x.

Teine paar meie paaris on y-koordinaat. See on vertikaalne kaugus x-teljest. Alates algsest punktist x-aksi, liikuge ülespoole, et saada positiivsed väärtused y ja alla negatiivsete väärtuste jaoks y.

Seejärel tähistatakse asukoht meie graafikul punktiga. Kordame seda protsessi ikka ja jälle oma andmekogumi iga punkti puhul. Tulemuseks on punktide hajumine, mis annab hajumispiirkonnale oma nime.

Selgitavad ja vastused

Üks oluline juhis, mis alles jääb, on olla ettevaatlik, milline muutuja on teljel. Kui meie paarisandmed koosnevad selgitavad ja vastused sidumisega, siis näidatakse seletav muutuja x-teljel. Kui mõlemat muutujat peetakse seletavaks, võime valida, kumb tuleb x-teljel joonistada ja milline y-aks.

Scatterploti omadused

Jaotusplaadil on mitu olulist omadust. Neid tunnuseid tuvastades saame meie andmebaasi kohta rohkem teavet. Nende funktsioonide hulka kuuluvad:

  • Meie muutujate üldine trend. Kui me loeme vasakult paremale, siis milline on see pilt? Kas ülespoole suunatud muster, allapoole või tsükliline?
  • Mis tahes kõrvalekalded üldisest trendist. Kas need on meie ülejäänud andmete kõrvalekalded või on need mõjukad punktid?
  • Mis tahes suundumuse kuju. Kas see on lineaarne, eksponentsiaalne, logaritmiline või midagi muud?
  • Mis tahes suundumuse tugevus. Kui täpselt sobivad andmed meie tuvastatud üldise mustriga?

Seotud teemad

Lineaarset suundumust omavaid hajutatud graafikuid saab analüüsida statistikameetodi abillineaarne regressioon ja korrelatsioon. Regressiooni saab teostada muud tüüpi mittelineaarsete suundumuste korral.