Kuidas arvutada korrelatsioonikoefitsienti

Jaotusplaani vaadates on palju küsimusi. Üks levinumaid on küsimus, kas sirge joon ühtlustab andmeid. Sellele vastuse leidmiseks on olemas kirjeldav statistika, mida nimetatakse korrelatsioonikordajaks. Näeme, kuidas seda statistikat arvutada.

Korrelatsioonikordaja

korrelatsioonikordaja, tähistatud r, ütleb meile, kui täpselt andmed a-s asuvad hajuvusdiagramm kukkuda sirgjoont pidi. Mida lähemal see on absoluutväärtus of r on üks, seda parem, kui andmeid kirjeldatakse lineaarse võrrandiga. Kui r = 1 või r = -1 siis on andmekogum ideaalselt joondatud. Andmekogumid väärtustega r nullilähedane näitab vähest sirgjoonelist suhet või puudub see üldse.

Pikkade arvutuste tõttu on kõige parem arvutada r kalkulaatori või statistilise tarkvara abil. Kuid alati tasub proovida teada, mida teie kalkulaator arvutamisel teeb. Järgnevalt arvutatakse korrelatsioonikoefitsient peamiselt käsitsi, kasutades rutiinsete aritmeetikaetappide jaoks kalkulaatorit.

Arvutamise sammud r

Alustuseks loetleme korrelatsioonikordaja arvutamise sammud. Andmed, millega me töötame, on

instagram viewer
paarisandmed, mille iga paari tähistatakse (xi, yi).

  1. Alustame mõne esialgse arvutusega. Nendest arvutustest saadud koguseid kasutatakse järgmistes arvutustes: r:
    1. Arvutage x̄, tähendama kõigi andmete esimestest koordinaatidest xi.
    2. Arvutage ȳ, kõigi andmete teise koordinaadi keskmine
    3. yi.
    4. Arvutama s x proov standardhälve kõigi andmete esimestest koordinaatidest xi.
    5. Arvutama s y andmete kõigi teise koordinaadi näidisstandardhälve yi.
  2. Kasutage valemit (zx)i = (xi - x̄) / s x ja arvutage iga standarditud väärtus xi.
  3. Kasutage valemit (zy)i = (yi – ȳ) / s y ja arvutage iga standarditud väärtus yi.
  4. Korrutage vastavad standardiseeritud väärtused: (zx)i(zy)i
  5. Lisage viimase sammu tooted kokku.
  6. Jagage summa eelmisest sammust väärtusega n - 1, kus n on meie paarisandmete komplekti punktide koguarv. Selle kõige tulemus on korrelatsioonikordaja r.

See protsess pole raske ja iga samm on üsna rutiinne, kuid kõigi nende toimingute kogumine on üsna kaasatud. Standardhälbe arvutamine on üksi piisavalt tüütu. Kuid korrelatsioonikoefitsiendi arvutamine hõlmab lisaks kahele standardhälbele ka paljusid muid toiminguid.

Näide

Et täpselt näha, kuidas r saadakse, vaatame näidet. Jällegi on oluline märkida, et praktiliste rakenduste jaoks tahaksime arvutamiseks kasutada kalkulaatorit või statistilist tarkvara r meile.

Alustame paarisandmete loetlemist: (1, 1), (2, 3), (4, 5), (5,7). Keskmine väärtus x väärtuste korral on 1, 2, 4 ja 5 keskmine x̄ = 3. Samuti on meil ȳ = 4. Standardhälve

x väärtused on sx = 1,83 ja sy = 2.58. Allpool esitatud tabel võtab kokku muud arvutuste tegemiseks vajalikud arvutused r. Parempoolsemas veerus olevate toodete summa on 2,969848. Kuna punkte on kokku neli ja 4 - 1 = 3, jagame toodete summa 3-ga. See annab meile korrelatsioonikordaja r = 2.969848/3 = 0.989949.

Tabel korrelatsioonikordaja arvutamise näite kohta

x y zx zy zxzy
1 1 -1.09544503 -1.161894958 1.272792057
2 3 -0.547722515 -0.387298319 0.212132009
4 5 0.547722515 0.387298319 0.212132009
5 7 1.09544503 1.161894958 1.272792057
instagram story viewer