Vabadusastmed iseseisvuse kahesuunalises tabelis

Arv vabadusastmeid kahe kategoorilise muutuja sõltumatuse tagamiseks antakse lihtne valem: (r - 1)(c - 1). Siin r on ridade arv ja c on veeru arv veerus kahesuunaline laud kategoorilise muutuja väärtustest. Loe edasi, et selle teema kohta rohkem teada saada ja mõista, miks see valem annab õige numbri.

Taust

Üks samm paljude protsessis hüpoteesitestid on vabadusastmete arvu määramine. See arv on oluline, sest jaoks tõenäosusjaotused mis hõlmavad jaotuste perekonda, nagu näiteks chi-ruutjaotus, kraadide arv vabadus näitab perekonna täpset jaotust, mida peaksime oma hüpoteesis kasutama test.

Vabadusastmed tähistavad vabade valikute arvu, mida saame antud olukorras teha. Üks hüpoteesitestidest, mis nõuab meilt vabadusastmete määramist, on: chi-ruut kahe kategoorilise muutuja iseseisvuse test.

Iseseisvuse testid ja kahesuunalised tabelid

Chi-square sõltumatuse test kutsub meid üles ehitama kahesuunalist lauda, tuntud ka kui situatsioonitabel. Seda tüüpi tabelis on r read ja c veerud, mis tähistavad

instagram viewer

r ühe kategoorilise muutuja ja c teise kategoorilise muutuja tasemed. Seega, kui me ei arvesta rida ja veerge, millesse kogusummad registreerime, on neid kokku rc lahtrid kahesuunalises tabelis.

Chi-square sõltumatuse test võimaldab meil kontrollida hüpoteesi, et kategooriline muutujad on üksteisest sõltumatud. Nagu me eespool mainisime, r read ja c tabeli veerud annavad meile (r - 1)(c - 1) vabadusastmed. Kuid ei pruugi olla kohe selge, miks see on õige vabadusastmete arv.

Vabadusastmete arv

Et teada saada, miks (r - 1)(c - 1) on õige arv, uurime seda olukorda üksikasjalikumalt. Oletame, et teame meie kategooriliste muutujate iga taseme piirkoguseid. Teisisõnu, me teame iga rea kogusummat ja iga veeru koguarvu. Esimese rea jaoks on olemas c meie tabeli veerge, nii et neid on c rakud. Kui me teame kõigi nende lahtrite, välja arvatud ühe, väärtused, siis kuna me teame kõigi lahtrite koguarvu, on järelejäänud lahtri väärtuse määramine lihtne algebraline probleem. Kui me täidaksime oma tabeli lahtrid, saaksime siseneda c - 1 neist vabalt, kuid siis määratakse järelejäänud lahter rea koguarvu järgi. Seega on olemas c - 1 vabadusaste esimesel real.

Jätkame sel viisil järgmise rea jaoks ja neid on jälle c - 1 vabadusaste. See protsess jätkub, kuni jõuame eelviimasele reale. Iga rida, välja arvatud viimane, annab oma panuse c - 1 vabadusaste kokku. Selleks ajaks, kui meil on kõike muud kui viimane rida, siis kuna me teame veeru summat, saame määrata kõik viimase rea kanded. See annab meile r - 1 rida koos c - 1 vabadusaste kõigis neis kokku (r - 1)(c - 1) vabadusastmed.

Näide

Näeme seda järgmise näitega. Oletame, et meil on kahesuunaliste tabelitega kahesuunaline tabel. Ühel muutujal on kolm taset ja teisel kaks. Lisaks oletame, et teame selle tabeli ridade ja veergude kogusummat:

A-tase	B-tase	Kokku
1. tase	100
2. tase	200
3. tase	300
Kokku	200	400	600

Valem ennustab, et on (3-1) (2-1) = 2 vabadusastet. Me näeme seda järgmiselt. Oletame, et täidame vasakpoolse ülemise lahtri numbriga 80. See määrab automaatselt kogu esimese kirjerea:

A-tase	B-tase	Kokku
1. tase	80	20	100
2. tase	200
3. tase	300
Kokku	200	400	600

Kui me teame, et teise rea esimene kanne on 50, siis on ülejäänud tabel täidetud, sest me teame iga rea ja veeru koguarvu:

A-tase	B-tase	Kokku
1. tase	80	20	100
2. tase	50	150	200
3. tase	70	230	300
Kokku	200	400	600

Tabel on täielikult täidetud, kuid meil oli ainult kaks vaba valikut. Kui need väärtused olid teada, määrati ülejäänud tabel täielikult.

Kuigi me ei pea tavaliselt teadma, miks on nii palju vabadusastmeid, on hea teada, et tegelikult rakendame vabadusastmete mõistet lihtsalt uues olukorras.