Arv vabadusastmeid kahe kategoorilise muutuja sõltumatuse tagamiseks antakse lihtne valem: (r - 1)(c - 1). Siin r on ridade arv ja c on veeru arv veerus kahesuunaline laud kategoorilise muutuja väärtustest. Loe edasi, et selle teema kohta rohkem teada saada ja mõista, miks see valem annab õige numbri.
Taust
Üks samm paljude protsessis hüpoteesitestid on vabadusastmete arvu määramine. See arv on oluline, sest jaoks tõenäosusjaotused mis hõlmavad jaotuste perekonda, nagu näiteks chi-ruutjaotus, kraadide arv vabadus näitab perekonna täpset jaotust, mida peaksime oma hüpoteesis kasutama test.
Vabadusastmed tähistavad vabade valikute arvu, mida saame antud olukorras teha. Üks hüpoteesitestidest, mis nõuab meilt vabadusastmete määramist, on: chi-ruut kahe kategoorilise muutuja iseseisvuse test.
Iseseisvuse testid ja kahesuunalised tabelid
Chi-square sõltumatuse test kutsub meid üles ehitama kahesuunalist lauda, tuntud ka kui situatsioonitabel. Seda tüüpi tabelis on r read ja c veerud, mis tähistavad
r ühe kategoorilise muutuja ja c teise kategoorilise muutuja tasemed. Seega, kui me ei arvesta rida ja veerge, millesse kogusummad registreerime, on neid kokku rc lahtrid kahesuunalises tabelis.Chi-square sõltumatuse test võimaldab meil kontrollida hüpoteesi, et kategooriline muutujad on üksteisest sõltumatud. Nagu me eespool mainisime, r read ja c tabeli veerud annavad meile (r - 1)(c - 1) vabadusastmed. Kuid ei pruugi olla kohe selge, miks see on õige vabadusastmete arv.
Vabadusastmete arv
Et teada saada, miks (r - 1)(c - 1) on õige arv, uurime seda olukorda üksikasjalikumalt. Oletame, et teame meie kategooriliste muutujate iga taseme piirkoguseid. Teisisõnu, me teame iga rea kogusummat ja iga veeru koguarvu. Esimese rea jaoks on olemas c meie tabeli veerge, nii et neid on c rakud. Kui me teame kõigi nende lahtrite, välja arvatud ühe, väärtused, siis kuna me teame kõigi lahtrite koguarvu, on järelejäänud lahtri väärtuse määramine lihtne algebraline probleem. Kui me täidaksime oma tabeli lahtrid, saaksime siseneda c - 1 neist vabalt, kuid siis määratakse järelejäänud lahter rea koguarvu järgi. Seega on olemas c - 1 vabadusaste esimesel real.
Jätkame sel viisil järgmise rea jaoks ja neid on jälle c - 1 vabadusaste. See protsess jätkub, kuni jõuame eelviimasele reale. Iga rida, välja arvatud viimane, annab oma panuse c - 1 vabadusaste kokku. Selleks ajaks, kui meil on kõike muud kui viimane rida, siis kuna me teame veeru summat, saame määrata kõik viimase rea kanded. See annab meile r - 1 rida koos c - 1 vabadusaste kõigis neis kokku (r - 1)(c - 1) vabadusastmed.
Näide
Näeme seda järgmise näitega. Oletame, et meil on kahesuunaliste tabelitega kahesuunaline tabel. Ühel muutujal on kolm taset ja teisel kaks. Lisaks oletame, et teame selle tabeli ridade ja veergude kogusummat:
A-tase | B-tase | Kokku | |
1. tase | 100 | ||
2. tase | 200 | ||
3. tase | 300 | ||
Kokku | 200 | 400 | 600 |
Valem ennustab, et on (3-1) (2-1) = 2 vabadusastet. Me näeme seda järgmiselt. Oletame, et täidame vasakpoolse ülemise lahtri numbriga 80. See määrab automaatselt kogu esimese kirjerea:
A-tase | B-tase | Kokku | |
1. tase | 80 | 20 | 100 |
2. tase | 200 | ||
3. tase | 300 | ||
Kokku | 200 | 400 | 600 |
Kui me teame, et teise rea esimene kanne on 50, siis on ülejäänud tabel täidetud, sest me teame iga rea ja veeru koguarvu:
A-tase | B-tase | Kokku | |
1. tase | 80 | 20 | 100 |
2. tase | 50 | 150 | 200 |
3. tase | 70 | 230 | 300 |
Kokku | 200 | 400 | 600 |
Tabel on täielikult täidetud, kuid meil oli ainult kaks vaba valikut. Kui need väärtused olid teada, määrati ülejäänud tabel täielikult.
Kuigi me ei pea tavaliselt teadma, miks on nii palju vabadusastmeid, on hea teada, et tegelikult rakendame vabadusastmete mõistet lihtsalt uues olukorras.