sobivuse testi chi-ruudu headus on kasulik võrrelda a teoreetiline mudel vaadeldud andmetele. See test on tüüp üldisemast chi-square testist. Nagu kõigi matemaatika või statistika teemade puhul, võib ka toimuva mõistmiseks olla abiks näite läbitöötamine, näites sobivuse testi chi-square väärtust.
Mõelge standardpakile piimašokolaadiga M & Ms. Värve on kuus: punane, oranž, kollane, roheline, sinine ja pruun. Oletame, et tunneme huvi nende värvide jaotuse vastu ja küsime, kas kõik kuus värvi esinevad võrdses osas? See on seda tüüpi küsimus, millele saab vastata sobivuse testiga.
Seadistamine
Alustuseks märkame seadet ja seda, miks sobivuse test on sobiv. Meie värvuse muutuja on kategooriline. Sellel muutujal on kuus taset, mis vastavad kuuele võimalikule värvile. Eeldame, et meie poolt arvestatavad M & Ms on lihtne juhuslik valim kõigi M & Ms populatsioonist.
Null- ja alternatiivsed hüpoteesid
null- ja alternatiivhüpoteesid meie sobivuse testi jaoks peegeldame eeldust, mille me rahvaarvu kohta teeme. Kuna me katsetame, kas värvid esinevad võrdsetes osades, on meie nullhüpotees, et kõik värvid esinevad samas proportsioonis. Ametlikumalt, kui
lk1 on punaste kommide rahvaarv lk2 on oranžide kommide elanike osakaal jne, siis on nullhüpotees selline lk1 = lk2 =... = lk6 = 1/6.Alternatiivne hüpotees on, et vähemalt üks populatsiooni proportsioonidest ei ole võrdne 1/6-ga.
Tegelik ja eeldatav arv
Tegelik arv on kommide arv iga kuue värvi jaoks. Eeldatav arv viitab sellele, mida me eeldaksime, kui nullhüpotees vastab tõele. Me laseme n olgu meie valimi suurus. Punaste kommide eeldatav arv on lk1 n või n/6. Tegelikult on selle näite puhul eeldatav kommide arv iga kuue värvi jaoks lihtsalt n korda lkivõi n/6.
Chi-square statistiline sobivus
Nüüd arvutame chi-ruudu statistika konkreetse näite jaoks. Oletame, et meil on lihtne 600 M&M kommi juhuslik proov, mille jaotus on järgmine:
- 212 kommidest on sinised.
- 147 kommidest on oranžid.
- 103 kommi on rohelised.
- 50 kommi on punased.
- 46 kommi on kollased.
- 42 kommidest on pruunid.
Kui nullhüpotees oleks tõene, siis oleks kõigi nende värvide eeldatav loendus (1/6) x 600 = 100. Nüüd kasutame seda chi-ruudu statistika arvutamisel.
Me arvutame panuse meie statistikasse iga värvi järgi. Kõik neist on kujul (tegelik - eeldatav)2/Expected.:
- Sinise jaoks on meil (212–100)2/100 = 125.44
- Apelsini jaoks on meil (147–100)2/100 = 22.09
- Rohelise jaoks on meil (103–100)2/100 = 0.09
- Punase jaoks on meil (50–100)2/100 = 25
- Kollase jaoks on meil (46–100)2/100 = 29.16
- Pruuni jaoks on meil (42–100)2/100 = 33.64
Seejärel liidame kõik need panused kokku ja leiame, et meie ruutude statistika on 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42.
Vabadusastmed
Arv vabadusastmeid sobivuse testi jaoks on see lihtsalt üks väiksem kui meie muutuja tasemete arv. Kuna värve oli kuus, on meil 6 - 1 = 5 vabadusastet.
Chi-ruut tabel ja P-väärtus
Meie arvutatud chi-ruudu statistika 235.42 vastab konkreetsele asukohale viie vabadusastmega chi-ruudu jaotuses. Nüüd vajame a p-väärtus, et määrata testistatistika saamise tõenäosus vähemalt sama äärmuslik kui 235,42, eeldades, et nullhüpotees on tõene.
Selle arvutuse jaoks saab kasutada Microsofti Excelit. Leiame, et meie viie vabadusastmega testi statistika p-väärtus on 7,29 x 10-49. See on äärmiselt väike p-väärtus.
Otsuse reegel
P-väärtuse suuruse põhjal otsustame, kas nullhüpotees lükata tagasi. Kuna meil on väga minimaalne p-väärtus, lükkame tagasi nullhüpoteesi. Me järeldame, et M & Ms ei ole kuue erineva värvi vahel ühtlaselt jaotunud. Ühe konkreetse värvi populatsiooni osakaalu usaldusvahemiku määramiseks võiks kasutada järelanalüüsi.