Näide kahest T-proovi testist ja usaldusvahemikust

Mõnikord on statistikas kasulik näha välja töötatud näiteid probleemidest. Need näited aitavad meil sarnaseid probleeme välja mõelda. Selles artiklis käsitleme järeldatava statistika läbiviimise protsessi tulemuste kohta, mis käsitlevad kahte rahvaarvu. Mitte ainult näeme, kuidas a hüpoteesi test kahe elanikkonna keskmise erinevuse kohta konstrueerime ka a usaldusvahemik selle erinevuse jaoks. Me kasutatavaid meetodeid nimetatakse mõnikord kahe proovi t-testiks ja kahe proovi t usaldusvahemikuks.

Probleemi kirjeldus

Oletame, et soovime testida kooliõpilaste matemaatilist võimekust. Üks küsimus, mis meil võib tekkida, on see, kas kõrgematel astmetel on kõrgemad keskmised testi tulemused.

27-st kolmandast klassist koosnevale lihtsale juhuslikule valimile antakse matemaatikatest, nende vastused hinnatakse ja tulemuste keskmine tulemus on 75 punkti koos valimi standardhälve 3 punktist.

20 viiendast klassist koosnevale lihtsale juhuslikule proovile antakse sama matemaatikatest ja nende vastused antakse hindeks. Viienda klassi õpilaste keskmine tulemus on 84 punkti, valimi standardhälve on 5 punkti.

instagram viewer

Selle stsenaariumi korral esitame järgmised küsimused:

  • Kas valimi andmed annavad meile tõendusmaterjali selle kohta, et kõigi viienda klassi astujate keskmine testi tulemus ületab kõigi kolmandate klasside populatsiooni keskmist testi tulemust?
  • Milline on 95% usaldusvahemik keskmiste ja viienda klassi astujate populatsioonide keskmiste testide erinevustes?

Tingimused ja kord

Peame valima, millist protseduuri kasutada. Seda tehes peame kontrollima ja kontrollima, kas selle protseduuri tingimused on täidetud. Meil palutakse võrrelda kahte rahvaarvu. Üks meetodikogum, mida saab kasutada selleks, on kaheproovilised t-protseduurid.

Nende t-protseduuride kasutamiseks kahe proovi jaoks peame tagama järgmiste tingimuste täitmise:

  • Kahest huvipakkuvast populatsioonist on meil kaks lihtsat juhuslikku valimit.
  • Meie lihtsad juhuslikud valimid ei moodusta rohkem kui 5% elanikkonnast.
  • Need kaks valimit on üksteisest sõltumatud ja katsealuste vahel pole vastavust.
  • Muutuja on tavaliselt jaotatud.
  • Mõlemad populatsioonid ei ole teada nii populatsiooni keskmist väärtust kui ka standardhälvet.

Me näeme, et enamik neist tingimustest on täidetud. Meile öeldi, et meil on lihtsad juhuslikud proovid. Meie uuritav populatsioon on suur, kuna nendes klassitasemetes on miljoneid õpilasi.

Tingimus, mida me ei saa automaatselt eeldada, on see, kui testi tulemusi jagatakse tavaliselt. Kuna meil on piisavalt suur valimi suurus, ei vaja me oma t-protseduuride vastupidavuse tõttu tingimata muutujat normaalseks jaotamiseks.

Kuna tingimused on täidetud, viime läbi paar esialgset arvutust.

Tavaline viga

Standardviga on standardhälbe hinnang. Selle statistika jaoks lisame valimite proovivariandi ja võtame seejärel ruutjuure. See annab valemi:

(s1 2 / n1 + s22 / n2)1/2

Ülaltoodud väärtusi kasutades näeme, et standardvea väärtus on

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Vabadusastmed

Saame kasutada konservatiivset lähendit vabadusastmeid. See võib vabadusastmete arvu alahinnata, kuid seda on palju lihtsam arvutada kui Welchi valemi abil. Kasutame kahest valimi suurusest väiksemat ja lahutame sellest arvust ühe.

Meie näite korral on kahest proovist väiksem 20. See tähendab, et vabadusastmete arv on 20 - 1 = 19.

Hüpoteesi test

Soovime kontrollida hüpoteesi, et viienda klassi õpilaste keskmine testi tulemus on suurem kui kolmandate klasside õpilaste keskmine tulemus. Las μ1 olema kõigi viienda klassi astujate keskmine skoor. Samamoodi lasime μ2 olema kõigi kolmandate klasside elanike keskmine tulemus.

Hüpoteesid on järgmised:

  • H0: μ1 - μ2 = 0
  • Ha: μ1 - μ2 > 0

Testistatistika on erinevus valimi keskmiste vahel, mis jagatakse seejärel standardveaga. Kuna populatsiooni standardhälbe hindamiseks kasutame valimi standardhälbeid, on t-jaotuse testi statistika.

Testimisstatistika väärtus on (84–75) / 1,2583. See on umbes 7.15.

Nüüd määrame selle hüpoteesitesti p-väärtuse. Vaatleme testistatistika väärtust ja seda, kus see asub 19-vabadusastmega t-jaotusel. Selle jaotuse jaoks on meil 4,2 x 10-7 kui meie p-väärtus. (Üks viis selle kindlakstegemiseks on Excelis funktsiooni T.DIST.RT kasutamine.)

Kuna meil on nii väike p-väärtus, lükkame tagasi nullhüpoteesi. Järeldus on, et viienda klassi astujate keskmine testi tulemus on kõrgem kui kolmanda klassi õpilaste keskmise testi tulemus.

Usaldusvahemik

Kuna oleme tuvastanud, et keskmiste hinnete vahel on erinevus, määrame nüüd nende kahe keskmise vahelise erinevuse usaldusvahemiku. Meil on juba palju vajalikku. Erinevuse usaldusvahemikul peab olema nii hinnang kui ka veamäär.

Kahe keskmise erinevuse hinnang on lihtne arvutada. Leiame lihtsalt valimisvahendite erinevuse. See valimi keskmiste erinevus hindab populatsiooni keskmiste erinevust.

Meie andmetel on valimi keskmiste erinevus 84–75 = 9.

Veamarginaali on pisut raskem arvutada. Selleks peame vastava statistika korrutama standardveaga. Vajalik statistika leitakse tabeli või statistilise tarkvara abil.

Jällegi konservatiivset lähendit kasutades on meil 19 vabadusastet. 95% usaldusvahemiku korral näeme, et t* = 2.09. Me võiksime kasutada T.INV funktsioon Excelisl selle väärtuse arvutamiseks.

Panime nüüd kõik kokku ja näeme, et meie veamäär on 2,09 x 1,2583, mis on umbes 2,63. Usaldusvahemik on 9 ± 2,63. Intervall, mille viies ja kolmas klass valisid, on vahemikus 6,37–11,63 punkti.