Inventiivse statistika üks suuremaid osi on arvutusviiside väljatöötamine usaldusvahemikud. Usaldusvahemikud annavad meile võimaluse rahvaarvu hindamiseks parameeter. Selle asemel, et öelda, et parameeter võrdub täpse väärtusega, ütleme, et parameeter jääb väärtuste vahemikku. See väärtusvahemik on tavaliselt hinnang, koos veamarginaaliga, mille me hinnangule lisame ja sellest lahutame.
Iga intervalliga on kinnitatud kindlustase. Usaldusväärsuse tase näitab, kui sageli pikaajaliselt meie usaldusvahemiku saamiseks kasutatud meetod tegeliku populatsiooni parameetri kajastab.
Statistika tundmaõppimisel on abiks mõni töötatud näide. Allpool käsitleme mitmeid usaldusvahemike näiteid rahvaarvu keskmise kohta. Näeme, et meetod, mida kasutame usaldusvahemiku kujundamiseks keskmise kohta, sõltub lisateabest meie elanike kohta. Täpsemalt sõltub valitud lähenemisviis sellest, kas me teame elanikkonna standardhälvet või mitte.
Probleemide kirjeldus
Alustame lihtsa juhusliku valimi abil, mis koosneb 25 konkreetsest liigi newtast ja mõõdame nende sabasid. Meie proovi keskmine saba pikkus on 5 cm.
- Kui me teame, et populatsiooni kõigi newttide sabapikkuste standardhälve on 0,2 cm, siis milline on populatsiooni kõigi newttide sabapikkuse keskmine vahemik 90%?
- Kui me teame, et populatsiooni kõigi newttide sabapikkuste standardhälve on 0,2 cm, siis milline on populatsiooni kõigi newttide saba keskmise pikkuse 95% usaldusvahemik?
- Kui leiame, et 0,2 cm on meie proovis olevate kiudainete sabapikkuste standardhälve, siis populatsioonist, siis milline on 90% usaldusvahemik kõigi hiidhaarde keskmiste sabapikkuste osas elanikkond?
- Kui leiame, et 0,2 cm on meie proovis olevate kiudainete sabapikkuste standardhälve, siis populatsioonist, siis milline on 95% usaldusvahemik kõigi hiidhaarde keskmiste sabapikkuste osas elanikkond?
Probleemide arutelu
Alustuseks analüüsime kõiki neid probleeme. Esimeses kahes probleemis me teada elanikkonna standardhälbe väärtust. Nende kahe probleemi erinevus seisneb selles, et usaldusnivoo on # 2 puhul suurem kui # 1 puhul.
Teises kahes probleemis populatsiooni standardhälve pole teada. Nende kahe probleemi korral hindame seda parameetrit valimi abil standardhälve. Nagu nägime kahes esimeses probleemis, on ka siin usaldus erinev.
Lahendused
Arvutame välja lahendused kõigile ülaltoodud probleemidele.
- Kuna me teame populatsiooni standardhälvet, kasutame z-skooride tabelit. Väärtus z mis vastab 90% usaldusvahemikule, on 1,645. Kasutades veamarginaali valem usaldusvahemik on vahemikus 5 - 1,645 (0,2 / 5) kuni 5 + 1,645 (0,2 / 5). (Siin nimetaja 5 on sellepärast, et oleme võtnud ruutjuure 25). Pärast aritmeetika tegemist on populatsiooni keskmise usaldusvahemik 4,934–5,066 cm.
- Kuna me teame populatsiooni standardhälvet, kasutame z-skooride tabelit. Väärtus z mis vastab 95% usaldusvahemikule, on 1,96. Kasutades veamarginaali valemit, on usaldusvahemik vahemikus 5 - 1,96 (0,2 / 5) kuni 5 + 1,96 (0,2 / 5). Pärast aritmeetika teostamist on meil populatsiooni keskmise usaldusvahemik 4,922–5,078 cm.
- Siin ei tea me populatsiooni standardhälvet, ainult valimi standardhälvet. Seega kasutame t-skooride tabelit. Kui kasutame tabelit t hinded, mida peame teadma, kui palju vabadusastmeid meil on. Sel juhul on 24 vabadusastet, mis on ühe võrra väiksem kui valimi suurus 25. Väärtus t mis vastab 90% usaldusvahemikule, on 1,71. Kasutades veamarginaali valemit, on usaldusvahemik vahemikus 5 - 1,71 (0,2 / 5) kuni 5 + 1,71 (0,2 / 5). Pärast aritmeetika tegemist on populatsiooni keskmise usaldusvahemikuna 4,932–5,068 cm.
- Siin ei tea me populatsiooni standardhälvet, ainult valimi standardhälvet. Seega kasutame taas t-skooride tabelit. Seal on 24 vabadusastet, mis on ühe võrra väiksem kui valimi suurus 25. Väärtus t mis vastab 95% usaldusvahemikule, on 2,06. Kasutades veamarginaali valemit, on usaldusvahemik vahemikus 5 - 2,06 (0,2 / 5) kuni 5 + 2,06 (0,2 / 5). Pärast aritmeetika teostamist on meil populatsiooni keskmise usaldusvahemik 4,912–5,082 cm.
Lahenduste arutelu
Nende lahenduste võrdlemisel on mõned asjad. Esimene on see, et mida suurem on meie enesekindluse tase, seda suurem on z või t et me lõpetasime. Põhjus on see, et selleks, et olla kindlamad, kas me tõepoolest hõivasime rahva usalduse intervalli, peame kasutama laiemat intervalli.
Teine omadus, mida tuleb arvestada, on see, et kindla usaldusvahemiku jaoks on need, mis kasutavad t on laiemad kui z. Selle põhjuseks on, et a t jaotuse sabade varieeruvus on suurem kui tavalise normaaljaotuse korral.
Seda tüüpi probleemide õige lahenduse võti on see, et kui me teame elanikkonna standardhälvet, kasutame tabelit z-skoorid. Kui me ei tea elanikkonna standardhälvet, kasutame tabelit t hinded.