Usaldusvahemikud saab kasutada mitme rahvaarvu hindamiseks parameetrid. Üks tüüpi parameetreid, mida saab kasutada kasutades järeldatav statistika on rahvaarv. Näiteks võime teada saada USA elanikkonna protsenti, kes toetab konkreetset õigusakti. Seda tüüpi küsimuste jaoks peame leidma usaldusvahemiku.
Selles artiklis näeme, kuidas luua usaldusvahemik elanikkonna osakaalu jaoks, ja uurime mõnda selle aluseks olevat teooriat.
Üldine raamistik
Alustame suure pildi vaatamist enne, kui oleme jõudnud spetsiifikani. Usaldusvahemiku tüüp, mida me kaalume, on järgmine:
Hinnanguline +/- veamarginaal
See tähendab, et peame määrama kaks numbrit. Need väärtused on hinnang soovitud parameetri kohta koos vea ülemmääraga.
Tingimused
Enne mis tahes statistilise testi või protseduuri tegemist on oluline veenduda, et kõik tingimused on täidetud. Elanikkonna osakaalu usaldusvahemiku saamiseks peame tagama, et järgitaks järgmist:
- Meil on lihtne juhuslik valim suurusest n suurest elanikkonnast
- Meie isikud on valitud üksteisest sõltumatult.
- Meie valimis on vähemalt 15 õnnestumist ja 15 ebaõnnestumist.
Kui viimane element ei ole rahul, siis võib olla võimalik meie valimit pisut kohandada ja kasutada a pluss neli usaldusvahemikku. Järgnevas osas eeldame, et kõik ülaltoodud tingimused on täidetud.
Valimi ja populatsiooni proportsioonid
Alustame oma rahvaarvu prognoosimisega. Nii nagu rahvaarvu keskmise hindamiseks kasutame valimi keskmist, kasutame populatsiooni osakaalu hindamiseks valimi osa. Rahvastiku osakaal on tundmatu parameeter. Valimi osa on statistika. See statistika leitakse, kui loendatakse meie valimis õnnestumiste arv ja jagatakse seejärel valimis olevate indiviidide koguarvuga.
Rahvastiku osakaalu tähistatakse numbriga lk ja on iseenesestmõistetav. Valimi osa märkimine on pisut rohkem seotud. Valimisuhet tähistame kui p read ja loeme seda sümbolit kui "p-mütsi", kuna see näeb välja nagu täht lk mütsiga peal.
Sellest saab meie usaldusvahemiku esimene osa. P hinnanguline väärtus on p̂.
Valimi jaotamine valimi proportsioonides
Veamarginaali valemi määramiseks peame mõtlema järgmisele: valimi jaotus p̂-st. Peame teadma keskmist, standardhälvet ja konkreetset jaotust, millega me töötame.
P̂ valimi jaotus on binoomjaotus edukuse tõenäosusega lk ja n kohtuprotsessid. Seda tüüpi juhusliku muutuja keskmine on lk ja standardhälve (lk(1 - lk)/n)0.5. Sellel on kaks probleemi.
Esimene probleem on see, et binoomjaotusega võib olla väga keeruline töötada. Faktoriaalide olemasolu võib põhjustada mõne väga suure arvu. See on koht, kus tingimused meid abistavad. Kuni meie tingimused on täidetud, saame binoomjaotust hinnata tavalise normaaljaotusega.
Teine probleem on see, et kasutatakse p̂ standardhälvet lk selle määratluses. Tundmatu populatsiooni parameetri hindamiseks kasutatakse sama parameetrit, kasutades vea ülemmäära. See ümmargune arutluskäik on probleem, mis tuleb lahendada.
Väljapääs sellest mõttest on asendada standardhälve selle standardveaga. Standardvead põhinevad statistikal, mitte parameetritel. Standardhälbe hindamiseks kasutatakse standardviga. See strateegia väärib seda, et me ei pea enam parameetri väärtust teadma lk.
Valem
Standardvea kasutamiseks asendame tundmatu parameetri lk statistilise p̂-ga. Tulemuseks on järgmine rahvaarvu usaldusvahemiku valem:
p̂ +/- z * (p̂ (1 - p̂) /n)0.5.
Siin väärtus z * määrab meie enesekindluse tase C. Normaalse normaaljaotuse jaoks täpselt C % normaalsest normaaljaotusest jääb vahemikku -z * ja z *. Ühised väärtused z * hõlmavad 1,645 90% usaldusnivoo ja 1,96 95% kindluse korral.
Näide
Vaatame, kuidas see meetod näitega töötab. Oletame, et soovime 95-protsendilise kindlustundega teada valimisprotsendi protsenti maakonnas, kus ennast peetakse demokraatlikuks. Viime selle maakonna 100 inimese juhusliku juhuvalimi ja leiame, et 64 neist on demokraat.
Me näeme, et kõik tingimused on täidetud. Meie rahvastiku osakaal on hinnanguliselt 64/100 = 0,64. See on valimi proportsiooni p̂ väärtus ja see on meie usaldusvahemiku keskpunkt.
Vea piir koosneb kahest tükist. Esimene on z*. Nagu me ütlesime, on 95% usaldusnivoo puhul väärtuseks z* = 1.96.
Teine osa veamarginaalist on esitatud valemiga (p̂ (1 - p̂) /n)0.5. Valisime p̂ = 0,64 ja arvutame = standardviga on (0,64 (0,36) / 100)0.5 = 0.048.
Korrutame need kaks arvu kokku ja saame vea ülemmääraks 0.09408. Lõpptulemus on:
0.64 +/- 0.09408,
või võime selle ümber kirjutada kui 54,592% kuni 73,408%. Seega oleme 95% kindlad, et demokraatide tegelik rahvaarv on kuskil nende protsentide vahemikus. See tähendab, et pikas perspektiivis haarab meie tehnika ja valem rahvaarvu 95% ajast.
Seotud ideed
Seda tüüpi usaldusvahemikuga on seotud mitmeid ideid ja teemasid. Näiteks võiksime läbi viia hüpoteesi testi, mis puudutab elanikkonna osakaalu väärtust. Võiksime võrrelda ka kahe erineva populatsiooni kahte proportsiooni.