Juhuslike järjestuste test

Arvestades a andmete jada, võib küsida, kas jada toimus juhuslikult või pole andmed juhuslikud. Juhuslikkust on raske tuvastada, kuna on väga raske lihtsalt andmeid vaadata ja otsustada, kas need on toodetud ainult juhuslikult. Üht meetodit, mille abil saab kindlaks teha, kas jada on tõesti juhuslikult toimunud, nimetatakse jooksutestiks.

Jooksukatse on olulisuse test või hüpoteesi test. Selle testi protseduur põhineb konkreetse tunnusega andmete käitamisel või järjestusel. Jooksukatse toimimise mõistmiseks peame kõigepealt uurima raja mõistet.

Andmete jadad

Alustuseks vaatame jooksude näidet. Mõelge järgmisele juhuslike numbrite jadale:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Üks viis nende numbrite klassifitseerimiseks on jagada need kahte kategooriasse, kas paarituteks (sealhulgas numbrid 0, 2, 4, 6 ja 8) või paarituteks (sealhulgas numbrid 1, 3, 5, 7 ja 9). Vaatleme juhuslike numbrite jada ja tähistame paarisarvu E-na ja paaritu arvu O-ga:

E E O E E O O E O E E E E E O E E O

Jooksud on lihtsamini mõistetavad, kui kirjutame selle ümber nii, et kõik O-d on koos ja kõik Es-id on koos:

instagram viewer

EE O EE OO E OEEEEEE O O EE OO

Loendame paaris- või paaritu arvu plokkide arvu ja näeme, et andmeid on kokku kümme korda. Neli rada on ühe pikkusega, viiel pikkusega kaks ja ühel pikkusega viis

Tingimused

Mis tahes olulisuse test, on oluline teada, millised tingimused on testi läbiviimiseks vajalikud. Käivitustesti jaoks saame klassifitseerida iga valimi andmeväärtuse ühte kahest kategooriast. Loendame käitamiste koguarvu igasse kategooriasse kuuluvate andmeväärtuste arvu suhtes.

Katse saab olema a kahepoolne test. Põhjus on see, et liiga vähe käitamisi tähendavad, et tõenäoliselt pole piisavalt varieerumist ja juhuslikust protsessist tulenevate käitamiste arv. Kui protsess vahetub kategooriate vahel liiga sageli, et seda juhuslikult kirjeldada, on tulemuseks liiga palju sõite.

Hüpoteesid ja P-väärtused

Igal olulisuse testil on a null ja alternatiivne hüpotees. Jooksutesti jaoks on nullhüpotees, et jada on juhuslik jada. Alternatiivne hüpotees on, et valimis sisalduvate andmete jada ei ole juhuslik.

Statistiline tarkvara suudab arvutada: p-väärtus mis vastab konkreetsele testistatistikale. Samuti on olemas tabeleid, mis annavad kriitilisi numbreid teatud tasemel olulisuse tase võistluste koguarvu kohta.

Töötab testi näite

Töötame järgmise näite läbi, et näha, kuidas töötab test. Oletame, et ülesande täitmisel palutakse üliõpilasel 16 korda mündi pöörata ja märkida üles ilmunud pead ja sabad. Kui lõpetame selle andmekogumiga:

H T H H H T T H T T H T H T H H

Võime küsida, kas õpilane tegi kodutööd tegelikult või peteti ja kirjutati üles H ja T seeria, mis näevad juhuslikud välja? Jooksukatse võib meid aidata. Jooksukatse eeldused on täidetud, kuna andmeid saab liigitada kahte rühma - kas pea või saba. Jätkame jooksude arvu arvestamisega. Ümbergrupeerimisel näeme järgmist:

H T HHH TT H TT H T H T HH

Meie andmetel on kümme sõitu, kus seitse saba on üheksa pead.

Nullhüpotees on, et andmed on juhuslikud. Alternatiiv on see, et see pole juhuslik. Kui alfa olulisuse väärtus on 0,05, näeme õige tabeli abil, et lükkame tagasi hüpoteesi nullist, kui käikude arv on alla 4 või suurem kui 16. Kuna meie andmetes on kümme tiraaži, siis meie ei suuda tagasi lükata nullhüpotees H0.

Tavaline lähendamine

Käitamistest on kasulik tööriist, et teha kindlaks, kas jada on tõenäoliselt juhuslik või mitte. Suure andmehulga jaoks on mõnikord võimalik kasutada tavalist lähendit. See normaalne lähend nõuab, et me kasutaksime igas kategoorias elementide arvu ja arvutaksime siis vastava väärtuse keskmise ja standardhälbe. normaalne jaotus.