Üks küsimus, mida on alati oluline sisse küsida statistika "Kas vaadeldav tulemus tuleneb ainuüksi juhusest või on see nii statistiliselt oluline? ” Üks klass hüpoteesitestid, mida nimetatakse permutatsioonitestideks, võimaldavad meil seda küsimust testida. Sellise testi ülevaade ja sammud on järgmised:
- Jagasime oma katsealused kontroll- ja katserühmaks. Nullhüpotees on, et nende kahe rühma vahel pole vahet.
- Rakendage katserühmale ravi.
- Mõõtke ravivastust
- Kaaluge katserühma kõiki võimalikke konfiguratsioone ja täheldatud vastust.
- Arvutage p-väärtus, mis põhineb meie täheldatud vastusel kõigi võimalike katserühmade suhtes.
See on permutatsiooni ülevaade. Selle ülevaate täpsustamiseks kulutame aega sellise permutatsioonikatse väljatöötatud näite uurimiseks väga detailselt.
Näide
Oletame, et uurime hiiri. Eriti huvitab meid see, kui kiiresti hiired lõpetavad labürindi, mida nad pole kunagi varem kohanud. Soovime tõestada eksperimentaalset ravi. Eesmärk on näidata, et ravirühma hiired lahendavad labürindi kiiremini kui töötlemata hiired.
Alustame oma teemadega: kuus hiirt. Mugavuse huvides viidatakse hiirtele tähtedega A, B, C, D, E, F. Neist hiirtest kolm valitakse eksperimentaalseks raviks juhuslikult ja ülejäänud kolm pannakse kontrollrühma, milles katsealused saavad platseebot.
Järgmisena valime juhuslikult labürindi käitamiseks hiirte valimise järjekorra. Märgitakse kõigi hiirte labürindi viimistlemiseks kulunud aeg ja arvutatakse iga rühma keskmine.
Oletame, et meie juhuslikus valikus on katserühmas hiired A, C ja E, teistel hiirtel platseebo kontrollrühm. Pärast ravi lõppu valime juhuslikult, kuidas hiired labürindist läbi jooksevad.
Iga hiire jooksuajad on:
- Hiir A juhib võistlust 10 sekundiga
- Hiir B juhib võistlust 12 sekundiga
- Hiir C juhib võistlust 9 sekundiga
- Hiir D juhib võistlust 11 sekundiga
- Hiir E juhib võistluse 11 sekundiga
- Hiir F juhib võistlust 13 sekundiga.
Katserühmas on hiirte labürindi läbimiseks kulunud keskmiselt 10 sekundit. Kontrollrühma kuuluvate labürindi läbimiseks kulub keskmiselt 12 sekundit.
Me võiksime esitada paar küsimust. Kas ravi on tõesti kiirema keskmise aja põhjuseks? Või kas meil kontrolli- ja katserühma valimisel lihtsalt vedas? Ravi ei pruukinud olla mingit mõju ja valisime juhuslikult platseebo saamiseks aeglasemad hiired ja ravi saamiseks kiiremad hiired. Nendele küsimustele aitab vastata permutatsioonitesti.
Hüpoteesid
Meie permutatsioonitesti hüpoteesid on järgmised:
- nullhüpotees on avaldus, et mõju puudub. Selle konkreetse testi jaoks on meil H0: Ravirühmade vahel pole vahet. Kõigi hiirte, keda ei ravita, labürindi kulgemise keskmine aeg on sama kui kõigi hiirte ravi ajal.
- Alternatiivse hüpoteesina püüame tõestada selle kasuks. Sel juhul oleks meil Ha: Kõigi ravitud hiirte keskmine aeg on kiirem kui kõigi hiirte ilma töötlemiseta.
Permutatsioonid
Hiiri on kuus ja katserühmas on kolm kohta. See tähendab, et võimalike katserühmade arv on antud kombinatsioonide arvuga C (6,3) = 6! / (3! 3!) = 20. Ülejäänud isikud kuuluksid kontrollrühma. Nii et on olemas 20 erinevat viisi, kuidas valida juhuslikult inimesi kahte rühma.
A, C ja E määramine katserühmale tehti juhuslikult. Kuna selliseid konfiguratsioone on 20, on A-, C- ja E-spetsiifilise konfiguratsiooni tõenäosus katserühmas 1/20 = 5%.
Peame määrama kõik meie uuringus osalenud eksperimentaalrühma 20 konfiguratsiooni.
- Katserühm: A B C ja kontrollrühm: D E F
- Katserühm: A B D ja kontrollrühm: C E F
- Katserühm: A B E ja kontrollrühm: C D F
- Katserühm: A B F ja kontrollrühm: C D E
- Katserühm: A C D ja kontrollrühm: B E F
- Katserühm: A C E ja kontrollrühm: B D F
- Katserühm: A C F ja kontrollrühm: B D E
- Katserühm: A D E ja kontrollrühm: B C F
- Katserühm: A D F ja kontrollrühm: B C E
- Katserühm: A E F ja kontrollrühm: B C D
- Katserühm: B C D ja kontrollrühm: A E F
- Katserühm: B C E ja kontrollrühm: A D F
- Katserühm: B C F ja kontrollrühm: A D E
- Katserühm: B D E ja kontrollrühm: A C F
- Katserühm: B D F ja kontrollrühm: A C E
- Katserühm: B E F ja kontrollrühm: A C D
- Katserühm: C D E ja kontrollrühm: A B F
- Katserühm: C D F ja kontrollrühm: A B E
- Katserühm: C E F ja kontrollrühm: A B D
- Katserühm: D E F ja kontrollrühm: A B C
Seejärel vaatame läbi iga eksperimentaalse ja kontrollrühma konfiguratsiooni. Arvutame ülaltoodud loendis sisalduva 20 permutatsiooni keskmise. Näiteks esimese puhul on A, B ja C ajad vastavalt 10, 12 ja 9. Nende kolme numbri keskmine on 10,3333. Ka selles esimeses permutatsioonis on D, E ja F ajad vastavalt 11, 11 ja 13. See on keskmiselt 11,6666.
Pärast arvutamist iga rühma keskmine, arvutame nende keskmiste erinevused. Kõik järgnevad vastavad ülalloetletud eksperimentaalse ja kontrollrühma erinevustele.
- Platseebo - ravi = 1,333333333 sekundit
- Platseebo - ravi = 0 sekundit
- Platseebo - ravi = 0 sekundit
- Platseebo - ravi = -1,333333333 sekundit
- Platseebo - ravi = 2 sekundit
- Platseebo - ravi = 2 sekundit
- Platseebo - ravi = 0,6666666667 sekundit
- Platseebo - ravi = 0,6666666667 sekundit
- Platseebo - ravi = -0,666666667 sekundit
- Platseebo - ravi = -0,666666667 sekundit
- Platseebo - ravi = 0,6666666667 sekundit
- Platseebo - ravi = 0,6666666667 sekundit
- Platseebo - ravi = -0,666666667 sekundit
- Platseebo - ravi = -0,666666667 sekundit
- Platseebo - ravi = -2 sekundit
- Platseebo - ravi = -2 sekundit
- Platseebo - ravi = 1,333333333 sekundit
- Platseebo - ravi = 0 sekundit
- Platseebo - ravi = 0 sekundit
- Platseebo - ravi = -1,333333333 sekundit
P-väärtus
Nüüd järjestame ülaltoodud rühmade erinevused iga rühma keskmiste vahel. Tabelitame ka protsendi meie 20 erinevast konfiguratsioonist, mida tähistavad keskmiste erinevused. Näiteks neljal 20-st 20-st ei olnud erinevust kontroll- ja ravirühmade vahel. See moodustab 20% ülalnimetatud 20 konfiguratsioonist.
- -2 10%
- -1,33 10%
- -0,667 20%
- 0 - 20%
- 0,667 - 20%
- 1,33 10%
- 2 10% jaoks.
Võrdleme seda kirjet meie täheldatud tulemusega. Hiirte juhuslik valimine ravi- ja kontrollrühmadesse andis keskmise erinevuse 2 sekundit. Samuti näeme, et see erinevus vastab 10% -le kõigist võimalikest proovidest. Tulemuseks on, et selle uuringu jaoks on meil a p-väärtus 10%.