Paarisandmed statistikas, mida sageli nimetatakse järjestatud paarideks, viitavad populatsiooni indiviidide kahele muutujale, mis on omavahel seotud, et teha kindlaks nendevaheline korrelatsioon. Selleks, et andmekogumit saaks käsitada paarisandmetena, peavad mõlemad need andmeväärtused olema üksteisega seotud või omavahel seotud ega tohi neid eraldi käsitleda.
Paariste andmete idee vastandub tavalisele ühe numbri seostamisele iga andmepunktiga nagu teisteski kvantitatiivsed andmed seab nii, et iga üksik andmepunkt on seotud kahe numbriga, pakkudes graafikut, mis võimaldab statistikutel jälgida nende muutujate suhet populatsioonis.
Seda paarisandmete meetodit kasutatakse juhul, kui uuringus loodetakse võrrelda kahte muutujat populatsiooni üksikisikute vahel, et teha täheldatud korrelatsioonist mingisugune järeldus. Nende andmepunktide vaatlemisel on oluline sidumisjärjestus, sest esimene number on ühe asja mõõt, teine aga millegi täiesti erineva mõõt.
Näide paarisandmetest
Paariste andmete näite nägemiseks oletagem, et õpetaja loeb iga õpilase jaoks kodutööde arvu konkreetse ühiku jaoks sisse lülitatud ja siis paaristab selle arvu iga õpilase protsendiga ühikatses. Paarid on järgmised:
- 10 ülesannet täitnud isik teenis testis 95%. (10, 95%)
- 5 ülesannet täitnud isik teenis testis 80%. (5, 80%)
- 9 ülesannet täitnud isik teenis testis 85%. (9, 85%)
- 2 ülesannet täitnud isik teenis testis 50%. (2, 50%)
- 5 ülesannet täitnud isik teenis testiga 60%. (5, 60%)
- 3 ülesannet täitnud isik teenis testis 70%. (3, 70%)
Kõigis neis seotud andmekomplektides näeme, et määramiste arv on alati esikohal tellitud paar, samal ajal kui testis teenitud protsent on teine, nagu nähtub esimesest astmest (10, 95%).
Ehkki nende andmete statistilist analüüsi saaks kasutada ka keskmiste arvude arvutamiseks kodused ülesanded täidetud või keskmine testi tulemus, võib olla muid küsimusi andmed. Sel juhul soovib õpetaja teada saada, kas kodutööde arvu vahel on mingit seost sisse lülitatud ja testi täitnud ning õpetajal oleks vaja sellele vastamiseks andmed siduda küsimus.
Paarisandmete analüüsimine
statistilised tehnikad kohta korrelatsioon ja regressiooni kasutatakse paarisandmete analüüsimiseks, kus korrelatsioonikordaja kvantifitseerib, kui tihedalt asuvad andmed sirgjooneliselt, ja mõõdab lineaarse seose tugevust.
Regressiooni seevastu kasutatakse mitme rakenduse jaoks, sealhulgas määramaks, milline rida sobib meie andmestiku jaoks kõige paremini. Seda rida saab omakorda kasutada hinnangu andmiseks või ennustamiseks y väärtused väärtused x mis ei olnud osa meie algsest andmekogust.
On olemas spetsiaalne graafikutüüp, mis sobib eriti hästi paariandmete jaoks, mida nimetatakse hajutatud graafikuks. Selles graafiku tüüp, tähistab üks koordinaattelg seotud andmete ühte kogust, teine koordinaattelg aga seotud andmete teist kogust.
Ülaltoodud andmete hajutatud graafikul oleks x-telg tähistatud sisse lülitatud ülesannete arvu, y-telg aga ühiktesti tulemusi.