Kirjeldavat statistikat on mitmesuguseid. Numbrid nagu keskmine, mediaan, režiim, vildakus, kurtosis, standardhälve, esimene ja kolmas kvartiil, kui nimetada mõnda, räägivad kõik meile midagi meie andmete kohta. Selle asemel, et neid vaadata kirjeldav statistika eraldi, mõnikord aitab nende ühendamine anda meile täieliku pildi. Seda eesmärki silmas pidades on viienumbriline kokkuvõte mugav viis viie kirjeldava statistika ühendamiseks.
Millised viis numbrit?
On selge, et meie kokkuvõttes peab olema viis numbrit, kuid milline viis? Valitud numbrid aitavad meil teada saada meie andmete keskpunkti ja seda, kuidas andmepunktid on jaotatud. Seda silmas pidades koosneb viiekohaline kokkuvõte järgmisest:
- Miinimum - see on meie andmekogumi väikseim väärtus.
- Esimene kvartiil - seda numbrit tähistatakse Q1 ja 25% meie andmetest jääb allapoole esimest kvartalit.
- Mediaan - see on andmete keskpunkt. 50% kõigist andmetest jääb alla mediaani.
- Kolmas kvartiil - seda numbrit tähistatakse Q3 ja 75% meie andmetest jääb kolmanda kvartali alla.
- Maksimaalne - see on meie andmekogumi suurim väärtus.
Keskmist ja standardhälvet saab koos kasutada ka andmete kogumi keskpunkti ja leviku edastamiseks. Mõlemad statistika on vastuvõtlikud kõrvalnäitajatele. Keskmist, esimest kvartiili ja kolmandat kvartiili ei mõjuta kõrvalekalded nii tugevalt.
Näide
Järgmise andmekogu põhjal esitame viie numbri kokkuvõtte:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Andmekogumis on kokku kakskümmend punkti. Mediaan on seega kümnenda ja üheteistkümnenda andmeväärtuse keskmine või:
(7 + 8)/2 = 7.5.
Andmete alumise poole mediaan on esimene kvartiil. Alumine pool on:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Seega arvutameQ1= (4 + 6)/2 = 5.
Algse andmekogumi ülemise poole mediaan on kolmas kvartiil. Peame leidma järgmise mediaani:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Seega arvutameQ3= (15 + 15)/2 = 15.
Me koondame kõik ülaltoodud tulemused kokku ja teatame, et ülaltoodud andmekogumi viie numbri kokkuvõte on 1, 5, 7,5, 12, 20.
Graafiline esitus
Viis numbrikokkuvõtet saab üksteisega võrrelda. Leiame, et kahel sarnaste keskmiste ja standardhälvetega komplektidel võib olla viie numbri kokkuvõtteid väga erinev. Kahe viie numbrikokkuvõtte hõlpsaks võrdlemiseks saame kasutada klahvi a boxplotvõi kasti ja vurride graafik.