A arvutamine proov dispersioon või standardhälve väljendatakse tavaliselt murdarvuna. Selle murru lugeja hõlmab ruutkeskmiste kõrvalekallete summat. Statistikas, on selle ruutude summa valem järgmine:
Σ (xi - x̄)2
Sümbol x̄ tähistab siin keskmist näidist ja sümbol Σ käsib meil ruutu erinevused kokku liita (xi - x̄) kõigile i.
Kuigi see valem töötab arvutuste jaoks, on olemas samaväärne otsetee valem, mis ei nõua, et me kõigepealt arvutaksime proovi keskmine. See ruutude summa otsetee valem on
Σ (xi2) - (Σ xi)2/n
Siin on muutuja n viitab meie valimis olevate andmepunktide arvule.
Standardvaleminäide
Selle otsetee valemi toimimiseks näeme mõlemat valemit kasutades arvutatud näidet. Oletame, et meie proov on 2, 4, 6, 8. Valimi keskmine on (2 + 4 + 6 + 8) / 4 = 20/4 = 5. Nüüd arvutame iga andmepunkti erinevuse keskmisega 5.
- 2 – 5 = -3
- 4 – 5 = -1
- 6 – 5 = 1
- 8 – 5 = 3
Nüüd ruudutame need numbrid ruutudeks ja liidame need kokku. (-3)2 + (-1)2 + 12 + 32 = 9 + 1 + 1 + 9 = 20.
Otsetee valeminäide
Nüüd kasutame sama andmekomplekti: 2, 4, 6, 8, kasutades otsetee valemit ruutude summa määramiseks. Ristame esmalt iga andmepunkti ruuduga ja liidame need kokku: 2
2 + 42 + 62 + 82 = 4 + 16 + 36 + 64 = 120.Järgmine samm on kõigi andmete liitmine ja ruudu summa kokku: (2 + 4 + 6 + 8)2 = 400. Jagame selle andmepunktide arvuga, et saada 400/4 = 100.
Nüüd lahutame selle arvu 120-st. See annab meile, et ruuthälvete summa on 20. See oli täpselt number, mille me juba teisest valemist leidsime.
Kuidas see töötab?
Paljud inimesed aktsepteerivad valemit nimiväärtuses ja neil pole aimugi, miks see valem töötab. Kasutades natuke algebrat, näeme, miks see otseteevalem on samaväärne tavapärase tavapärase meetodiga ruuthälvete summa arvutamiseks.
Ehkki reaalse maailma andmekogumis võib olla sadu, kui mitte tuhandeid väärtusi, eeldame, et andmestikku on ainult kolm: x1, x2, x3. Siin nähtu võiks laiendada andmekogule, millel on tuhandeid punkte.
Alustuseks peame märkima, et (x1 + x2 + x3) = 3 x̄. Lause Σ (xi - x̄)2 = (x1 - x̄)2 + (x2 - x̄)2 + (x3 - x̄)2.
Nüüd kasutame põhialgebrast fakti, et (a + b)2 = a2 + 2ab + b2. See tähendab, et (x1 - x̄)2 = x12 -2x1 x̄ + x̄2. Teeme seda oma summeerimise ülejäänud kahe tingimuse jaoks ja meil on:
x12 -2x1 x̄ + x̄2 + x22 -2x2 x̄ + x̄2 + x32 -2x3 x̄ + x̄2.
Me korraldame selle ümber ja meil on:
x12+ x22 + x32+ 3x̄2 - 2x̄ (x1 + x2 + x3) .
Uuesti kirjutades (x1 + x2 + x3) = 3x̄ ülaltoodud väärtuseks:
x12+ x22 + x32 - 3x̄2.
Nüüd alates 3x̄2 = (x1+ x2 + x3)2/ 3, meie valem saab:
x12+ x22 + x32 - (x1+ x2 + x3)2/3
Ja see on eespool mainitud üldvalemi erijuhtum:
Σ (xi2) - (Σ xi)2/n
Kas see on tõesti otsetee?
Võib-olla ei tundu see valem tõeliselt otsetee. Lõppude lõpuks näib, et ülaltoodud näites on arvutusi sama palju. Osaliselt on see seotud tõsiasjaga, et vaatasime ainult väikese valimi suurust.
Kui suurendame oma valimi suurust, näeme, et otsetee valem vähendab arvutuste arvu umbes poole võrra. Me ei pea igast andmepunktist keskmist lahutama ja siis tulemust ruutudeks jagama. See vähendab operatsioonide koguarvu märkimisväärselt.