Jaotusjaotus on teatud tüüpi graafik, mida kasutatakse esitamiseks paarisandmed. Selgitav muutuja joonistatakse piki horisontaaltelge ja reageerimismuutuja joonistatakse piki vertikaaltelge. Seda tüüpi graafiku kasutamise üheks põhjuseks on seoste otsimine muutujate vahel.
Kõige elementaarsem muster, mida paaritud andmete kogumis otsida, on sirge. Mis tahes kahe punkti kaudu saame tõmmata sirgjoone. Kui meie hajaasustuses on rohkem kui kaks punkti, ei suuda me enam enam joont tõmmata, mis läbib iga punkti. Selle asemel tõmbame joone, mis läbib punktide keskpunkti ja kuvab andmete üldise lineaarse trendi.
Kui vaatame oma graafiku punkte ja soovime nendest punktidest piiri tõmmata, tekib küsimus. Millise joone peaksime tõmbama? Joonistada saab lõputult palju ridu. Ainuüksi meie silmi kasutades on selge, et iga hajaasustust vaatav inimene võiks tekitada pisut erineva joone. See ebaselgus on probleem. Tahame, et kõigil oleks täpselt määratletud viis sama joone saamiseks. Eesmärk on saada matemaatiliselt täpne kirjeldus, milline joon tuleks tõmmata. Kõige vähem ruute
regressioonijoon on üks selline joon meie andmepunktide kaudu.Vähimad ruudud
Väikseimate ruutude rea nimi selgitab, mida see teeb. Alustame punktide kogumisega, mille koordinaadid on andnud (xi, yi). Kõik sirged liiguvad nende punktide vahel ja lähevad neist üle või alla. Saame arvutada kauguse nendest punktidest jooneni, valides väärtuse x ja seejärel lahutatakse vaadeldav y sellele vastavat koordinaati x alates y meie joone koordinaat.
Sama punktide komplekti läbivad erinevad jooned annaksid erineva vahemaade komplekti. Me tahame, et need vahemaad oleksid võimalikult väikesed. Kuid probleem on olemas. Kuna meie vahemaad võivad olla kas positiivsed või negatiivsed, tühistab kõigi nende vahemaade summa kokku teineteise. Vahemaade summa on alati võrdne nulliga.
Selle probleemi lahendus on kõrvaldada kõik negatiivsed numbrid, jagades punktide ja joone vahelised kaugused. See annab mittenegatiivsete numbrite kogumi. Meie eesmärk leida kõige sobivam joon on sama, mis teha nende ruutvahede summa võimalikult väikseks. Calculus tuleb siia appi. Diferentseerimise protsess arvutamisel võimaldab minimeerida ruutkauguste summa antud joonest. See selgitab selle rea fraasi “kõige vähem ruute” meie nimes.
Parima sobivuse rida
Kuna väikseima ruuduga joon minimeerib joone ja meie punktide vahelised ruudukujulised kaugused, võime mõelda sellele joonele, mis sobib kõige paremini meie andmetega. Seetõttu tuntakse kõige väiksemate ruutude joont ka kõige sobivamana. Kõigist võimalikest joontest, mida saab tõmmata, on väikseima ruudu joon kõige lähemal andmekogule tervikuna. See võib tähendada, et meie rida ei suuda ühtegi meie andmestiku punkti tabada.
Väikseimate ruutude joone omadused
Igal väikseima ruudu joonel on mõned funktsioonid. Esimene huvipakkuv teema käsitleb meie rea kallakut. Kallakul on ühendus korrelatsioonikordaja meie andmetest. Tegelikult on joone kalle võrdne r (sy/ sx). Siin s x tähistab standardhälvet x koordinaadid ja s y - standardhälve; y meie andmete koordinaadid. Korrelatsioonikordaja märk on otseselt seotud meie kõige väiksemate ruutude joone kalde tähisega.
Veel üks väikseimate ruutude joon on seotud punktiga, mille see läbib. Samal ajal kui y väikseimate ruutude joone pealtkuulamine ei pruugi olla statistiliselt huvitav, on üks punkt, mis on. Iga väikseima ruudu joon läbib andmete keskpunkti. Sellel keskpunktil on x koordinaat, mis on tähendama selle x väärtused ja a y koordinaat, mis on y väärtused.