Bootstrapping on statistiline tehnika, mis kuulub laiemasse proovivõtmise rubriiki. See meetod hõlmab suhteliselt lihtsat protseduuri, kuid seda korratakse nii mitu korda, et see sõltub suuresti arvutiarvestustest. Alglaadimine pakub populatsiooni parameetri hindamiseks muud meetodit kui usaldusvahemikud. Tundub, et alglaadimine töötab nagu võlujõud. Lugege edasi, et näha, kuidas see oma huvitava nime saab.
Bootstrappingu selgitus
Üks eesmärk järeldatav statistika on populatsiooni parameetri väärtuse määramine. Tavaliselt on selle otse mõõtmine liiga kallis või isegi võimatu. Nii et me kasutame statistiline valim. Valime populatsiooni, mõõdame selle valimi statistikat ja kasutame seda statistikat siis, et midagi öelda vastav parameeter elanikkonnast.
Näiteks võiksime šokolaadivabrikus garanteerida, et kommipulkadel on konkreetne toode tähendama kaal. Igat toodetud kommibaari ei ole võimalik kaaluda, seetõttu kasutame 100 kommibaari juhuslikuks valimiseks proovivõtumeetodeid. Arvutame nende 100 kommipulga keskmise ja ütleme, et populatsiooni keskmine jääb vea piiridesse, võrreldes meie valimi keskmisega.
Oletame, et paar kuud hiljem tahame teada suurema täpsusega - või vähem a veamäär - milline oli kommikoti keskmine kaal päeval, mil proovisime tootmisliini. Me ei saa kasutada ka tänapäeva kommikarpe palju muutujaid on pildile sisenenud (erinevad piima-, suhkru- ja kakaoubade partiid, erinevad atmosfääritingimused, erinevad töötajad liinil jne). Kõik, mis meil on alates päevast, mil oleme uudishimulikud, on 100 kaalu. Ilma ajamasinata tagasi sellele päevale näib, et esialgne veamäär on parim, mida võime loota.
Õnneks saame kasutada alglaadimise tehnika. Selles olukorras me juhuslikult proov koos asendamisega 100 teadaolevast kaalust. Seejärel kutsume seda alglaadimise prooviks. Kuna lubame asendamist, pole see alglaadimisproov tõenäoliselt identne meie algse prooviga. Mõni andmepunkt võib olla dubleeritud ja teised algse 100 andmepunkti võib alglaadimisproovis ära jätta. Arvuti abil saab suhteliselt lühikese aja jooksul luua tuhandeid alglaadimisproove.
Näide
Nagu mainitud, peame alglaadimistehnikate tõeliseks kasutamiseks kasutama arvutit. Järgnev numbriline näide aitab protsessi toimimist näidata. Kui alustame valimis 2, 4, 5, 6, 6, siis on kõik järgmised võimalikud alglaadimisproovid:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
Tehnika ajalugu
Bootstrap-tehnika on statistika valdkonnas suhteliselt uus. Esimene kasutusala ilmus 1979. aastal Bradley Efroni väljaandes. Kuna arvutusvõimsus on suurenenud ja odavamaks muutunud, on alglaadimistehnikad laiemalt levinud.
Miks nimi Bootstrapping?
Nimi “bootstrapping” pärineb fraasist “Enda tõstmiseks oma bootstrapsist”. See viitab millelegi, mis on petlik ja võimatu. Proovige nii kõvasti kui võimalik, te ei saa end õhku tõsta, kui tõmbate saabastelt nahatükke.
On olemas mõni matemaatiline teooria, mis õigustab alglaadimise tehnikaid. Bootstrappingu kasutamisel on tunne, et teete võimatut. Ehkki ei tundu, nagu saaksite rahvastikustatistika hinnanguid paremaks muuta, korrates sama valimit ikka ja jälle, saab bootstrapping seda tegelikult teha.