Põhikomponendid ja tegurite analüüs

Põhikomponentide analüüs (PCA) ja faktorianalüüs (FA) on statistilised meetodid, mida kasutatakse andmete vähendamiseks või struktuuri tuvastamiseks. Neid kahte meetodit rakendatakse ühe muutujate komplekti korral, kui teadlane on sellest huvitatud avastades, millised muutujad komplektis moodustavad sidusaid alamhulki, mis on ühest sõltumatult sõltumatud teine. Muutujad, mis on omavahel korrelatsioonis, kuid on teistest muutujate komplektidest suuresti sõltumatud, ühendatakse teguriteks. Need tegurid võimaldavad analüüsi muutujate arvu koondada, ühendades mitu muutujat üheks teguriks.

PCA või FA konkreetsed eesmärgid on kokkuvõtlikult kirjeldada korrelatsioonid vaadeldud muutujate hulgast vähendada suurt hulka vaadeldavaid muutujaid väiksemale arvule teguritele, et saada a regressioonivõrrand alusprotsessi jaoks, kasutades vaadeldavaid muutujaid, või testida teooriat alusprotsesside olemuse kohta.

Näide

Ütleme näiteks, et teadlane on huvitatud kraadiõppurite omaduste uurimisest. Teadlane uurib suurt hulka kraadiõppureid isiksuseomaduste, näiteks motivatsioon, intellektuaalne võime, õpetlik ajalugu, perekonna ajalugu, tervis, füüsilised omadused, jne. Kõiki neid alasid mõõdetakse mitme muutujaga. Seejärel sisestatakse muutujad individuaalselt analüüsi ja uuritakse nendevahelisi seoseid. Analüüsist selgub muutujate korrelatsioonimustrid, mille kohta arvatakse, et need peegeldavad kraadiõppurite käitumist mõjutavaid protsesse. Näiteks ühendavad intellektuaalse võimekuse näitajate mitmed muutujad mõne muutujaga õppest pärit ajaloolistest mõõtmistest, et moodustada intelligentsust mõõtv tegur. Sarnaselt võivad isiksuse mõõtmete muutujad olla ühendatud mõne muutujaga motivatsioonist ja õpetlikest ajaloo mõõtühikud, et moodustada tegur, mis mõõdab, mil määral õpilane eelistab töötada iseseisvalt - iseseisvust faktor.

instagram viewer

Põhikomponentide analüüsi ja faktoranalüüsi etapid

Põhikomponentide analüüsi ja faktoranalüüsi etapid hõlmavad järgmist:

  • Valige ja mõõtke muutujate komplekti.
  • PCA või FA tegemiseks valmistage ette korrelatsioonimaatriks.
  • Lahutage korrelatsioonimaatriksist tegurite kogum.
  • Määrake tegurite arv.
  • Vajadusel tõlgendatavuse suurendamiseks pöörduge tegurite vahel.
  • Tõlgendage tulemusi.
  • Kontrollige tegurite struktuuri, määrates tegurite konstruktiivse kehtivuse.

Põhikomponentide analüüsi ja faktoranalüüsi erinevus

Põhikomponentide analüüs ja faktorianalüüs on sarnased, kuna mõlemat protseduuri kasutatakse muutujate kogumi struktuuri lihtsustamiseks. Kuid analüüsid erinevad mitmel olulisel viisil:

  • PCA-s arvutatakse komponendid algsete muutujate lineaarsete kombinatsioonidena. FA-s määratletakse algsed muutujad tegurite lineaarsete kombinatsioonidena.
  • PCA-s on eesmärk arvestada sama palju koguarvust dispersioon muutujates kui võimalik. FA eesmärk on selgitada muutujate kovariatsioone või korrelatsioone.
  • PCA-d kasutatakse andmete jaotamiseks väiksemaks arvuks komponentideks. FA kasutatakse selleks, et mõista, millised konstruktsioonid on andmete aluseks.

Põhikomponentide analüüsi ja faktoranalüüsi probleemid

PCA ja FA üheks probleemiks on see, et pole ühtegi kriteeriumi muutujat, mille alusel lahendust testida. Teistes statistilistes tehnikates, näiteks diskrimineeriva funktsiooni analüüs, logistiline regressioon, profiilianalüüs ja mitme muutujaga analüüs dispersiooni analüüs, hinnatakse lahenduse järgi, kui hästi see ennustab rühma kuulumist. PCA-s ja FA-s pole lahenduse testimiseks välist kriteeriumi, näiteks rühma kuulumist.

PCA ja FA teine ​​probleem on see, et pärast ekstraheerimist on saadaval lõpmatu arv pöördeid, kõik moodustavad algsetes andmetes sama varieeruvuse, kuid tegur on veidi määratletud erinevad. Lõpliku valiku jätab teadlane oma tõlgenduse ja teadusliku kasulikkuse hindamise põhjal. Teadlased erinevad sageli arvamuse põhjal, milline valik on parim.

Kolmas probleem on see, et FA-d kasutatakse sageli halvasti kavandatud teadusuuringute “päästmiseks”. Kui mõni muu statistiline protseduur ei ole sobiv ega rakendatav, saab andmeid vähemalt faktoranalüüsida. See jätab paljud uskuma, et FA erinevad vormid on seotud lohakate uuringutega.