Teisese andmeanalüüsi mõiste ja näited

Teisene andmete analüüs on kellegi teise kogutud andmete analüüs. Allpool vaatame üle sekundaarsete andmete määratluse, kuidas teadlased neid saavad kasutada, ja seda tüüpi uuringute plusse ja miinuseid.

Peamised võtmed: teisene andmete analüüs

  • Esmased andmed osutavad andmetele, mille teadlased on ise kogunud, teisesed andmed aga andmetele, mille on kogunud keegi teine.
  • Teisene teave on saadaval mitmesugustest allikatest, näiteks valitsustest ja teadusasutustest.
  • Teiseste andmete kasutamine võib olla säästlikum, kuid olemasolevad andmekogumid ei pruugi vastata kõigile teadlase küsimustele.

Esmaste ja sekundaarsete andmete võrdlus

Ühiskonnaõpetuse uuringutes on terminid esmased andmed ja sekundaarsed andmed levinud. Algandmeid kogub teadlane või teadlaste meeskond vaadeldava konkreetse eesmärgi või analüüsi jaoks. Siin kavandab ja töötab uurimisrühm välja uurimisprojekti, otsustab: proovivõtu tehnika, kogub andmeid, mis on mõeldud konkreetsete küsimuste lahendamiseks, ja analüüsib kogutud andmeid ise. Sel juhul tunnevad andmeanalüüsi kaasatud inimesed teadustöö kavandamise ja andmete kogumise protsessi.

instagram viewer

Teisene andmete analüüsteiselt poolt on andmete kasutamine, mis kogus keegi teine ​​muul eesmärgil. Sel juhul esitab teadlane küsimusi, millele vastatakse selliste andmekogumite analüüsi kaudu, mille kogumisega nad ei tegelenud. Andmeid ei kogutud teadlase konkreetsetele uurimisküsimustele vastamiseks ja need koguti hoopis muul eesmärgil. See tähendab, et sama andmekogum võib tegelikult olla ühe uurija jaoks primaarne andmekogum ja teise jaoks sekundaarne andmekogum.

Sekundaarsete andmete kasutamine

Enne sekundaarsete andmete kasutamist analüüsis tuleb ära teha mõned olulised asjad. Kuna teadlane andmeid ei kogunud, on oluline, et ta tutvuks andmekogumiga: kuidas andmeid koguti, millised on iga vastuse kategooriad küsimus, kas analüüsi ajal tuleb kaalusid rakendada või mitte, kas klastrite või kihistumise osas tuleb arvestada, kes oli uuritav populatsioon ja rohkem.

Suur hulk teiseseid andmeressursse ja andmekogumeid on saadaval sotsioloogilisteks uuringuteks, millest paljud on avalikud ja hõlpsasti juurdepääsetavad. Ameerika Ühendriikide loendus, Üldine sotsiaaluuring, ja Ameerika kogukonna uuring on mõned kõige sagedamini kasutatavad sekundaarsed andmekogumid.

Teisese andmeanalüüsi eelised

Teisese andmete kasutamise suurim eelis on see, et see võib olla säästlikum. Keegi teine ​​on andmed juba kogunud, nii et teadlane ei pea sellele uurimisfaasile raha, aega, energiat ja ressursse pühendama. Mõnikord tuleb teisene andmekogum osta, kuid kulud on peaaegu alati madalamad kui sarnase kogumise kulud andmekogum nullist, mis tavaliselt hõlmab palku, reisimist ja transporti, kontoriruume, seadmeid ja muid üldkulusid kulud. Lisaks, kuna andmeid juba kogutakse ja tavaliselt puhastatakse ning säilitatakse elektroonilisel kujul, saab teadlane veeta suurema osa ajast andmete analüüsimine selle asemel, et andmed analüüsi jaoks valmis saada.

Teisese andmete kasutamise teine ​​peamine eelis on saadaolevate andmete laius. Föderaalvalitsus viib läbi arvukalt uuringuid suures üleriigilises plaanis, mida üksikutel teadlastel oleks keeruline koguda. Paljud neist andmekogumitest on ka pikisuunaline, mis tähendab, et sama populatsiooni kohta on kogutud samu andmeid mitme erineva ajavahemiku jooksul. See võimaldab teadlastel vaadata suundumusi ja nähtuste muutusi aja jooksul.

Teisene andmete kasutamise kolmas oluline eelis on see, et andmekogumisprotsess hoiab sageli taset asjatundlikkust ja professionaalsust, mis ei pruugi olla üksikute teadlaste või väikeste uurimisprojektide korral. Näiteks koguvad paljude föderaalsete andmekogumite jaoks andmeid spetsialiseerunud töötajad teatud ülesannete täitmisel ja neil on selles valdkonnas ja selle konkreetse uuringu käigus mitmeaastane kogemus. Paljudel väiksematel teadusprojektidel pole seda teadmiste taset, kuna osalise tööajaga töötavad üliõpilased koguvad palju andmeid.

Teisese andmeanalüüsi puudused

Teiseste andmete kasutamisel on suur puudus see, et see ei pruugi vastata teadlase konkreetsetele uurimisküsimustele ega sisaldada konkreetset teavet, mida teadlane soovib. Samuti ei pruukinud seda koguda soovitud geograafilises piirkonnas või soovitud aastate jooksul või konkreetse elanikkonnaga, mida teadlane uurida soovib. Näiteks noorukite uurimisest huvitatud teadlane võib leida, et teisene andmekogum hõlmab ainult noori täiskasvanuid.

Kuna teadlane andmeid ei kogunud, ei ole neil ka kontrolli selle üle, mis selles andmekogumis sisaldub. Sageli võib see analüüsi piirata või muuta algseid küsimusi, millele uurija vastust otsis. Näiteks võib õnne ja optimismi uuriv teadlane leida, et teisene andmekogum sisaldab ainult ühte neist muutujad, kuid mitte mõlemad.

Seotud probleem on see, et muutujad võisid olla määratletud või liigitatud erinevalt kui teadlane oleks valinud. Näiteks võib vanus olla kogutud kategooriatesse, mitte pideva muutujana, või võidakse rass määratleda kui „valge“ ja „muu“, selle asemel, et sisaldada kategooriaid iga suurema võistluse jaoks.

Teine oluline andmete puudus sekundaarsete andmete kasutamisel on see, et teadlane ei tea täpselt, kuidas andmete kogumise protsess toimus või kui hästi see läbi viidi. Teadlasel pole tavaliselt teavet selle kohta, kui tõsiselt mõjutavad andmeid sellised probleemid nagu madal vastamismäär või vastajate arusaamatus konkreetsete küsitlusküsimuste korral. Mõnikord on see teave hõlpsasti kättesaadav, nagu paljude föderaalsete andmekogumite puhul. Paljude muude sekundaarsete andmekogumitega seda tüüpi teave siiski puudub ja analüütik peab õppima lugema ridade vahel, et avastada andmete võimalikud piirangud.