René Mõttus

Intelligentsuse psühholoogia


Скачать книгу

kuhu me jõuda tahtsime – korrelatsioonikordajani. Just standardiseeritud kovariatsioonikordaja ongi Pearsoni korrelatsioon, mida tihti tähistatakse väikese r-tähega.

      Vaatame veel kord eelnevat näidet, et leida pikkuse ja kehakaalu korrelatsioon. Kõigepealt arvutame pikkuse ja kehakaalu standardhälbed (0,20 ja 24,09) ning seejärel jagame kovariatsioonikordaja standardhälvete korrutisega, r = 3,57/(0,2 × 24,09) = 0,74. Saame veel kord öelda, et uuritavate inimeste puhul valitseb pikkuse ja kehakaalu vahel ootuspäraselt positiivne korrelatsioon: mida pikem on inimene, seda suurem kaldub olema ka tema kehakaal.

      Tegelikult tuleb siinkohal teha üks täpsustus: sellisel moel leitud korrelatsioon sobib tõepoolest hästi vaadeldud andmetes olnud tunnuste seose kirjeldamiseks. Enamasti aga soovitakse ühes andmestikus leitud seoste põhjal teha järeldusi suurema hulga inimeste (nt populatsiooni) kohta. Selleks asendatakse eeltoodud valemites tunnusepaaride (ehk inimeste) arv vabadusastmete arvuga. Selle mõiste sisu täpsemalt lahti seletamata võtame teadmiseks, et korrelatsiooni arvutamisel on vabadusastmete arv võrdne väärtusega, mille saame, lahutades paaride arvust (n) ühe (seega n – 1). Mida suurem on korrelatsiooni arvutamise aluseks olnud tunnusepaaride arv, seda vähem paaride arvu vabadusastmete arvuga asendamine tulemust mõjutab. Teisisõnu, seda lähemal on meie valimilt leitud seos eeldatavasti populatsioonis kehtivale seosele. See on igati arukas eeldus, sest mida suurem on valim, seda suurema tõenäosusega esindab see populatsiooni.

      Soovides eelnevas näites leitud korrelatsioonikordajat üldistada populatsioonile, asendame kovariatsiooni valemis paaride arvu vabadusastmete arvuga ning saame populatsioonile üldistatud korrelatsiooniks r = 0,87. Et meie valim oli väga väike, siis on populatsioonikorrelatsioon tunduvalt suurem kui meie valimil leitu, suurema valimi puhul poleks aga niivõrd suurt hüpet tulnud.

      Järgnevalt on toodud korrelatsiooni arvutamise valem lõplikul kujul:

      Ülaltoodud valemis tähistab rxy muutujate x ja y korrelatsiooni, n – tunnusepaaride arvu (nt inimeste arvu valimis), i = 1, 2, … n, ẍ ja ȳ vastavalt muutujate x ja y keskmisi, ning sx ja sy vastavalt muutujate x ja y standardhälbeid.

      Korrelatsiooni kaks omadust

      Lineaarsete seoste korral on ühe tunnuse väärtus prognoositav teise tunnuse väärtusest sirgjooneliselt: ühe tunnuse muutudes X ühiku võrra muutub teine tunnus a0+a1X, kusjuures a0 ja a1on konstandid. Tegelikkuses on tunnuste seosed mõnikord teistsugused. Näiteks võib ühe tunnuse väärtuse suurenedes teise tunnuse väärtus kasvada eksponentsiaalselt ehk järjest suurema kiirusega või logaritmiliselt ehk järjest väikesema kiirusega. Viimase olukorra lihtsustatud näitena võime vaadelda laste vanuse ning teadmiste kasvu seost: esimese paari eluaastaga kasvab lapse teadmiste ja oskuste hulk tohutu kiirusega (iga aastaga palju kordi), hiljem aga suureneb teadmiste hulk järjest tagasihoidlikuma tempoga (nt on vähe usutav, et 17aastasel oleks poole rohkem verbaalseid oskusi ja teadmisi kui 16aastasel, võrreldes 1aastast vastsündinuga on see aga mõeldav). Selliseid seoseid ei pruugi korrelatsioonikordaja kõige täpsemini kirjeldada. Muidugi on võimalik tunnuseid enne korrelatsiooni arvutamist sobival moel kohandada (nt astendada) ning seeläbi seosed lineaarseks muuta, ent siis on seda tarvis ka tõlgendamisel eraldi silmas pidada.

      Teiseks, korrelatsioon ei muutu, kui tunnuseid lineaarselt teisendada. Näites liites ühe tunnuse kõikidele väärtustele 6 ning korrutades selle summa läbi 82ga jääb korrelatsioon ikka samasuguseks kui enne. Põhjus on siin selles, et hajuvuse muutumisele vaatamata tunnuse üksikväärtuste suhteline paiknemine keskväärtuse suhtes selliste teisenduste tulemusena ei muutu. Kovariatsioonikordaja väärtus küll muutub, ent korrelatsiooniks teisendamise käigus see standardiseeritakse ning nii pole muutunud keskmisel ja standardhälbel enam mingit tähendust. Niisuguse asjaolu praktiline tähendus on see, et ei pea muretsema skaalade pärast, millel uuritavad tunnused paiknevad. Meie eelnevas näites võiksime teisendada pikkuse vabalt meetritest sentimeetriteks, korrelatsioonikordaja väärtus sellest ei muutuks.

      Vahekokkuvõte

      Eelnevat kokku võttes võib öelda, et korrelatsioon (r) on üks lihtsamaid ja universaalsemaid tunnuste lineaarsete seoste väljendamise viise. See kirjeldab kahe paarikaupa vaadeldava tunnuse koosmuutumist, näidates ära nii tunnuste seose suuna kui tugevuse. Korrelatsiooni võlu on selles, et see hindab seost standardsel skaalal, varieerudes vahemikus –1…1. Korrelatsioonikordaja r on 1 siis, kui tunnuste vahel on üksühene samapidine seos, –1 siis, kui tunnuste vahel on üksühene vastupidine seos, ning 0 siis, kui ühe tunnuse väärtuse põhjal pole võimalik ennustada teise tunnuse väärtust. Tegelikult on aga nii, et sotsiaal- ja käitumisteadustes ei leita peaaegu kunagi korrelatsioone, mille absoluutväärtus oleks 1. Isegi 0,90 ringis olevat absoluutväärtust tuleb ette üliharva. Kas see tähendab, et saadud tulemustel on harva mingi tähendus? Hoopiski mitte. Järgmises alaosas vaatame lähemalt mõningaid põhimõtteid, kuidas korrelatsiooni tugevust enda jaoks lahti mõtestada.

      KORRELATSIOONI TÕLGENDAMINE

      Paljud statistikakursused ja – õpikud annavad lugejale kaasa Jacob Coheni õpetussõnad (Cohen, 1988), mis ütleb, et korrelatsioonid, mis on suuremad kui 0,50, on tugevad, vahemikus 0,30–0,50 mõõdukad, vahemikus 0,10–0,30 väikesed ja alla 0,10 tühised või triviaalsed. Lugedes aga sotsioloogide, psühholoogide ja teiste sotsiaalteadlaste tekste, võib leida, et ühe jaoks on korrelatsioon 0,30 nõrk, teise jaoks keskmine ja mõne jaoks isegi kõrgeim, mis antud uurimisküsimuse kontekstis üldse olla saab. Näiteks psühholoog Walter Mischel ennustas aastaid tagasi (muide ekslikult!), et ükski isiksuse skoor ei saa olla seotud mingi välise kriteeriumiga tugevama korrelatsiooniga kui 0,30. Seega oleks iga korrelatsioon, mis on 0,30 lähedal või üle selle, väga tugev.

      Korrelatsiooni tugevust või nõrkust ei määra tema arvuline suurus, vaid sisuline tõlgendus ja kontekst, milles seda vaadeldakse. Erinevates olukordades ja erisuguse tõlgenduse korral võib üks ja seesama korrelatsioon olla tõepoolest nii nõrk, mõõdukas kui ka tugev. Seega tuleb Coheni tugevuseskaalat võtta vaid väga ligikaudse orientiirina, mis võib abiks olla siis, kui puuduvad igasugused teised taustandmed, mis võiksid aidata saadud korrelatsiooni tugevust hinnata.

      Hinnang korrelatsioonile

      Niisiis, ühele ja samale korrelatsioonikordaja numbrilisele väärtusele on võimalik anda üsna erinevaid hinnanguid. Ühes olukorras võib korrelatsioon absoluutväärtusega 0,80 tunduda nõrk, mõnes teises olukorras aga võib ka korrelatsioonikordaja 0,30 teadlased rõõmust rõkkama panna. Tundub veider? Tegelikult mitte: korrelatsiooni väärtuse sisulisel hindamisel tuleb lähtuda kontekstist. Ilma tausta arvestamata polegi korrelatsioonikordajast palju kasu.

      Näiteks üks tegur, mis mõjutab korrelatsiooni suurusele antavat hinnangut, on uuritavate nähtuste iseloom. Kui näiteks inimesed sooritavad kaks pikka ja põhjalikku intelligentsustesti, on igati põhjendatud ootus, et kahe testi tulemuste korrelatsiooni väärtus oleks kõrge. Eeldatavasti peaksid need kaks testi ju mõõtma ühte ja sama asja. Samuti võiks intelligentsustesti skoor olla tugevas korrelatsioonis ülikoolikandidaatide valikul kasutatava akadeemilise võimekuse testiga – seegi mõõdab inimeste teadmisi ja võimeid, ehkki pisut kitsamas tähenduses. Intelligentsustesti skoori ja sissetuleku seost uurides võiksime aga olla rahul ka korrelatsioonikordaja tunduvalt madalama väärtusega ning pidada sedagi sisulises mõttes tugevaks. Intelligentsus ja sissetulek ei ole ju kaugelt üks ja seesama asi. Ehkki intelligentsuse tase on sissetulekuga tõenäoliselt üsnagi tugevas korrelatsioonis (vt peatükki „Intelligentsus ja edukus”), mõjutavad sissetulekut ootuspäraselt veel mitmed muud, intelligentsuse tasemest täiesti sõltumatud tegurid. Veelgi nõrgema korrelatsiooniga peaksime aga tõenäoliselt leppima siis, kui uuriksime mõne spetsiifilise ajuparameetri – näiteks mõne ajukoes oleva keemilise ühendi hulga – seost inimeste sissetulekuga. Need kaks nähtust on olemuslikult teineteisest väga erinevad. Samas võib ka statistiliselt väike seos kahe sedalaadi tunnuse vahel olla teadlastele äärmiselt informatiivne: teades