Anto Aasa, Mare Ainsaar, Mai Beilmann, Marju Himma Muischnek,

Kuidas mõista andmestunud maailma


Скачать книгу

al. 2019). Kui kriitiline realism lähtub metodoloogilise pluralismi ideest ja toob uurimisprotsessis kesksele kohale inimese kui aktiivse toimija (agency), siis pragmatism soovitab varasemate kvalitatiivsete vs. kvantitatiivsete või andmetest tuletatud (data-driven) vs. interpretatiivsete käsitluste ning „lõpliku tõe“ otsimise asemel lähtuda „lõpliku kasulikkuse“ põhimõttest. Mõlemal juhul soovitatakse (uurimis)probleemide lahendamiseks kasutada segameetodeid, kus konkreetsete analüütiliste sammude asemel lähtutakse algsest uurimisküsimusest, probleemiseadest ja uurimuse eesmärkidest. Nende diskussioonide ja käesolevas raamatus esitatud praktiliste Eesti näidete varal oleme pakkunud andmestunud maailma uurimise üheksanda postulaadi: uurimistööks sobivate meetodite valikul on paradigmasõdade asemel mõistlik lähtuda kasulikkuse põhimõttest.

      Andmestumise mõistmine eeldab nii andmesubjektiga arvestamist kui ka andmetöötaja või uurija refleksiivse võimekuse arendamist, hindamaks andmete kogumise ja analüüsiprotsessi asjakohasust. Ka siinses kogumikus oleme pidanud oluliseks rõhutada uurija refleksiivsust, mistõttu on sellele pühendatud kogumiku kuues osa, mis keskendub meetoditele, mille keskmes on iseteadlik ja teovõimeline inimene. Rakendades kriitilise realismi põhimõtteid andmestumisele, muutuvad andmeprotsessis oluliseks ka aktiivsed andmekodanikud – indiviidid, kellel on võimalik avatud andmete abil andmesubjektide huve kaitsta ja ka ise analüütilisse tegevusse panustada. Selline tõusev andmeaktivism (Milan, Velden 2016) või uued andmekodakondsuse vormid (Hintz et al. 2019) annavad muu hulgas võimaluse kodanikuosaluse täiustamiseks. Eeltoodust ajendatult oleme sõnastanud andmestunud maailma uurimise kümnenda postulaadi: uurija refleksiivsus ehk kriitiline võime hinnata oma tegevuse tagajärgi on oluline valikute tegemisel andmete, meetodite ja tõlgendusviiside mitmekesisuse kontekstis, uuringu ühiskondliku kasu tagamisel ning võimalike kahjude vältimisel.

      Soovime rõhutada, et andmestunud ühiskonna uurimiseks kogu tema mitmekesisuses peab olema avatud kombineerimisele ning sõltuvalt uuringu eesmärgist võivad olla kasulikud nii digitaalsed, virtuaalsed, arvutuslikud kui ka interpretatiivsed meetodid. Vaatamata nihetele andmetes, meetodites ja ühiskonnas on andmestunud ühiskond endiselt ühiskond, inimesed endiselt inimesed ja sedalaadi komplekssete süsteemide mõtestamiseks on mõistlik kombineerida asjakohaseid meetodeid ning kasutada mitmekesiseid kättesaadavaid tööriistu ja luua uusi. Teooriat on andmeühiskonna mõistmiseks samuti vaja enam kui iial varem.

      Raamatu ülesehitus

      Raamat koosneb 24 sisulisest üksteisega tihedalt seotud peatükist, mis on jaotatud kuude temaatilisse ossa:

      1. Maailma andmestumine

      2. (Suur)andmete mõtestamine

      3. Teksti- ja tajuandmete analüüs

      4. Lugude jutustamine andmetest ja andmetega

      5. Platvormid ja andmetaristud uurimisvahendi ja -objektina

      6. Iseteadlik ja teovõimeline inimene andmeühiskonnas

      Sellise temaatilise jaotusega sõnastame kuus peamist muudatust, mis meie hinnangul andmestumist ja selle uurimist iseloomustavad, ning soovime rõhutada, et ranged meetodite klassifikatsioonid, näiteks kvalitatiivne vs. kvantitatiivne, positivistlik vs. interpretatiivne, ei pruugi andmeühiskonna uurimisel kehtida ning andmestumisega seotud nähtuste mõistmiseks ja selgitamiseks võib olla vajalik rakendada kõiki neid meetodeid. Jaotus koorus välja raamatu koostamise, toimetamise ning kaasautoritega toimunud arutelude ja ühiste põhimõtete otsingute käigus.10

      Raamatu esimene osa „Maailma andmestumine“ keskendub andmeühiskonna uurimise eetilistele, sotsiaalsetele ja õiguslikele nüanssidele. Kas see, et mingi informatsioon on andmeteks muudetav või tehniliselt andmetena kättesaadav, tähendab tingimata, et seda peaks sellisena kasutama? Millised on andmestumise ja andmeanalüütika võimalikud kasud ja kahjud ning kuidas neid kaaluda? Kas kõikide andmetoimingute taga peaks seisma õigluse ja kahju vältimise ideaal? Esimese osa avavad Anu Masso, Triin Vihalemm ja Leno Saarniit peatükiga „Andmepõhine muutuste juhtimine“. Andmepõhine muutuste juhtimine tagab teadlikud otsused, vähendab määramatust ja kiirendab otsuste langetamist. Ohuks on väärtuspõhised eriarvamused, mille vältimiseks soovitavad peatüki autorid lähtuda andmeõigluse  – rakendada sotsiaalse õigluse põhimõtteid andmetöös. Üksikisikute huvide kaitsele keskendub ka järgmine peatükk „Andmete õiguslik kaitse ja kasutamine teadustöös“ (autorid Aleksei Kelli, Irene Kull, Age Värv), mis soovitab teadusuuringu korraldajal arvestada andmetöös peamiselt nelja kaasneva õigusliku aspektiga: 1) vajadus arvestada andmebaasi looja õigustega, 2) vajadus kaitsta isikuandmeid, 3) erandlik õigus kasutada andmeid teadustöö eesmärgil ja 4) nõue andmete kasutamisel kaitsta andmesubjekti huve. Peatükk „Avaandmete kasutusvõimalused ja piirangud“ (autorid Mai Beilmann, Ave Roots) rõhutab, et tänu avaandmetele on kvaliteetsetele andmetele juurdepääs varasemast märksa enamatel inimestel. Teisalt ei sobi andmete avamine kõigile uuringu raames toodetud andmetele ja sellega kaasnevad ka ohud – avaandmete kasutamine eeldab lisaoskusi andmete kvaliteedi hindamiseks ja andmete eetiliseks kasutamiseks. Raamatu esimese osa võtab kokku peatükk „Eetika ja privaatsus“ (autorid Katrin Tiidenberg, Andra Siibak), mille peamine eesmärk on innustada uurijaid ja andmetöötajaid küsima endalt teatud põhimõttelisi küsimusi ning sellest johtuvalt otsustama võimalikult eetilise andmete kogumise, puhastamise, talletamise, analüüsimise ja hävitamise viisi kasuks. Eetika ja privaatsus on ka raamatu kõiki peatükke läbiv ühine teema.

      Raamatu teine osa „(Suur)andmete mõtestamine“ keskendub arvutusliku sotsiaalteaduse nurgakiviks kujunenud andmetele ja meetoditele. Juttu tuleb visualiseerimise abil andmetes leiduvate mustrite hindamisest, tunnusepõhiselt analüüsilt indiviidipõhisele analüüsile (võrgustiku- ja agendipõhise modelleerimise meetodid) liikumisest ning viimastel aastatel sotsiaal- ja humanitaarteaduslikes uuringutes valdavaks muutunud masinõppe meetodite rakendustest. Anto Aasa peatükk „(Suur)andmete visuaalne esitamine“ annab ülevaate visualiseerimistehnikatest, mis aitavad andmeid mõtestada ja neid väärtuslikuks ressursiks muuta. Analüüsi kiiruse ja keerukuse kasvuga, ent ka interaktiivsete visualiseerimisvahendite rohkusega kaasneb üks suurandmete visualiseerimise peamisi kitsaskohti – pakutavate vahendite ülekülluse kontekstis peab uurija suutma teha mõistlikke valikuid värvi- ja sümbolilahenduste osas. Innar Liivi peatükk „Sotsiaalvõrgustike analüüs“ annab detailse ülevaate sotsiaalsete struktuuride tehnikatest, vahenditest ja meetoditest mustrite avastamiseks. Sotsiaalsete võrgustike meetodid aitavad mõista ja leida uudseid lahendusi näiteks sellele, kuidas institutsioonid ja riik inimestega suhtlevad. Sarnaselt sotsiaalvõrgustike meetodiga keskendub ka Kuldar Taveteri peatükk „Agendipõhine modelleerimine“ keerukatele sotsiaalsetele suhtevõrgustikele, milles osalejad ei pruugi käituda ratsionaalselt, mistõttu nende käitumine ei pruugi olla ennustatav. Agendipõhine modelleerimine selgitab keeruliste nähtuste (nt Brexiti mõju majandusele, ingliskeelsete elanike arvu kasvu mõju eesti keele elujõulisusele või koroonaviiruse leviku kiirus) aktiivseid olemeid ehk agente ja nende vastastikust mõju. Raamatu teise osa lõpetab Toomas Kirdi peatükk „Masinõppe meetodid ja rakendused suurandmete töötlemisel“. Peatükis tutvustatud masinõppe meetodeid kasutatakse näiteks klientide ostukorvi analüüsimiseks äriettevõtte müügi suurendamise eesmärgil või inimeste linna kolimise põhjuste selgitamiseks individuaalsete profiilide analüüsi kaudu. Masinõppe leviku ja meetodite paljususe kontekstis on käsitluse peamisteks ülesanneteks kvaliteetsete andmete tagamine, tööprotsessi kiirendavate töövahendite paralleelne kasutamine ja treeningandmete kättesaadavus.

      Kolmas osa „Teksti- ja tajuandmete analüüs“ pakub sissejuhatuse meetoditesse, mis tegelevad struktureerimata (teksti)andmete viimisega struktureeritud kujule. See osa näitab ilmekalt, et andmed võivad tekkida inimeste kognitiivsete ressursside n-ö ekspluateerimise tagajärjel sotsiaalmeedia keskkondades (inimestele meeldivaid emotsioone loovate nn klikitegevuste tulemusel) (Mühlhoff 2019). Teisalt on meil üha enam võimalusi kasutada erinevaid tööriistu samade tajuprotsesside uurimiseks (nt kuidas inimesed tajuvad erinevaid tekste, andmetehnoloogiaid ja neis sisalduvat meelestatust). Selliselt kajastab see osa sotsiaal-