maailma uurimiseks, esitades selleks kümme postulaati (vt tekstikast 2), millest soovitame andmestunud maailma tõlgendamisel ja mõistmisel lähtuda. Postulaatide loomisel tuginesime nii rahvusvahelistele teadusdiskussioonidele, raamatu peatükkides esitletule kui ka meie enda uurimistööst tõusetunud teadmistele.
TEKSTIKAST 2. ANDMESTUNUD MAAILMA UURIMISE POSTULAADID
1. Andmestumine on keeruline protsess, andmesuhted on hierarhilised. Andmete loomine, kogumine ja kasutamine on vastastikku sõltuv, keeruline ja läbipõimunud sotsiaalne protsess. Andmetöös on oluline mõista andmete sageli vastuolulistest ja hierarhilistest suhetest läbipõimitud eluteed.
2. Andmestunud maailmas valitsevad võrgustunud seosed. Andmeühiskonna mõistmiseks ei piisa tavapärastest lineaarsetest põhjuslikest tõlgendustest. Andmeühiskonna mõistmiseks on vaja keskenduda võrgustike seostele.
3. Andmetaristu on avalik hüve. Andmete mitmekesisus ja võrdne juurdepääs andmetele on ülioluline. Selle eest peaks võitlema nii andmesubjektid, andmekodanikud, andmeaktivistid, andmetöötajad kui ka andmeühiskonna uurijad.
4. Eetika ja andmeõiglus peaks olema andmestunud ühiskonna alustalad. Andmete kogumine, analüüsimine ja tõlgendamine, aga ka selle tegemata jätmine peab olema andmesubjekti ning ühiskonna seisukohalt eetiline, õiglane ja õigustatud.
5. Kontekst on kuningas. Andmed vajavad alati tõlgendamist. Tõlgendused peavad lähtuma sotsiaal-kultuurilisest kontekstist. Analüüsitulemused on enamasti üldistatavad vaid konkreetses ajas ja ruumis toimuvatele nähtustele.
6. Andmed ei teki iseenesest. Andmetöötajal ja uurijal on aktiivne roll andmekogumise planeerimisel ja andmete kogumisega seotud valikute tegemisel. Kõiki andmeid, mida on võimalik luua või koguda, ei ole tingimata vaja luua või koguda. Andmeid tuleks luua ja tõlgendada lähtuvalt praktilisest vajadusest ning andmeõigluse ja -eetika põhimõtetest.
7. Teooria pole surnud. Andmestunud maailma uurimine algab asjakohase ja haritud küsimuse püstitamisest. Andmete tõlgendamine peab olema dialoogis huvitava nähtuse kohta juba teadaoleva infoga.
8. Käes on metodoloogilise pluralismi aeg. Mõistlik on meetodeid paindlikult ja uurimisküsimusele vastavalt kombineerida.
9. Paradigmasõjad jäägu minevikku. Andmeühiskonna mõistmisel tuleks lähtuda kasulikkuse põhimõttest, ühelgi distsipliinil ei ole andmeühiskonna mõtestamise monopoli. Traditsioonidest ja distsiplinaarsetest erisustest olulisem on uurimisprobleemi pragmaatiline käsitlus.
10. Andmetöötaja või uurija on kõige olulisem epistemoloogiline tööriist. Andmetöötaja või uurija peaks olema iseteadlik ja teovõimeline ning hindama alati kriitiliselt oma tegevuse tagajärgi.
Kui mõni sõnastatud soovitustest on sotsiaal- ja humanitaarteaduslikus uurimistöös ja ka andmestunud ühiskonna uurimisel juba juurdumas (nt andme-eetika), siis mõne põhimõtte konkreetsed rakendusviisid ja lahendused on alles välja kujunemas (nt juurdepääs andmetaristule, andmeõiglus). Nii pakume neile kümnele postulaadile toetudes välja kuus andmestunud maailma mõistmise viisi, mille järgi oleme peatükid koondanud raamatu osadeks: 1) maailma andmestumine, 2) suurandmete mõtestamine, 3) teksti- ja tajuandmete analüüs, 4) andmetega ja andmetest lugude jutustamine, 5) platvormid ja andmetaristud ning 6) andmeühiskonnas tegutsev inimene (vt alajaotus „Raamatu ülesehitus: meetodid, mõtteviisid ja muutused“). Selline jaotus on kahtlemata üks paljudest võimalikest. Seetõttu loodame raamatu koostajate ja kaasautoritena, et diskussioonid andmeühiskonna uurimise parimate lahenduste leidmise nimel jätkuvad.
Lisaks on pakutud postulaadid Eesti kontekstis esimene samm andmestumisega seotud muutuste mõtestamise suunas. Loodame, et see suunab ja toetab andmestumist mõtestavaid tegevusi ja toob kaasa järgnevad sammud nende edasiarendamiseks. Meie hinnangul loob nende kümne põhimõtte ning kuue käsitlusviisi läbikaalumine vundamendi heade andmepõhiste lahenduste loomiseks ning aitab loodetavasti ära hoida soovimatuid tagajärgi.
Järgnevalt tutvustame andmestunud ühiskonna uurimise postulaate ja nendega kaasnevat pisut lähemalt.
Andmestumine ja andmepööre
Käesolevas kogumikus mõistame andmeid ja andmestumist kui ontoloogilist (andmed kui loodud reaalsus või selle konstrueerimise vahend), epistemoloogilist (andmed kui teadmise viis) ja sageli ka ideoloogilist protsessi. Rahvusvahelistes uuringutes on eksperdid defineerinud ühiskonna andmestumist eelkõige kui kõigi ja kõige viimist struktureeritud andmeformaati, mis omakorda võimaldab ja soosib kvantifitseerimist (vt nt Dijck et al. 2018; Schäfer 2016; Lupton 2020). Sageli väidetakse, et andmestumine kaasneb paratamatult teiste maailmas toimuvate muutustega, nagu digitaliseerimine ja võrgustamine.
Lihtsustatult võib väita, et infotehnoloogia vahendusel sooritatud tegevusest jäävad maha „andmepurust rajad“. Ehkki nende teket on paljudes avalikes ja ka professionaalsetes keskusteludes kombeks paratamatuks pidada, soovitavad kriitilised käsitlused (D’Ignazio, Klein 2020) alati küsida, kelle kätte koonduvad andmed, kas sellega kaasneb võimu koondumine, ning kas seesinane koondumine ja seda soosiv süsteem peaks ikka eksisteerima. Eriti aktuaalseks on sellised küsimused muutunud näiteks USA ja Hiina näotuvastustehnoloogiate ja ennustava politseitöö teemalistes vestlustes. Lisaks võiks iga andmeagent (andmete looja, kasutaja, nendega töötav või neid uuriv isik) endalt küsida, kas andmepuru kogumine, arhiveerimine, agregeerimine ja teatud eesmärkidel kasutamine on paratamatu ja vajalik. Kui midagi on võimalik andmeteks muuta, ei tähenda see tingimata, et see on hea idee. Andmestumise protsessilisusest tulenevalt olemegi sõnastanud andmestunud maailma mõistmise esimese postulaadi: andmete loomine, kogumine ja kasutamine on keeruline sotsiaalne protsess, kus andmeanalüütik (andmete põhjal otsustaja) peab arvestama andmete loodud sotsiaalse reaalsusega, sh sageli vastuoluliste ja hierarhiliste andmesuhetega.
Andmete ja ühiskonna vahelised seosed on keerulised. Ühest küljest luuakse andmeid inimeste elus ja ühiskonnas toimuvate protsesside põhjal ning neid kasutatakse samade protsesside analüüsimiseks ja mõtestamiseks; nii vaadates on andmed ühiskonna osa. Teisalt tekivad andmestumise baasilt täiesti uued ühiskondlikud nähtused. Seega on oluline, millisest perspektiivist lähtuvalt tõlgendatakse muutuste selgitamisel andmete ja ühiskonna omavahelist suhet (vt nt Beraldo, Milan 2019) – kas ühiskondlikud protsessid on andmete ja andmetehnoloogiate poolt juhitud (data-driven), andmetel põhinevad (data-based) või andmetest informeeritud (data-informed) (vt ka ptk 1.1). Esimesel juhul eeldatakse, et andmed ja andmetehnoloogiad tingivad teatud nähtusi (näiteks kui algoritmid filtreerivad ja vormivad inimeste juurdepääsu informatsioonile, millel võivad olla laiaulatuslikud sotsiaalsed, poliitilised ja võrdset kohtlemist puudutavad tagajärjed). Teisel juhul on andmed vaid formaalne infrastruktuur, mis loob aluse otsuste tegemiseks, näiteks teadlike valikute tegemisel algoritmide poolt filtreeritud informatsiooni kontekstis. Nii oleme sõnastanud andmestunud maailma uurimise teise postulaadi: võrgustunud ja omavahel tihedas seoses olevad protsessid ei pruugi olla selgitatavad lineaarsete tõlgenduste ja meetodite kaudu, vaid üha enam tuleb tähelepanu pöörata tegutsejate võrgustikule, mis võimaldab selgitada andmestumisega seotud keerukaid nähtusi ja võimalusi mitmetasandiliste ja üksteisega põimunud seoste kaudu.
Ühiskondlikult oluliste tegevuste kvantifitseerimises pole iseenesest midagi uut: valitsejad on maksukogumiseks andmeid kogunud tuhandeid aastaid, kirikud kogusid ja avaldasid aastasadu surnute andmebaase. Ka nende näidete puhul võib väita, et andmesubjektide kohta teadmiste koondamisega kaasnes võimu koondumine nende kätte, kelle kätte koondusid andmed (D’Ignazio, Kelin 2020). Siiski võib tänase andmestumise üheks alguspunktiks märkida arvutustehnoloogiate kasutuselevõtu rahvaloendusandmete töötlemisel. Herman Hollerithi 1890. aastal USA-s välja töötatud arvutusmasin (vt nt Whitby 2020) võimaldas rahvaloenduse tulemustest kokkuvõtte teha mõne kuuga varasema kaheksa aasta asemel. Seega võib andmestumist selgitada lainetena toimuva tehno-sotsiaalse muutusena (Schot, Kanger 2018), mis digitaliseerumise (Archer 2015), meediastumise3