üldisi eetilise uurimuse põhimõtteid, samas on aga selge, et andmeanalüütik, kes tegutseb poliitikakujundamise eesmärgil, ei suuda alati ette ennustada, millist infot täpselt võidakse koguda ning kuidas see võib hiljem osalejat mõjutada (Creswell, Creswell 2018; Fisher, Anushko 2012). Näiteks võivad tekkida selged õiguslikud või sotsiaalsed tagajärjed juhul, kui info uuritavate kohta peaks avalikuks muutuma (nt info terviseseisundi kohta, nagu nakatumine HIV-ga, võib oluliselt mõjutada suhtumist ja kaasa tuua sotsiaalse tõrjutuse; kuritegevust uurides võib avalikuks muutunud info kaasa tuua õiguslikke tagajärgi). Paratamatult tekivad siin riived selliste väärtustega nagu läbipaistvus (transparency) ja hoolsuskohustus (beneficence) ehk kohustus maksimeerida uuringuga saadavat kasu ja minimeerida kahju.
Probleemid muutuvad veelgi komplitseeritumaks juhul, kui tegemist ei ole sotsiaalteaduslike uurimustega, vaid hoopis erasektori kogutud andmega. Kui avalikus sektoris on tänu õiguslikele regulatsioonidele võimalik veidi lihtsamalt aru saada, millised andmed on riigil isiku kohta olemas, kellel on neile juurdepääs ja millistel tingimustel on võimalik seda infot kolmandatele osapooltele edastada, siis erasektoris ei ole info jagamine olnud alati nii selge. Kliendiandmete kogumine ja müük teistele ettevõtetele, sellest tulenevad suunatud reklaamid ja müügikõned ning võimalikud privaatsuseriived ei ole alati üksikisiku poolt kontrollitavad ega ka hoomatavad. Keeruline on aru saada, et andmed, mis oleme teadlikult andnud näiteks poodides kliendikaarti registreerides (telefoninumber, e-posti aadress) ja mis ei ole just salastatud info, võidakse edasi müüa ja see võib kaasa tuua tagajärgi, mida alguses ei teadvustatud. Selles situatsioonis on eriti haavatavad näiteks eakad, kes ei suuda pealetükkivate müügikõnedega toime tulla. Jällegi tekib küsimus nii süsteemi ja andmete kasutamise läbipaistvusest kui ka osapoolte vastutusest (nii andmete müüjad kui ka ostjad). Selliseid vastuolulisi arusaamu ideaalides ja väärtustes on uuringutes nimetatud ka algoritmiliseks lõheks (Männiste, Masso 2020).
Sotsiaalteadustele omaselt võib oluline probleem olla ka andmete tõlgendamine. See, milliseid andmeid järelduste ja soovituste tegemisel kaasata ning kuidas neid tõlgendada, ei ole absoluutne ega ka mitte tingimata objektiivne. Kui eespool on mainitud uuringu rahastaja võimalikku survet ja sellest tulenevat huvide konflikti (Fisher, Anushko 2012; May 2011), siis tegelik osapoolte skaala on veidi laiem. Näiteks on poliitikate kujundamisel sageli mitu osapoolt, kelle ettekujutuses võib andmete põhjal jutustatav lugu suuresti erineda, lähtuvalt sellest, millise huvigrupi esindajatega on tegemist. Riigi julgeoleku eest seisjad võivad pooldada suuremat juurdepääsu andmetele selleks, et teha paremaid otsuseid ja võimalikke rünnakuid ennetada; inimeste privaatsuse ja põhiõiguste kaitsjad aga pooldavad pigem väiksemat juurdepääsu ja suuremat eelkontrolli. Kuid see, kelle lugu ja eesmärke peaks uurimuse kavandamisel ja andmete analüüsil arvesse võtma, ei ole ühemõtteline (vt ka ptk 4.2). Kui võtta näiteks poliitikaanalüüsid, siis ei ole kindel, kas arvestama peaks ühiskonnaga laiemalt, konkreetse avaliku teenuse klientidega (või nende alarühmadega), muude sidusgruppidega, teenuse eest vastutava valitsusasutusega, käesoleva hetke valitsuskoalitsiooni partneritega või hoopis kellegi muuga (Rossi et al. 2019: 295). Kui hindamiskriteeriumiks on asjakohasus (relevance) ja kasulikkus (utility), siis on ehk kõige parem aluseks võtta poliitika sihtgrupi või avaliku teenuse kliendi perspektiiv – kas püstitatud eesmärk lähtub tegelikest vajadustest ja kas poliitika aitab probleemi lahendada. Kui aga hindamiskriteeriumiks on tõhusus (efficiency), siis võib kasulik olla pigem elluviimise eest vastutava institutsiooni seisukoht. Küsimusele, milline lähtekoht aluseks võtta, ei ole õiget-valet vastust; pigem on küsimus selles, kas see on selgelt välja öeldud ja analüüsitulemuste kasutajale arusaadav.
Väärtuste kujundamise alusena on eelkõige kolm peamist võimalust: 1) metodoloogiline objektiivsus ja läbipaistvus (analytical integrity), 2) vastutus kliendi (ehk tellija, nt riigiasutuse) ees ja 3) analüütiku enda arusaam heast ühiskonnast (Weimer, Vining 2005: 41–43). Neist esimene rõhutab analüütiku rolli „objektiivse tehnikuna“, kelle ülesanne on võimalikult igakülgselt identifitseerida olulised hindamiskriteeriumid ja andmed ning neid ka võimalikult objektiivselt tõlgendada, lähtuvalt kõnealuse valdkonna parimast praktikast. Eesmärk on anda analüüsi kliendile (tellijale) võimalikult täpne hinnang või prognoos, tuua välja kõik valikukohad, jättes valikud kliendi teha. Teise variandi puhul on analüütiku ülesanne anda küll kliendile igakülgset infot, kuid tõlgendada vaieldavaid olukordi kliendi kasuks või lähtuvalt tema perspektiivist. Primaarseks väärtuseks on siinkohal analüütiku lojaalsus kliendile ning isiklike seisukohtade tagaplaanile jätmine. Kolmanda variandi puhul aga identifitseerib analüütik end pigem poliitikaprobleemi edendajana või konkreetse sihtgrupi kaitsjana ning seega protsessi osapoolena. Seega tõlgendatakse vaieldavad andmed lähtuvalt sihtgrupist või eesmärgist ning lojaalsus on suunatud neile, mitte kliendile.
Paratamatult kujuneb valik variantide vahel mitme osapoole koosmõjul. Faktoriteks võivad olla nii analüüsi tellija surve, analüütiku organisatsiooniline kuuluvus kui ka analüütiku enda väärtushinnangud. Analüüsi tellija surve on sageli seotud eespool mainitud rahastamisega. Organisatsiooniline kuuluvus võib analüüsi raames ette kirjutada ka konkreetse (poliitilis-ideoloogilise) vaatenurga (nt poliitikat analüüsivad mõttekeskused (thinktanks), mis on seotud ühe erakonna ja ideoloogiaga), mille kaudu kõiki andmeid tõlgendatakse. Juhul kui selline organisatsiooniline surve või tellija suunis puudub, on üha suurem mõju analüütiku enda seisukohtadel, sealhulgas sellel, kui oluline uuritav teema talle isiklikult on (nt kui analüüsitakse ühiskondlikku probleemi, millega on olemas isiklik seos, vs. juhtumid, kus isiklik seos puudub) ning kuidas see tema objektiivsust mõjutab.
Seega ei saa väärtusaluste aspektist kõrvale jätta analüütiku enesereflektsiooni – teadlikku mõtestatud valikut väärtuste vahel, mis suunavad järelduste tegemist ja soovituste andmist. Andmepõhise otsustamise ja analüütiku enesereflektsiooni kombineerimise vajadus otsuste tegemisel on viinud andmeõigluse printsiipide sõnastamiseni, millest töös andmetega lähtutakse.
1.1.5. Andmeõiglus andmeanalüütiku töös
Vajadus sõnastada sotsiaalse õigluse põhimõtted, mis sobiksid tööks andmetega, tulenes andmelahenduste loomise arengust, kus andmetehnoloogia looja huvid ja väärtused kaldusid domineerima üksikisiku huvide üle. Näiteks on algoritmid, mudelid ja sotsiaalne profileerimine kasutusel kindlustuse müümisel, laenuotsuste tegemisel, suunatud reklaamides ja kuriteoennetuses.
Optimistlikult hinnates on profileerimise eesmärk teha kiiremaid ja paremaid otsuseid ning pakkuda sobivamaid teenuseid, lähtudes andmemassiivis märgatud seaduspärasustest. Algoritmid lihtsustavad, ühtlustavad ja kiirendavad otsuste tegemist eriti olukorras, kus otsuste hulk on liiga suur, et võimaldada ettevõttel või riigiasutusel teha individuaalseid otsuseid, seega on need tänapäevases maailmas mõneti paratamatud (vt nt Kearns, Roth 2019). Riigi perspektiivist võib see parandada otsusprotsessi (nt kes suunata esmajärjekorras tööturuteenuste sihtgruppi, ennetamaks pikaajalist töötust; milliste ettevõtete ja üksikisikute tuludeklaratsioone põhjalikumalt kontrollida, et avastada võimalikke maksupettusi; millisesse piirkonda saata rohkem politseinikke, et kuritegevust ennetada) ning tagada piiratud ressursside tõhusama kasutamise. Üksikisikule võib see tähendada võimalust perioodiliseks arstlikuks kontrolliks või seda, et muusikaplatvormid pakuvad tema eelistustega sobivat muusikat. Samas võib see aga kaasa tuua sagedasemat kinnipidamist liikluses või pidevat sattumist „juhuvalikusse“ lennujaama turvakontrollis, kõrgemat hinda kindlustust ostes või raskusi kodulaenu saamisel.
Vajadused ja võimalused kasutada andmeid organisatsiooni muutuste juhtimiseks ja poliitika kujundamiseks ning tekkivad küsimused seoses poliitiliste, sotsiaalsete ja eetiliste väärtustega, mida andmed endas kannavad, on tõstatanud küsimuse andmeõiglusest. Andmeõigluse idee lähtub klassikalisest sotsiaalse õigluse kontseptsioonist ning püstitab küsimuse, kas ja kuivõrd need sõnastatud õigused ja vabadused on rakendatavad andmetehnoloogiate kasutamise ja loomise kontekstis ehk kuidas on võimalik „õigluse tagamine viisil, et inimesed ja nende vajadused on nähtavad, esindatud ja õiglaselt koheldud nende toodetud digitaalsete andmete tulemusena“ (Taylor 2017: 1).
Andmeõigluse idee pöörab tähelepanu levinud probleemile, et üldiste seaduspärasuste