Karin Kastehein

Eesti infoühiskonna aastaraamat 2011/2012


Скачать книгу

pan EU data portal – data.gov.eu“5,

      • Suurbritannia avatud andmete põhimõtted6,

      • W3C avatud andmete põhimõtted7,

      • Open Government Data avatud andmete arendamisgrupi soovitused8,

      • USA ja UK soovitused OECD-le avaandmete poliitika osas9,

      • OFKN Open Data käsiraamat (juriidika, sotsiaalia, tehnoloogia).

      Paljud riigid, regioonid ja omavalitsused on taaskasutuseks loonud raamistikud ja taaskasutust lihtsustavad portaalid.

      • Euroopa avaandmete koondkataloog http://publicdata.eu

      • USA avaandmete kataloog http://data.gov

      • UK avaandmete kataloog http://data.gov.uk

      • Austraalia avaandmete kataloog http://data.gov.au

      • Kanada avaandmete kataloog http://data.gc.ca

      • Keenia avaandmete kataloog http://opendata.go.ke

      • Norra avaandmete kataloog http://data.norge.no

      • Hollandi avaandmete kataloog http://data.overheid.nl

      • Uus-Meremaa avaandmete kataloog http://data.govt.nz

      • Itaalia avaandmete kataloog http://data.gov.it

      • Prantsusmaa avaandmete kataloog http://data.gouv.fr

      • Rootsi avaandmete kataloog (eraisiku initsiatiivina) http://www.opengov.se

      • Philadelphia piirkonna avaandmete kataloog http://opendataphilly.org

      • Helsingi piirkonna omavalitsuste avaandmed http://www.hri.fi/en

      • CKAN avaandmete kataloog/hoidla http://thedatahub.org

      Kuigi andmete avamine taaskasutuseks toob kaasa tuntava kulu, on poliitikud tunnetanud selle tugevat mõju riigi majandusele ja asunud aktiivselt investeerima avaandmete infrastruktuuri loomisesse ja arendamisesse. USA president Obama kirjutas oma esimesel valitsemispäeval alla avatud ja läbipaistva riigi memorandumile, mille kohaselt avalik sektor avas oma andmed taaskasutuseks. Juba 2011. aasta sügiseks sisaldas USA avaandmete kataloog 390 000 andmehulka.

      Mis on avaandmed?

      Avaandmed ja andmehulgad. Taaskasutuseks publitseeritud andmeid nimetatakse avatud andmeteks (open data) ehk avaandmeteks. Selle all mõistame kõigile avalikult vabalt kasutamiseks antud, veebisaitidest kättesaadavaid, masinloetavas vormingus andmeid ilma kasutamis-, patentide- ja levitamispiiranguteta. Kui seaduses ei ole andmete hankimise eest ette nähtud tasu, saab avaandmeid kätte tasuta ja ilma ligipääsukitsendusteta.

      Taaskasutamiseks sobivad vabavaraliste rakendustega avatavad ja töödeldavad vormingud.

      Avaliku teabe seadus10 kohustab avalikustama avaliku sektori juurdepääsupiiranguteta info asutuse veebisaidi, dokumendiregistri ja andmekogude kaudu. Lisaks lasub avalikul sektoril kohustus väljastada teavet vastavalt esitatud teabenõuetele. Siin räägime avaandmetest kui infost, mis esitatakse avalikkusele proaktiivselt avatud vormingutes. Avaandmete allalaadimise jaoks ei ole üldjuhul vaja teabenõuet esitada.

      Ametkondlikult loodud andmete avalikustamisel on mitu olulist eesmärki, kõige konkreetsem neist on isikute, ettevõtete ja kolmanda sektori huvi kas lihtsalt tutvuda olemasolevate andmetega või kasutada neid oma tarkvararakendustes lisaväärtuse loomiseks mingis valdkonnas.

      Avalikustamisele kuuluvad kõik nii riigiametite kui ka kohalike omavalitsuste loodud andmed, mille avalik kasutus ei ole otseselt keelatud ning mis sisaldavad ka muid andmeid peale isikuandmete. Andmetest, mis sisaldavad nii isikuandmeid kui ka muid andmeid, avalikustatakse ainult viimased.

      Avaandmete kontekstis nimetame terviku moodustavaid andmeid andmehulgaks (dataset). Need võivad olla näiteks lepingutekstid, määruste tekstid, kirjavahetuse metainfo kogud, eelarve- ja statistikafailid, avatud vormingusse konverteeritud andmebaasid/registrid või registritest andmeid väljastavad avatud võrguteenused. Üksikuid lepinguid, määrusi jne ei ole mõistlik käsitleda eraldi andmehulgana, erinevalt üksikust andmebaasist. Mõne andmehulga puhul piisab kasutajale teabele juurdepääsust (lugemiseks, kopeerimiseks), mõne puhul on olemas tugev taaskasutamise huvi. Allpool on valdkonnad järjestatud (vastavalt OECD 2006. aasta analüüsile) taaskasutamisväärtuse kasvavas järjekorras:

      • kultuur (raamatukogud, arhiivid, muuseumid, ringhääling),

      • poliitika (pressiteated, strateegiad, rohelised raamatud),

      • haridus (loengud, õppematerjalid),

      • teadus (ülikoolide, instituutide ja avaliku sektori uuringud),

      • õigusinfo (kohus, õigusaktid, patendid, kaubamärgid, õigused ja kohustused),

      • loodus (bioloogiline, ökoloogiline, geoloogiline ja geofüüsikaline info, teave energiaressurssidest),

      • põllumajandus, mets, kalandus,

      • turism, majutus ja meelelahutus,

      • liiklus, transport,

      • sotsiaalne info (statistika, demograafia, tervis, haridus),

      • majandus ja äri,

      • meteoroloogia, keskkonnainfo,

      • ruumiandmed.

      Avalikustatav andmehulk võib tehnilises mõttes olla nii kogumik inimloetavaid tekstifaile (näiteks seaduste või määruste, ametlike teadete või lepingute kogu) kui ka masinloetavaid andmeid (näiteks csv- või xml-vormingus failideks eksporditud andmebaas või veebiteenus, mis võimaldab otsida ja alla laadida kõiki andmeid näiteks json- või xml-vormingus).

      Andmehulk on tehnilises mõttes inimloetavate tekstifailide kogumik

      Kasutaja peab saama:

      • sirvida ja otsida avalike andmehulkade seast endale huvipakkuvat kogu;

      • laadida leitud andmehulk tervikuna või teenuste pakutud otsisüsteemi kaudu osadena kohe alla, ilma et ta peaks selleks läbirääkimisi pidama või paroole hankima. Erandina võib andmehulga laadimine olla tasuline;

      • kasutada andmekogu edaspidi vabalt, õigusega see tervikuna enda arvutisse laadida ja kasutada oma rakendustes (nii tasuta kui ka tasulistes), ilma et ta peaks selle eest (täiendavalt) maksma või et tal oleks selleks vaja luba.

      Kusjuures andmehulka looval ja avalikustaval avaliku sektori asutusel pole kohustust pakkuda andmete kasutajatele lisamugavusi, näiteks talle sobivasse vormingusse konverteerimist, spetsiaalsete võrguteenuste ehitamist, tõlkimist vms. Samuti ei ole ametkonnal kohustust tagada andmete korrektsust ega ajakohasust. Selle asemel peab avalikustaja selgitama lühidalt andmete olemust ja panema kirja nende oodatava ajakohastamise sageduse.

      Andmehulga litsents ja tasu. Avaandmete hulgal peab olema litsents, mis võimaldab seda vabalt ja piiranguteta kasutada, töödelda ja levitada, kusjuures kasutaja valikul nii tasuta kui ka tasu eest. Konkreetselt soovitame litsentsiks valida creative commons’i litsentsi11. Seal loetletud litsentsidest soovitame eeskätt CC by 3.0 litsentsi12. See tähendab, et oma teost litsentsides on litsentsiandjaks autor või autoriõiguste omaja, litsentsisaajaks aga üldsus. Teil on õigus teost kopeerida (reprodutseerida), levitada, esitada ja üldsusele suunata ning teha sellest kohandusi (adaptsioone), arranžeeringuid ja teisi töötlusi, sh tuletatud teoseid tingimusel, et viitate autorile.

      Avaandmed avalikustatakse soovituslikult tasuta allalaadimiseks, kuid selleks seadusega ettenähtud juhtudel on avalikustajal õigus nõuda andmete laadimise eest tasu.

      Andmehulga