Karin Kastehein

Eesti infoühiskonna aastaraamat 2011/2012


Скачать книгу

järgmistest kahest.

      • Microdata kujul22, mis on ette nähtud andmete kodeerimiseks inimloetava html-i sisse: info on korraga nii harilikul viisil inimloetav kui ka kergesti masintöödeldav.

      • RDFa23, mis on analoogiline ja samade eesmärkidega kui Microdata, kuid veidi keerukam.

      Microdatas esitatud andmed on alati triviaalselt konverteeritavad RDFaks. Järgmine küsimus peale Microdata/RDFa teemat on väljanimede ehk objekti omaduste nimede valik. Siin on kaks peamist lähenemist.

      • Kõige lihtsam on esitada algse andmehulga tabeli/väljanimede paarid URIdena, näiteks kujul http://www.asutus.ee/andmehulganimi/tabelinimi/väljanimi, kus näide võiks olla http://www.asutus.ee/loasaajad/fyysisikud/synniaeg.

      • Veidi keerulisem, kuid kohati kasulikum alternatiiv on kasutada algse süsteemi tabeli/väljanime asemel üldisemat ja laiemalt levinud omaduse nime, kui sellise leiab. Sobivaks kataloogiks nimede otsimisel on schema.org. Tasub tähele panna, et kui sobivat nime ei leita, on kasutajal hiljem siiski väga lihtne teisendada eksporditud nimesid endale sobivale kujule, eeldusel, et ta saab eksporditud väljanime tähendusest sisuliselt aru.

      Väljanimede esitamisest rääkides tasub puudutada ka ontoloogiate teemat. Neid võib vaadelda kui väljanimede teisendus-/klassifitseerimisreegleid, näiteks, kui soovime öelda, et meie URI kujul väljanimi http://www.asutus.ee/loasaajad/fyysisikud/synniaeg on täpselt sama asi kui schema.org-i Thing>Person>birthDate.

      Selliselt vaadates ei ole ontoloogiad andmete avalikustamisel otseselt oluline ega keeruline teema, pigem on tegu kasuliku töövahendiga rakenduste loojatele, kes kombineerivad eri allikatest saadud andmeid. Andmete eksportimiseks avalikustamisel tasubki ontoloogiaid soovi korral ise kirjutada kas siis oma väljanimede dokumenteerimiseks või alamhulga olemasolevate väljanimede konverteerimiseks schema.org-i nimedeks.

      Viietärni-vormingute selgitusi. Andmete URIde kaudu linkimise üks viise on kasutada andmebaasis rakendatava identifikaatori asemel võimaluse korral de facto universaalsemat globaalset identifikaatorit ehk URI. Oletame näiteks, et riigis lepitakse kokku (või asuvad näiteks rahvastikuregister ja äriregister kasutama) isikukoodide ja ettevõtete koodide jaoks vormingut kujul http://prefiks1.ee/prefiks2/isikukood ja http://prefiks3.ee/prefiks4/ettevõttekood. Sel juhul oleks isikukoodi ja ettevõtte koodi viietärni-esituseks taolisel kujul URId, kus prefiksid / URI kujud ei ole mitte antud asutuse enda, vaid üldisemalt kokkulepitud / laiemalt kasutusel kujud. Sama kehtib siis ka andmebaasiväljade ehk objektide omaduste nimede kohta.

      Kuidas andmehulka reaalselt avalikustada? Konkreetselt on andmete avalikustamiseks kolm peamist tehnoloogilist viisi.

      • Inimloetavate failide korral pakkida faile sisaldavad kataloogid kokku, lisada peakataloogi lühike sisuseletus ja laadida pakitud kataloog/kataloogid vabalt allatõmmatavana soovitatavalt asutuse veebisaiti http://<asutuse domeeninimi>.ee/avaandmed või opendata.riik.ee kataloogi.

      • Andmebaasides sisalduvate andmete korral eksportida andmebaasi sisu kas xml-, või csv- või json-failideks vms struktureeritud tekstikujule ning rakendada seejärel sama lihtsat kokkupakkimise ja veebiserverisse laadimise meetodit. Kui andmebaas sisaldab isikuandmeid, mis ei kuulu avalikustamisele, siis neid väljasid lihtsalt ei ekspordita.

      • Alternatiivina võib andmebaasides esitavad andmed avalikustada vabalt kasutava võrguteenusena, mille kaudu on võimalik leida ja alla laadida kogu andmehulga sisu või selle filtreeritud osahulk. Võrguteenus võib olla näiteks SOAP-teenus, kuid eelistatumad on lihtsamad, näiteks jsoni-põhised nn REST-teenused, samuti näiteks ka lihtsalt csv-vormingusse välja andvad get- või post-sisendparameetritega teenused.

      Andmed peavad olema mõistlikult kirjeldatud, st nende eesmärgist, struktuurist ja sisust peab andmehulgaga varem mitte kokku puutunud, kuid siiski valdkonda ja tehnoloogiat mõistev inimene mõistliku pingutusega iseseisvalt aru saama.

      Andmehulga edaspidise uuendamise põhimõtted ja uuendamise planeeritav sagedus peavad olema andmehulga juures kirjeldatud. Andmehulga avaldajal ei lasu seejuures mingit otsest kohustust andmehulka regulaarselt uuendada – tähtis on uuendamise kava (või selle puudumine) arusaadavalt kirja panna.

      Asutuse avalikustatud andmehulgad peavad olema kergesti leitavad. Selleks tuleb kasutada vähemalt kaht viisi avalikustatud andmete olemasolu, kirjelduste ja laadimislinkide avaldamiseks.

      • Asutuse oma veebisaidil spetsiaalne kataloog/avaandmed, näiteks http://www.asutus.ee/avaandmed

      • Üleriiklik avaandmete koondportaal/varamu http://opendata.riik.ee

      Avatud ruumiandmed

      Kristian Teiter

      [email protected]

      Maa-amet

      Mis on ruumiandmed?

      Ruumiandmed on lihtsustatult öeldes andmed, millel on geograafiline asukoht ja kuju. Selliseid andmeid nimetatakse ka geoandmeteks, geoinfoks ja asukohaandmeteks. Reeglina esitatakse ja kasutatakse ruumiandmeid kaardina, mida võib lugeda ka andmekogu ruumiandmete väljundiks. Näiteks Eesti topograafia andmekogus hallatavate topograafiliste andmete üheks väljundiks on topograafilised kaardid, kuid andmeid endid saab kasutada ja kättesaadavaks teha ka näiteks veebiteenuste kaudu xml-kujul.

      Valdkonnad, kus ruumiandmeid põhiliselt kasutatakse, on keskkonnakaitse, planeerimine, ehitus, logistika ja transport, sõjandus, statistika jne. Järjest enam osatakse näha asukohas peituvat potentsiaali ning ruumiandmete kasutamine eri eluvaldkondades kasvab plahvatuslikult.

      Ruumiandmete hulka kuuluvad ka aadressiandmed. Ilmselt on nii mõnelegi andmekogu haldajale viimasel ajal just tänu aadressiandmetele jõudnud üllatusena kohale teadmine, et tema hallatav andmekogu sisaldab ruumiandmeid.

      Avalikustamine ja taaskasutamine

      Võrreldes Euroopa ja maailmaga on ruumiandmed, mida saab käsitelda avaliku teabena, Eestis hästi avalikustatud. Maa-amet kui suurim riiklik kaarditootja ja ruumiandmete haldaja avalikustas juba 2001. aastal katastriüksuste andmed, halduspiirid ja topograafilised aluskaardid veebipõhise kaardiserveri (http://geoportaal.maaamet.ee/) kaudu. 2008. aastal lisandusid avalikule kaardiserverile veebipõhised kaarditeenused (WMS), mille kaudu on Maa-ameti kaardid kasutatavad mitmesuguste GIS-/CAD-tarkvarade abil. Kaardiserver ja teenused on väga populaarsed, kokku tehakse nende abil umbes 500 000 külastust kuus.

      Teise näitena võib esile tõsta Keskkonnateabe Keskuse, mille kodulehelt näeb interaktiivsete kaardiserverite kaudu igasuguseid keskkonnateemalisi ruumiandmeid. Üheks näiteks on metsaregistri avalik veebiteenus.

      Avalikustamise ja taaskasutamise vahe on valdavalt selles, et avalikustatud ruumiandmeid saab vaadata, pärida, otsida ning piiratud ulatusega pildina ka alla laadida ja välja trükkida. Taaskasutataval kujul ruumiandmete kasutusvõimalused on aga piiramatud ning reeglina on need andmekogumitena sobivas vormingus allalaaditavad. Just taaskasutataval kujul ruumiandmete kättesaadavaks tegemine loob eeldused, et era- ja kolmas sektor kasutavad avaliku sektori teavet uute ja huvitavate teenuste ning rakenduste loomiseks.

      Taaskasutataval kujul ruumiandmete kättesaadavusega on Eestis pilt üsna kirju. On ruumiandmeid, mis on taaskasutataval kujul kogu Eesti kohta lihtsalt kättesaadavad, kuid on ka selliseid, mille kättesaadavus on mitmel põhjusel keeruline. Andmete kättesaadavus on erinev nii ametkondade vahel kui ka nende sees.

      Vastavus avatud andmete põhimõtetele

      Olen siin ära toonud oma subjektiivse hinnangu Eesti ruumiandmete olukorra vastavuse kohta mõnele avatud andmete põhimõttele. Kuid asjaolu, et tegemist on ruumiandmetega, ei oma selles olukorras mingit erilist tähtsust. Pigem on pilti mõjutanud andmekogude haldajate tehnoloogiline võimekus, õiguslik regulatsioon, ajaloolised tavad jmt tegurid.

      Üheks põhimõtteks on see, et andmed on töötluseta kogutud algallikast ja need on säilitanud originaalkuju ja detailsuse. See on põhimõte, millega oli ruumiandmete