Читать книгу Eesti infoühiskonna aastaraamat 2011/2012 - Karin Kastehein - Страница 2

1. PEATÜKK
Avatud andmed

Оглавление

Avatud andmete ehk avaandmete teemast ei saa tänapäeval mööda vaadata enam ükski riik. Sellest on saanud meie igapäevaelu osa – juba praegu toodavad, koguvad ja säilitavad avaliku sektori asutused mitmesuguseid andmeid digitaalsel kujul, olles ahvatlevaks toormaterjaliks kõikvõimalikele uutele teenustele ja toodetele. Avaandmete all mõistetakse kõigile vabalt ja avalikult kasutamiseks antud masinloetavas formaadis andmeid, millel puuduvad kasutamist ning levitamist takistavad piirangud. Ka Eesti avaliku teabe seadus kohustab avaliku sektori juurdepääsupiiranguta infot avalikustama (kas veebisaidi, dokumendiregistri või andmekogu kaudu). See peatükk annab ülevaate avaandmete teemast ja põhimõtetest nii Eestis kui ka välismaal.

Avaandmed – samm tuleviku internetti

Uuno Vallner

uuno.vallner@riso.ee

Majandus- ja Kommunikatsiooniministeerium


Viiekümnendatel sõnastatud avaandmete (open data) ja avatud riigi (open government) põhimõte muutus uue sajandi alguseks lööksõnaks. Nüüd on see aga muutunud kogu ühiskonda mõjutavaks tegevussuunaks. Avaandmed on esimene etapp liikumises n-ö asjade interneti ja lingitud maailma poole. Just andmete linkimises nähakse võimalust, kuidas suuremahulise infohulgaga (big data) tulevikus toime tulla.

Meilgi võiks üheks eesmärgiks olla „lingitud Eesti“ – eestimeelne IKT toel loodud hajutatud isikute, organisatsioonide, tarkade seadmete, teadmiste, infosüsteemide, linkandmete koosvõimeline võrgustik. Selle loomine eeldaks läbimurret sellistes suundades nagu ülikiire andmesidevõrk ja targad seadmed, koosvõimelised infosüsteemid, teadmusvõrgustikud, semantilised võrgustikud, linkandmed ja avatud riigi tehnoloogiad (avatud standardid ja andmed, vaba tarkvara).

Taaskasutuseks avatud andmed

Avaliku sektori asutused toodavad, koguvad või säilitavad suurt hulka teavet ja infosisu, nagu statistika, ruumiandmed, majandusandmed, keskkonnaandmed, arhiivimaterjalid, raamatud, kunstikogud. Tänapäeval on need ressursid väga suurel määral digitaalsel kujul ja kujutavad endast suurt väärtust uute toodete või teenuste juures, kus kasutatakse neid andmeid toormaterjalina. Erilist taaskasutamise huvi pakuvad dünaamiliselt muutuvad andmed avaliku sektori registrites.

Euroopa Liidu tellitud uuringu1 kohaselt on ELi 27 riigis avaliku sektori teabe suurema avatuse ja hõlpsa juurdepääsu võimaldamise kaudu võimalik saavutada majanduslikku kasu ligikaudu 40 miljardit eurot aastas. Taaskasutuse turg Euroopas kasvab aastas 7–40 %. Euroopa Komisjoni asepresident Neelie Kroes on nimetanud avatud andmeid lausa uueks kullaks2: „Kui naftat nimetada mustaks kullaks, siis andmete taaskasutamine oleks Euroopale uus kuld“. Avaliku sektori andmete avamine võimaldab erasektoril kombineerida neid teiste andmetega ja luua uusi lisaväärtusega äriteenuseid. Avalik sektor saaks keskenduda oma põhitegevusele ja loobuda konkureerimisest erasektoriga. Kuid andmete esitamine taaskasutataval kujul toob kaasa kulutusi. Euroopa Komisjoni uuringu alusel võimaldaks 1,4 miljardi suurune avaliku sektori poolne investeering suurendada Euroopa SKP käivet 140 miljardi euroni. Seega iga investeeritud sent suurendaks riigi SKPd euro võrra.

Avatud andmed on taasavastatud kullapada

Andmete taaskasutamise teema pole uus. Sellest hakati rääkima juba 50. aastate lõpus. Nõukogude ajal taaskasutas näiteks tollane informatsiooni instituut referaatide välisbaase magnetlintidel kogumahuga üle miljoni kirje aastas3. Taasiseseisvunud Eesti esimeseks registri taaskasutamisjuhuks oli 1995/96 loodud Riigi Teataja tehnoloogiline lahendus. Selle väljaandmiseks paberkujul kasutati WordPerfecti kontoritarkvara. WordPerfecti failid konverteeriti SGMLi ( xml on SGMLi derivaat) vormingusse, signeeriti digitaalselt ja avati ftp serveri kaudu kõigile vabaks kasutamiseks. Õigusaktide aktiivsemad taaskasutajad olid Riigikantselei dokumendihaldussüsteem, Riigi Teataja online-andmebaas, IBSi otsisüsteem ja EstLex. Viimastel aastatel on paljud riigid avastanud, et andmete avamisega on võimalik elavdada majandust, ja alustanud ulatuslikke andmete taaskasutamist toetavaid projekte:

• Euroopa Komisjoni avaandmete poliitika4,

• Komisjoni tellitud uurimus „Towards a pan EU data portal – data.gov.eu“5,

• Suurbritannia avatud andmete põhimõtted6,

• W3C avatud andmete põhimõtted7,

• Open Government Data avatud andmete arendamisgrupi soovitused8,

• USA ja UK soovitused OECD-le avaandmete poliitika osas9,

• OFKN Open Data käsiraamat (juriidika, sotsiaalia, tehnoloogia).

Paljud riigid, regioonid ja omavalitsused on taaskasutuseks loonud raamistikud ja taaskasutust lihtsustavad portaalid.

• Euroopa avaandmete koondkataloog http://publicdata.eu

• USA avaandmete kataloog http://data.gov

• UK avaandmete kataloog http://data.gov.uk

• Austraalia avaandmete kataloog http://data.gov.au

• Kanada avaandmete kataloog http://data.gc.ca

• Keenia avaandmete kataloog http://opendata.go.ke

• Norra avaandmete kataloog http://data.norge.no

• Hollandi avaandmete kataloog http://data.overheid.nl

• Uus-Meremaa avaandmete kataloog http://data.govt.nz

• Itaalia avaandmete kataloog http://data.gov.it

• Prantsusmaa avaandmete kataloog http://data.gouv.fr

• Rootsi avaandmete kataloog (eraisiku initsiatiivina) http://www.opengov.se

• Philadelphia piirkonna avaandmete kataloog http://opendataphilly.org

• Helsingi piirkonna omavalitsuste avaandmed http://www.hri.fi/en

• CKAN avaandmete kataloog/hoidla http://thedatahub.org

Kuigi andmete avamine taaskasutuseks toob kaasa tuntava kulu, on poliitikud tunnetanud selle tugevat mõju riigi majandusele ja asunud aktiivselt investeerima avaandmete infrastruktuuri loomisesse ja arendamisesse. USA president Obama kirjutas oma esimesel valitsemispäeval alla avatud ja läbipaistva riigi memorandumile, mille kohaselt avalik sektor avas oma andmed taaskasutuseks. Juba 2011. aasta sügiseks sisaldas USA avaandmete kataloog 390 000 andmehulka.

Mis on avaandmed?

Avaandmed ja andmehulgad. Taaskasutuseks publitseeritud andmeid nimetatakse avatud andmeteks (open data) ehk avaandmeteks. Selle all mõistame kõigile avalikult vabalt kasutamiseks antud, veebisaitidest kättesaadavaid, masinloetavas vormingus andmeid ilma kasutamis-, patentide- ja levitamispiiranguteta. Kui seaduses ei ole andmete hankimise eest ette nähtud tasu, saab avaandmeid kätte tasuta ja ilma ligipääsukitsendusteta.

Taaskasutamiseks sobivad vabavaraliste rakendustega avatavad ja töödeldavad vormingud.

Avaliku teabe seadus10 kohustab avalikustama avaliku sektori juurdepääsupiiranguteta info asutuse veebisaidi, dokumendiregistri ja andmekogude kaudu. Lisaks lasub avalikul sektoril kohustus väljastada teavet vastavalt esitatud teabenõuetele. Siin räägime avaandmetest kui infost, mis esitatakse avalikkusele proaktiivselt avatud vormingutes. Avaandmete allalaadimise jaoks ei ole üldjuhul vaja teabenõuet esitada.

Ametkondlikult loodud andmete avalikustamisel on mitu olulist eesmärki, kõige konkreetsem neist on isikute, ettevõtete ja kolmanda sektori huvi kas lihtsalt tutvuda olemasolevate andmetega või kasutada neid oma tarkvararakendustes lisaväärtuse loomiseks mingis valdkonnas.

Avalikustamisele kuuluvad kõik nii riigiametite kui ka kohalike omavalitsuste loodud andmed, mille avalik kasutus ei ole otseselt keelatud ning mis sisaldavad ka muid andmeid peale isikuandmete. Andmetest, mis sisaldavad nii isikuandmeid kui ka muid andmeid, avalikustatakse ainult viimased.

Avaandmete kontekstis nimetame terviku moodustavaid andmeid andmehulgaks (dataset). Need võivad olla näiteks lepingutekstid, määruste tekstid, kirjavahetuse metainfo kogud, eelarve- ja statistikafailid, avatud vormingusse konverteeritud andmebaasid/registrid või registritest andmeid väljastavad avatud võrguteenused. Üksikuid lepinguid, määrusi jne ei ole mõistlik käsitleda eraldi andmehulgana, erinevalt üksikust andmebaasist. Mõne andmehulga puhul piisab kasutajale teabele juurdepääsust (lugemiseks, kopeerimiseks), mõne puhul on olemas tugev taaskasutamise huvi. Allpool on valdkonnad järjestatud (vastavalt OECD 2006. aasta analüüsile) taaskasutamisväärtuse kasvavas järjekorras:

• kultuur (raamatukogud, arhiivid, muuseumid, ringhääling),

• poliitika (pressiteated, strateegiad, rohelised raamatud),

• haridus (loengud, õppematerjalid),

• teadus (ülikoolide, instituutide ja avaliku sektori uuringud),

• õigusinfo (kohus, õigusaktid, patendid, kaubamärgid, õigused ja kohustused),

• loodus (bioloogiline, ökoloogiline, geoloogiline ja geofüüsikaline info, teave energiaressurssidest),

• põllumajandus, mets, kalandus,

• turism, majutus ja meelelahutus,

• liiklus, transport,

• sotsiaalne info (statistika, demograafia, tervis, haridus),

• majandus ja äri,

• meteoroloogia, keskkonnainfo,

• ruumiandmed.

Avalikustatav andmehulk võib tehnilises mõttes olla nii kogumik inimloetavaid tekstifaile (näiteks seaduste või määruste, ametlike teadete või lepingute kogu) kui ka masinloetavaid andmeid (näiteks csv- või xml-vormingus failideks eksporditud andmebaas või veebiteenus, mis võimaldab otsida ja alla laadida kõiki andmeid näiteks json- või xml-vormingus).

Andmehulk on tehnilises mõttes inimloetavate tekstifailide kogumik

Kasutaja peab saama:

• sirvida ja otsida avalike andmehulkade seast endale huvipakkuvat kogu;

• laadida leitud andmehulk tervikuna või teenuste pakutud otsisüsteemi kaudu osadena kohe alla, ilma et ta peaks selleks läbirääkimisi pidama või paroole hankima. Erandina võib andmehulga laadimine olla tasuline;

• kasutada andmekogu edaspidi vabalt, õigusega see tervikuna enda arvutisse laadida ja kasutada oma rakendustes (nii tasuta kui ka tasulistes), ilma et ta peaks selle eest (täiendavalt) maksma või et tal oleks selleks vaja luba.

Kusjuures andmehulka looval ja avalikustaval avaliku sektori asutusel pole kohustust pakkuda andmete kasutajatele lisamugavusi, näiteks talle sobivasse vormingusse konverteerimist, spetsiaalsete võrguteenuste ehitamist, tõlkimist vms. Samuti ei ole ametkonnal kohustust tagada andmete korrektsust ega ajakohasust. Selle asemel peab avalikustaja selgitama lühidalt andmete olemust ja panema kirja nende oodatava ajakohastamise sageduse.

Andmehulga litsents ja tasu. Avaandmete hulgal peab olema litsents, mis võimaldab seda vabalt ja piiranguteta kasutada, töödelda ja levitada, kusjuures kasutaja valikul nii tasuta kui ka tasu eest. Konkreetselt soovitame litsentsiks valida creative commons’i litsentsi11. Seal loetletud litsentsidest soovitame eeskätt CC by 3.0 litsentsi12. See tähendab, et oma teost litsentsides on litsentsiandjaks autor või autoriõiguste omaja, litsentsisaajaks aga üldsus. Teil on õigus teost kopeerida (reprodutseerida), levitada, esitada ja üldsusele suunata ning teha sellest kohandusi (adaptsioone), arranžeeringuid ja teisi töötlusi, sh tuletatud teoseid tingimusel, et viitate autorile.

Avaandmed avalikustatakse soovituslikult tasuta allalaadimiseks, kuid selleks seadusega ettenähtud juhtudel on avalikustajal õigus nõuda andmete laadimise eest tasu.

Andmehulga avalikustamise põhimõtted. Andmehulga avalikustamise juures tuleb otsida kompromissi kahe eesmärgi vahel:

• andmete mugav kasutatavus ja arusaadavus andmete otsijale ja allalaadijale,

• andmete avalikustamise lihtsus ja avalikustaja töökulu minimeerimine.

1

http://epsiplatform.eu/content/review-recent-psi-re-use-studies-published

2

Neelie Kroesi kõne “Data is the new gold“ 12.12.2011: http://europa.eu/rapid/pressReleasesAction.do?reference=SPEECH/11/872&format=HTML&aged=0&language=EN&guiLanguage=en

3

Uuno Vallner. Retrospektiivsed otsisüsteemid. Tallinn, Eesti Informatsiooni Instituut, 1985.

4

http://ec.europa.eu/information_society/policy/psi/index_en.htm

5

http://ec.europa.eu/information_society/policy/psi/docs/pdfs/towards_an_eu_psi_portals_v4_final.pdf

6

http://data.gov.uk/opendataconsultation

7

http://www.w3.org/TR/gov-data

8

http://www.opengovdata.org

9

https://usoecd.cms.getusinfo.com/data.html

10

https://www.riigiteataja.ee/akt/122032011010?leiaKehtiv

11

http://creativecommons.org

12

http://creativecommons.org/licenses/by/3.0

Eesti infoühiskonna aastaraamat 2011/2012

Подняться наверх