Читать книгу Kuidas mõista andmestunud maailma - Anto Aasa Mare Ainsaar Mai Beilmann Marju Himma Muischnek - Страница 6
SISSEJUHATUS1
Andmestumine ja andmepööre
ОглавлениеKäesolevas kogumikus mõistame andmeid ja andmestumist kui ontoloogilist (andmed kui loodud reaalsus või selle konstrueerimise vahend), epistemoloogilist (andmed kui teadmise viis) ja sageli ka ideoloogilist protsessi. Rahvusvahelistes uuringutes on eksperdid defineerinud ühiskonna andmestumist eelkõige kui kõigi ja kõige viimist struktureeritud andmeformaati, mis omakorda võimaldab ja soosib kvantifitseerimist (vt nt Dijck et al. 2018; Schäfer 2016; Lupton 2020). Sageli väidetakse, et andmestumine kaasneb paratamatult teiste maailmas toimuvate muutustega, nagu digitaliseerimine ja võrgustamine.
Lihtsustatult võib väita, et infotehnoloogia vahendusel sooritatud tegevusest jäävad maha „andmepurust rajad“. Ehkki nende teket on paljudes avalikes ja ka professionaalsetes keskusteludes kombeks paratamatuks pidada, soovitavad kriitilised käsitlused (D’Ignazio, Klein 2020) alati küsida, kelle kätte koonduvad andmed, kas sellega kaasneb võimu koondumine, ning kas seesinane koondumine ja seda soosiv süsteem peaks ikka eksisteerima. Eriti aktuaalseks on sellised küsimused muutunud näiteks USA ja Hiina näotuvastustehnoloogiate ja ennustava politseitöö teemalistes vestlustes. Lisaks võiks iga andmeagent (andmete looja, kasutaja, nendega töötav või neid uuriv isik) endalt küsida, kas andmepuru kogumine, arhiveerimine, agregeerimine ja teatud eesmärkidel kasutamine on paratamatu ja vajalik. Kui midagi on võimalik andmeteks muuta, ei tähenda see tingimata, et see on hea idee. Andmestumise protsessilisusest tulenevalt olemegi sõnastanud andmestunud maailma mõistmise esimese postulaadi: andmete loomine, kogumine ja kasutamine on keeruline sotsiaalne protsess, kus andmeanalüütik (andmete põhjal otsustaja) peab arvestama andmete loodud sotsiaalse reaalsusega, sh sageli vastuoluliste ja hierarhiliste andmesuhetega.
Andmete ja ühiskonna vahelised seosed on keerulised. Ühest küljest luuakse andmeid inimeste elus ja ühiskonnas toimuvate protsesside põhjal ning neid kasutatakse samade protsesside analüüsimiseks ja mõtestamiseks; nii vaadates on andmed ühiskonna osa. Teisalt tekivad andmestumise baasilt täiesti uued ühiskondlikud nähtused. Seega on oluline, millisest perspektiivist lähtuvalt tõlgendatakse muutuste selgitamisel andmete ja ühiskonna omavahelist suhet (vt nt Beraldo, Milan 2019) – kas ühiskondlikud protsessid on andmete ja andmetehnoloogiate poolt juhitud (data-driven), andmetel põhinevad (data-based) või andmetest informeeritud (data-informed) (vt ka ptk 1.1). Esimesel juhul eeldatakse, et andmed ja andmetehnoloogiad tingivad teatud nähtusi (näiteks kui algoritmid filtreerivad ja vormivad inimeste juurdepääsu informatsioonile, millel võivad olla laiaulatuslikud sotsiaalsed, poliitilised ja võrdset kohtlemist puudutavad tagajärjed). Teisel juhul on andmed vaid formaalne infrastruktuur, mis loob aluse otsuste tegemiseks, näiteks teadlike valikute tegemisel algoritmide poolt filtreeritud informatsiooni kontekstis. Nii oleme sõnastanud andmestunud maailma uurimise teise postulaadi: võrgustunud ja omavahel tihedas seoses olevad protsessid ei pruugi olla selgitatavad lineaarsete tõlgenduste ja meetodite kaudu, vaid üha enam tuleb tähelepanu pöörata tegutsejate võrgustikule, mis võimaldab selgitada andmestumisega seotud keerukaid nähtusi ja võimalusi mitmetasandiliste ja üksteisega põimunud seoste kaudu.
Ühiskondlikult oluliste tegevuste kvantifitseerimises pole iseenesest midagi uut: valitsejad on maksukogumiseks andmeid kogunud tuhandeid aastaid, kirikud kogusid ja avaldasid aastasadu surnute andmebaase. Ka nende näidete puhul võib väita, et andmesubjektide kohta teadmiste koondamisega kaasnes võimu koondumine nende kätte, kelle kätte koondusid andmed (D’Ignazio, Kelin 2020). Siiski võib tänase andmestumise üheks alguspunktiks märkida arvutustehnoloogiate kasutuselevõtu rahvaloendusandmete töötlemisel. Herman Hollerithi 1890. aastal USA-s välja töötatud arvutusmasin (vt nt Whitby 2020) võimaldas rahvaloenduse tulemustest kokkuvõtte teha mõne kuuga varasema kaheksa aasta asemel. Seega võib andmestumist selgitada lainetena toimuva tehno-sotsiaalse muutusena (Schot, Kanger 2018), mis digitaliseerumise (Archer 2015), meediastumise3 (Hepp 2020) ja ühenduvusega (connectivity) (Couldry, Meijas 2019) seoses on järjekordse transformatsiooni läbi teinud. Käimasolevat andmestumiselainet peetakse eripäraseks (Just, Latzer 2017) johtuvalt selle skaalast ja ulatusest, mistõttu on praeguse andmestumisega kaasnenud suurem killustumine, kaubastumine, ebavõrdsus ja riigipiiride hägustumine ning vähenenud andmetega seotud protsesside läbipaistvus, kontrollitavus ja ennustatavus. Andmestumine ei ole passiivne (datafied), vaid aktiivne protsess (datafying), milles on oma võitjad ja kaotajad.
Eestis on andmestumine nähtavamaks muutunud seoses Euroopa andmekaitseseadusega (EP 2016), mille jõustumise ning kaasnevate piirangute tõttu on era- ja avaliku sfääri institutsioonid, aga ka n-ö andmesubjektideks peetavad indiviidid, kelle isikuandmeid kogutakse, hoitakse või töödeldakse (sageli mh nende enese teadmata), saanud teadlikumaks andmekasutamisega seotud võimalustest, ohtudest ja piirangutest. Selline areng on Eestis tõstatanud järgmised küsimused: Kas ja mis tingimustel on lubatud erafirmadel andmeid kasutada ja analüüsida? Kuidas teha andmed kättesaadavaks teadusuuringute jaoks? Kuidas tagada avatud andmete liikumine avaliku sektori institutsioonidele ja kodanikuaktivistidele? Kas ärilistel ja teaduslikel eesmärkidel andmete kogumisele peaks rakenduma erinevad piirangud? Ka siinses raamatus käsitletakse andmete kasutamise printsiipe, näiteks andmete õiguslikku kaitset ja kasutamist (ptk 1.3), andmete kasutamisega seotud eetilisi põhimõtteid (ptk 1.4) ning andmetega seotud sotsiaalse õigluse küsimusi (ptk 1.1). Sellest lähtuvalt oleme sõnastanud ka andmestunud maailma uurimise kolmanda postulaadi: andmestunud maailmas pole andmetaristu üksnes institutsionaalne omand, vaid võimalus avaliku hüve loomiseks, andmetes leiduva mitmekesisuse kaudu sotsiaalse mitmekesisuse tagamiseks ning andmepõhiste muutuste strateegiliseks juhtimiseks.
Raamatu koostajatena väidame, et andmed ja andmetes esindatud isikud pole teineteise teisikud (data doubles; vt Raley 2013; Goriunova 2019). Pigem peegelduvad andmekogudes uurijate väärtused ning (kohati aegunud) arusaamad sotsiaalsete kategooriate (sugu, rass, sissetulek, vanusegrupp, haridustase) tõlgendusjõust. Kuigi andmestumine loob loendamatud andmekogud ja teoreetilise võimaluse haarata ühiskondlikku elu kogu selle mitmekesisuses, jääb andmete mitmekesisuse küsimus sageli tähelepanuta. Andmestumine lähtub suuresti põhimõttest, et sotsiaalne reaalsus jaotatakse piiratud kategooriatesse. Ka klassikaline arvutusteaduslik meetod baseerub dihhotoomsele ehk 0–1 jaotusele ja arusaamale maailmast. Varasemalt kasutatud binaarsed kategooriad (nt 1 – õige, 2 – vale) on andmete puhastamisel, korrastamisel ja tõlgendamisel endiselt kasutusel, selmet püüelda andmete lõpmatus mitmekesisuses leiduva intersektsionaalsuse kajastamise poole (Hopkins 2019). Andmestunud ühiskonna teadmusloome (Shaw 2015; Wagner-Pacifici et al. 2015) eeldab andmete käsitlemist nii epistemoloogilise kui ka ontoloogilise nähtusena, ent tekitab lisaks hulga andmeõigluslikke (data justice) küsimusi, mille eesmärk on kindlustada, et andmed tagaks senisest suurema, mitte väiksema sotsiaalse õigluse. Nende diskussioonide põhjal oleme sõnastanud andmestunud maailma mõistmise neljanda postulaadi: lisaks tavapärastele teaduseetika nõuetele (uuritavate kahjustamise vältimine) peab andmete kogumine, analüüsimine ja tõlgendamine olema andmesubjekti ja ühiskonna seisukohalt õigustatud ja õiglane.
Eesti ühiskond pakub suurepärase võimaluse andmestumisega seotud arengusuundade analüüsiks – ühest küljest ollakse Eestis andme- ja tehnoloogiausust kannustatuna altid katsetama uudseid andmetehnoloogiaid (Runnel et al. 2009; Shaw 2015), teisalt on Eesti maailma kontekstis olnud suhteliselt tagasihoidlik valitsuse avaandmete arendamisel (McBride et al. 2018). Probleemiks on olnud eelkõige era- ja avaliku sektori ebavõrdne juurdepääs andmeressurssidele, aga ka erinevad arusaamad avalikest väärtustest ja sotsiaalsetest normidest andmelahenduste väljatöötamisel (Männiste, Masso 2020). Meil on eeskujulik digitaalne riigihaldus ja e-valitsemise taristu, ent erasektori digiteeritus on ebaühtlane ning kultuuripärandi lausdigiteerimise ja avaandmestamise algatused kipuvad venima (vt ptk 5.1).
Siiski on Eesti olnud teerajaja mitut tüüpi andmete kasutuselevõtmisel ja nende analüüsiks vajalike meetodite arendamisel. Mobiiltelefonide kõnetoiminguandmed ja mobiilpositsioneerimine sotsiaal-ruumilise segregatsiooni analüüsimiseks (Ahas et al. 2007) on üks eredaim näide (vt ptk-d 5.4 ja 2.1). Eesti digitehnoloogiate edusamme ja uuenduslikke andmelahendusi on kasutatud isegi riigi rahvusvaheliseks brändimiseks (Tammpuu, Masso 2018; Männiste, Masso 2020). Selle hiljutiseks näiteks on Eesti tehisintellekti ehk krattide lahendused.
Paljud Eesti teadlased ja selle kogumiku autorid on oma erialal uurimismeetodite edasiarendamises ja nendega eksperimenteerimises esirinnas, luues lahendusi, mida kasutavad kolleegid ja tudengid rahvusvaheliselt. Käesolev raamat esitab ülevaate Eestis välja pakutud andmestunud maailma uurimise viisidest, mis on kohandatavad rahvusvaheliselt, kuid eelkõige loodud Eesti ühiskonda arvestades. Kuna andmelahendused on loodud konkreetses sotsiaalses kontekstis, on ka andmestunud maailma mõistmise viiside korral oluline lähtuda konkreetse riigi kontekstist. Nende eelduste põhjal oleme sõnastanud viienda postulaadi: andmestunud maailma mõistmiseks – uuringu planeerimisel, andmete kogumisel, analüüsimisel ja tõlgendamisel – on oluline arvestada uuritava nähtuse ja andmete sotsiaal-kultuurilise kontekstiga.
3
Meediastumine on sotsiaalse maailma ja selle eri protsesside aina tihenev seotus meediaga.