Читать книгу Kuidas mõista andmestunud maailma - Anto Aasa Mare Ainsaar Mai Beilmann Marju Himma Muischnek - Страница 7
SISSEJUHATUS1
Andmete mitmetähenduslikkusest
ОглавлениеKui ühiskonna andmestumisest rohkem rääkima hakati, peeti silmas eelkõige n-ö suurandmeid,4 mida defineeriti algselt eelkõige kasvanud andmemahu (volume) kaudu (ülevaateks vt nt Schäfer 2016). Hilisemad käsitlused on iseloomustanud suurandmeid viie V-ga ehk mahule lisati sellised omadused nagu mitmekesisus (variety), kiirus (velocity), tõepärasus (veracity) ja väärtus (value; Gupta et al. 2012). Viimastel aastatel on hakatud suurandmeid kirjeldama, mainides suuremat hulka omadusi (Lupton 2015), mida tuntakse ka suurandmete 13 P-na, väites et suurandmed võivad olla kõikehõlmavad (portentous), pahelised (perverse),5 isiklikud (personal), loovad (productive), osalised (partial), praktikaga seotud (practices),6 ennustavad (predictive), poliitilised (political), provokatiivsed (provocative), privaatsed (privacy), mitmetähenduslikud (polyvalent), mitmekujulised (polymorphous) ja mängulised (playful). Seetõttu käsitleme kogumiku teises osas lähemalt peamisi suurandmete mõtestamise viise – nii masinõppe ja visuaalsete meetodite kasutamise kasvu suurtes andmemassiivides tähenduslike mustrite leidmiseks kui ka tunnustepõhiselt analüüsilt indiviidipõhistele meetoditele liikumist (sotsiaalsete võrgustike analüüs ja agendipõhine modelleerimine).
Nagu paljusid uusi nähtusi, selgitati ka suurandmeid algselt arvukate metafooride kaudu (Puschmann, Burgess 2014) – suurandmeid kirjeldati allutamist vajava loodusjõu ja tarbitava ressursina. Eriti levinud on (suur)andmete nimetamine naftaks, mis loob Luke Starki ja Anna Lauren Hoffmani (2019) sõnul spetsiifilise ettekujutuse sellest, mida andmetega peaks tegema, ja tekitab mitmeid andme-eetika ja andmeõigluse probleeme, kuna on suunitletud konkurentsile, olelusvõitlusele ja võimuahnusele. Maavarametafooride asemel soovitavad kriitikud lähtuda pigem „katkiste andmete“ metafoorist, mis rõhutab, et andmed pole kunagi täiuslikud (Pink et al. 2018). Kui siiski loodusvara metafooride juurde jääda, peaks õppima ehk looduskaitse või metsamajanduse valdkonnast ja andmekaevandamise ning väärindamise asemel mõtlema näiteks andmehooldusest (data stewardship) või pakkuma välja sootuks alternatiivseid metafoore (Stark, Hoffman 2019).
Teine grupp olulisi turumajanduslikke metafoore, mis andmesuhteid vormivad, on andmeõigluse kontekstis kasutatavad ekspluateerimise (Mühlhoff 2019), isegi koloniseerimise (Chun 2018) metafoorid. Sotsiaalmeediaplatvormide kasutajaliidesed näiteks innustavad inimesi sisu jagama, laikima ja postitama, kuna see võimaldab maksimeerida turundus- ja reklaamiklientidele kasulike andmete teket. Kui tavakasutaja jaoks on andmed kõrvalprodukt, siis platvormiomanike ärimudeli perspektiivist on suhtlus väärtuslik seetõttu, et selle tagajärjel tekivad müüdavad andmed. Samas ei ole tavakasutajatel võimalik nn andmedoonorlusest loobuda või sellest mingit kasu saada. Käesoleva kogumiku kolmandasse ossa oleme koondanud indiviidide kognitiivse ekspluateerimise tagajärjel loodud tekstiandmete analüüsimise meetodite ja ka nende tajuprotsesside süstemaatilisele hindamisele keskenduvate meetodite peatükid, kuna neis toetutakse peamiselt nn andmedoonorluse käigus tekkinud andmete analüüsile.
Andmetega seotud ühiskondlikke protsesse on tabavalt kirjeldatud kui sotsiaal-kultuurilist koodi (Chun 2018) või andmeteekonda (Bates et al. 2016), mille mõtestamiseks peame aduma andmete loomise, kasutamise ja mõtestamise terviklikku protsessi. Selliselt pole andmed mitte üksnes nähtuste konstrueerimise ja mõistmise vahend, vaid ka oluline sisend lugude jutustamisel maailmas toimuvast. Andmete kui koodi mõistmine ja selle põhjal lugude jutustamine on muutunud oluliseks uurimisvahendiks, aga ka -objektiks. Sel põhjusel oleme kogumiku neljanda osa pühendanud lugude jutustamisele andmetest ja andmetega. Andmed ei ole kunagi neutraalsed ega teki „iseenesest“, neid loovad konkreetses ajalises ja ruumilises kontekstis inimesed. Tunnustatud informaatikaprofessor Geoffry Bowker (2005: 183–184) on nentinud, et „toorandmed on oksüümoron“, väites, et andmed on alati mingil moel „küpsetatud“. Kohe, kui määratleme mingite fenomenide vaatlemise, mõõtmise ja märkamise tulemused andmetena, tegeleme nende andmeteks „küpsetamisega“, see tähendab, et andmetesse on alati küpsetatud teatud tähendused, eeldused, küsimused ja muidugi võimusuhted.
Iga andmetöötaja ja uurija peaks seega olema teadlik oma rollist andmete „küpsetamisel“ – nii siis, kui ta andmeid „kogub“, kui ka siis, kui ta andmetest söödava ja kasuliku produkti loob (vt ka ptk 1.1). Bowkeri väidet edasi arendades kirjutavad Lisa Gitelman ja Virginia Jackson (2013), et toorandmete mõiste mõjub analüütikutele peibutavalt, sest sellesse on peidetud pika ajalooga ja ideoloogiliselt võimas positivistlik eeldus (vt ka Markham 2016), et arvulised andmed on kuskil meist sõltumata olemas, et andmed eelnevad faktidele, et need on meie teadmiste alus, midagi objektiivset, ilmselget ja läbipaistvat, mis on vaja üksnes kokku korjata ja hoolikalt ära mõõta. Paljudes era- ja ka uurimissituatsioonides räägitakse lisaks „isetekkelistest“ (mõnikord ka „loomulikult esinevatest“) andmetest, mida kriitikute sõnul samuti tegelikult olemas ei ole. Nendele diskussioonidele tuginedes oleme sõnastanud andmestunud maailma mõistmise kuuenda postulaadi: andmed ei teki iseenesest, vaid luuakse uurija valikute tulemusel, mis tähendab, et uuringu ülesehitusest sõltub, milliseid järeldusi on uuringu põhjal võimalik teha.
Andmestunud ühiskonna kontekstis pole muutunud niisiis mitte ainult andmed, nende loomine ja kasutamine, vaid andmetöö üldiselt (Fuchs 2018; Rossi 2019), hõlmates lisaks traditsioonilisele andmeanalüütiku tööle aina enam ka internetikasutajate valdavalt teadvustamata tööd ja veebipõhiste andmelahenduste testijate (n-ö klikitööliste) sageli halvasti tasustatud panust. Andmeid loovad platvormid on seega muutunud nii oluliseks andmeallikaks kui ka sotsiaalseks reaalsuseks. Selle kogumiku viiendas osas käsitlemegi lähemalt nihet platvormipõhisele uurimusele ning näitlikustame seda, millist rolli võivad platvormid jt andmetaristud mängida uurimisvahendi ja -objektina.
4
Suurandmeid on eesti keeles nimetatud ka mahtandmeteks; mõlema nimetuse korral on tegemist metafoorse konstruktsiooniga, mis ei anna üheselt edasi nähtuse mitmetähenduslikkust. Sel põhjusel oleme siinses kogumikus eelistanud seotud sotsiaalsetele protsessidele viitavat terminit „andmestumine“.
5
Andmete pahelisus tähendab siin andmetega seotud representatsioonide ambivalentsust – suurandmed ei tekita mitte ainult suurt elevust seoses tekkivate võimalustega, vaid ka hirmu ja ärevust, sest andmete loomine ja kasutamine ei pruugi suure mahu, lakkamatu loomise ja kasutamise tõttu olla kontrollitav.
6
Andmete seotus praktikaga tähendab, et suurte andmekogude loomine ja kasutamine hõlmab mitmesugust üksikisikute ja organisatsioonide andmepraktikat, sealhulgas enda kohta teadlikult teabe kogumist (nt nutikellaga), aga sageli ka enesele teadvustamata andmete loomist näiteks sotsiaalmeedia lehele sisu lisades.