Sotsiaalse Analüüsi Meetodite ja Metodoloogia õpibaas

Isikuandmete töötlemine sotsiaalteaduslikes uuringutes

Marten Juurik
2025

Käesolev peatükk käsitleb isikuandmete kogumist, kasutamist ja haldamist sotsiaalteaduslikus uurimistöös. Suur osa isikuandmete kaitse seaduslikust regulatsioonist kehtib ühetaoliselt kõigis eluvaldkondades, mistõttu saab siin käsitletavaid põhimõtteid ja soovitusi üle kanda teistele uuringuvaldkondadele ning kasutada ka väljaspool teadusmaailma. Peatüki lugemisel tulevad kasuks varasemad teadmised isikuandmete kaitse valdkonnast.

Peatükk on kirjutatud täienduse ja lisana Tartu Ülikooli veebijuhendile „Andmekaitse teadustöös“ (Juurik, Mäesalu, Tarkpea, 2023), mis täpsustab paljusid andmekaitsega seotud küsimusi teadusuuringute kontekstis. Selle eesmärk on anda praktilisi soovitusi, mistõttu ei käsitle see kõiki andmekaitsega seotud küsimusi või erijuhte. Peatükis pakutakse välja mõningad lihtsad põhitõed ja praktikad andmekaitsest, mille järgimine aitab tagada, et isikuandmete töötlemine lõpu- või üliõpilastöös oleks kooskõlas üldmäärusega; samuti selgitatakse mõningaid isikuandmete töötlemise standardseid või lihtsamaid lahendusi, kuid ei paku ammendavat ülevaadet kõikvõimalikest isikuandmete töötlemise juhtudest teadusuuringute kontekstis.

Isikuandmete kaitse ehk andmekaitse (ingl k data protection) on nimetus õigusvaldkonnale, mis tegeleb isikuandmete kasutamise õiguslike küsimustega. Andmekaitse eesmärk on tagada üksikisiku õigus eraelu ehk privaatsuse kaitsele, mis on üks inimese põhiõigusi, keskendudes eelkõige just andmete dimensioonile. Andmekaitse regulatsioon lähtub suurel määral informatsioonilise enesemääramise printsiibist ehk põhimõttest, mille kohaselt on igal inimesel õigus ise otsustada tema kohta käivate andmete üle ja kontrollida, kes ja kuidas tema andmeid kasutada võib. Kõige üldisemalt püüab andmekaitse õigusvaldkond leida konkureerivate huvide vahel mõistlikku tasakaalu, mis austab ühelt poolt üksikisiku õigust oma andmete kasutust kontrollida ja teisalt arvestab ülejäänud ühiskonnaliikmete huvi ja vajadusega tema andmeid kasutada.

Kuigi andmekaitsest räägitakse väga palju, ei kata see kõiki privaatsuse tahke, mistõttu tuleks alati arvestada sellega, et andmekaitse nõuded, mis kohati võivad olla küllalt formaalsed, ei ole üksi piisavad, et lahendada kõikvõimalikke privaatsusega seotud probleeme või küsimusi. Näiteks võib uurija intervjuu läbiviimiseks külastada inimese kodu, kus ta näeb koduseid olusid või kuuleb võib-olla pealt koduseid ja eraviisilisi vestlusi – kaitsta tuleb ka seda inimeste eraelu osa, mis otseselt intervjuu tekstis ei kajastu. Samuti on võimalik, et inimene annab küll nõusoleku intervjuus osalemiseks, kuid intervjuu käigus räägib kolmandate isikute eraelulistest ja tundlikest seikadest – näiteks haiguslugudest või piinlikest olukordadest.

Vaatamata privaatsuse olulisusele eeldab mitmete ühiskondlike nähtuste teaduslik uurimine mõningast sekkumist inimeste eraellu. Selleks on välja kujunenud kaks üldisemat lähenemist. Esiteks, sekkumine eraellu saab toimuda inimese vabal tahtel, toetades tema informatsioonilist enesemääramisõigust. Inimene saab sellisel juhul ise kontrollida, kuidas ja mil määral ta oma eraelulist teavet jagab. Teadusuuringutes toimub see tavapäraselt teavitatud nõusoleku põhjal – uurija selgitab inimesele, mida temalt teada tahetakse ja mis selle teabega tehakse, ning inimene saab selle põhjal otsustada, kas ta soovib neil tingimustel uuringus osaleda.

Teiseks, sekkumine eraellu saab põhineda vastandlike, kuid ühtviisi oluliste õiguste ja huvide kaalumisel. Olulised on nii inimeste privaatsus kui ka ühiskondlike probleemide teaduslik uurimine – mõnel juhul võib olla kaalukam inimese õigus eraelule, mõnel juhul aga vajadus teadusuuringuid läbi viia. Nii näiteks on kõigi Eesti elanike terviseandmed koondunud ühtsesse tervise infosüsteemi, kust vastavalt vajadusele ka teadusuuringutele andmeid väljastatakse.

Kuna uurijal ei ole võimalik küsida kümnete või sadade tuhandete inimeste nõusolekut, on lubatud selliste uuringute läbiviimine nõusolekut küsimata. Samas võivad sel viisil teadusuuringutesse sattuda ka nende inimeste andmed, kes seda ei soovi, ning niiviisi kaob inimesel kontroll oma isikuandmete üle. Selleks et leida mõistlik tasakaal vastandlike huvide vahel, ongi seadusega sätestatud täiendavad tingimused seda sorti teadusuuringute läbiviimiseks – uuringu läbiviimine eeldab kooskõlastust eetikakomiteelt, kes peab veenduma selles, et vajadus teadusuuringu järele on kaalukam inimeste privaatsuse riivest. Üldiselt eeldavad sedasorti uuringud, et teadlased saavad analüüsimiseks pseudonüümitud andmed, et välistada uuringu käigus konkreetsete inimeste tuvastamine ja seeläbi vältida, et uuringuga kellegi eraelu kahjustataks.

Nõusoleku küsimine on lihtsam ja selgem lahendus, mis ei eelda tudengilt ja tema juhendajalt õiguslikku kaalutlemist. Seetõttu on tudengitöö puhul soovitatav alati eelistada nõusoleku küsimist.

Euroopa Liidu isikuandmete kaitse üldmäärus on keskne õigusliku regulatsiooni vahend, mille suurem eesmärk on ühtlustada isikuandmete töötlemist puudutavaid õiguslikke norme liikmesriikideüleselt, et seeläbi võimaldada isikuandmete vaba liikumist Euroopa Liidu piires, tagades samal ajal piisava kaitse üksikisiku privaatsusele. Kuigi üldmäärus võib tavapäraste ülikooliõpingute kontekstis tunduda kauge, tuleb siiski arvestada, et ka lõputöö või õppetöö tarbeks isikuandmete kogumine ja edasine töötlemine peab olema kooskõlas üldmääruse normide ja põhimõtetega.

Lisaks üldmäärusele reguleerib isikuandmete töötlemist ka Eesti isikuandmete kaitse seadus. Kuigi Eesti seadus võib tunduda Eestis läbiviidavate uuringute osas lähedasem või sobivam, sisaldab see vaid mõningaid erandeid, mis tudengitöö kontekstis ei ole olulised. Eesti seaduses on siiski üks oluline erand, mis käsitleb teadusuuringute eesmärgil isikuandmete töötlemist ilma inimese nõusolekuta (§ 6). Selle paragrahvi alusel toimuvad teadusuuringud, kus inimeselt nõusoleku küsimine ei ole võimalik, näiteks kui küsitakse registritest või andmekogudest suure hulga inimeste andmeid.

Isikuandmete kaitse regulatsioon tugineb mõnele üldisemale põhimõttele, millest on kantud suurem osa Euroopa Liidu üldmääruse normidest. Nende põhimõtete tundmine annab esmase arusaama sellest, mida isikuandmete kogumisel ja töötlemisel tuleb silmas pidada.

Seaduslik töötlemine: isikuandmete töötlemine on seaduslik, kui see põhineb ühel üldmääruses nimetatud õiguslikul alusel. Tavapärane õiguslik alus sotsiaalteaduslikes uurimustes on uuritava nõusolek. Siinne juhend on kirjutatud eeldusega, et sotsiaalteadusliku uurimuse raames töödeldakse isikuandmeid nõusoleku alusel. Kuigi leidub olukordi, kus isikuandmeid töödeldakse nõusolekuta (nt avalike andmekogude andmete kasutus uuringutes, sotsiaalmeediast isikuandmete kogumine), eeldab see natuke paremat andmekaitse valdkonna tundmist. Nõusolekuta uuringud on samuti seaduslikud, kuid sel juhul tuleb täita Eesti isikuandmete kaitse seaduses sätestatud täiendavaid tingimusi, et uuritavate õigused oleksid piisavalt kaitstud.

Läbipaistvus: isikuandmete töötlemine on läbipaistev, kui inimestele antakse piisavalt ja selget teavet selle kohta, kes, milleks ja kuidas nende andmeid töötleb. Tavapäraselt aitab uuringutes  läbipaistvust tagada nõusolekuvorm või eraldi teabeleht ning võimalus uurijalt lisainfot küsida.

Eesmärgipärasus: isikuandmete töötlemisel peab olema selgelt ja võimalikult täpselt määratletud eesmärk ning töötlemine peab piirduma selle eesmärgiga. Isikuandmete töötlemise eesmärgi sõnastamisel saab toetuda uurimuse eesmärgile – see peab olema sõnastatud täpsemalt kui lihtsalt huvi pakkuva probleemi „uurimine“. Kui uuring toimub mõne projekti raames, saab eesmärgi sõnastamisel lähtuda projekti eesmärgist.

Minimaalsus: isikuandmeid tuleks koguda ja töödelda võimalikult vähe, st üksnes nii palju, kui on eesmärgi saavutamiseks vajalik. Isikuandmete üleliigset kogumist ja töötlemist tuleb vältida. Andmekoosseisu määratlemisel saab eeskuju võtta varasematest uuringutest, kui tegemist on standardse meetodiga või varem läbiproovitud uuringudisainiga. Kuna sotsiaalteadusliku uuringuga kaasneb alati mõningane määramatus, on keeruline öelda, millised andmed on vajalikud ja millised on ülearused. Oluline on, et uurija teaks ja oskaks põhjendada, miks uuringus just selliseid andmeid vaja on.

Säilitamise piirang: see on eraldiseisev põhimõte, mille kohaselt tuleb isikuandmed pärast eesmärgi täitmist (ehk pärast uuringu lõppu) kustutada või anonüümida (vt anonüümimise kohta täpsemalt allpool). Teadusuuringutele  kehtib selle põhimõtte puhul erand, mis lubab isikuandmeid säilitada kauem, kuid seda vaid uute teadusuuringute vajadusteks. Erandile toetumine eeldab, et uurija teab ja oskab põhjendada, miks uuringus kogutud andmeid on vaja kauem säilitada, ning tagab, et see oleks kooskõlas üldmääruse ja Eesti isikuandmete kaitse seaduse nõuetega. Kui tudengitöö on osa suuremast projektist, on võimalik, et mingi osa isikuandmeid säilitatakse ka tulevaste uuringute jaoks. Tavapärasem on siiski see, et tudengitöö kaitsmise järel kaob ka vajadus uuringu aluseks olevaid isikuandmeid täiendavalt säilitada, mistõttu tuleks need esimesel võimalusel kustutada (nt allkirjastatud nõusolekuvormid, intervjuude salvestised) või anonüümida (kvantitatiivsed andmestikud, kust tuleks kustutada või üldistada kõik tuvastamist võimaldavad tunnused).

Turvalisus: isikuandmete töötlemine on turvaline, kui on tagatud, et kõrvalised isikud (st kõik, kes ei ole uuringu tegemisega otseselt seotud) ei pääse isikuandmetele ligi, ja on tagatud, et isikuandmed on kaitstud soovimatute muudatuste või hävinemise eest. Lihtsaim lahendus on kasutada võimalikult suurel määral ülikooli pakutavaid infosüsteeme ja teenuseid (e-post, võrguketas, digitaalne arhiiv). Isikuandmete töötlemine isiklikus arvutis või telefonis ei ole keelatud, kuid sellisel juhul peab uurija ise tagama, et andmed oleksid korrektselt varundatud ja et kõrvalised isikud (nt sõbrad või pereliikmed) andmetele ligi ei pääseks. Turvalisust aitab tagada näiteks see, kui jagada isikuandmeid krüpteeritult (andmefaile ei saadeta niisama kirja manuses) või kui andmed enne analüüsiga alustamist pseudonüümida (vt täpsemat seletust allpool).

Üldine soovitus on enne isikuandmete kogumist või nende töötlemisega alustamist mõelda eespool nimetatud andmekaitse põhimõtetele. Kui midagi tundub vastuoluline, küsitav või ebaselge, viitab see võimalikule probleemile, millega tuleks võimalikult varakult tegeleda. Täiendavalt saab anda veel paar soovitust.

  1. Küsi nõu ja abi: keegi ei eelda, et üliõpilane, kes puutub võib-olla esimest korda elus teadlikult kokku isikuandmete kogumise ja töötlemisega, teab ja tunneb andmekaitse valdkonda. Andmekaitse põhimõtetest alustamine on hea lähtekoht selleks, et selgeks mõelda, mis on arusaadav ja milles on abi vaja. Nõu võib küsida juhendajalt, kaastudengitelt, andmekaitsespetsialistilt, õppejõult või nõustajalt.
  2. Ole aus ja täpne: aus kirjeldus isikuandmete töötlemisest aitab suurendada läbipaistvust ja vähendab riski, et mõni osaline on uuringust, selle eesmärkidest, sisust, kestusest või mahust valesti aru saanud. Väldi ilustamist või ülemääraselt suurustavaid lubadusi uuringu osalistele.

Isikuandmed on üldmääruses (art 4 lg 1) defineeritud kui mistahes teave tuvastatud või tuvastatava isiku kohta. Määratlus on väga lai, kuna oluline pole see, mida andmed kirjeldavad, vaid nende andmete seos konkreetse inimesega. Isegi kui uurimistöö raames vaadeldakse inimeste kodust keskkonda – näiteks tubade arvu, ruumikust, valguse määra, õhukvaliteeti, temperatuuri vms –, on tegemist isikuandmetega seni, kuni koduste olude kirjeldus on seotud konkreetse inimesega ja uurijale on teada, kelle kodu see on. Sel juhul on ka võimalik koduste olude põhjal teha järeldusi inimese jõukuse või elujärje kohta või oletada, mis piirkonnas ta elab.

Tasub meeles pidada, et mistahes andmed saavad olla isikuandmed. Isikuandmed võivad kirjeldada inimest ja tema identiteeti, sotsiaal-demograafilisi tunnuseid, tervist, heaolu, keha, välimust, käitumist, hoiakuid, harjumusi, elukogemusi, mõtteid, arvamusi, asukohta, suhteid või ühistegevust. Kuna täielikku loendit inimelu või -tegevuse aspektidest ei ole, ei saa anda ka ammendavat loetelu kõigist isikuandmete tüüpidest.

Isikuandmed saavad olla ka mistahes kujul ja vormis. Isikuandmed võivad olla nii struktureeritud (nt tabelina) kui ka struktureerimata kujul (nt vabatekst). Isikuandmed võivad esineda arvudena, tekstina, kujutiste või helina.

Isikuandmete puhul võib aeg-ajalt kohata ekslikku arusaama, et need on vaid tunnused, mille abil on inimene otseselt tuvastatav, näiteks nimi või isiklik meiliaadress. See on liiga kitsas määratlus ja jätaks osa andmeid õigusliku kaitseta. Lisaks otsesele tuvastamisele tuleb arvestada kaudse tuvastamise võimalusega, näiteks kombineerides erinevaid tunnuseid või kõrvutades andmeid avalikult kättesaadavate andmetega. Seega on eksitav küsida näiteks, kas rahulolu tööga (arvuline hinnang skaalal) on isikuandmed, kuna enamasti ei koosne andmestik vaid ühest tunnusest ja selle väärtustest. Selleks et hinnata, kas andmed on isikuandmed või mitte, tuleb otsa vaadata kogu andmestikule, tabeli näitel selle kõigile tulpadele ja ridadele, ja seejärel hinnata, kas andmete põhjal on võimalik luua seoseid konkreetsete isikutega.

Euroopa Liidu isikuandmete kaitse üldmäärusest tuleneb vaid üks üldine isikuandmete liigitus: on tavalised ja eriliiki isikuandmed. Tavalised on kõik need isikuandmed, mis ei ole eriliiki. Eriliiki isikuandmed on

  • andmed, millest ilmneb rassiline või etniline päritolu;
  • andmed, millest ilmnevad poliitilised vaated, usulised või filosoofilised veendumused;
  • andmed, millest ilmneb ametiühingusse kuulumine;
  • geneetilised andmed;
  • füüsilise isiku kordumatuks tuvastamiseks kasutatavad biomeetrilised andmed;
  • terviseandmed;
  • andmed füüsilise isiku seksuaalelu ja seksuaalse sättumuse kohta.

Eriliiki isikuandmed on sellised, mille valesti kasutamise korral on võimalik inimesi diskrimineerida või nende õigusi muul moel kahjustada. Eriliiki isikuandmete töötlemine on üldjuhul keelatud, välja arvatud siis, kui esineb mõni üldmääruses nimetatud erand. Üks erandeid on inimese nõusolek. Seega, kui intervjuu käigus on plaanis inimesega rääkida näiteks tema tervisest või poliitilistest vaadetest, peaks teda eelnevalt teavitama, et uuringus sellistel teemadel räägitakse. Inimene peab sellest aru saama ja andma vabatahtlikult nõusoleku uuringus osalemiseks. Sel juhul on eriliiki andmete töötlemine lubatud; lisaks tuleb järgida muid andmekaitse põhimõtteid ja norme.

Kuigi muus osas andmekaitse õigus isikuandmeid ei liigita, on siiski võimalik, et mõned andmed on teistest oma sisu või mõju tõttu tundlikumat laadi, näiteks andmed laste või sotsiaaltoetuste vajaduse kohta. Sel juhul peab uurija ise konteksti ja andmete tundlikkust tajuma ning vajadusel oma uuringu disaini muutma. Andmekaitse ei ütle ette, millised teemad on tundlikud või millised teemad vajavad uurimist – need hinnangud peab uurija ise andma. Mida olulisem on uuritav probleem, seda põhjendatum on tundlike andmete kogumine. Tundlike andmete töötlemisel tuleks juhinduda siiski minimaalsuse põhimõttest ehk neid võib töödelda juhul, kui need on uuringu eesmärgi saavutamiseks vajalikud.

Isikuandmetega ei ole enam tegemist siis, kui andmeid ei saa algusest peale tuvastatava isikuga seostada või kui andmeid on sellisel viisil töödeldud, et need ei oleks enam tuvastatava isikuga seotud. Niisuguseid andmeid nimetatakse (algupäraselt) anonüümseteks või anonüümsele kujule viidud ehk anonüümitud andmeteks.

Isikuandmete anonüümimine võib esmapilgul tunduda hea ja eelistatav lahendus inimeste eraelu kaitsmiseks. Tegelikkuses ei ole seda aga lihtne saavutada. Lisaks kaasneb andmete anonüümimisega mõningane moonutus või kadu (nt arvulised või sõnalised väärtused üldistatakse väärtusvahemikuks või mõned äärmuslikud või eripärased väärtused, nt fraas „minu olümpiavõitjast poeg“ või vastaja vanus on üle saja aasta, kustutatakse või üldistatakse). Samuti puudub õigus- ja andmeteadlaste seas konsensus, millisel juhul on andmed anonüümsed ja millisel juhul mitte täielikult. Anonüümimise eesmärk on viia inimese uuesti tuvastamise tõenäosus nullilähedaseks.

Andmeteadlased on viimase kahekümne aasta jooksul mitmel korral näidanud, kuidas andmete kombineerimise abil on juba võimalik anonüümseks peetud andmetest isikuid uuesti tuvastada. Narayana ja Shmatikov (2006) kirjeldavad ühte varasemat tuntud näidet, kui USA voogedastusplatvorm Netflix avaldas anonüümitud andmed kasutajate vaatamisajaloo ja reitingute kohta, et läbi viia võistlus parima soovitusalgoritmi leidmiseks. Võistlus kandis nime Netflix Prize ja aastate jooksul osales selles tuhandeid meeskondi. Privaatsuse probleem seisnes avalikustatud andmete eeldatavas anonüümsuses. Narayana ja Shmatikov (2006) selgitavad, kuidas pea poole miljoni kasutaja kohta üle saja miljoni reitingu sisaldavas andmestikus leidus siiski piisavalt unikaalseid kombinatsioone, mis võimaldasid avalikult kättesaadavate andmetega kõrvutatult või taustateadmisi kasutades mõned kasutajad tuvastada.

Sedalaadi isikute uuesti tuvastamise katsete risk on tõenäosuslik. Seetõttu tuleks ka anonüümimisse suhtuda mõningase ettevaatusega ja küsida: milline on tõenäosus, et mõni anonüümseks peetavate andmete taga peituv isik on kõrvalisele isikule tuvastatav? Anonüümsus on hinnanguline – arvestama peab nii saadaolevate tehnoloogiliste lahendustega kui ka sellega, kui palju teadmisi, aega ja ressursse isikute uuesti tuvastamine nõuab.

Anonüümsuse puhul tuleks selgelt eristada kolme seotud mõistet.

  1. Anonüümimine on isikuandmete töötlemine selliselt, et isiku taastuvastamine ei ole enam võimalik ühelgi mõistlikul ja tõenäolisel viisil. Anonüümimine peab tagama, et isikute taastuvastamine on pöördumatult võimatu.
  2. Pseudonüümimine on isikuandmete töötlemine selliselt, et isikuandmeid ei saa konkreetse isikuga seostada, kasutamata selleks täiendavat teavet. Seda täiendavat teavet tuleb hoida salajas. Pseudonüümimine on tagasipööratav, kasutades selleks salajas hoitud teavet (nt koode).
  3. Konfidentsiaalsus tähendab üldiselt salajasust. Kui miski on konfidentsiaalne, siis tuleb seda hoida salajas ja vältida selle sattumist kõrvaliste isikute kätte. Konfidentsiaalsus ei tähenda, et isiku tuvastamine ei ole enam võimalik – kui salajas hoitud andmed lekivad või need varastatakse, siis võivad inimesed olla tuvastatavad.

Anonüümsuse mõistel on tavakeeles ja andmekaitse õiguses kohati erinev sisu. Anonüümsus võib tavakeeles tähendada vaid tõsiasja, et inimese nimi ei ole teada või seda pole esitatud. Näiteks võib veebikommentaari kohta öelda anonüümne, kui selle juures ei ole kommentaari autori või avaldaja nime. Andmekaitse õiguse seisukohast tähendab anonüümsus, et andmesubjekt (st inimene, kelle andmetega on tegemist) ei ole kaasaegset tehnoloogiat silmas pidades ühelgi mõistlikul viisil tuvastatav. Eestiski on teada juhtumeid, kus anonüümse kommentaari autor on üles leitud, kasutades selleks internetiteenuse kasutamise andmeid.

Nime puudumine ei tähenda, et isik ei ole tuvastatav. Tuvastamine võib toimuda tunnuste kombineerimise teel või kui inimene mõne tunnuse poolest teistest (nt oma elukohas) selgelt eristub (nt on väga vana või väga noor, väga pikk või väga lühike, tal on eriline amet või staatus). Kui uurija kustutab andmestikust uuritavate nimed, aitab see küll neile konfidentsiaalsust tagada, kuid see ei ole piisav andmestiku anonüümseks nimetamiseks. Anonüümimiseks tuleks kogu andmestik (vajadusel nii arvulised kui ka vabad ehk tekstilised vastused) hoolega läbi vaadata ja veenduda, et andmetes ei peitu unikaalseid kombinatsioone või muud selgelt eristuvat teavet, mille abil saab uuritava kaudselt tuvastada. Tuvastamist võimaldavad andmed tuleks kustutada või muuta.

Anonüümimine toimub enamasti eraldi andmetöötluse etapina pärast andmete kogumist. Leidub mõningaid meetodeid, mis võimaldavad andmeid kohe anonüümselt koguda, nii et igasugune seostamine kogutud andmete ja tuvastatavate isikutega on võimatu või ebamõistlikult keeruline. Kui kogutud andmed ei ole kohe anonüümsed, siis sellisel juhul tuleb kõiki töötlemise etappe kuni anonüümimiseni, sh ka anonüümimist ennast, käsitleda isikuandmete töötlemisena.

Andmekaitse küsimustele tasub mõelda juba uurimistöö teemat valides. Allpool on kõige olulisemad küsimused, mida kavandamise faasis käsitleda.

Teemavalik

Esiteks, teemavaldkond vihjab sellele, kas ja kuivõrd on uuringu tegemiseks vaja eriliiki või tavapärasest tundlikumaid isikuandmeid. Teiseks, tasub mõelda, kas uuring on osa mõnest teadusprojektist. Kolmandaks, arvestama peab sellega, milline on uurija senine kogemus. Mida suurem on uurija või uurimisrühma kogemus ja pädevus, seda tundlikumate andmetega ümberkäimist saab neile usaldada. Kui uuringut tuleb teha üksi ilma uurimisrühmata ning varasemat uurimistöö tegemise kogemust ei ole, siis on mõistlik alustada vähem tundlikust teemast või andmestikust.

Konfidentsiaalsuse määr

Enne uuringuga alustamist tuleks enda jaoks selgeks mõelda ka see, millist konfidentsiaalsuse ehk salajasuse määra uuritavad ja uuringu sisu vajavad (vt tabel 1). Üldine tava paljudes teadusvaldkondades on, et

1) uuritavatele tuleb tagada võimalikult suur konfidentsiaalsus;

2) uuringu tulemusi toetavad andmed peavad olema võimalikult avalikud.

Nii anonüümimine kui ka pseudonüümimine aitavad neid eesmärke täita. Samas tuleb arvestada ka teistsuguse disainiga uuringutega, mis eeldavad nimelist ehk avalikult osalemist. Sellised uuringud ei ole andmekaitse põhimõtetega vastuolus, kuid uuritavad peavad olema sellisest lahendusest teadlikud ning nõus nendel tingimustel uuringus osalema. Tabelis 1 on toodud ülevaade uuringu tulemuste ja uuringus osalejate võimalikest konfidentsiaalsuse määradest. Tabeli eesmärk on illustreerida konfidentsiaalsuse temaatika keerukust, kuna konfidentsiaalseks ehk salajaseks saab jätta erinevat laadi teavet (toodud näites osaliste identiteet ning osalistelt kogutud andmed) ning erineval määral (avalikud, osaliselt konfidentsiaalsed, täiesti konfidentsiaalsed). Tabel on vaid illustreeriva eesmärgiga, kuna uuringute konfidentsiaalsuse määra kohta puuduvad standardne terminoloogia ja tüpoloogia, kuid samas on sotsiaalteaduslike uuringute praktika mitmekülgne. Seega on võimalikud teistsugused lahendused ja määratlused.

Teadusuuringute eetikas on oluline põhimõte kaitsta uuringusse kaasatute konfidentsiaalsust, aga põhimõte ise ei ütle uurijale, kuidas konfidentsiaalsust tagada. Läbipaistvuse põhimõte eeldab, et uurija avaldab uuringu meetodi, valimi ja andmete kohta võimalikult palju teavet, kuna see võimaldab veenduda uuringu usaldusväärsuses. Läbipaistvus võib olla eriti oluline rakenduslike sotsiaalteaduslike uuringute puhul, mille eesmärgiks on informeerida poliitika kujundamist või pakkuda lahendusi ühiskondlikele probleemidele. Läbipaistvus on oluline näiteks ka ekspertintervjuude puhul, et veenduda, keda uurija eksperdina on käsitlenud. Teine, vastandlik põhimõte on inimese informatsiooniline enesemääramine – kuna inimene peaks saama ise kontrollida, kes ja kuidas tema kohta teavet kasutab, võib inimene soovida oma nime avaldamist. Kui uurimus keskendub üksikutele inimestele (nt eluloolised uurimused, dokumentalistika, etnoloogilised uurimused), võib inimene ise avaldada soovi, et uurimuse tulemusi avaldades ka tema nimi avaldatakse.

Sellegipoolest on osaliste nimede ja uuringuandmete või tulemuste piiranguteta avaldamine erand, mille korral tuleb veenduda, et see on vajalik ja põhjendatud. Tavapäraselt kehtib ikkagi põhimõte, et osalisi ja neilt kogutud andmeid peab käsitlema konfidentsiaalselt, et tagada osaliste õigustele ja huvidele võimalikult suur kaitse. Nagu eespool öeldud, ei lahenda andmekaitse uurija jaoks kõiki privaatsusega seotud probleeme – isegi kui andmete avaldamine on õiguslikult lubatav või võimalik, ei tähenda see, et uurija peaks andmed avaldama. Lisanduvad ka eetilised kaalutlused, milline mõju võib andmete avaldamisel olla uuringus osalejatele või ühiskonnale laiemalt.

Tabel 1. Uuringus osalejate ja uuringu tulemused avalikkuse ja konfidentsiaalsuse vaatest

 Andmed on avalikudAndmed on osaliselt konfidentsiaalsedAndmed on täiesti konfidentsiaalsed
Uuringus osalejad on avalikult tuvastatavadKvalitatiivsed andmed: ekspertintervjuud, milles osalejad ja nende intervjuude täistranskriptsioonid on avalikustatud.   Kvantitatiivsed andmed: väga erandlik. Võib olla võimalik, kui isikud on avaliku elu tegelased või ajaloolised (surnud) isikud (nt meediatekstide kvantitatiivne kontentanalüüs).Kvalitatiivsed andmed: osalejate nimed on avalikult teada, kuid uurija teeb valikud, millist teavet avaldada ja millist mitte, nt eluloolised uurimused või dokumentalistika, kus võib tundlikumad osad jätta avaldamata. Kvantitatiivsed andmed: väga erandlik ja ilmselt ei esine teadusuuringutes.Kvalitatiivsed andmed: ekspertintervjuud, kus on teada küll eksperdid, kellega on räägitud, kuid kogu uuringu sisu on avaldatud üldistatud kujul (nt ei ole kasutatud nimelisi tsitaate vm).   Kvantitatiivsed andmed: asutusepõhised küsimustikud, kus on teada kõik uuringus osalejad (kõik asutuse töötajad), kuid andmestikku ei avalikustata. See jääb asutusesiseseks kasutamiseks.
Uuringus osalejad on tuvastatavad vaid uurijateleKvalitatiivsed andmed: pseudonüümitud intervjuude transkriptsioonide avaldamine ei ole soovitatav praktika. Tekstide pseudonüümimine on keeruline ja tagab vaid minimaalse kaitse, kuna inimene võib olla äratuntav keelekasutuse või ideede kaudu.   Kvantitatiivsed andmed: avaldatakse pseudonüümitud kujul küsitlusandmed näiteks teadusandmete hoidlas või teaduspublikatsiooni juures.Kvalitatiivsed andmed: avaldatakse katkeid pseudonüümitud intervjuudest. Transkriptsioone ei avalikustata ning uurija jätab tundlikumad osad avaldamata.   Kvantitatiivsed andmed: koos teaduspublikatsiooniga avaldatakse pseudonüümitud kujul andmed, kuid mõned tunnused või andmeväljad jäävad avaldamata (nt vabatekstiga vastused küsimustikes).Kvalitatiivsed andmed: intervjuude põhjal kirjutatakse raport, kus kasutatakse katkeid pseudonüümitud intervjuudest, kuid raport on tundliku teema tõttu konfidentsiaalne. Uuritavate isikud on teada vaid uurijatele, kuid uuringu tulemusi tutvustatakse laiemas ringis (nt riigiasutuses), kellel on siiski kohustus seda salajas hoida.  See on teadusuuringutes väga erandlik.   Kvantitatiivsed andmed: avaldatakse küsitlusandmete analüüsi tulemused (statistiline üldistus), kuid alusandmed jäävad vaid uurijate teada ning neid ei jagata.
Uuringus osalejad ei ole kellelegi tuvastatavadKvalitatiivsed andmed: väga erandlik, kuna tekstiliste andmete (nt transkriptsioonid) anonüümimine on väga keeruline ja eeldab teksti muutmist. Kvantitatiivsed andmed: korrektselt anonüümitud andmestik avalikustatakse tervikuna.Kvalitatiivsed andmed: väga erandlik, kuna tekstiliste andmete (nt transkriptsioonid) anonüümimine on väga keeruline ja eeldab teksti muutmist. Kvantitatiivsed andmed: korrektselt anonüümitud andmestik avaldatakse osaliselt või katketena. Näiteks küsimustikuga kogutud andmetest avalikustatakse kvantitatiivne pool, kuid vabatekstiväljad jäetakse avalikustamata.Kvalitatiivsed andmed: ilmselt ei esine kunagi. Kvantitatiivsed andmed: korrektselt anonüümitud andmestik, mis sellele vaatamata on salastatud, näiteks äri- või riigisaladuse kaitseks. Teadusuuringute puhul ei tohiks sellist lahendust esineda.  

Konfidentsiaalsuse seisukohast on tudengitöös soovitatav silmas pidada järgnevat.

  1. Tudengitöös tuleb üldjuhul tagada osalejatele konfidentsiaalsus ning uurimistöö andmeid avaldada minimaalsel vajalikul määral.
  2. Kvalitatiivseid andmeid üldjuhul ei avaldata, kuid neist võib avaldada katkeid (nt intervjuudest tsitaate).
  3. Kvantitatiivseid andmeid võib avaldada vaid pseudonüümitud või anonüümitud kujul.
  4. Uuringus osalenute nimesid tudengitöös ei avaldata, v.a kui see on põhjendatud (nt ekspertintervjuud) ja juhendajaga kokku lepitud.

Andmehaldusplaan

Isikuandmete kogumisega seotud võimalike probleemide ennetamiseks on soovitatav koostada andmehaldusplaan, millesse on kirja pandud kõik andmetega tehtavad toimingud ja andmekoosseisu kirjeldus. Isikuandmeid puudutavate tegevuste dokumenteerimine väljendab uurija hoolsust. Hoolsus ja põhjalikkus isikuandmete töötlemisel näitab uurija vastutustundlikkust ja on üldjuhul kergendav asjaolu, kui peaks aset leidma andmekaitsealane rikkumine (nt andmed lekkisid või varastati).

Loe täpsemalt andmekaitse juhendist dokumenteerimise kohta.

Andmekaitse kontrollküsimustik

Kui kogu plaan on paigas, on soovitatav enne uuringuga edasiliikumist läbi käia isikuandmete töötlemise kontrollküsimustik. See aitab veenduda, et midagi olulist tähelepanuta ei jää.

Inimesele tuleb anda teavet uuringu ja tema isikuandmete töötlemise kohta. Nõusolekul põhinevates uuringutes teavitatakse inimest informeeritud nõusoleku kaudu. Nõusolek teadusuuringus osalemiseks ja nõusolek isikuandmete töötlemise õigusliku alusena on kaks erinevat nõusolekut, kuna nende õiguslik tähendus on erinev ja kumbki eeldab teavitamist erinevaist asjaoludest (vt joonis 1). Tavaks on siiski küsida inimeselt üks nõusolek, tagades, et kõik nõutav teave on inimesele selgelt ja arusaadavalt antud.

Joonis 1.  Kahe nõusolekukontseptsiooni inimesele esitatava teabe võrdlus

Nõusoleku küsimise käigus uuritavale antav info on uurijale eetiliselt ja õiguslikult siduv. Uuritavale antud lubadusi tuleb alati täita. Seega tasub olla tähelepanelik, mida inimestele lubatakse; kas see on mõistlik ja vajalik; kas see on andmekaitse vaatest korrektne.

Allpool on mõningad soovitused, mida uuringusse kaasatud inimeste teavitamisel silmas pidada.

Kirjelda võimalikult täpselt plaanitavaid tegevusi.

Selle asemel et murda pead, kas tegemist on või ei ole anonüümimisega, võiks uuritavale lihtsalt selgitada, mida tema andmetega tehakse. Kolm olulisemat küsimust on järgmised: 1) millised andmed kustutatakse ja millised jäävad alles; 2) millised andmeid jagatakse või avaldatakse ning milliseid andmeid hoitakse salajas; 3) mis saab andmetest pärast uuringu lõppu.

Nõusolekuvormis võib inimesele näiteks selgitada, et pärast intervjuude transkribeerimist asendatakse nimed pseudonüümiga, kustutatakse pseudonüümide „võtmed“ (millise pseudonüümiga tähistatakse millist uuritavat) ning kustutatakse ka intervjuude salvestised. Täiendavalt saab näiteks lubada, et transkriptsioonist eemaldatakse kohad, mis osalisi tuvastavad, või et pseudonüümitud transkriptsioone hoitakse salajas (konfidentsiaalselt), nii et vaid uurimisrühma liikmed saavad neid näha. Kui see on asjakohane, võib lubada ka transkriptsioonide kustutamist pärast uuringu lõppemist. Iga inimene saab sel juhul ise otsustada, kas tema jaoks on loetletud tegevused piisavad ja kas ta on nõus uuringus osalema.

Ära luba anonüümsust, kui sa ei kasuta andmestikule sobivaid anonüümimise meetodeid.

Anonüümimise lävend on küllaltki kõrge ja seda ei saa üldjuhul saavutada vaid nimede eemaldamisega. Kuigi tunnuste (sh nime) eemaldamine on üks üldiseid anonüümimise meetodeid, tuleb vajadusel kasutada ka muid võtted: üldistamist (väärtuste või tunnuste grupeerimist) ning juhuslikustamist (andmete randomiseeritud moonutamine). Sobiv ja piisav anonüümimise lahendus sõltub suurel määral andmestikust. Seega võib leiduda olukordi, kus nime eemaldamine on piisav, kuid selles peab uurija kindlasti veenduma. Eelkõige sobib anonüümimine kvantitatiivsete andmestike puhul, kvalitatiivsete andmestike (nt tekstide) anonüümimine võib olla keeruline või isegi võimatu, kuna eeldab tekstist kõikvõimalike fraaside, mõtete ja kirjelduste eemaldamist, mis inimesi võiks tuvastada.

Anonüümsuse asemel võib rääkida konfidentsiaalsusest – ja nagu eelnevalt soovitatud, tuleks inimesele ausalt ja lihtsalt selgitada, milline osa teabest jääb konfidentsiaalseks ja millist osa jagatakse teiste teadlastega või avalikult.

Isikuandmete kogumiseks on erinevaid sotsiaalteaduslikke meetodeid. Andmekaitse seisukohast on kõige olulisem samm uuringu kavandamine, kus tuleb langetada peamised valikud õigusliku aluse, kogutavate andmete ja nende edasise kasutuse kohta. Andmete kogumise hetkeks peaksid olema kõik suuremad probleemkohad lahendatud. Allpool on andmekogumismeetodite kaupa välja toodud erinevad aspektid, millele tasub tähelepanu pöörata.

Intervjuu

Intervjuu puhul tuleb kogu intervjuu sisu käsitleda isikuandmetena, kuna selles võib esineda „mistahes teave“ tuvastatava isiku kohta. Kuna intervjuu tekst on struktureerimata, on ka keeruline hinnata, mis selles on tundlik või mis täpselt võimaldab rääkijat tuvastada. Mõnel juhul võib isegi sõnakasutus olla piisav inimese tuvastamiseks – selleks kasutatakse erinevaid stiilimeetria meetodeid. Sel põhjusel on intervjuu teksti täielik anonüümimine keeruline või isegi võimatu ja nii ei tohikski uuritavale anonüümsuse tagamist lubada.

Transkriptsioonide avaldamine või jagamine on põhjendatud juhtudel siiski võimalik, kui kasutusele võetakse vajalikud meetmed osaliste kaitseks ning intervjueeritavad on selleks nõusoleku andnud. Kui intervjuul on oluline teaduslik või ajalooline väärtus, võib olla vajalik transkriptsiooni (või toimetatud intervjuu) tähtajatu säilitamine. Kui intervjueeritavale selgitada, miks on see vajalik (eesmärgi põhimõte eeldab pikaaegse säilitamise eesmärgi selget sõnastamist), kes ja kuidas andmeid säilitab, võib selleks intervjueeritavalt eraldi nõusoleku küsida.

Intervjuude salvestamine on levinud praktika. Selle tulemusena tekkivate salvestistega tuleb samuti tegeleda. Tavaliselt kustutatakse need pärast intervjuude transkribeerimist. Sedagi peaks intervjueeritavale selgelt ütlema.

Lisaks võivad isikuandmed esineda nõusolekuvormil, kui see kirjalikult täidetakse ja allkirjastatakse. Kui uurija lepib intervjueeritavaga sobivat aega kokku, tekivad isikuandmed ka kirjavahetuse ja kontaktandmete kujul. Kuna kontaktandmeid saab kasutada ka isiklikuks suhtluseks teiste inimestega, ei ole kontaktandmete olemasolu ja alles jäämine enamasti probleem. Kui aga intervjueeritava konfidentsiaalsuse tagamine on oluline, tuleks kustutada kõik andmejäljed, mis võimaldavad teda tuvastada.

Küsitlus

Küsitluse puhul tuleb samuti arvestada, et vastuste teel saadav teave on isikuandmed, kui esineb seos vastaja ja vastuste vahel. Enamasti küsitlusuuringutes vastaja nime ei küsita, kuid see iseenesest ei ole veel piisav küsitluse anonüümsena esitlemiseks. Hindama peab ka seda, kas vastaja on võimalik tuvastada kaudselt, näiteks tunnuste unikaalsete kombinatsioonide kaudu, vabateksti vastuste või kontaktandmete (nt vastaja meiliaadressi) kaudu. Mõnikord koguvad veebipõhised küsitluskeskkonnad vastaja seadme või veebiseansi kohta täiendavaid metaandmeid, nagu IP-aadress, vastamise aeg või kasutatav seade – ka need võivad pakkuda täiendavaid võimalusi inimese tuvastamiseks. Paljud küsitluskeskkonnad võimaldavad sellise andmekogumise välja lülitada, mida on soovitatav ka teha.

Erinevalt intervjuutekstidest on küsitlustulemused anonüümitavad, kuna andmed on struktureeritud ja meetodid selliste andmete anonüümimiseks on olemas. Anonüümimise küsimus on oluline eelkõige juhul, kui tekib vajadus andmeid jagada või avalikustada. Sel juhul on mõistlik juba varakult koostada küsitlusankeet selliselt, et vastajate sotsiaal-demograafilised tunnused (nt vanus, haridus, sissetulek) on üldistatud vahemikeks ning ei küsita ka muude tunnuste täpseid väärtusi. Näiteks küsitakse täpse ametinimetuse asemel valdkonda, täpse vanuse asemel vanusevahemikku, täpse laste arvu asemel laste arvu vahemikku. See vähendab vastajate tuvastamise tõenäosust. Loomulikult ei pruugi see lahendus iga küsitluse puhul toimida – tunnused ja nende väärtused tuleks määratleda eelkõige selle järgi, mis on uuringu teaduslik eesmärk ja millise täpsusega andmeid on selle eesmärgi täitmiseks vaja.

Hoolikalt plaanides on võimalik korraldada küsitlusuuring, mida võib pidada algusest peale anonüümseks. See eeldab, et inimeselt ei küsita tema nime ega kontaktandmeid, välja on lülitatud küsitlusseansi metaandmete kogumine, kasutusele ei ole võetud vastajate jälgimise lahendusi (ingl k respondent tracking) ning küsitluses kasutatakse võimalikult suurel määral väärtuste vahemikke, mitte konkreetseid väärtusi.

Fookusgrupi intervjuu

Fookusgrupi puhul tuleb silmas pidada samu aspekte nagu intervjuul, kuid lisandub rühma aspekt, mis teeb konfidentsiaalsuse tagamise raskemaks. Kuna rühma liikmed teavad, kes intervjuul osalesid, on pea võimatu lubada osalistele anonüümsust, kuid ka konfidentsiaalsuse tagamine võib olla keeruline, kui mõni rühmaliige välja räägib, kes mida ütles.

Fookusgrupi puhul on osalejate konfidentsiaalsuse tagamine kollektiivne vastutus ja uurija ei saa üksi kontrollida, kes mida fookusgrupis kuuldud infoga edasi teeb. Eelistatult võikski tegemist olla sellise teema ja osaliste ringiga, et konfidentsiaalsuse tagamine ei ole oluline. Kui fookusgrupp koosneb ekspertidest, võib olla põhjendatud suurem avalikkuse määr, kuid see tuleks selgelt osalistega eelnevalt kokku leppida. Näiteks võib osalistelt küsida, kas neile sobib, kui nende seisukohtadele viidatakse uuringutulemustes nimeliselt. Kui fookusgrupis käsitletav teema on tundlikum ja on teada, et osalised jagavad isikliku elu seiku ja kogemusi, või leidub muu põhjus, miks konfidentsiaalsus on oluline, võib mõnel puhul osalistega täiendava konfidentsiaalsuslepingu sõlmida. Tavapärasem on siiski kõigile osalistele meelde tuletada vastastikuse lugupidamise ja eraeluliste seikade kaitsmise vajadust, ilma et sellega kaasneks allkirjastatav kinnitus.

Vaatlused

Vaatlusmeetodid varieeruvad oluliselt näiteks uurija osaluse määra poolest, kuid andmekaitse vaatest on tähtis pigem see, milliseid märkmeid vaatleja teeb, millise üldistusastmega ning kuivõrd tekib võimalus vaatlusandmeid konkreetsete inimestega seostada. Kui vaatlusandmeid salvestatakse, tekivad suure tõenäosusega ka isikuandmed. Kui vaatlus toimub selgelt piiritletud isikute ringis (nt mingi asutuse ühe osakonna töötajad) ning vältab pikemat aega, on samuti tõenäoline, et vaatlusandmete põhjal on isikud kaudselt tuvastatavad. Kui vaatlusandmetesse tehakse nimelisi märkmeid selle kohta, kes mida tegi või ütles, on need kindlasti isikuandmed. Samas ei kujuta vaatlemine – see, kui uurija kõnnib vaadeldavas keskkonnas ringi ja oma pilguga sündmusi jälgib – endast isikuandmete töötlemist.

Vaadeldavate isikute konfidentsiaalsuse tagamiseks tuleks uuringu disain juba varakult läbi mõelda. Sõltuvalt vaatluse kestusest võivad osalusvaatluse märkmed olla niivõrd detailsed ja mitmekülgsed, et nende anonüümimine ei olegi võimalik – inimesed võivad olla äratuntavad ka oma rutiinide, harjumuste või käitumuslike eripärade kaudu.

Kõrge üldistuse astmega vaatlusuuringud (nt nähtuste või tegevuste loendused) võivad anda ka kohe anonüümse andmestiku, kui loendustulemused salvestatakse arvudena ja täiendavaid andmeid inimeste kohta ei koguta. Sellisel juhul ei ole tegemist isikuandmete töötlemisega ning sellega kaasnevate kohustuste pärast ei pea muretsema. Kui vaatlusele lisaks toimuvad uuritavatega ka intervjuud, saab vaatlust käsitleda osana laiemast uuringuplaanist, mida on uuritavatele tutvustatud ja mille kohta nad on teadliku nõusoleku andnud.

Oluline on arvestada, et teadusuuringu eesmärgil võib isikuandmeid töödelda ka ilma inimese nõusolekuta, kui järgitakse isikuandmete kaitse seadust. Selline lahendus eeldab andmekaitse valdkonna paremat mõistmist ja tuleks igal juhul juhendaja või uurimisrühmaga läbi arutada.

Avalikustatud isikuandmete kogumine

Kui uurimistöö raames on kavas koguda avalikustatud andmeid (nt meediatekste või sotsiaalmeediapostitusi), siis tuleb meeles pidada, et need postitused või tekstid on enamasti loonud tuvastatavad isikud, mistõttu on tegemist isikuandmetega. Sel juhul tuleb andmekaitse põhimõtteid ja neist tulenevaid nõudeid järgida olenemata sellest, et andmed on juba avalikustatud.

Üldjuhul ei põhine selline andmekogumine inimeste nõusolekul, mistõttu kehtib ka siin sama soovitus – kuna tegemist on nõusolekuta isikuandmete töötlemisega teadusuuringus, põhineb see eranditel, mille korrektne kasutamine eeldab mõnevõrra suuremat teadlikkust andmekaitsest ja tuleks juhendaja või uurimismeeskonnaga läbi arutada.

Sotsiaalmeediast andmete kogumisel võivad piiravaks saada ka eetilised kaalutlused, kuna arvestama peab uuritavate eeldatava privaatsuse määraga. Kuigi põhimõtteliselt on sotsiaalmeedia avalikus sfääris, toimuvad seal ka privaatvestlused või tegevused piiratud osalistega gruppides, kus inimesed võivad oodata suuremat privaatsust. Eetiliste kaalutluste puhul on soovitatav lugeda rahvusvahelise internetiuurijate assotsiatsiooni (AoIR) eetikakoodeksit, mis koondab internetiuurijate kogukonna endi loodud praktikaid ja häid tavasid, mis võivad olla nüansirikkamad.

Eriti tähelepanelik tuleb olla selle osas, kas avalikustatud tekstidest kogutakse andmeid, mida saab pidada isikuandmete eriliikideks (nt andmeid tervise kohta). Kui teadusuuringutes töödeldakse ilma nõusolekuta isikuandmete eriliike, peab isikuandmete kaitse seaduse § 6 lg 4 kohaselt uuringu kooskõlastama eetikakomitee.

Tudengitöö puhul võib mõtteliselt uuringu lõpuks pidada seda, kui uurimistöö on kaitstud ja hinnatud. Uurimistöö andmeid võib säilitada veel paar kuud, kui see võib olla vajalik uurimistöö tulemuste kontrollimiseks, kuid üldjuhul tuleb tudengitöö kaitsmise järel astuda veel viimane samm ja kustutada need isikuandmed, mida enam vaja ei ole. Kustutada tuleks kõik sellised kõrvalised andmed, mida ei ole plaanis või ei saagi anonüümida: salvestised, koopiad, kontaktandmed, kirjavahetus uuritavatega, nõusolekulehed jms.

Alternatiiv kustutamisele on anonüümimine. Kui kogu andmestik on korrektselt ja lõplikult anonüümitud, võib seda teiste uurijatega jagada või ka avalikult kättesaadavaks teha. Nagu eespool mainitud, võib anonüümimisega kaasneda mõningane kadu – arvulisi väärtusi üldistatakse või need eemaldatakse, tekstilistest andmetest kustutatakse lauseid või detaile. Kui anonüümimise käigus andmestik liigselt moondub, võib kaduma minna selle eeldatav kasu ja tuleks kaaluda, kas anonüümimine on sel juhul üldse mõistlik.

Erandjuhtudel võib olla vajalik isikuandmeid säilitada ka pärast uuringu lõppu tulevaste uuringute jaoks. Tudengitööde puhul ei tohiks seda ette tulla, küll aga teadusprojektides, eriti longituud- ehk pikiuuringutes, kus tuleb kokku viia mitme uuringulaine jooksul samadelt osalejatelt kogutud andmed, et neid võrrelda. Teadusuuringu käigus ei ole isikuandmete pikaajaline säilitamine keelatud, kuid see eeldab põhjalikku kaalumist ning seda peaks juba uuringut kavandades ette nägema. Kõige selgem ja õiglasem oleks niisugune lahendus, kus teaduslikult väärtuslike isikuandmete pikaajaline säilitamine on määratletud eraldiseisva isikuandmete töötlemise eesmärgina, millest on uuritavat teavitatud ja milleks on ta andnud nõusoleku. Loe lisaks andmekaitse juhendi peatükki teadusandmete säilitamise kohta.

Euroopa andmekaitseõiguse käsiraamat (2018). https://fra.europa.eu/et/publication/2020/euroopa-andmekaitseoiguse-kasiraamat-2018-aasta-valjaanne

Juurik, M., Mäesalu, T., & Tarkpea, T. (2023). Andmekaitse teadustöös. Tartu Ülikool; TÜ Wiki. https://wiki.ut.ee/pages/viewpage.action?pageId=196183311

Euroopa Parlamendi ja Nõukogu määrus (EL) 2016/679, 27. aprill 2016, füüsiliste isikute kaitse kohta isikuandmete töötlemisel ja selliste andmete vaba liikumise ning direktiivi 95/46/EÜ kehtetuks tunnistamise kohta (isikuandmete kaitse üldmäärus), ELT 119/1. http://data.europa.eu/eli/reg/2016/679/2016-05-04

Narayanan, A.; Shmatikov, V. (2006). „How To Break Anonymity of the Netflix Prize Dataset“. arXiv:cs/0610105

Accept Cookies