Julkisuuteen tuodun tiedon ja sen unohtamisen oikeutus – yleisen edun ja kehkeytymisen haasteita

Tutkija toimii osana laein säädeltyä yhteiskuntaa, joten tutkimukseen vaikuttavien lakien muutoksista on hyvä olla perillä – ne usein vaikuttavat tutkijoiden käytännön työhön. Tämän tekstin tarkoitus on osoittaa, että julkiseksi saatetun tiedon muuttuminen, esimerkiksi ryhmien ja identiteettien kehkeytymisen takia, on suuri laskennallisen yhteiskuntatieteen eteen avautuva eettinen rajaseutu. Yksittäisen tutkijan on tutkimastaan ilmiöstä riippuen hahmotettava erilaisten kehkeytymisprosessien luonnetta ja otettava huomioon, miten tutkittavien mieli ja sitä myötä tulkinnat saattavat ajan kuluessa muuttua.

cocoons-329070_1920

Taustaa

Online-aineistojen hankintaa ja käsittelyä formalisoi taannoin niin kutsuttu tietosuoja-asetus, lyhyemmin GDPR (Euroopan parlamentin ja neuvoston asetus luonnollisten henkilöiden suojelusta henkilötietojen käsittelyssä sekä näiden tietojen vapaasta liikkuvuudesta (yleinen tietosuoja-asetus), 2016). Nykyisen tietosuoja-asetuksen edeltäjä (Henkilötietolaki 1999) määritteli erikseen arkaluontoiset tiedot, joukossaan poliittinen suuntaus ja terveystieto. Koska arkaluontoisia tietojakin koskeva tutkimustyö oli aina sallittu, tutkijat määrittelivät sisäisillä säännöillään sen, millainen tieto täsmälleen käsitetään vaikkapa terveystiedoksi, ja miten sen arkaluontoisuuteen pitäisi käytännössä suhtautua.

GDPR-käsitteistössä arkaluontoisten, eli “erityisten henkilötietoryhmien” (9. artikla) käsittely ei ole kiellettyä sikäli kun se “koskee henkilötietoja, jotka rekisteröity on nimenomaisesti saattanut julkisiksi”. ”Julkisuuteen saatetulla tiedolla” on kuitenkin muuttuva luonne. Yksi tutkijan uudistunut vastuu tietosuoja-asetuksen ja eräiden muiden viimeaikaisten lakien ja tulkintojen jälkeen onkin hahmottaa, mikä milloinkin on se täsmällinen tieto, joka on nimenomaisesti saatettu julkiseksi. Kehkeytyvien ryhmien ja identiteettien tutkimuksen esimerkit osoittavat uudistuneita eettisten ja tulkinnallisten pohdintojen paikkoja.

Mikä halutaan unohtaa, mikä tieto milloinkin saatettiin julkiseksi ja mistä ei vielä tiedetä mitä julkisuuteen ollaan laittamassa tai miltä se voi tulevaisuudessa näyttää?

Jotkut tiedot on jossain vaiheessa saatettu julkisiksi, mutta myöhemmin ne halutaan poistaa julkisuudesta. GDPR:n tunnetuimpia seurauksia lienee niin kutsuttu “oikeus tulla unohdetuksi”; rekisteröidyn oikeus pyytää itseään koskevien tietojen poistamista. Tämä oikeus on linjassa tutkimuksen kanssa, jonka mukaan enemmistö online-tutkimuksen kohteista pitää epämukavana ajatusta, että heidän myöhemmin poistamaansa Twitter-viestiä käytettäisiin tutkimuksessa (Fiesler and Proferes 2018). ”Oikeus tulla unohdetuksi” onkin hyvä esimerkki siitä, kuinka lakeja kirjoitetaan ajan myötä uudelleen ja tulkitaan eri paikoissa eri tavoilla. Aiempi Suomen henkilötietolaki (1999) ei tunnistanut unohtamisen oikeutta lainkaan, jolloin tietojen poistamisen huomioon ottaminen jäi tieteen sisäisen ja jopa yksittäisen tutkijan pohdinnan varaan. GDPR:n (2016) mukaan henkilötietojen käsittely ei ole lainmukaista enää sen jälkeen kun rekisteröity on perunut suostumuksensa, erityisesti silloin kun rekisteröity on antanut suostumuksensa lapsena. Käsittelyn tulisi silti edelleen olla lainmukaista tutkimustarkoituksiin. Vaikka Fieslerin ja Proferesin (2018) tavoittamat tutkittavat eivät siitä pitäisikään, GDPR ei kiellä tutkijaa hyödyntämästä tutkimuksessaan myös poistettuja henkilötietoja (kuten poliittisen kannan ilmaisevia Twitter-viestejä). Muotoilullaan GDPR silti alleviivaa, että muissa konteksteissa moinen ei olisi mahdollista. Suomen tietosuojavaltuutettu ohjaa tutkijaa tässä linjauksellaan, että rekisteröidyllä ”ei ole oikeutta” poistattaa häntä koskevia tietoja, jos tieto on “tarpeen” “yleisen edun” mukaisessa tutkimustarkoituksessa[1]. Suomalaisessa tulkinnassa ”yleinen etu” menee näin yhdysvaltalaisten Fieslerin ja Proferesin tutkiman yksityisen edun edelle. GDPR ei kuitenkaan sitä edellytä.

Mitä tämä ”yleinen etu” sitten käytännössä tarkoittaa? COVID-epidemian pyörteissä voidaan nostaa esiin tietosuojavaltuutetun linjaama kansanterveyteen liittyvä yleinen etu, jota hahmottelee myös hiljattain säädetty, niin kutsuttu toisiolaki (Laki sosiaali- ja terveystietojen toissijaisesta käytöstä 2019). Tutkimukseen vaikuttavassa lainsäädännössä on kuitenkin määritelty muitakin yleisiä etuja. Niin kutsutut tiedustelulait, (Laki sotilastiedustelusta 2019), sekä (Laki henkilötietojen käsittelystä rikosasioissa ja kansallisen turvallisuuden ylläpitämisen yhteydessä 2018), hahmottelevat nykyään myös Suomessa rajalinjoja tutkijalle ja tutkittaville, joiden toimien voisi tulkita olevan kansallisen turvallisuuden kannalta kiinnostavia. Tämän tyyppiset tutkimusaiheet eivät ole suorastaan harvinaisia – esimerkkinä palvelkoon kapinallisryhmien mobilisoituminen onlinealustoilla, kuten (Käihkö 2020):n Ukrainaa käsittelevässä julkaisussa. Tutkijan luonnollisesti kuuluu pohdiskella esimerkiksi sitä, kuka kuuluu kapinallisryhmään, millä perusteella, ja millä perustein tutkittavat sekä tutkittava ryhmä valitaan ja identifioidaan. Asiaa mutkistaa se, että Internetissä myös leikitellään identiteeteillä (Lampinen, Lehtinen, and Cheshire 2014), ja toisaalta poliittisten ryhmien päämäärät muokkautuvat vähitellen diskursiivisessa prosessissa (Tilly 2002). On siis oltava sensitiivinen sille, kuinka vakaasti joku on saattanut julkiseksi tiedon siitä, että edustaa tiettyä poliittista kantaa. Tutkijan valinnoilla voi olla viime kädessä tuomioistuinseuraamuksia.

”Oikeus unohtaa” ei siis koske aivan kaikkia tilanteita, mutta lainsäädännön aluevaltaukset eivät ole pelkästään syy hämärtää tutkittavien poliittista kantaa viranomaisten pelossa. Laajemmin ymmärrettynä tutkija tarvitsee sensitiivisyyttä niin sille, miten tutkittava tutkimuksessa kullakin hetkellä nimetään, kuin sille, kuinka hänen annetaan suhtautua menneisyyteensä. GDPR:ssä esimerkkinä ”oikeudesta unohtaa” käytetään lapsena annetun suostumuksen peruuttamista. ”Success kid”-meemi on kuitenkin ambivalentti ääriesimerkki tapauksesta, jossa yhtä lapsuuden hetkeään ei voi koskaan unohtaa, koska siitä on tullut osa kulttuurista kuvastoa[2]. Nuorison tutkimista Internet-kontekstissa on aiemmin ansiokkaasti pohtinut esimerkiksi (Tikka 2014), mutta kuinka tutkijoina otammekaan huomioon aikuiset, joiden suhtautuminen julkisuuteen saattamaansa tietoon muuttuu? Esimerkkejä usein staattisiksi oletettujen tietojen muutoksesta voidaan nimetä kaksi. Poliittisen kannan muuttumisen esimerkkinä palvelkoon radikaalin suomalaisen vastarintaliikkeen perustaja, joka katsoo menneisyyttään katumuksella, ja on kirjan julkaisemalla tehnyt aiempiin ajatuksiinsa pesäeron (Holappa 2016). Toisen tyyppinen esimerkki ovat henkilöt, jotka haluavat jossain vaiheessa muuttaa usein staattiseksi oletettua ominaisuutta kuten julkiseksi saatettua ”sukupuoli”-kategoriaa. Julkisiin esimerkkeihin kuuluvat sukupuoltaan korjanneet suomalainen kirkkoherra Aalto[3] ja yhdysvaltalainen ex-urheilija-televisiotähti Jenner[4]. Jälkimmäiset kaksi eivät haastatteluissaan Holapan tavoin tuomitse aiempaa elämänvaihettaan. Näitä hyvin erilaisia esimerkkejä yhdistää kuitenkin se, etteivät ihmiset aina näytä kaipaavan ”oikeutta unohtaa”. He työstävät julkiseksi tiedoksi päätynyttä menneisyyttään ja nykyisyyttään osana ympäristöään. Tämä tutkijan tulee ymmärtää silloinkin, kun työstäminen saatetaan vain osittain julkiseksi.

Pohdinnat kiertyvät lopulta yhden ja saman aiheen ympärille: Online-tutkijalle tarjoutuva julkisuuteen saatettu tieto on muuttuvaa. Se voi olla alkujaankin tulkinnanvaraista, ja mahdolliset tulkinnat muuttuvat ajan myötä. Esimerkiksi kehkeytyvät poliittiset ryhmät eivät suinkaan ole alusta asti päämäärätietoisia ja stabiileja. Niiden ideologia ja jäsenyys on etenkin alkuvaiheessa yleensä huokoista; rajat ovat vasta kehkeytymässä (Abbott 2014, 2016; Tilly 1978). Toisaalta erityisesti marginaalista nouseviin identiteetteihin on kehkeytymässä intersektionaalisuutta, jossa eri lähtökohdista ponnistavat identiteetit löytävätkin yhteneväisyyksiä toistensa kanssa (Abbott 2001; Crenshaw 1989; Tormos 2017). Käymistilassa olevien identiteettien kantajat toisaalta käyvät läpi omaa identiteettiprosessiaan, toisaalta hahmottelevat niin henkilökohtaisen kuin ryhmäidentiteettinsä intersektionaalisuutta muiden identiteettien kanssa.

On selvää, että erityisesti kehkeytyviä ilmiöitä hahmottelevan tutkijan on aktiivisesti suhteutettava aineistonsa ja tutkimuksensa eritasoisten kehkeytymisprosessien vaiheisiin, sekä ”unohtamisen” ja ”yleisen edun” problematiikkaan. Vaikka johtopäätös olisi, että tänään on ”yleisen edun” mukaista tutkia transsukupuolisuuttaan 2010-luvun alussa kipuilleen nuoren online-viiltelykertomuksia, ei liene haittaa hahmotella silloin tällöin myös sitä, miten omien aiempien aineistojen tulkinta muuttuisi ajan myötä.

Viitteet

Abbott, Andrew. 2001. Chaos of Disciplines. University of Chicago Press.

———. 2014. The System of Professions: An Essay on the Division of Expert Labor. University of Chicago press.

———. 2016. “Social Order and Process.” In Processual Sociology, University of Chicago Press, 198–232.

Crenshaw, Kimberle. 1989. “Demarginalizing the Intersection of Race and Sex: A Black Feminist Critique of Antidiscrimination Doctrine, Feminist Theory and Antiracist Politics.” The University of Chicago Legal Forum: 139–68.

Fiesler, Casey, and Nicholas Proferes. 2018. “‘Participant’ Perceptions of Twitter Research Ethics.” Social Media and Society 4(1).

Henkilötietolaki. 1999. Finland. https://www.finlex.fi/fi/laki/ajantasa/kumotut/1999/19990523.

Holappa, Henrik. 2016. Minä Perustin Uusnatsijärjestön – Suomen Vastarintaliikkeen Ex-Johtajan Muistelmat. Into Kustannus.

Käihkö, Ilmari. 2020. “Conflict Chatnography: Instant Messaging Apps, Social Media and Conflict Ethnography in Ukraine.” Ethnography 21(1): 71–91.

Laki Henkilötietojen Käsittelystä Rikosasioissa Ja Kansallisen Turvallisuuden Ylläpitämisen Yhteydessä. 2018. Finland. https://www.finlex.fi/fi/laki/alkup/2018/20181054.

Laki Sosiaali- Ja Terveystietojen Toissijaisesta Käytöstä. 2019. Finland. https://www.finlex.fi/fi/laki/alkup/2019/20190552#Lidp446465968.

Laki Sotilastiedustelusta. 2019. Finland. https://www.finlex.fi/fi/laki/alkup/2019/20190590.

Lampinen, Airi, Vilma Lehtinen, and Coye Cheshire. 2014. “Media Choice and Identity Work: A Case Study of Information Communication Technology Use in a Peer Community.” In Communication and Information Technologies Annual, Studies in Media and Communications, Emerald Group Publishing Limited, 103–30. https://doi.org/10.1108/S2050-206020140000008020.

Tikka, Minttu. 2014. “Tutkija Nuorten Mediamaailmassa.” Nuorisotutkimus 32(3).

Tilly, Charles. 1978. From Mobilization to Revolution. Addison-Wesley.

———. 2002. Stories, Identities, and Political Change. Rowman & Littlefield.

Tormos, F. 2017. “Intersectional Solidarity.” Politics, Groups, and Identities 5(4): 707–20. https://doi.org/10.1080/21565503.2017.1385494.

 

[1] https://tietosuoja.fi/oikeus-poistaa-tiedot

[2] https://thetab.com/uk/2020/02/11/success-kid-meme-now-142830

[3] https://yle.fi/uutiset/3-11228614

[4] https://www.vanityfair.com/hollywood/2015/06/caitlyn-jenner-bruce-cover-annie-leibovitz

Kuka saa päättää, mitä dataa tutkijalla on käytössään? Ei ainakaan amerikkalainen suuryritys

social media logos and light beams
Photo (cc) Kevin Dooley Flickr, edits by Salla L

Sosiaalisen median datan käyttöä tutkimuksessa suitsitaan nyt monelta kantilta. Tämän vuoden keväällä paljastuneen Cambridge Analytica -skandaalin jälkeen sekä Facebook että Twitter ovat uudistaneet pikavauhdilla datapolitiikkaansa. Samaan aikaan tutkijoita ja yliopistojen lakimiehiä on huolestuttanut toukokuussa voimaan tullut GDPR sekä Suomen tuleva uusi tietosuojalaki, joka on hyväksytty eduskunnassa marraskuussa.

On pelkästään hyvä asia, että aineistojen käyttöön kiinnitetään enemmän huomiota, ja että tutkijat joutuvat entistä tarkemmin miettimään aineistojen käytön oikeutuksia. Pohdinnoissa näyttäisi kuitenkin kummallisesti sekoittuvan aineiston tekninen saatavuus, laillisuus ja eettisyys.

Teknisestä näkökulmasta aineistojen saatavuus on hiukan hankaloitunut. Esimerkiksi Facebookin julkisilta sivuilta ei pysty enää rajapinnan (API) kautta lataamaan koneluettavassa muodossa viestejä kirjoittaneiden käyttäjien nimiä. Ryhmistä dataa saa ladata ainoastaan ryhmän ylläpitäjän luvalla. Yksittäisistä profiileista ladattavan datan käyttöä Facebook on rajoittanut jo huomattavasti aiemmin; toki käyttäjä voi halutessaan edelleen sovellusten kautta luovuttaa aineistojaan. Tämän kevään uudistusten myötä kuitenkin myös laajempia käyttäjätietoja tarvitsevat sovellukset joutuvat Facebookilla tarkempaan syyniin. Samanlainen prosessi on syntymässä myös Twitterin osalta: jatkossa jokaisen rajapintaa käyttävän sovelluksen on saatava Twitterin hyväksyntä.

Tutkijayhteisössä keskustelu API-rajoituksista on ollut varsin dramaattista. Tutkijat ovat kansainvälisesti huolestuneet Facebook-tutkimuksen tulevaisuudesta siinä määrin, että aiheesta on julkaistu kirjelmiä ja tehty listauksia rajapintojen avulla tehdyistä tutkimuksista. Akateemiset tutkijat ovat – oikeutetusti – huolissaan siitä, että aineistojen saatavuuden rajoittaminen rajaa myös tiettyjä tutkimusaiheita pois ja siten ohjaa tutkimusta. Toisaalta rajapintojen rajoitukset eivät estä tutkijaa tutkimuseettisten rajojen ja lainsäädännön puitteissa keräämästä laadullista aineistoa esimerkiksi Facebook-ryhmistä.

Toiset ovat huolestuneet palvelujen käyttöehdoissa (Terms of Service, TOS) mainittavista käytön rajoituksista. Joidenkin tulkintojen mukaan esimerkiksi YouTuben käyttö tutkimusaineistona ei ole lainkaan sallittua, koska palvelun käyttöehdot kieltävät palvelun muun kuin yksityisen käytön (jos tilanne olisi tämä Googlen mielestä, luulisi että joku niistä melkein kolmesta miljoonasta YouTube-hakusanalla löytyvästä tutkimusartikkelista olisi jo päätynyt raastupaan). Todennäköisesti amerikkalaisyrityksen ehdoista puuttuu erillismaininta akateemisesta käytöstä, koska se sisältyy jo Yhdysvaltojen lainsäädännössä olevaan fair use -pykälään.

GDPR:n ja Suomen tulevaisuudessa voimaan astuvan tietosuojalain myötä sosiaalisen median aineistojen henkilötietomaisuus on noussut uudella tavalla valokeilaan, vaikka tilanne ei käytännössä juuri ole muuttunut Suomen vanhaan henkilötietolakiin verrattuna.  Sosiaalisen median aineisto on käyttäjänimien vuoksi usein henkilödataa, ja tuoreiden tiukimpien tulkintojen mukaan sen kerääminen on nyt tietosuojasyistä kokonaan kielletty.

Sekä GDPR, tuleva tietosuoja-asetus että Suomen nykyinen henkilötietolaki mainitsevat kuitenkin tieteellisen tutkimuksen poikkeuksena henkilötietojen käsittelyyn. Tutkimus on erityisasemassa myös arkaluontoisia tietoja käsiteltäessä sekä rekisteröityjen oikeudessa tietojen poistoon (ns. oikeus tulla unohdetuksi ei automaattisesti päde, ks. Kohta 2.3.8). Henkilötietojen käsittely vaatii rekisteriselosteen ja GDPR:n ohjeistuksien mukaan myös vaikutustenarvioinnin, jos aineistossa on arkaluontoisia tietoja.

Lain noudattaminen ja tutkimuksen poikkeusasema eivät kuitenkaan tarkoita, että kaikenlainen henkilötietojen käsittely olisi eettisesti oikein, tai että kaikenlaisen avoimen aineiston käyttö olisi eettistä. Tämän määrittelee tutkimuseettinen harkinta, jonka periaatteet tiedeyhteisö on itse määritellyt ja joita se myös valvoo. Siksi GDPR:n nostattama keskustelu on tervetullutta ja omiaan parantamaan tutkittavien oikeuksia ja lisäämään tutkimusaineistoista käyttävää eettistä keskustelua. Aiemmin on ehkä luotettu liikaakin siihen, että TOS ratkaisee suostumuksen ongelmat, jotka on ikään kuin ulkoistettu yrityksen tuottamalle dokumentille. Samaan aikaan on varsin hyvin tiedossa, etteivät käyttäjät juuri lue käyttöehtoja.

Eettisen keskustelun keskiössä on usein tutkittavan suostumus (informed consent). Tutkimuseettisen neuvottelukunnan ihmistieteiden eettinen ohjeistus muistuttaa, että tutkittavan “suostumuksen periaatteesta voidaan poiketa tutkittaessa julkistettuja ja julkisia tietoja sekä arkistoaineistoja”. Tästä näkökulmasta sosiaalisen median aineistojen käyttöön ei tarvita tutkittavan suostumusta, jos aineisto on julkisesti saatavilla.

Oleellisempi on kuitenkin ohjeistuksen toinen kohta: vahingoittamisen välttäminen. Siihen keskittyy myös esimerkiksi Association of Internet Researchers AoIR:n eettinen ohjeistus. Vahingoittamisen välttäminen tarkoittaa esimerkiksi sosiaalisten ja taloudellisten haittojen minimointia sekä tutkimustulosten julkaisemisen mahdollisten seurausten pohdintaa. Se on keskeinen osa tutkimuseettistä harkintaa ja tutkijan ammattitaitoa.

Mutta tutkijalla on myös toinen ammatillinen ja eettinen velvoite: tuottaa yhteiskunnalle kriittistä tietoa. Yhteiskunnalliset ilmiöt Suomessa ja muualla heijastuvat entistä isommin myös digitaalisille alustoille. Siksi ei ole eettisesti kestävää tulkita lakeja ja käyttösääntöjä tiukasti niin, että amerikkalainen alustayritys sanelisi, mitä suomalainen tieteellinen tutkija saa sosiaalisesta mediasta tutkia. Sen sijaan se tarkoittaa, että eettisten pohdintojen perusteella toisinaan voi olla jopa perusteltua rikkoa käyttöehtoja – alkaen esimerkiksi siitä, että käyttöehtojen vastaisesti anonymisoidaan tutkimusaineisto. Tällaista tieteen vapautta puolustaa myös Suomen tuleva tietosuoja-asetus.

* Teksti: Salla-Maaria Laaksonen (Helsingin yliopisto, @jahapaula) & Margareta Salonen (Jyväskylän yliopisto, @MaakeSalonen)

Ps. Rajapinta ry. yhdessä MEVI ry:n kanssa järjestää 10. tammikuuta Tieteiden yössä tapahtuman, jossa kerromme sosiaalisen median aineistojen tutkimuskäytöstä. Työpajassa pääset myös itse penkomaan someaineistoja. Tervetuloa mukaan Tieteiden talolle!

Pps. Erinomaista pohdintaa tutkijoiden ja käyttöehtojen yhteiselosta kriminologian professori Matthew Williamsin ja kumppaneiden artikkelissa Sociology-lehdessä.

Miten GDPR vaikuttaa tutkijan työhön?

Helsingin yliopistolla järjestettiin koulutus tutkijoille EU:n uudesta tietosuoja-asetuksesta GDPR:sta (General Data Protection Regulation). GDPR koskee henkilötietorekisterien keräämistä ja käsittelyä ja sen tarkoituksena on harmonisoida EU-maiden tietosuojalainsäädäntöä. Täysmittaisesti GDPR:n soveltaminen alkaa 25.5.2018. Tarkan kuvauksen GDPR:sta voi lukea esimerkiksi täältä tai täältä. Helsingin yliopiston työntekijöille koulutusmateriaali löytyy täältä.

Tutkimuksen etiikan periaatteet auttavat tutkijaa pitkälle myös uuden lain puitteissa (kts. esim. Sallan postaus verkkotutkimuksen etiikasta), mutta joitakin muutoksia nykykäytäntöihin tulee. Tässä havaintoja, jotka mielestäni vaikuttavat eniten tutkijan työhön varsinkin yhteiskuntatieteissä.

GDPR koskee henkilötietoja koskevia rekistereitä tai aineistoja, ja usein esimerkiksi kysely- tai haastatteluaineistot sisältävät henkilötietoja. Henkilötietona voidaan pitää mitä vaan tietoa, joka voidaan yhdistää johonkin luonnolliseen henkilöön. Itsestään selviä ovat nimet, sosiaaliturvatunnukset, osoitteet ja muut vastaavat tiedot, mutta myös esimerkiksi IP-osoitteet katsotaan henkilötiedoksi. Pseudonymisointi (salanimien tai numerotunnisteiden käyttö) on yleinen tapa ohittaa henkilötietojen käsittelyyn liittyviä haasteita, mutta laissa pseudonymisoitu tieto nähdään lähtökohtaisesti samoin kuin henkilötiedot paljastava, ei-pseudonymisoitu tieto. Tiedon anonymisointi onkin suositeltavaa aina kun mahdollista (henkilötiedot tai pseudonyymien lisätiedot/koodiavaimet pysyvästi poistettu).

Oma lukunsa ovat arkaluonteiset tiedot, joita ovat ainakin:

  • Rotu, etninen alkuperä
  • Poliittiset mielipiteet, äänestyskäyttäytyminen
  • Uskonnolliset tai filosofiset vakaumukset
  • Ammattiyhdistysliikkeen jäsenyys
  • Terveystiedot
  • Seksuaalinen suuntautuminen
  • Rikosrekisteri

Arkaluonteisen henkilötiedon tapauksessa tutkijan tulee laatia tietosuojaa koskeva vaikutustenarviointi (Data Processing Impact Assessment, PDIA). Lisätietoja löytyy täältä, ja varmasti kaikkien yliopistojen omilta lakimiehiltä tai tietosuojavastaavilta.

Henkilötietojen keräämisen yhteydessä pitää huomioida minimisaation periaate – kerää ainoastaan ne henkilötiedot, jotka ovat tutkimuksen kannalta välttämättömiä, ja jätä muut keräämättä. Tietoja saa käyttää ainoastaan siinä tarkoituksessa, johon lupa on annettu. Lupaa pyydettäessä tutkijan kannattaa ottaa huomioon aineistojen mahdollisen jatkokäyttö, ja pyytää myös siihen suostumus. Tieteellisen tutkimuksen tapauksessa myös laissa säädetyn tehtävän suorittaminen tai yleinen etu voivat toimia laillisina henkilötietojen keräämisen ja käsittelyn perusteina.

Nickname

Suurin muutos aiempaan henkilötietolakiin on rekisterinpitäjän osoitusvelvollisuus, eli velvollisuus kirjallisesti osoittaa GDPR:n mukaisen toiminnan ja rekisteröityjen oikeuksien täyttämisen. Riittävät toimenpiteet määritellään riskianalyysin mukaan, eikä laki suoraan määrittele, mitä nämä toimenpiteet ovat. Rekisteröityjen oikeudet ovat:

  • Saada läpinäkyvää tietoa rekisteristä
  • Päästä omiin tietoihin
  • Oikaista tietoja
  • Tulla unohdetuksi
  • Rajoittaa käsittelyä
  • Siirto-oikeus
  • Vastustamisoikeus

Tieteellinen tutkimus voi useimmissa tapauksia toimia poikkeuksena, jos tutkimuksesta on laadittu tutkimussuunnitelma, hankkeella on vastuullinen tutkija tai tutkimusryhmä ja henkilötietoja käytetään ainoastaan tutkimustarkoituksiin.

GDPR:ssä erotetaan rekisterinpitäjä ja henkilötietojen käsittelijä, joka toimii rekisterinpitäjän ohjeiden mukaisesti. Tieteellisen tutkimuksen tapauksessa rekisterinpitäjänä pidetään lähtökohtaisesti yliopistoa ja tutkijaa käsittelijänä. Tutkijoiden tulee siis noudattaa yliopiston tietosuoja- ja tietoturvasääntöjä, jotka kannattaa käydä läpi olemassa olevien henkilötietoja sisältävien aineistojen ja uusien aineistojen keräyksen osalta. Poikkeuksena on tutkimus, joka toteutetaan omalla ajalla ja rahalla, tai jos tutkija esimerkiksi omistaa aineiston itse. Tällöin väärinkäytöksistä seuraavat sanktiot voivat langeta rekisterinpitäjälle, eli yksittäiselle tutkijalle.

Viimeisenä huomiona nostan sopimuksen henkilötietojen käsittelystä (Data Processing Agreement, DPA), joka vaaditaan, kun tietojen käsittely ulkoistetaan. Koska esimerkiksi tietojen säilytys luetaan tietojen käsittelyksi, tutkijan tulee mm. ottaa huomioon, mitä pilvipalveluja työssään käyttää. Henkilötietoja sisältävät aineistot kannattaa siis aina säilyttää ensisijaisesti yliopiston palvelimella tai muuten yliopiston sisällä, eikä esimerkiksi Google Drivellä tai Dropboxissa.

Tässä siis huomioita, joita itse koulutuksesta tein. Kommentoi jos huomaat puuttuvia keskeisiä pointteja GDPR:stä tutkijan työn näkökulmasta!

Miten some-aineistoja sopii analysoida?

15422638442_cb6aeb137e_z
(cc) Janet McKnight, Flickr

Blogikirjoitus on rinnakkaispostaus Etiikka.fi-sivustolta ja sosiaalisen median tutkimusetiikkaa käsittelevää kirjoitussarjaa. Digitutkimuksen etiikan pohdinta jatkuu Rajapintapäivillä 2.11.!
– –

Yhä useampi yhteiskuntatieteellinen tutkija työskentelee sosiaalisesta mediasta kerättyjen aineistojen parissa – olivat ne sitten perinteisiä, pienempiä otoksia tai isompia big data -aineistoja. Verkkoaineistojen kanssa työskentely on kuitenkin tutkimusta siinä missä muukin tutkimus, ja eettiset ohjenuorat ovat työssä kullanarvoinen apu.

Sosiaalisen median aineistojen analyysin erityispiirre on se, että aineistoihin lähes väistämättä liittyy henkilötietoja. Monissa sosiaalisen median palveluissa profiili kytkeytyy suoraan oikeaan nimeen, mutta joidenkin tulkintojen mukaan esimerkiksi pelkkä Twitterin käyttäjänimi riittää yksilöimään käyttäjän henkilön. Tutkijan täytyy olla tietoinen sekä henkilötietojen käsittelyyn liittyvästä lainsäädännöstä, että ihmistutkimuksen eettisistä periaatteista. Ohjeistuksien peruspilareihin kuuluu tutkittavan koskemattomuuden säilyttäminen ja vahingoittamisen välttäminen sekä yksityisyydestä ja tietosuojasta huolehtiminen (ks. TENK).

Mikä on aineiston konteksti?

Verkkoaineistojen avulla voidaan käsitellä hyvinkin henkilökohtaisia ja arkaluontoisia teemoja, esimerkiksi uskontoon, poliittisiin mielipiteisiin tai seksuaaliseen suuntautumiseen liittyviä asioita. Tutkittavan fyysinen koskemattomuus tuskin on uhattuna, mutta leikepöydällä voi olla materiaalia, jonka analysointi tai julkistaminen voi tuottaa tutkittavalle vahinkoa esimerkiksi henkilömaineen tahriintumisen tai jopa post-traumaattisen stressin muodossa.

Association of Internet Researchersin eettiset ohjeet painottavat juuri vahingon aiheuttamiseen liittyvää harkintaa: mitä haavoittuvaisemmasta tutkittavasta tai teemasta on kysymys, sitä tarkemmin tutkijan velvollisuus on suojata tutkittaviaan:

“The greater the vulnerability of the community / author / participant, the greater the obligation of the researcher to protect the community / author / participant.” (Markham & Buchanan 2012, AoIR ethical guidelines)

Sosiaalisen median aineistojen käsittelyssä olennaisinta on kehittää tarkka ymmärrys aineiston kontekstista. On mahdotonta antaa yleispätevää vastausta esimerkiksi kysymykseen ”Aiheutuuko twiittien keräämisestä haittaa niiden lähettäjälle?”. Vastaus riippuu aina viestin lähettäjästä, aihepiiristä ja yhteiskunnallisesta kontekstista. Lopputulos riippuu myös analyysissa tehtävistä toimenpiteistä ja valinnoista.

Anonyymia analyysia

Perinteinen keino turvata tutkittavien henkilöiden oikeuksia on aineiston anonymisointi. Monessa yhteiskuntatieteellisessä tutkimuksessa on kuitenkin oleellista tietää, kuka viestin on kirjoittanut. Esimerkiksi yhteiskunnallisen vallankäytön tutkiminen ilman lähettäjätietoja on mahdotonta.

Silti on hyvä miettiä myös tutkimusprosessin aikana tarkasti, onko tutkijoiden tarpeen tietää tutkittavien identiteettejä. Omassa Digivaalit 2015 -tutkimuksessamme kerätyistä isoista aineistoista tunnistettiin nimellä ainoastaan vaaliehdokkaat. ansalaisten käyttäjänimet näkyivät vain numerosarjoina: tutkimusongelman valossa meillä ei ollut mitään tarvetta tietää, minkä niminen henkilö on kirjoittanut poliitikoille kommentteja.

Anonymisointi ei kuitenkaan ole oikotie onneen. Eri aineistoja yhdistämällä voi olla mahdollista luoda pelottavan tarkkoja henkilöprofiileja arkaluontoisistakin aiheista: klassisessa amerikkalaisessa esimerkissä terveystietoja sisältävä, anonymisoitu aineisto pystyttiin yhdistämään muutaman muuttujan avulla suoraan äänestäjärekisteriin. Tuoreessa tapauksessa pystyttiin profiiliosoitteiden avulla tunnistamaan lukuisia käyttäjiä anonyymista selainhistoriadatasta.

Lisäksi sosiaalisen median aineistojen kohdalla anonymisointi on osin kosmeettista. Julkisesta verkosta kerätty aineisto on kenen tahansa löydettävissä pelkästään tekstisisältöjen perusteella: esimerkiksi aineistolainaukseen poimitun twiitin lähettäjineen löytää Twitteristä hakukoneella. Siksi varovaisuusperiaate täytyy pitää mielessä aina tutkimustulosten raportointiin ja julkaisemiseen asti. Tutkija joutuu käytännössä punnitsemaan, näyttääkö hän lukijalle aineistonäytteitä parantaakseen argumentaatiotaan, vai pyrkiikö hän turvaamaan tutkittavien anonymiteetin.

Henkilötieto on henkilötietoa, mutta julkinen ei välttämättä julkista

Kenties paras muistisääntö sosiaalisen median aineistojen analyysin parissa työskentelevälle tutkijalle onkin ajatella ja käsitellä niitä koko ajan henkilötietoina. Yhdeksi apumitaksi kannattaa ottaa lakipykälät. Suomen laki henkilötietojen käsittelystä on – kansalaisten onneksi – sen verran tiukka, että sen pykälistä löytyy hyvää tukea myös tutkimusetiikan pohtimiseksi.

Laki pakottaa miettimään tarkemmin aineistojen tallentamista ja suojaamista. Suojaamaton pilvipalvelu on henkilötietoja sisältävälle tutkimusaineistolle yhtä väärä paikka kuin ruotsalaisten henkilötiedoille.

Laki ei kuitenkaan ota kantaa kaikkiin tutkimuksen kannalta tärkeisiin eettisiin kysymyksiin Sen näkökulmasta julkiset verkkokeskustelut ovat arkaluontoisinakin julkistettua tietoa, jonka käyttäminen aineistona on sallittua. Keväällä 2018 voimaan tuleva uusi EU:n tietosuoja-asetus näyttäisi jopa antavan entistä enemmän vapauksia henkilödatan tutkimuskäytölle.

Palaamme siis tärkeimmän opin äärelle: kontekstin ymmärtäminen ja aineiston käytöstä mahdollisesti aiheutuvien haittojen pohtiminen on tärkein osa tutkijan eettistä ammattitaitoa. Digitaalisten aineistojen käyttöön pätevät samat varotoimenpiteet kuin ei-digitaalisten aineistojen kohdalla: tutkittavien anonymisointi varsinkin lopullisessa julkaisussa, sekä tutkimuksesta tutkittaville mahdollisesti aiheutuvan harmin ja vahingon välttäminen tutkimusprosessin jokaisessa vaiheessa.

– –
Salla-Maaria Laaksonen, VTT,  on viestinnän ja teknologian tutkija Viestinnän Tutkimuskeskus CRC:ssa ja Kuluttajatutkimuskeskuksella.