Taitavasti eettistä verkkotutkimusta

https://www.flickr.com/photos/janetmck/15422638442/
(cc) Janet McKnight, Flickr

Vaatii taitoa ja rohkeutta rakentaa sosiaalista mediaa hyödyntävät tutkimusasetelmat niin, että eettisen tutkimuksen ehdot täyttyvät. // Teksti on rinnakkaisjulkaisu TENK:n Vastuullinen tiede -sivustolta (CC BY 4.0).

Sosiaalinen media valtavine viestimäärineen näyttäytyy monelle tutkijalle houkuttelevana aineistopankkina, halusipa sitten tutkia ihmisten asenteita ja käyttäytymistä tai yhteiskunnallisia muutoksia. Aineistojen vapaa saatavuus ei kuitenkaan poista eettisen pohdinnan tärkeyttä.

Verkkosisältöjen tutkimuskäyttöä koskevat eettiset käytännöt ja ohjeistukset ovat kirjavia Suomessa ja kansainvälisesti. Suomessa ihmistieteiden eettisen ennakkoarvioinnin ohjeistus ei ota erikseen kantaa verkkotutkimukseen. Tutkimukseen vaikuttavat lait puolestaan ovat auttamattomasti digitaalista aikaa jäljessä. Käytännössä tutkija joutuu verkkoaineistojen kanssa toimimaan hiukan harmaalla alueella ja luottamaan omaan harkintaansa ratkaisuja tehdessään.

Tutkimuskohteena ihminen vai data?

Tutkimuseettisen neuvottelukunnan laatima ohjeistus ihmistieteiden eettisestä ennakkoarvioinnista lähtee siitä, että ihmistieteellistä tutkimusta ohjaa kolme eettistä periaatetta: tutkittavan itsemääräämisoikeuden kunnioittaminen, vahingoittamisen välttäminen sekä yksityisyyden ja tietosuojan säilyttäminen. Periaatteet viittaavat siis erityisesti tutkimuksiin, jossa tutkimuksen kohteena on ihmistoimija. Verkkoaineistojen kohdalla tyypillistä on kuitenkin ihmisen, datan ja tekstin rajan hämärtyminen.

Jos tutkimuksen fokus on sisällöissä, voidaan sosiaalisen median aineistot rinnastaa julkistetuiksi tiedoiksi tai rekisteriaineistoiksi, jolloin tutkittavien erillistä suostumusta ei vaadita. Sosiaalisen median aineistoissa tekstit kuitenkin tyypillisesti ovat yksityishenkilöiden tuottamia ja käyttäjän nimi usein näkyvillä.

Usein verkossa tutkimusta tehdään kontekstissa, jossa suostumuksen kerääminen kaikilta tutkittavilta on vaikeaa ja käytännössä jopa mahdotonta. Monilla verkkoalustoilla keskustelua käydään anonyymisti eikä esimerkiksi vanhasta aineistosta ole useinkaan mahdollista etsiä nimetynkään tekijän yhteystietoja.

Verkkotutkimuksessa tutkimuskohde on siis väistämättä häilyväinen, eikä ihmisyys olekaan kovin järkevä tapa tarkastella verkkotutkimusta. Keskeisempää on pohtia laajemmin tutkimuksen mahdollisesti aiheuttamaa haittaa, tutkittavien haavoittuvutta ja yksityisyyttä.

Kimurantti julkisuus ja yksityisyys

Verkossa julkisen ja yksityisen ero hämärtyy helposti. Sosiaalisen median kontekstissa teknisesti julkisella aineistolla tarkoitetaan kaikkien saataville julkaistuja päivityksiä esimerkiksi avoimilla keskustelualustoilla tai ryhmissä. Selkeästi yksityistä aineistoa ovat esimerkiksi tutkijalle luottamuksellisesti lähetetyt viestit sosiaalisen median kanavissa tai viestit suljetuista ryhmistä, joihin tutkijalla on pääsy.

Silti teknisesti julkistenkin viestien kohdalla on vaikea arvioida kirjoittajien käsitystä aineiston julkisuudesta. Yksityisyyden ja julkisuuden käsitteet ovat vahvasti kulttuurisidonnaisia. Lisäksi palveluiden yksityisyysasetukset muuttuvat niin usein, että tavalliselle käyttäjälle ei välttämättä ole aina selvää, mitkä viesteistä ovat julkisia ja mitkä eivät. Näin ollen tiedon julkinen saatavuus ei yksinään riitä eettiseksi periaatteeksi, vaan tutkijan on pohdittava myös tiedon tuotannon kontekstia sekä tiedon arkaluontoisuutta.

Teknisestä ja lainopillisesta näkökulmasta neuvottelukumppanina verkkoaineistojen tutkimuksessa on myös verkkoalusta, jossa sisällöt on julkaistu. Tutkijan onkin syytä tutustua verkkopalveluiden käyttöehtoihin. Ne asettavat usein reunaehtoja materiaalin tutkimuskäytölle sekä rajoittavat koneellisesti ladattavan aineiston saatavuutta joko suojellakseen käyttäjien yksityisyyttä tai omaa liiketoimintaansa. Esimerkiksi Facebookista pystyy koneellisesti lataamaan ainoastaan julkisten ryhmien ja sivujen sisältöjä, mutta yksityishenkilöiden profiileista julkisetkaan päivitykset eivät ole saatavilla. Selaimen kautta ne ovat kuitenkin nähtävissä ja helposti osa esimerkiksi verkkoetnografin aineistoa.

Teksti ja konteksti

Tutkijat ovat käsitelleet luottamuksellisia aineistoja ennen digiaikaakin, eivätkä yksityisyyden suojaamisen ongelmat ole verkkoaineistoissa perustavalla tavalla erilaisia esimerkiksi haastatteluaineistoihin verrattuna. Myös sosiaalisen median aineistoja on analyysivaiheessa mahdollista käsitellä niin, että yksityishenkilöiden anonymiteetti ja tietosuoja säilyvät. Esimerkiksi poliittisen viestinnän tutkimusprojekteissamme anonymisoimme aineistosta tavalliset käyttäjät, mutta jätimme poliitikkojen nimet näkyville.

Anonymisointi kuitenkin ratkaisee vain analysointivaiheen haasteita. Sosiaalisen median aineistojen erityispiirre on se, että vaikka tutkimuksen kohteena olisikin pelkkä teksti, on se helppo yhdistää takaisin alkuperäiseen kirjoittajaan. Yksittäisen twiitin lähettäjä löytyy helposti syöttämällä teksti hakukoneeseen. Lisäksi erilaisia aineistoja yhdistämällä anonymisoitujenkin henkilöiden tunnistaminen voi olla mahdollista.

Siksi eettiset periaatteet on pidettävä mielessä myös silloin, kun tutkimusjulkaisuun valitaan lainauksia aineistosta tai jos aineistoa halutaan avata tutkimuskäyttöön. Arkaluontoisten teemojen kohdalla tutkija joutuu punnitsemaan, näyttääkö hän lukijalle aineistonäytteitä parantaakseen argumentaatiotaan vai pyrkiikö hän turvaamaan tutkittavien anonymiteetin.

Tietoa, taitoa ja rohkeutta

Lakitekstiviidakossa ja eettisiä ohjeita tiukasti lukien on helppo tulkita, että sosiaalisen median aineistojen käyttäminen ei ole laillista tai eettisesti suotavaa. Varsinkin yhteiskuntatieteellisen tutkimuksen näkökulmasta tutkijoilta kaivataan kuitenkin paitsi ammattitaitoa, myös rohkeutta ja taitoa rakentaa sosiaalista mediaa hyödyntävät tutkimusasetelmat siten, että eettisen tutkimuksen ehdot täyttyvät. Sosiaalinen media heijastelee lukuisia yhteiskunnallisesti merkittäviä teemoja. On sääli, jos esimerkiksi yhteiskunnallista vallankäyttöä koskevista tutkimuksista pitäisi ohjeiden puuttuessa jättää digitaalinen osuus tekemättä.

Kuten kaikessa tutkimuksessa, verkkotutkimuksessa on asetelmia, jotka eettisistä syistä tulisi jättää toteuttamatta. Tutkimuksen tutkittaville aiheuttamat haitat ja seuraukset ovat kuitenkin kontekstin määrittämiä tekijöitä, minkä vuoksi yleispätevien ohjeiden antaminen on mahdotonta. Eettisen pohdinnan avuksi löytyy kuitenkin erilaisia apuvälineitä esimerkiksi tämän kirjoituksen viitteistä – erityisesti verkkotutkimuksen kansainvälisen yhdistyksen Association of Internet Researchers AoIR:n julkaisema eettinen ohjeistus on erinomainen apu tutkijalle.

Salla-Maaria Laaksonen on tutkija Helsingin yliopistossa.

Lisätietoja:

  • AoIR (2012). Ethical decision-making and Internet research: Version 2.0. Recommendations from the AoIR Ethics Working Committee. Final Draft; Association of Internet Researchers. (pdf)
  • Östman, S., & Turtiainen, R. (2016). From research ethics to researching ethics in an online specific context. Media and Communication, 4(4), 66–74.
  • Tikka, Minttu (2014) Tutkija nuorten mediamaailmassa: tutkimuseettisiä kysymyksiä. Nuorisotutkimus vol. 32(3).
  • Turtiainen R, Östman S. (2013). Verkkotutkimuksen eettiset haasteet: Armi ja anoreksia. Kirjassa: Laaksonen S-M, Matikainen J, Tikka M. (toim.) Otteita verkosta. Verkon ja sosiaalisen median tutkimusmenetelmät. Tampere: Vastapaino, s. 49–67.

DCCS syyskuussa: aihemallinnusta sekä algoritmejä

Syyskuun viimeisenä perjantaina, tieteiden yön iltapäivällä, Digital Citizens, Communities, and Society kokoontui pohtimaan yhteiskuntatieteen ja tieto- ja viestintäteknologian rajamaastoa. Meillä oli kaksi vuorovaikutteista johdantoa, joita pyrin hiukan tiivistämään blogin muotoon.

Uusia menetelmämahdollisuuksia

Tuukka Ylä-Anttila puhuiaihemallinnuksesta (topic modeling) sosiologin työvälineenä, esitellen kolmea projektia: kehysanalyysiä ilmastopoliittisesta keskustelusta, poliittisten keskustelujen hakemista Suomi24-keskustelualueelta sekä MV-lehden sisällön luokittelua

Lyhyesti, aihemallinnuksessa algoritmi luokittelee sanoja sekä “dokumentteja” esiintymisien mukaan ryhmiin ohjaamattomasti. Yhteiskuntatieteilijä voi käyttää mallia keskustelunaiheiden luokitteluun, mutta suuri kysymys on, onnistuuko keskustelun tapojen kuten kehysten tai diskurssien luokittelu.

Käytimme varsin paljon aikaa pohtimalla miten aihemallinnukset tulisi validoida ja –  ainakin itse – valitin kunnon ohjekirjan puuttumista tälle osa-alueelle. Ylä-Anttila kolleegoineen ovat dokumentoineet prosessin, jossa ensin arvioidaan aihemallinnuksen sanapilviä, minkä jälkeen arvioidaan aiheissa olevien dokumenttien sisältöjä ja tarkennetaan aihetulkintaan jos se on tarpeen. Lähestymistapa kuulosti varsin toimivalta, jäänkin kuuntelemaan mitä mieltä vertaisarvioitsijat ovat siitä.

Toisaalta, myös aiheiden tulkinta herätti huolta: voivatko kyseessä olla framet, diskurssit tai mitkään muut yleisesti käyttämät teoretisoinnit sisällöstä. Tätä ei myöskään helpota, kuten Tuukka muistutti, että framestakin on useampia erilaisia merkityksiä ja tulkintoja yhteiskuntatieteessä. Itse pohdiskelin ääneen, että miksi aiheita pitäisi sanoa joksikin muuksi kuin aiheiksi, mutta Tuukka nopeasti vastasi, että tuo pohdinta liittyy siihen, mihin aiempaan tutkimustraditioon sitten itse sijoittuu. Teoreettisilla käsitteillä on pitkät juuret, jotka vaikuttavat niiden tulkintaan.

Tämä lieneekin valtavirtaistuksen suurin ongelma, jollain tavalla laskennalliset menetelmät ja niiden tulokset pitäisi saada puhumaan traditionaalisten yhteiskunnallisten menetelmien kanssa. Tällöin yhteinen terminologia esimerkiksi auttaa jo varsin paljon, helpoittaa valtavirta-yhteiskuntatieteilijän pohdintaa tulosten järkevyydestä ja merkittävyydestä.

Aiheesta lisää sekä muutama uudehko opinnnäytetyö

Algoritmit sosiaalisessa vuorovaikutuksessa

Jesse Haapoja kertoi juuri jättämästään Helsingin yliopiston jatko-opintosuunnitelmasta, algoritmeistä sosiaalipsykologian kannalta. Hänen keskeinen argumenttinsa on (tai, ehkä paremminkin, minun tulkinta hänen ajatuksestaan), että teknisillä järjestelmillä on toimijuutta mikrotasolla vuorovaikutukstilanteilla – näkökulma joka vielä toistaiseksi puuttuu isoista algoritmien vallankäytön keskustelusta. Algoritmit ja tekniset järjestelmät mahdollistavat ja rajoittavat ihmisten välistä vuorovaikutusta, Tinderin deittaussovelluksesta Pokémon Go:n algoritmin päättämiin vuorovaikutuspaikkoihin.

Jessen tavoite tutkimuksessaan on havainnoida kuinka algoritmit tulevat esille mikrotasolla ihmisten välisessä vuorovaikutuksessa sekä ajatella, miten ihmiset reagoivat algoritmien toimintaan. Eräs esimerkki on vaalikoneet, joiden algoritmit eivät vain neuvo meitä äänestämään vaan myös rakentavat poliittista identiteettiä.

Mikä on oikein ja mikä väärin?

Viimeisenä aiheena eräs pro gradu-työn tekijä Matti Autio esitteli pohdintaansa Facebookin kaupunginosa-ryhmien toiminnasta ja siellä esiintyvästä rajoittavasta sekä yhdentävästä viestittelystä. Hänen suurin kysymys oli tutkimuseettinen: saako tätä tutkimusta oikeastaan tehdä ja voiko gradussa olla lainauksia näistä ryhmistä ja saako ryhmiä edes tutkia.

Tämä herätti laajaa keskustelua DCCS-ryhmässä, tutkimuseettinen pohdinta on vielä kesken. Johtopäätöksemme taisi olla, ettei isojen ryhmien tutkimisessa ollut isompia ongelmia, mutta lainaukset olisi hyvä tarkistaa jokaiselta osallistujalta erikseen. Vaikka verkon tutkimusta onkin tehty jo useampi vuosikymmen, samat eettiset kysymykset ovat edelleen avoinna. Lopuksi päädyimme suosittelemaan vielä opiskelijaa tarkastaman Internet-tutkijoiden AOIRn eettisen toimikunnan ohjeita aiheesta.