Sosiaalinen media – tutkimusaineiston hankala aarrearkku

Blogikirjoitus on rinnakkaisjulkaisu huhtikuussa 2016 julkaistusta kommenttipuheenvuorosta: Laaksonen, S-M. (2016). Sosiaalinen media – tutkimusaineiston hankala aarrearkku. Sosiaalilääketieteellinen aikakauslehti / Journal of Social Medicine 53(2), 145-146. [link]

6727218759_7e57510553_z
cc: Elias Gayles

Varomaton tai huolimaton verkkotutkija voi aiheuttaa vahinkoa tutkittavilleen. Tämän vuoksi tutkimuseettisten näkökulmien pitäminen esillä ja avoin keskustelu niistä on tärkeää, kuten Terkamo-Moisio, Halkoaho ja Pietilä kirjoittavat. Huolimatta siitä, että ohjeistuksia sosiaalisen median eettiseen tutkimuskäyttöön alkaa olla saatavilla (esim. 1, 2), ovat käytännöt melko kirjavia niin Suomessa kuin maailmallakin. Monesti verkkoaineistojen kanssa luotetaan suoraviivaisesti niiden julkiseen saatavuuteen, eikä sen kummemmin pohdita tutkittavien asemaa. Eettisen ennakkoarvioinnin periaatteet (3) eivät nekään ota kantaa verkkotutkimukseen, vaan keskittyvät lähinnä tutkittavien fyysiseen ja psykologiseen koskemattomuuteen koetilanteessa. Yhteiskuntatieteissä, joita itse edustan, eettisten ennakkoarviointien hakeminen on ylipäänsä varsin harvinaista.

Ihmistieteiden eettisen ohjeistuksen mukaan tutkittavan tulisi vähintäänkin tietää olevansa tutkimuksen kohde. Jo tämä on verkkotutkimuksen kohdalla haasteellista, sillä useinkaan kaikkien verkkokeskustelijoiden identiteetti tai yhteystiedot eivät ole selvitettävissä. Näin ollen varsin harvoin valmiita aineistoja verkosta keräävät tutkijat tekevät analyysiaan tutkimuksen kohteille erityisen tiettäväksi. Joitakin tapoja kuitenkin on — esimerkiksi itse sain aikanaan Turun yliopiston tutkijalta Sari Östmanilta blogiini kommenttina kysymyksen aineiston tutkimuskäytöstä (4).

Sosiaalisen median aineistojen — kuten muidenkin aineistojen — käytössä on aina punnittavana tieteen etu yksilön etua vasten. Kuten Markham ja Buchanan (1) muotoilevat (s. 4): “In different contexts the rights of subjects may outweigh the benefits of research.” Käytännössä sosiaalisen median aineistojen tutkimuskäyttö onkin aina hyvin konteksti- ja aihesidonnaista. Se, että tieto on helposti saatavilla, ei tarkoita, että sen käyttäminen on välttämättä laillista tai eettistä. Erityisen varovainen on oltava silloin, kun tutkittavat ovat esimerkiksi nuoria tai sairaita, tai käsiteltävä aihepiiri on arkaluontoinen.

Omissa tutkimuksissani olen käyttänyt aineistoina enimmäkseen verkkokeskusteluja, jotka liittyvät yrityksiin tai politiikkaan, ja jotka on kerätty avoimista verkkoryhmistä tai -palveluista. Tässä mielessä voimme jossakin määrin turvautua aineistojen julkisuuteen ja varsinkin politiikan kohdalla tutkittavien julkiseen rooliin ja kapeampaan yksityisyydensuojaan. Aineistoissa on kuitenkin myös paljon kansalaisten tuottamaa sisältöä. Esimerkiksi Digivaalit-projektissa (5) 1,5 miljoonan viestin aineistossamme valtaosa sisällöistä on muiden kuin poliittisten toimijoiden tuottamaa. Tutkimuskäyttöön vastikään avattu Suomi24-aineisto (6) puolestaan on käytännössä yksinomaan kansalaisten tuottamaa sisältöä.

Molemmissa hankkeissa aineistot on kerätty ohjelmoidusti suoraan palvelujen rajapintojen kautta. Käsittelemme aineistoja pääasiassa isoina tekstimuotoisina tietokantoina, joissa käyttäjästä on näkyvissä vain nimimerkki (esim. Suomi24, Twitter) tai Facebookin tapauksessa numerotunniste. Vaikka numerotunnisteen yhdistäminen todelliseen käyttäjään Facebook-aineistossa on triviaalia, olemme tämän kytköksen tehneet vain politiikkojen kohdalla. Kansalaiset ja muut toimijat siis pysyvät aineistossa vain numerokoodeina, jotka jäävät tutkijalle analyysinkin aikana tuntemattomiksi. Tämä toki on myös mahdollinen rajoite: kommentoijana saattaa olla julkisuuden henkilö tai aihepiirin aktivisti, ja hänen identiteettinsä saattaisi olla merkityksellistä keskustelun merkitysten tulkinnalle. Laskennallisen yhteiskuntatieteen analyyseissa keskitymme kuitenkin enemmän tekstimassasta tuotettavaan numeeriseen dataan ja vuorovaikutusyhteyksiin.

Kuten kirjoittajatkin nostavat esille, liittyy tutkijan ja tutkittavan lisäksi sosiaalisen median aineistonkeruuseen aina kolmaskin osapuoli: teknologinen alusta, jolla sisältö on julkaistu. Periaatteessa esimerkiksi jokainen Facebookin käyttäjä on hyväksynyt julkisten päivitystensä tutkimuskäytön rajapinnan kautta jo silloin, kun käyttäjä on kirjautunut palveluun ensimmäistä kertaa ja hyväksynyt käyttösäännöt — jokunen ehkä jopa lukenutkin ne. Palveluiden yksityisyysasetukset kuitenkin muuttuvat jatkuvasti niin, että käyttäjien on vaikea pysyä perillä siitä, missä julkisuuden rajat menevät. Poliittisen toimijan kohdalla viestien julkisuus vaikuttaa suunnitellulta, mutta voimmeko yksittäisen kansalaisen kohdalla olla varmoja, että viesti on todella tarkoitettu julkiseksi?

Onneksi sosiaalisen median alustat myös jossakin määrin suojelevat käyttäjiään. Esimerkiksi Facebookin ohjelmointirajapinnan kautta saatavan tiedon määrä on muuttunut vuosi vuodelta vähäisemmäksi. Tällä hetkellä yksittäisten käyttäjien julkaisemia julkisia tilapäivityksiä ei saa rajapinnan kautta tallennettua.

Lopuksi on hyvä muistaa, että sosiaalisen median aineistoja hyödyntävät myös muut kuin akateemiset tutkijat, usein kaupallisiin tarkoituksiin. Näistä hyödyntämistavoista tutkimus lienee kilteimmästä päästä. Se ei silti tarkoita, että tieteellisen tutkimuksen tulisi perääntyä eettisistä periaatteistaan. Verkko tarjoaa ainutlaatuisen mahdollisuuden ymmärtää ihmisten sosiaalista toimintaa laajalla skaalalla, ja tähän mahdollisuuteen kannattaa tarttua. Liian huolissaan ei kannata olla: tutkijat ovat aina käsitelleet arkaluontoisia aineistoja, ja meillä on siihen liittyvää ammattitaitoa. Nyt tuo taito täytyy mukauttaa digitaaliselle aikakaudelle ja muistaa pitää pää kylmänä myös verkon mahdollisuuksien edessä.

Viitteet:

  1. Markham, A., Buchanan, E., & AoIR Ethics Working Committee. 2012. Ethical decision-making and Internet research: Version 2.0. Recommendations from the AoIR Ethics Working Committee. Final Draft, Association of Internet Researchers.
  2. Turtiainen, R. & Östman, S. 2013. Verkkotutkimuksen eettiset haasteet: Armi ja anoreksia. Teoksessa: Laaksonen, S-M; Matikainen, J. & Tikka, M. (toim.). Otteita verkosta. Verkon ja sosiaalisen median tutkimusmenetelmät. Tampere: Vastapaino, s. 49–67.
  3. Tutkimuseettinen neuvottelukunta. 2009. Humanistisen, yhteiskuntatieteellisen ja käyttäytymistieteellisen tutkimuksen eettiset periaatteet ja ehdotus eettisen ennakkoarvioinnin järjestämiseksi.  Luettu 17.2.2016.
  4. Östman, S. 2007. Kommentti blogikirjoitukseen Koulukyytejä blogissa Little Things.  Luettu 18.2.2016.
  5. Helsinki Institute for Information Technology. 2015. Digivaalit 2015. Luettu 19.2.2016
  6. Citizen Mindscapes. nd. Luettu 19.2.2016.

One thought on “Sosiaalinen media – tutkimusaineiston hankala aarrearkku

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s