Slämärit ja superkäyttäjät: ihmeellinen Internet tutkijan työpöydällä

 

https://www.flickr.com/photos/meddygarnet/8346190491/
(cc) Morgan @Flickr

Smarter Social Media Analytics -tutkimushankkeessa sovellamme ja kehitämme erilaisia koneoppimiseen pohjautuvia menetelmiä sosiaalisen median tekstisisältöjen analysointiin. Fiksumpi  analyysi kuitenkin vaatii algoritmien rinnalle ihmisilmää – vähintäänkin kehitysvaiheessa.

Olen lukenut eilen ja tänään  SSMA-hankkeemme aineistosta läpi parintuhannen viestin otoksen, jossa viestit koskevat kasvissyöntiä tavalla tai toisella. Otos liittyy koko aineistosta tehtyyn aihemallinnukseen, jossa noin puolen miljoonan viestin massasta on ohjaamattoman koneoppimisen avulla erotettu erilaisia topiikkeja tai teemoja. Mallinnuksen syötteenä skripti antaa kasan perusmuotoistettuja sanalistoja, jotka kuvaavat näitä erilaisia aiheita. Lopulta kuitenkin ainoa tapa varmistaa, että tehty analyysi toimii kuten pitää, on ihmisvoimin tarkistaa mistä topiikeissa oikeastaan on kysymys. Tämä tapahtuu esimerkkiviestejä tarkistamalla.

Tarkistuskeikka on pieni matka yhä vain ihmeelliseen Internetiin. Sosiaalisen median tutkimuksen parasta antia ovat usein juuri näkymät vuorovaikutuksen maailmoihin, joita ihmiset verkossa elävät ja tuottavat mikrotasolla. Tässä kaksi hienoa esimerkkiä kasvisruokakeskusteluista.

**

Viestejä läpikäydessä olen kohdannut kymmeniä erilaisia virtuaalislämäreitä. Omassa nuoruudessani slämäri oli vihko, jossa jokaisella sivulla oli eri kysymys ja vastaukset kirjattiin tietyllä symbolilla tai anonyymisti. Nykypäivän slämäri on keskustelupalstalla kiertävä lista numeroituja kysymyksiä, johon kukin kirjoittaja vastaa, tai lista [ ] väittämiä, joista [x] rastitaan kirjoittajaan sopivat kohdat. Arvioin kirjoittajien olevan enimmäkseen melko nuoria.

Tällaiset memeettiset sisällöt ovat toistuvia, mutta kuitenkin niin monipuolisia tekstimuotoja, ettei sanojen yhdessä esiintymisen perusteella aiheita luokitteleva algoritmi osaa niitä niputtaa. Virtuaalislämäreissä kuitenkin kiertää kasvisyöntiä koskevia kysymyksiä, joiden vuoksi kaikki nuo tuhannet viestit näkyvät jokaisessa kasvissyönti-sanalla tehdyssä haussa tai tietyllä sanalla piirretyissä trendikuvaajissa. Toki ne osaltaan trendistä kertovatkin; kasvissyönti puhututtaa.

Toinen ihmettelyn aihe oli aihemallinnuksessa erästä topiikkia kuvaava sana, joka ei ollut mikään suomen kielen tunnistettava sana. Pienen selvittelyn jälkeen paljastui, että kyseessä on yksi Suomi24-foorumin superaktiivinen käyttäjä, joka kirjoittaa palstalle joka päivä keskimäärin kolmetoista viestiä päivässä.

Viestimäärä on ilmeisen tarpeeksi, että saa aikaan oman aiheen aihemallinnuksessa, kun muut käyttäjät mainitsevat kyseisen nimimerkin tarpeeksi usein. Selvästi siis onnistunut keskustelunherättäjä ja oman mikroyleisönsä julkkis, jonka viesteillä voi olla suurikin vaikutus keskustelujen aihepiiriin.

**

Molemmat esimerkit ovat sellaisia, joita on hankala automaattisesti tekstin seasta erottaa ilman laadullista tarkastelua, tai vähintäänkin sen tekeminen vaatisi melkoisia tapauskohtaisia virityksiä koodiin. Viritykset taas ovat varsinkin tuotantokäytössä aika hankalia ja toisaalta tekevät analyysista prosessin, jonka toimintaperiaatteita on vaikea ymmärtää ja tuloksia tulkita.

Silti ne ovat aika oleellisia mikrotason havaintoja siitä dynamiikasta, jolla vuorovaikutus verkossa muodostuu.

Kohti fiksumpaa keskustelujen mallinnusta siis pyritään, mutta todellisuus on aina vaan analytiikkaa ihmeellisempää. Se on jotenkin lohdullista.

Digitaalisen yhteiskunnan rajapinnoilla -luentosarja Tiedekulmassa 30.10.-11.12.

labyrinthclassroom_2435823037_7853d39e69_z
(cc) Karl-Ludwig Poggemann @Flickr

Rajapinta ry. järjestää yhdessä Helsingin yliopiston Kuluttajatutkimuskeskuksen kanssa luentosarjan Digitaalisen yhteiskunnan rajapinnoilla Helsingin yliopiston Tiedekulmassa 30.10.–11.12.2017 aina maanantaisin klo 13.15-14.45. Luennot ovat kaikille avoimia ja ne välitetään myös suorana verkkoon – tervetuloa kuulolle!

Luentosarja pureutuu digitaalisuuden yhteiskunnallisiin vaikutuksiin eri näkökulmista. Digitaalisuus ja teknologiset laitteet ovat muodostuneet erottamattoksi osaksi arkeamme. WhatsAppissa lähetetään yhdessä minuutissa 21 miljoonaa viestiä ja pyyhkäistään lähes miljoona kertaa Tinderissä. Suomessa tehdään päivittäin 30 miljoonaa Google-hakua. Vaalikeskustelut käydään vaaliteltan sijasta Twitterissä. Luentosarja kysyy, miten digitalisoituminen vaikuttaa sosiaalisen ja yhteiskunnalliseen toimintaan? Minkälaisia poliittisia, taloudellisia ja kulttuurillisia kytköksiä teknologian taustalla on? Teemoista alustavat teknologiayhteiskuntatieteilijät sekä organisaatioiden edustajat.

Helsingin yliopiston opiskelijat voivat suorittaa luentosarjan kurssina, jolloin suoritukseen kuuluu myös lukupiirisessio luentojen jälkeen.

Kurssin ohjelma:

*** 30.10. Introluento: Mitä on digitaalinen yhteiskuntatiede? [tallenne]

Mika Pantzar & Minna Ruckenstein (Kuluttajatutkimuskeskus)
Mika Pantzar luennoi kuluttajakansalaisen arjesta datataloudessa ja kertoo, miksi digitaalisesta kannattaa olla kiinnostunut? Vielä muutama vuosikymmen sitten mobiilin tietoyhteiskunnan visioissa kuluttaja näyttäytyi liike-elämälle lähinnä uutuuksien ja tiedon virran vastaanottajana. Internetin, sosiaalisen median ja kaikkialla mukana kulkevien digitaalisten laitteiden myötä käsitys kuluttajasta on kääntynyt päälaelleen. Kuluttajasta on tullut taloudellisen arvonmuodostuksen tärkein lähde. Minna Ruckenstein valottaa digitaalisen kulttuurin ja sosiaalisuuden tutkimuksellisia lähtökohtia.

*** 6.11. Identiteetti, addiktio ja teknologia [tallenne]

Suvi Uski (tutkija, Someturva) & Eeva Raita (Futurice Oy)
Suvi Uskin aiheena on yksilön identiteetti ja teknologia- Yksilön toiminta digitaalisissa ympäristössä ei pääse eroon ihmisen psykologian lainalaisuuksista. Luento pureutuu tutkimustietoon sekä tällä hetkellä tarjolla olevaan ongelma-avaruuteen, joka koskettaa kaikkia digitaalisissa ympäristöissä toimivia. Eeva Raita puhuu teemasta “Kokemus, addiktio ja mobiiliteknologia”: Jokaisen menestyvän digitaalisen palvelun takana on syvällinen ymmärrys ihmisten kokemuksellisuudesta. Luennolla keskustellaan siitä miten, miksi ja millä seurauksilla kokemus on noussut teknologian kehittämisen keskiöön.

*** 13.11. Näkökulmia politiikkaan ja teknologiaan [tallenne]

Matti Nelimarkka (Aalto-yliopisto & Helsingin yliopisto) & Minerva Krohn (Helsingin kaupunki, digitalisaatiotoimikunta)
Käsittelemme luennolla kahta laajaa teemaa: (1) teknologian käyttöä politiikassa erilaisten demokratiaa ja politiikkaa käsittelevien normatiivisten käsitysten kautta sekä
(2) puramme teknologian ja politiikan suhdetta toistensa muovaajina.

*** 20.11. Sosiaalinen vuorovaikutus ja yhteistoiminta verkkoalustoilla [tallenne]

Airi Lampinen (Tukholman yliopisto) & Vilma Lehtinen (Skhole Oy)
Sosiaalinen ja taloudellinen vuorovaikutus nivoutuvat yhteen alustapalveluiden avulla järjestettävässä toiminnassa. Esimerkkejä tästä ovat jakamistalous ja joukkoistaminen. Luennolla digitalisoitunutta sosiaalisuutta tarkastellaan vuorovaikutuksen, yhteisöjen ja yhteistoiminnan näkökulmasta

*** 27.11. Alustatoimijat ja datatalous [tallenne]

Tuukka Lehtiniemi (Aalto-yliopisto & Turun yliopisto) & Pauli Aalto-Setälä (Aller Media Oy)
Ihmisiä koskevasta datasta, henkilödatasta, on tullut digitaalisessa taloudessa keskeinen arvonluonnin raaka-aine. Tästä hyvänä esimerkkinä ovat verkon alustapalvelut. Luennolla kuvataan alustatoimijoiden keskeiseen asemaan johtaneita tekijöitä sekä avataan viimeaikaisia pyrkimyksiä ymmärtää datatalouden toimintalogiikkaa. Allerin Pauli Aalto-Setälä kertoo Allerin data-analyytikasta ja RIkastamo-projektista.

*** 4.12. Algoritmit, julkisuus ja media [tallenne]

Salla-Maaria Laaksonen (Helsingin yliopisto) & Jarno Koponen (YLE)
Julkisuus muotoutuu yhä enemmän mediateknologian muodostamassa ympäristössä, jossa viestien välitystä ja leviämistä säätelevät toisenlaiset logiikat kuin perinteisen mediajulkisuuden aikana. Luennolla avataan, miten teknologia ja ihmistoimijat yhdessä rakentavat hybridiä verkkojulkisuutta ja siellä liikkuvia diskursseja. Jarno Koponen Yeisradiolta avaa mikä on YLEn Uutisvahti ja kertoo muista discovery-ratkaisuista uutiskäyttäjän näkökulmasta.

*** 11.12. Teknologiavälitteinen kansalaisuus

Veikko Eranti (Tampereen yliopisto) & Johannes Koponen (Demos Helsinki)
Millaisia mahdollisuuksia ja haasteita vuorovaikutuksen, viestinnän ja politiikan teknologiavälitteisyys aiheuttavat kansalaisuuteen? Miten meitä kontrolloidaan ja miten voimme itse hyödyntää teknologiaa poliittisessa toiminnassa? Tällä luennolla pohditaan, millaisia ovat poliittinen toimijuus ja kansalaisuus teknologiavälitteisessä maailmassa.

 

Algoritminen julkisuus on vinoutunutta kyborgijulkisuutta

2453788025_fd51aeb4d9_z
(cc) runran @Flickr

Teknologia nähdään helposti neutraalina tiedonvälittäjänä. Moni viestinnän ammattilainen ei tiedä, miten teknologia toimii tai miten sen kanssa pitäisi toimia. Meidän pitäisi kuitenkin olla yhä tietoisempia siitä, miten esimerkiksi algoritmit meitä  tulevaisuudessakin ohjaavat.

“Software is, in other words, a part of a ‘technological unconscious’ (Clough, 2000), a means of sustaining presence which we cannot access but which clearly has effects, a technical substrate of unconscious meaning and activity.” (Thrift, 2005)

Maantieteilijä-sosiologi Sir Nigel Trift on käyttänyt teknologisen tiedostamattoman käsittettä kuvaamaan teknologian ja ohjelmistojen vaikutusta eräänlaisena sosiaalisen elämän kehikkona, joka tiedostomattomasti vaikuttaa toimintaamme.

Viestinnän ja julkisuuden näkökulmasta teknologisen tiedostamattoman käsite kuvaa kahta asiaa: Ensinnäkin niitä informaatioteknologian tuntemattomia ominaisuuksia ja tapoja, jotka muokkaavat arkea ja erityisesti media-arkeamme, mutta joista emme useinkaan ole kovin tietoisia. Toisaalta käsite muistuttaa siitä, että monella viestinnän ammattilaisella ei ole tarpeeksi tietoa siitä miten teknologia lopulta toimii tai miten sen kanssa pitäisi toimia.

Teknologinen tiedostamaton määrittelee monella tapaa sitä, miten julkisuus muotoutuu. Keskeisin tämän hetken julkisuuden rakennuspalikka on newsfeed, uutisvirta, joka eri palveluissa jäsentää verkon sisältöjä pyrkien maksimoimaan huomion ja palvelussa vietetyn ajan. Käytännössä tämä tapahtuu erilaisten algoritmien avulla: pienet tietokoneohjelmat tai laskukaavat ohjaavat sisällön esittämistä aiempaan käyttäytymiseemme perustuen.

Huolestuttavaa on, että teknologia nähdään neutraalina tiedonvälittäjänä. Vuoden 2017 Edelman Trust Barometerissä vastaajat arvioivat hakukoneet kaikkein luotettavimmaksi tiedonlähteeksi. Perinteisen median luottamus puolestaan on romahtanut. Teknologia vaikuttaa puolueettomalta ja virheettömältä toimijalta samalla kun perinteinen media nähdään eliitin käsikassarana.

Algoritmit ovat kuitenkin tasan yhtä hyviä kuin mekin. Ihmisten toimintatavat, vinoumat ja virhekäsitykset siirtyvät suoraan niihin joko ohjelmoinnin tai koneoppimisen kautta. Hakukone suoltaa sisältöä, josta se arvelee etsijän pitävän aiemman verkkokäyttäytymisen perusteella. Teknologia tuottaa kaikukammioita, koska ihmiset ovat sosiaalisessa toiminnassa tyypillisesti mieluten oman viiteryhmänsä kanssa. Työnhakualgoritmi syrjii tummaihoisia. Microsoftin tekoälybotti jouduttiin ottamaan pois linjoilta, kun se oppi päivässä suoltamaan rasistista vihapuhetta Twitterin elämänkoulussa.

Sisältöjen kohdentamisessa ja teknologiajättien bisnesmallina vinotkin algoritmit kuitenkin toimivat hyvin. Facebook tahkoaa rahaa 6,4 miljardin dollarin liikevaihdolla. Käyttäjämäärät suosituissa sosiaalisen median palveluissa jatkavat kasvuaan, ja alustat tuottavat uusia toimintamuotoja, joilla pyritään maksimoimaan niissä vietetty aika. Julkisuuden ja demokratian kannalta kuitenkin ongelmallista on, että algoritmi ei osaa tehdä eroa eri sisältöjen välillä. Se tarjoilee samalla logiikalla kenkiä, lääkkeitä ja politiikkaa. Syyskuussa 2017 Facebookissa pystyi esimerkiksi kohdentamaan mainoksia suoraan juutalaisvihaajille.

Rahalla siis saa. Bisneslogiikan nimissä samaan aikaan mediayhtiöt ovat huomanneet, että Facebookin algoritmi näyttää entistä vähemmän mediatalojen postauksia niiden seuraajille. Sen sijaan se painottaa sosiaalisuutta ja engagementtia: newsfeedissä näkyy todennäköisimmin sisältöjä, joita kaverisi ovat jakaneet, tykänneet tai kommentoineet. Faktoilla ei tässä pelissä ole arvoa. Sen sijaan tunteilla ja epärehellisyydellä on.

Tämä logiikka on voimalain logiikkaa (Matthew effect). Mikä tahansa tahmainen, ihastuttava tai vihastuttava sisältö päätyy todennäköisemmin näytetyksi, ja sisällön suosio kasvaa entisestään. Siksi julkisuudestamme muodostuu väistämättä tunnejulkisuus, joka etenee kohusta toiseen. Teknologinen tiedostamaton on siis lopulta hybridiä ihmisyyttä, julkisuuden muodostumista kyborgitoimijoiden kautta.

Viestinnän ammattilaisen näkökulmasta huolestuttavaa on se, että teknologian edistämä logiikka hiipii myös niihin tapoihin, joilla viestintää tehdään ja mittareihin, joilla sitä mitataan. Klikkien tuijottamisesta on kenties päästy piirun verran eteenpäin, mutta nyt uusi mittari, jota kaikki maanisesti tuijottavat on sisällön aikaansaama sitoutuminen, engagament.

Se on muuten Facebookin kaupallista menestymistä varten tehty mittari.

Mitäpä jos pakasta napatun mittarin sijasta viestinnän ammattilaiset itse rohkeasti määrittelisivät, mitä on hyvä viestintä, mitä on vaikuttavuus ja miten sitä halutaan mitata?

– –
Salla-Maaria Laaksonen (VTT) on viestinnän ja teknologian tutkija Viestinnän Tutkimuskeskus CRC:ssa ja Kuluttajatutkimuskeskuksella.

Blogikirjoitus on rinnakkaispostaus Viesti ry:n blogista. ja perustuu HY+:n ja Viesti ry:n Viestinnän tulevaisuus -tilaisuudessa 26.9.2017 pidettyyn puheenvuoroon.

Keskustelukuplia ja kaikukammioita – missä on demokratian dialogi verkossa?

AmitBorade_17841847105_778599506a_z
(cc) Amit Borade @Flickr

Blogikirjoitus on rinnakkaispostaus Oikeusministeriön #suomi100-blogista.

Yhteiskunnallisen verkkokeskustelun kuplautuminen on ollut vahvasti huolenaiheena julkisessa keskustelussa. Onko teknologia, jonka piti mahdollistaa kaikkien kansalaisten osallistuminen yhteiskunnalliseen keskusteluun, sittenkin sulkenut meidät kaikukammioihin huutelemaan samanmielisten kanssa?

Kuplakeskustelun avasi Eli Pariser (2011) kirjallaan Filter Bubbles, jossa hän osoitti, kuinka eri puolueita kannattavat käyttäjät saavat hakukoneesta samalla hakusanalla aivan erilaisia tuloksia. Samaa ilmiötä on kauhisteltu muun muassa Facebookin kohdalla. Yleisradion toimittaja loi muukalaisvihamielisen feikkiprofiilin Facebookiin ja osoitti, miten muutamassa kuukaudessa käyttäjä sulkeutui vihakuplaan.

Kuplautumisen taustalla on teknologiajättien bisneslogiikka, jossa pyrkimyksenä on maksimoida käyttäjän palveluissa viettämä aika. Uutisvirta ei harjoita journalistista harkintaa, vaan oppii aiemmasta käyttäytymisestä. Facebookissa on tuhansia eri attribuutteja määrittämässä uutisvirtaamme sisältöä – mitä valtaosa käyttäjistä ei edes tiedosta. Sen sijaan he kehittävät luovasti erilaisia sosiaalisia perusteluja sisältöjen piiloutumiselle.

Kuplissa ei kuitenkaan ole kysymys ainoastaan teknologiasta. Sosiaalipsykologia on pitkään tarkastellut sosiaalisen identiteetin muodostumista ja ryhmien merkitystä. Ryhmässä mielipiteet yhtenäistyvät ja ryhmä alkaa suosia omaa ryhmäänsä toisten ryhmien kustannuksella. Lisäksi meillä on vahva taipumus tykästyä ärsykkeisiin, joille altistumme toistuvasti. Kun luemme samaa sisältöä uudelleen ja uudelleen, se alkaa tuntua normaalilta ja hyväksyttävältä.

Kuplautuminen on siis luonnollista, mutta on selvää, että viestintäteknologialla on sitä tukevia ominaisuuksia. Sosiaalinen media mahdollistaa sen, että samalla tavalla ajattelevat ihmiset voivat päätyä kaikukammioihinsa jakamaan virheellisiä väitteitä keskenään myös omaa lähituttavien piiriä laajemmalle.

Kuplasta ulos pääseminen vaatii työtä. Informaatiotulvan keskellä on mahdollista etsiä kattavasti eri mielipiteitä ja vertailla niitä. Käytännössä ihmiset eivät kuitenkaan tee niin, vaan tyytyvät ensimmäisiin tarjokkaisiin. Edelmanin luottamustutkimuksen mukaan hakukoneiden puolueettomuuteen luotetaan enemmän kuin uutismediaan.

Kuplilla pelotteluun liittyy kuitenkin riski siitä, että kaikki verkossa käytävä keskustelu latistetaan kuplissa tapahtuvaksi arvottomaksi huuteluksi, johon teknologia meidät ajaa. Verkkokeskusteluissa käydään myös asiallista poliittista keskustelua ja nostetaan esille kansalaisten huolia. Kuplat tai algoritmit eivät tee niistä vähemmän todellisia. Teknologia ei ole irrallinen yhteiskunnasta eikä mullista sitä kertaheitolla, vaikka vastuuta halutaan mielellään sälyttää teknologialle.

Algoritmeilla ja teknologialla pelottelun sijaan meidän tulisi paremmin ymmärtää niiden hybridi luonne: algoritmit ovat tasan yhtä hyviä kuin mekin. Ihmisten toimintatavat ja virhekäsitykset siirtyvät niihin ohjelmoinnin tai koneoppimisen kautta. Hakukone ja uutisvirrat suoltavat sisältöä, josta ne arvelevat etsijän pitävän aiemman verkkokäyttäytymisen perusteella. Teknologia tuottaa kaikukammioita, koska ihmiset ovat sosiaalisessa toiminnassa mieluiten oman viiteryhmänsä kanssa. Tekoälybotti oppii päivässä rasistiseksi vihapuhujaksi muita Twitter-käyttäjiä seuraamalla. Työnhakualgoritmi syrjii tummaihoisia, koska se oppii käyttäytymismallin aiemmasta aineistosta.

Kupla- ja algoritmikauhistelun sijasta tarvitsemme paitsi sosiaalipsykologista ymmärrystä omasta toiminnastamme, myös algoritmilukutaitoa: ymmärrystä siitä, miten julkisuus rakentuu sosiaalis-teknologisena järjestelmänä, ja miten voimme itse siihen vaikuttaa. Kriittisyys sisältöjä ja lähteitä kohtaan on tärkeää. Tieto kannattaa aina varmistaa monesta eri lähteestä, eikä hakukonekaan ole puolueeton. Omia ennakkoluulojaan voi haastaa etsiytymällä tarkoituksella toisen sosiaalisen ryhmän keskusteluihin. Siihen teknologia tarjoaa parempia mahdollisuuksia kuin paperimedia.

_________________________________________________

Salla-Maaria Laaksonen (VTT) on viestinnän ja teknologian tutkija Viestinnän Tutkimuskeskus CRC:ssa ja Kuluttajatutkimuskeskuksella. Laaksonen on tutkinut muun muassa yritysmainetta, digitaalista vaalijulkisuutta ja organisoitumista verkossa.

Lue lisää:
•    Tristan Harris: How a handful of tech companies control billions of minds every day  
•    TechCrunch: Ultimate Guide to the News Feed
•    Edelman 2017 Trust Barometer

Miten some-aineistoja sopii analysoida?

15422638442_cb6aeb137e_z
(cc) Janet McKnight, Flickr

Blogikirjoitus on rinnakkaispostaus Etiikka.fi-sivustolta ja sosiaalisen median tutkimusetiikkaa käsittelevää kirjoitussarjaa. Digitutkimuksen etiikan pohdinta jatkuu Rajapintapäivillä 2.11.!
– –

Yhä useampi yhteiskuntatieteellinen tutkija työskentelee sosiaalisesta mediasta kerättyjen aineistojen parissa – olivat ne sitten perinteisiä, pienempiä otoksia tai isompia big data -aineistoja. Verkkoaineistojen kanssa työskentely on kuitenkin tutkimusta siinä missä muukin tutkimus, ja eettiset ohjenuorat ovat työssä kullanarvoinen apu.

Sosiaalisen median aineistojen analyysin erityispiirre on se, että aineistoihin lähes väistämättä liittyy henkilötietoja. Monissa sosiaalisen median palveluissa profiili kytkeytyy suoraan oikeaan nimeen, mutta joidenkin tulkintojen mukaan esimerkiksi pelkkä Twitterin käyttäjänimi riittää yksilöimään käyttäjän henkilön. Tutkijan täytyy olla tietoinen sekä henkilötietojen käsittelyyn liittyvästä lainsäädännöstä, että ihmistutkimuksen eettisistä periaatteista. Ohjeistuksien peruspilareihin kuuluu tutkittavan koskemattomuuden säilyttäminen ja vahingoittamisen välttäminen sekä yksityisyydestä ja tietosuojasta huolehtiminen (ks. TENK).

Mikä on aineiston konteksti?

Verkkoaineistojen avulla voidaan käsitellä hyvinkin henkilökohtaisia ja arkaluontoisia teemoja, esimerkiksi uskontoon, poliittisiin mielipiteisiin tai seksuaaliseen suuntautumiseen liittyviä asioita. Tutkittavan fyysinen koskemattomuus tuskin on uhattuna, mutta leikepöydällä voi olla materiaalia, jonka analysointi tai julkistaminen voi tuottaa tutkittavalle vahinkoa esimerkiksi henkilömaineen tahriintumisen tai jopa post-traumaattisen stressin muodossa.

Association of Internet Researchersin eettiset ohjeet painottavat juuri vahingon aiheuttamiseen liittyvää harkintaa: mitä haavoittuvaisemmasta tutkittavasta tai teemasta on kysymys, sitä tarkemmin tutkijan velvollisuus on suojata tutkittaviaan:

“The greater the vulnerability of the community / author / participant, the greater the obligation of the researcher to protect the community / author / participant.” (Markham & Buchanan 2012, AoIR ethical guidelines)

Sosiaalisen median aineistojen käsittelyssä olennaisinta on kehittää tarkka ymmärrys aineiston kontekstista. On mahdotonta antaa yleispätevää vastausta esimerkiksi kysymykseen ”Aiheutuuko twiittien keräämisestä haittaa niiden lähettäjälle?”. Vastaus riippuu aina viestin lähettäjästä, aihepiiristä ja yhteiskunnallisesta kontekstista. Lopputulos riippuu myös analyysissa tehtävistä toimenpiteistä ja valinnoista.

Anonyymia analyysia

Perinteinen keino turvata tutkittavien henkilöiden oikeuksia on aineiston anonymisointi. Monessa yhteiskuntatieteellisessä tutkimuksessa on kuitenkin oleellista tietää, kuka viestin on kirjoittanut. Esimerkiksi yhteiskunnallisen vallankäytön tutkiminen ilman lähettäjätietoja on mahdotonta.

Silti on hyvä miettiä myös tutkimusprosessin aikana tarkasti, onko tutkijoiden tarpeen tietää tutkittavien identiteettejä. Omassa Digivaalit 2015 -tutkimuksessamme kerätyistä isoista aineistoista tunnistettiin nimellä ainoastaan vaaliehdokkaat. ansalaisten käyttäjänimet näkyivät vain numerosarjoina: tutkimusongelman valossa meillä ei ollut mitään tarvetta tietää, minkä niminen henkilö on kirjoittanut poliitikoille kommentteja.

Anonymisointi ei kuitenkaan ole oikotie onneen. Eri aineistoja yhdistämällä voi olla mahdollista luoda pelottavan tarkkoja henkilöprofiileja arkaluontoisistakin aiheista: klassisessa amerikkalaisessa esimerkissä terveystietoja sisältävä, anonymisoitu aineisto pystyttiin yhdistämään muutaman muuttujan avulla suoraan äänestäjärekisteriin. Tuoreessa tapauksessa pystyttiin profiiliosoitteiden avulla tunnistamaan lukuisia käyttäjiä anonyymista selainhistoriadatasta.

Lisäksi sosiaalisen median aineistojen kohdalla anonymisointi on osin kosmeettista. Julkisesta verkosta kerätty aineisto on kenen tahansa löydettävissä pelkästään tekstisisältöjen perusteella: esimerkiksi aineistolainaukseen poimitun twiitin lähettäjineen löytää Twitteristä hakukoneella. Siksi varovaisuusperiaate täytyy pitää mielessä aina tutkimustulosten raportointiin ja julkaisemiseen asti. Tutkija joutuu käytännössä punnitsemaan, näyttääkö hän lukijalle aineistonäytteitä parantaakseen argumentaatiotaan, vai pyrkiikö hän turvaamaan tutkittavien anonymiteetin.

Henkilötieto on henkilötietoa, mutta julkinen ei välttämättä julkista

Kenties paras muistisääntö sosiaalisen median aineistojen analyysin parissa työskentelevälle tutkijalle onkin ajatella ja käsitellä niitä koko ajan henkilötietoina. Yhdeksi apumitaksi kannattaa ottaa lakipykälät. Suomen laki henkilötietojen käsittelystä on – kansalaisten onneksi – sen verran tiukka, että sen pykälistä löytyy hyvää tukea myös tutkimusetiikan pohtimiseksi.

Laki pakottaa miettimään tarkemmin aineistojen tallentamista ja suojaamista. Suojaamaton pilvipalvelu on henkilötietoja sisältävälle tutkimusaineistolle yhtä väärä paikka kuin ruotsalaisten henkilötiedoille.

Laki ei kuitenkaan ota kantaa kaikkiin tutkimuksen kannalta tärkeisiin eettisiin kysymyksiin Sen näkökulmasta julkiset verkkokeskustelut ovat arkaluontoisinakin julkistettua tietoa, jonka käyttäminen aineistona on sallittua. Keväällä 2018 voimaan tuleva uusi EU:n tietosuoja-asetus näyttäisi jopa antavan entistä enemmän vapauksia henkilödatan tutkimuskäytölle.

Palaamme siis tärkeimmän opin äärelle: kontekstin ymmärtäminen ja aineiston käytöstä mahdollisesti aiheutuvien haittojen pohtiminen on tärkein osa tutkijan eettistä ammattitaitoa. Digitaalisten aineistojen käyttöön pätevät samat varotoimenpiteet kuin ei-digitaalisten aineistojen kohdalla: tutkittavien anonymisointi varsinkin lopullisessa julkaisussa, sekä tutkimuksesta tutkittaville mahdollisesti aiheutuvan harmin ja vahingon välttäminen tutkimusprosessin jokaisessa vaiheessa.

– –
Salla-Maaria Laaksonen, VTT,  on viestinnän ja teknologian tutkija Viestinnän Tutkimuskeskus CRC:ssa ja Kuluttajatutkimuskeskuksella.

Teknologia, demokratia ja teknologinen kansalaisuus

https://www.flickr.com/photos/nickharris1/8026290210
Photo: Nick Harris

Eilen tulevaa syyslukukautta juhlistettiin valtiotieteellisen tiedekunnan sisäpihalla sidosryhmille suunnatun kesäjuhlan merkeissä. Pidimme yhdessä Mika Pantzarin kanssa tapahtumassa lyhyen dialogipuheenvuoron aiheesta teknologia, demokratia ja kansalaisuus. Ohessa oma pointtini lyhyesti.

Teknologia on osa sosiaalisia, taloudellisia ja poliittisia valtarakenteita.

Suomalaiset yhteiskuntatietelijät ovat yllättävän vähän kiinnostuneita teknologiasta ottaen huomioon kuinka keskeisessä roolissa se arjessamme on. Samaan aikaan julkisuudessa on tällä hetkellä on kovasti vallalla eräänlainen uus-deterministinen puhe teknologiasta: väitteet siitä, kuinka algoritmit määrittelvät kaiken julkisen tilan, kertovat olemmeko sairaita vai emme, ja kuinka tekoäly saavuttaa pian tietoisuuden ja valloittaa maailman. Näissä puheissa teknologia nähdään toimijana, joka tuntuu olevan ihmiskontrollin ulottumattomissa.

Tutkijoina, asiantuntijoina ja kansalaisina meidän pitäisi ymmärtää paremmin niitä taloudellis-poliittisia rakenteita, jotka vaikuttavat teknologian taustalla. Vain siten osaamme paremmin suhteuttaa myös yllä kuvattua puhetapaa todellisuuteen.

Teknologisen kansalaisuuden näkökulmasta on merkittävää, että teknologialla tai tarkemmin teknologiayrityksillä on rakenteellista valtaa, joka määrittelee arkeamme ja julkisuuden rakennetta. tätä valtaa käyttävät ennen kaikkea isot amerikkalaisyritykset – le GAFA, eli Google, Apple, Facebook ja Amazon – joiden toimintalogiikkaa ohjaavat taloudelliset intressit. Tämä huolimatta siitä, että niiden mainospuheissa käytetään jatkuvasti kulttuurillista ja sosiaalista retoriikkaa [1].

Siksi teknologinen kansalaisuus tapahtuu tällä hetkellä kaupallisessa kontekstissa ja on kiinni markkinavetoisessa logiikassa: somekohut, Trumpin twiitit ja yhtä lailla myös perinteinen media ohjautuvat pääasiassa talouden logiikalla.

Markkinavetoinen teknologinen kansalaisuus on somekohuja ja närkästymistä, joita sitten mitataan ja analysoidaan, ja joista tehdään uutisia. On vaarana, että  tälainen pulina jää vain pulinaksi, jossa äänekäs vähemmistö vie näkyvyyden (cf. Marcuse ja repressiivinen toleranssi [2]). Luulemme osallistuvamme ja tekevämme politiikkaa, mutta todellisuudessa luomme vain kohun ja datapisteitä markkinoijalle.

Ehkä demokraattisempi teknologinen kansalaisuus voisi olla teknologian käyttöä suoraan kontaktiin valtaapitävien kanssa, erilaisia osallistavia teknologiaprojekteja ja jalkautumista poliitikkojen ja virkamiesten taholta?

Teknologian tutkimuksessa onkin viime aikoina korostettu niin sanottua vastavuoroisen rakentumisen näkökulmaa (mutual constitution of technology). Sanarimpsu tarkoittaa sitä, että teknologia ja ihmistoimijat vaikuttavat toisiinsa ja teknologian merkitys ja käyttötavat rakentuvat sosiaalisen toiminnan kautta.

Tässä mielessä meillä on kansalaisina ja kuluttajina väistämättä myös valtaa vaikuttaa siihen minkälaiseksi teknologia muodostuu, miten sitä käytetään ja miten se ymmärretään. Tätä valtaa kannattaa käyttää: kehittää uusia tapoja käyttää olemassa olevaa teknologiaa demokratian edistämiseen, pitää yllä tietoisuutta teknologian taustalla olevista voimista, ja tuoda rohkeammin yhteiskuntatieteellistä näkökulmaa myös teknologian kehitykseen.

* *

[1] Van Dijck, J., & Nieborg, D. (2009). Wikinomics and its discontents: a critical analysis of Web 2.0 business manifestos. New Media & Society, 11(5), 855–874. http://doi.org/10.1177/1461444809105356

[2] https://en.wikipedia.org/wiki/A_Critique_of_Pure_Tolerance

AoIR 2017 preconference: Less Hate in Politics!

nettikett.pngIf heading to AoIR 2017, consider also joining our preconference on hate speech recognition and prevention:

Less Hate in Politics! Machine Learning and Interventions as Tools to Mitigate Online Hate Speech in Political Campaigns

  • Oct 18th, 9 am – 12:30 pm
  • Dorpat Convention Centre, Tartu, Estonia

Discriminating, hateful speech online, often targeting specific groups and minorities, has become a pressing problem in the societies. Hateful speech is a form of verbal violence that creates enemities, silences debates, and marginalizes individuals and groups from participation online.

What is challenging is that ‘hate speech’ has come to mean a variety of speech acts and other ill-behaviours online, ranging from penal criminal acts to speech which is uncivil and disturbing, but yet to be tolerated. This definitional difficulty is further abused in claims that any limitations of hate speech endanger people’s right to freedom of expression.

Hate speech has been criminalized in many countries and major Internet companies also engage in efforts to limit it. While many social media platforms allow users to flag content as hate speech for moderation purposes, no official follow-up actions take place. Furthermore, the automatic identification of hate speech is limited by lacking tools.

Pre-conference workshop aim and content:

The aim of the workshop is to facilitate the development of tools and processes how the academic community could run interventions which aim to decrease the toxicity in the online space.

We will provide participants a kick-start with computational tools for hate speech recognition. We will also discuss and reflect the challenges of such interventions and examine the opportunities and problems of deploying such systems. Our own experiences – which we reflect in the workshop – emerge from a project where the social media activity of candidates was monitored during the Finnish municipal election campaigns in April 2017.

The workshop will follow an interactive style using both online and offline tools to facilitate discussion.


Clipart by Eggib.