Botteja, algoritmeja ja kokemuksen väärentämistä

 

Tällä viikolla Etelä-Saimaa julkaisi Juho Maijalan kirjoittaman jutun, jossa kerrottiin kansanedustaja Jani Mäkelän (ps.) mielipidekirjoituksiin kohdistuneesta bottiklikkausliikenteestä. Klikkiliikenteen seurauksena kyseiset kirjoitukset olivat nousseet lehden luetuimpien listalla kärkeen. Tapaus on rakenteeltaan mielenkiintoinen. Joku tai jotkut tahot ovat käyttäneet botteja vaikuttaakseen algoritmiin vaikuttaakseen juttujen asemaan verkkosivulla, minkä mitä luultavimmin toivotaan vaikuttavan lukijoiden toimintaan ja ajatuksiin. Tapaus siis suorastaan huokuu nykyaikaa ja näyttää osuvasti, kuinka algoritmeja voidaan valjastaa palvelemaan tarkoitusperiä, joita niiden kehittäjät eivät ole toivoneet.

Erving Goffman puhuu teoksessaan Frame analysis (1986) kokemuksen väärentämisestä (käyttäen termiä fabrication englanniksi). Etelä-Saimaan jutussa puhutaan näkyvyyden lisääntymisestä yhtenä seurauksena manipulaatiosta; itse lisäisin joukkoon myös kokemuksen muokkaamisen. Korkea asema luetuimpien listalla viestii myös jutun asemasta suosittuna muiden ihmisten keskuudessa, eli siihen liittyy sosiaalista informaatiota. Tässä tapauksessa kokemuksen väärentäminen kohdistuu juuri tähän. Kehys, jossa informaatiota tulkitaan perustuu oletukseen, että muut ihmiset ovat omalla toiminnallaan nostaneet tietyn tekstin luetuimpien listalla kärkipaikoille. Ihmiset käyttävät usein muiden toimintaa tiedonlähteenä oman toimintansa suhteen ja se voi osaltaan vaikuttaa myös sisällön arviointiin (e.g. Salganik, Dodds, & Watts, 2006; Knobloch-Westerwick, Sharma, Hansen, & Alter, 2005). Paljon luettu artikkeli voidaan tulkita sisällöltään ja näkökulmaltaan validiksi ja suosionsa perusteella tärkeäksi. Algoritmi toimi tilanteessa niin kuin se oli rakennettu: sen kannalta jokainen klikkaus oli yhtä aito kuin mikä tahansa muu. Se mikä tälle algoritmille on relevanttia dataa on ihmisen valinta. Klikkauksen ajatellaan symboloivan kiinnostusta tai muuta mahdollisesti positiivista suhtautumista tiettyyn kirjoitukseen. Tässä tapauksessa paljastui, että jos klikkausmäärä on se, minkä ajatellaan olevan objektiivinen mittari, niin klikkaus ei itsessään aina tarkoita ihmisen klikkausta ja intentio klikkauksen takana ei aina ole selvä.

Etelä-Saimaa paljastaessaan epäilyttävän verkkoliikenteen purki, Goffmanin termejä käyttäen, kehyksen joka oli botteja käyttäen rakennettu Jani Mäkelän mielipidekirjoitusten ympärille. Koko tapaus on osuva kuvaamaan, kuinka haavoittuvainen jopa hyvin yksinkertaisten mittareiden perusteella rakennettu kokemus voi olla, miten algoritmeja on mahdollista manipuloida omien intressien edistämiseksi, ja toisaalta kuinka fabrikoituja kehyksiä on mahdollista purkaa.

Kirjallisuutta:

Goffman, E. (1986). Frame analysis: An essay on the organization of experience. Harvard University Press.

Knobloch-Westerwick, S., Sharma, N., Hansen, D. L., & Alter, S. (2005). Impact of popularity indications on readers’ selective exposure to online news. Journal of Broadcasting & Electronic Media, 49(3), 296–313.

Salganik, M. J., Dodds, P. S., & Watts, D. J. (2006). Experimental study of inequality and unpredictability in an artificial cultural market. Science, 311(5762), 854–856.

Algoritmitutkimuksesta yleisemmin:

Gillespie, T. (2012). The relevance of algorithms. Media Technologies: Essays on Communication, Materiality, and Society, (Light 1999), 167–194. http://doi.org/10.7551/mitpress/9780262525374.003.0009

Kitchin, R. (2016). Thinking critically about and researching algorithms. Information, Communication & Society, 1-16.

DCCS syyskuussa: aihemallinnusta sekä algoritmejä

Syyskuun viimeisenä perjantaina, tieteiden yön iltapäivällä, Digital Citizens, Communities, and Society kokoontui pohtimaan yhteiskuntatieteen ja tieto- ja viestintäteknologian rajamaastoa. Meillä oli kaksi vuorovaikutteista johdantoa, joita pyrin hiukan tiivistämään blogin muotoon.

Uusia menetelmämahdollisuuksia

Tuukka Ylä-Anttila puhuiaihemallinnuksesta (topic modeling) sosiologin työvälineenä, esitellen kolmea projektia: kehysanalyysiä ilmastopoliittisesta keskustelusta, poliittisten keskustelujen hakemista Suomi24-keskustelualueelta sekä MV-lehden sisällön luokittelua

Lyhyesti, aihemallinnuksessa algoritmi luokittelee sanoja sekä “dokumentteja” esiintymisien mukaan ryhmiin ohjaamattomasti. Yhteiskuntatieteilijä voi käyttää mallia keskustelunaiheiden luokitteluun, mutta suuri kysymys on, onnistuuko keskustelun tapojen kuten kehysten tai diskurssien luokittelu.

Käytimme varsin paljon aikaa pohtimalla miten aihemallinnukset tulisi validoida ja –  ainakin itse – valitin kunnon ohjekirjan puuttumista tälle osa-alueelle. Ylä-Anttila kolleegoineen ovat dokumentoineet prosessin, jossa ensin arvioidaan aihemallinnuksen sanapilviä, minkä jälkeen arvioidaan aiheissa olevien dokumenttien sisältöjä ja tarkennetaan aihetulkintaan jos se on tarpeen. Lähestymistapa kuulosti varsin toimivalta, jäänkin kuuntelemaan mitä mieltä vertaisarvioitsijat ovat siitä.

Toisaalta, myös aiheiden tulkinta herätti huolta: voivatko kyseessä olla framet, diskurssit tai mitkään muut yleisesti käyttämät teoretisoinnit sisällöstä. Tätä ei myöskään helpota, kuten Tuukka muistutti, että framestakin on useampia erilaisia merkityksiä ja tulkintoja yhteiskuntatieteessä. Itse pohdiskelin ääneen, että miksi aiheita pitäisi sanoa joksikin muuksi kuin aiheiksi, mutta Tuukka nopeasti vastasi, että tuo pohdinta liittyy siihen, mihin aiempaan tutkimustraditioon sitten itse sijoittuu. Teoreettisilla käsitteillä on pitkät juuret, jotka vaikuttavat niiden tulkintaan.

Tämä lieneekin valtavirtaistuksen suurin ongelma, jollain tavalla laskennalliset menetelmät ja niiden tulokset pitäisi saada puhumaan traditionaalisten yhteiskunnallisten menetelmien kanssa. Tällöin yhteinen terminologia esimerkiksi auttaa jo varsin paljon, helpoittaa valtavirta-yhteiskuntatieteilijän pohdintaa tulosten järkevyydestä ja merkittävyydestä.

Aiheesta lisää sekä muutama uudehko opinnnäytetyö

Algoritmit sosiaalisessa vuorovaikutuksessa

Jesse Haapoja kertoi juuri jättämästään Helsingin yliopiston jatko-opintosuunnitelmasta, algoritmeistä sosiaalipsykologian kannalta. Hänen keskeinen argumenttinsa on (tai, ehkä paremminkin, minun tulkinta hänen ajatuksestaan), että teknisillä järjestelmillä on toimijuutta mikrotasolla vuorovaikutukstilanteilla – näkökulma joka vielä toistaiseksi puuttuu isoista algoritmien vallankäytön keskustelusta. Algoritmit ja tekniset järjestelmät mahdollistavat ja rajoittavat ihmisten välistä vuorovaikutusta, Tinderin deittaussovelluksesta Pokémon Go:n algoritmin päättämiin vuorovaikutuspaikkoihin.

Jessen tavoite tutkimuksessaan on havainnoida kuinka algoritmit tulevat esille mikrotasolla ihmisten välisessä vuorovaikutuksessa sekä ajatella, miten ihmiset reagoivat algoritmien toimintaan. Eräs esimerkki on vaalikoneet, joiden algoritmit eivät vain neuvo meitä äänestämään vaan myös rakentavat poliittista identiteettiä.

Mikä on oikein ja mikä väärin?

Viimeisenä aiheena eräs pro gradu-työn tekijä Matti Autio esitteli pohdintaansa Facebookin kaupunginosa-ryhmien toiminnasta ja siellä esiintyvästä rajoittavasta sekä yhdentävästä viestittelystä. Hänen suurin kysymys oli tutkimuseettinen: saako tätä tutkimusta oikeastaan tehdä ja voiko gradussa olla lainauksia näistä ryhmistä ja saako ryhmiä edes tutkia.

Tämä herätti laajaa keskustelua DCCS-ryhmässä, tutkimuseettinen pohdinta on vielä kesken. Johtopäätöksemme taisi olla, ettei isojen ryhmien tutkimisessa ollut isompia ongelmia, mutta lainaukset olisi hyvä tarkistaa jokaiselta osallistujalta erikseen. Vaikka verkon tutkimusta onkin tehty jo useampi vuosikymmen, samat eettiset kysymykset ovat edelleen avoinna. Lopuksi päädyimme suosittelemaan vielä opiskelijaa tarkastaman Internet-tutkijoiden AOIRn eettisen toimikunnan ohjeita aiheesta.