Lukemisen datafikaatio ja uskottavuus

Yhä useampi arkipäiväinen toimintamme muutetaan erilaisten digitaalisten välineiden avulla dataksi, jota käytetään erilaisiin laskennallisiin toimiin kuten käyttäytymisemme ennakointiin ja sisältöjen personointiin. Tätä prosessia kutsutaan datafikaatioksi. Ihmiset luonnollisesti tulkitsevat tätä prosessia kuten ympäristöään ylipäätään. Tässä blogikirjoituksessa keskityn lukemisen datafikaatioon ja miten ihmiset sitä ymmärtävät.

Julkaisimme hiljattain Airi Lampisen kanssa artikkelin, jota varten haastattelin jo suljetun uutissuosittelujärjestelmä Scoopinionin käyttäjiä ja pääkehittäjää. Scoopinion oli Suomessa kehitetty uutissuosittelujärjestelmä, joka seurasi käyttäjien lukuaikaa eri uutisartikkeleissa. Se suositteli käyttäjille heitä tältä pohjalta mahdollisesti kiinnostavia artikkeleita. Scoopinionia voidaan siis pitää yhtenä esimerkkinä datafikaatiosta.

Uskottavuus ja data

Haastatteluissa nousi esiin uskottavuus: koska Scoopinion keskittyi lukuajan mittaamiseen eikä perinteisempään klikkipohjaiseen analytiikkaan, kokivat haastateltavat sen antamat suositukset luotettavammiksi. Tämä luotettavuus syntyi ajatuksesta, että lukuaika on pelkkää klikkausta parempi todiste siitä, että datan lähde on pitänyt artikkelia kiinnostavana. Lukuajan ajateltiin siis edustavan paremmin lukijan arviota artikkelista. Tämä tapa kehystää lukuaika oli toki myös se tapa, jolla järjestelmän kehittäjät pyrkivät palveluaan markkinoimaan.

Scoopinionin uskottavuus siis rakentui lukemiseen liitettyjen merkitysten varaan, joita kehittäjät käyttivät hyväkseen sekä järjestelmää rakentaessaan että sitä markkinoidessaan. Järjestelmää käyttäneet ihmiset tulkitsivat järjestelmän toimintaa lukemiseen liitettyjen merkitysten kautta. Järjestelmää tehtiin ymmärrettäväksi pohjaten näihin merkityksiin, kuten esimerkiksi siihen, että ihmiset ajattelevina olentoina arvioivat lukemaansa omien mieltymystensä mukaan ja viettävät enemmän aikaa itseään kiinnostavien tekstien parissa kuin sellaisten tekstien, jotka heitä eivät kiinnosta. Toisaalta palvelu myös toi uusia merkityksiä lukemiselle: kun palvelu seurasi lukemista, lukeminen muuttui implisiittiseksi suosittelemiseksi. Tämän seurauksena palvelu, jossa käyttäjillä ei ollut mahdollisuutta nähdä muita käyttäjiä koettiin kuitenkin tietyllä tapaa sosiaalisena.

Algoritmiset palvelut osana laajempaa merkitysjärjestelmää

Myös muissa algoritmisissa palveluissa ymmärrystä rakennetaan niitä edeltävien merkitysten varaan, samalla kuitenkin tuoden niihin jotain erilaista. Facebook-ystävät eivät ehkä tarkoita täsmälleen samaa kuin ihmiset jotka koemme ystäviksemme sen ulkopuolella, mutta palvelu käyttää kuitenkin hyväkseen ystävyyteen liitettyjä merkityksiä. Kun kyydityspalvelu Uber alkoi menestymään, rupesivat monet muut jakamistalouspalvelut markkinoimaan itseään tietyn asian “Uberina”: uusien palveluiden uskottavuutta menestyä rakennettiin Uberin menestyksen päälle. Nämä palvelut nojasivat tällä kehystämisellä Uberiin liitettyihin merkityksiin, joka puolestaan on idealtaan hyvin samankaltainen kuin sitä vanhemmat taksipalvelut. Tässä tapauksessa korostui Uberin lupaus tehdä vanha asia kustannustehokkaammin ja antaa “tavallisille” ihmisille mahdollisuus hyötyä taloudellisesti toiminnasta, joka oli aiemmin nähty pääosin tietyn ammattiryhmän toimialana.

Algoritmisia järjestelmiä sosiaalitieteellisestä näkökulmasta tutkittaessa tulisi huomioida, että usein niiden käyttämää dataa ja siihen liittyviä merkityksiä on hankalaa, ellei mahdotonta, erottaa itse algoritmeista, joita järjestelmät käyttävät. Usein data edustaa palveluissa ihmistä ja tästä datasta tehdään selkoa niiden käsitysten kautta, joita ihmisten toimintaan liitetään palvelun ulkopuolella.

Järjestelmät ovat ihmisten rakentamia ja niitä ruokitaan ihmisten toiminnalla. Ne ovat siis läpeensä sosiaalisia.

Artikkeli julkaistiin ihmisen ja tietokoneen välisen vuorovaikutuksen tutkimukseen keskittyvässä NordiChi-konferenssissa ja sitä tehtiin osana Koneen Säätiön rahoittamaa Algoritmiset järjestelmät, valta ja vuorovaikutus -hanketta.

Artikkelin tiedot:
Haapoja, J., & Lampinen, A. (2018). ‘Datafied’ Reading: Framing behavioral data and algorithmic news recommendations. In NordiCHI 2018: Revisiting the Life Cycle – Proceedings of the 10th Nordic Conference on Human-Computer Interaction (pp. 125-136). DOI: 10.1145/3240167.3240194

Botteja, algoritmeja ja kokemuksen väärentämistä

 

Tällä viikolla Etelä-Saimaa julkaisi Juho Maijalan kirjoittaman jutun, jossa kerrottiin kansanedustaja Jani Mäkelän (ps.) mielipidekirjoituksiin kohdistuneesta bottiklikkausliikenteestä. Klikkiliikenteen seurauksena kyseiset kirjoitukset olivat nousseet lehden luetuimpien listalla kärkeen. Tapaus on rakenteeltaan mielenkiintoinen. Joku tai jotkut tahot ovat käyttäneet botteja vaikuttaakseen algoritmiin vaikuttaakseen juttujen asemaan verkkosivulla, minkä mitä luultavimmin toivotaan vaikuttavan lukijoiden toimintaan ja ajatuksiin. Tapaus siis suorastaan huokuu nykyaikaa ja näyttää osuvasti, kuinka algoritmeja voidaan valjastaa palvelemaan tarkoitusperiä, joita niiden kehittäjät eivät ole toivoneet.

Erving Goffman puhuu teoksessaan Frame analysis (1986) kokemuksen väärentämisestä (käyttäen termiä fabrication englanniksi). Etelä-Saimaan jutussa puhutaan näkyvyyden lisääntymisestä yhtenä seurauksena manipulaatiosta; itse lisäisin joukkoon myös kokemuksen muokkaamisen. Korkea asema luetuimpien listalla viestii myös jutun asemasta suosittuna muiden ihmisten keskuudessa, eli siihen liittyy sosiaalista informaatiota. Tässä tapauksessa kokemuksen väärentäminen kohdistuu juuri tähän. Kehys, jossa informaatiota tulkitaan perustuu oletukseen, että muut ihmiset ovat omalla toiminnallaan nostaneet tietyn tekstin luetuimpien listalla kärkipaikoille. Ihmiset käyttävät usein muiden toimintaa tiedonlähteenä oman toimintansa suhteen ja se voi osaltaan vaikuttaa myös sisällön arviointiin (e.g. Salganik, Dodds, & Watts, 2006; Knobloch-Westerwick, Sharma, Hansen, & Alter, 2005). Paljon luettu artikkeli voidaan tulkita sisällöltään ja näkökulmaltaan validiksi ja suosionsa perusteella tärkeäksi. Algoritmi toimi tilanteessa niin kuin se oli rakennettu: sen kannalta jokainen klikkaus oli yhtä aito kuin mikä tahansa muu. Se mikä tälle algoritmille on relevanttia dataa on ihmisen valinta. Klikkauksen ajatellaan symboloivan kiinnostusta tai muuta mahdollisesti positiivista suhtautumista tiettyyn kirjoitukseen. Tässä tapauksessa paljastui, että jos klikkausmäärä on se, minkä ajatellaan olevan objektiivinen mittari, niin klikkaus ei itsessään aina tarkoita ihmisen klikkausta ja intentio klikkauksen takana ei aina ole selvä.

Etelä-Saimaa paljastaessaan epäilyttävän verkkoliikenteen purki, Goffmanin termejä käyttäen, kehyksen joka oli botteja käyttäen rakennettu Jani Mäkelän mielipidekirjoitusten ympärille. Koko tapaus on osuva kuvaamaan, kuinka haavoittuvainen jopa hyvin yksinkertaisten mittareiden perusteella rakennettu kokemus voi olla, miten algoritmeja on mahdollista manipuloida omien intressien edistämiseksi, ja toisaalta kuinka fabrikoituja kehyksiä on mahdollista purkaa.

Kirjallisuutta:

Goffman, E. (1986). Frame analysis: An essay on the organization of experience. Harvard University Press.

Knobloch-Westerwick, S., Sharma, N., Hansen, D. L., & Alter, S. (2005). Impact of popularity indications on readers’ selective exposure to online news. Journal of Broadcasting & Electronic Media, 49(3), 296–313.

Salganik, M. J., Dodds, P. S., & Watts, D. J. (2006). Experimental study of inequality and unpredictability in an artificial cultural market. Science, 311(5762), 854–856.

Algoritmitutkimuksesta yleisemmin:

Gillespie, T. (2012). The relevance of algorithms. Media Technologies: Essays on Communication, Materiality, and Society, (Light 1999), 167–194. http://doi.org/10.7551/mitpress/9780262525374.003.0009

Kitchin, R. (2016). Thinking critically about and researching algorithms. Information, Communication & Society, 1-16.