Interventions in Surveillance Capitalism With Personal Data Spaces

This is a cross-post from Blink, the Surveillance & Society blog.

Image: Wikimedia Commons

A rather uniform logic seems to be at work behind the scenes of the digital economy: value creation is based on extracting data about users, turning data into behavioral predictions, and monetizing them through markets users cannot participate in. This logic, called “surveillance capitalism” by Shoshana Zuboff, seems to have become institutionalized as the default mode of operation in the tech industry. To highlight how the flexibility of the market economy made surveillance capitalism possible, Zuboff quotes Thomas Piketty’s Capital in the Twenty-first Century:

“This will continue to be true in the future, no doubt more than ever: new forms of organization and ownership remain to be invented.”

Even if surveillance capitalism is the default, the Piketty quote also indicates that new market forms will continue to be experimented in the margins of the digital economy. Discontentment with how it now works has prompted initiatives from activists and technology developers, promising to empower users to take control of their data. The MyData Global Network is an example of a movement organizing around this idea, and “personal data spaces,” or PDSs, are concrete technologies being developed towards this end.

In practical terms, PDSs are intermediaries that operate between their users and third parties. They offer data storage services coupled with interfaces to manage data flows, and possibilities to run code. With the data portability rulings under the new EU general data protection regulation, the regulatory environment in the EU is taking steps in a direction that favors PDSs. We will likely see more efforts towards development of PDSs in the near future, and therefore it makes sense to ask: what is the intervention that PDSs aim at?

In my recent article in Surveillance & Society, “Personal Data Spaces: An Intervention in Surveillance Capitalism,” I look more closely at three PDSs to analyze their imaginaries of how the digital economy should work. The three exemplars are a “personal cloud server” called Cozy Cloud, a “digital life management” service called Meeco, and a “personal data store” called OpenPDS.

In the imaginaries of PDSs, users reap more of the benefits from data collection and use for themselves. PDSs offer users different entry points in the value creation process: starting from gathering data, into intermediating data between third parties, controlling analytics, and creating and sharing abstract information, such as intentions. Users are to become active subjects in value creation, instead of passive objects of data extraction. Users are envisioned as market participants who selectively redirect and share more, and more nuanced, data based on benefits received.
In this way, the aim of PDSs is to increase the quality and specificity of data that businesses can employ. While they do attempt to intervene in surveillance capitalism, they do not deny or counter its value creation: instead, they offer users access into the existing value creation processes.

For themselves, PDS envision a position of a platform provider that facilitates data exchanges, relying on market mechanisms to ensure that third parties develop beneficial services for users to choose from, once the technology to control data flows is in place.

––

Lehtiniemi, T. (2017). Personal Data Spaces: An Intervention in Surveillance Capitalism? Surveillance & Society, 15(5), 626–639. You can read the article here.

Kuplista ja niiden ehkäisemisestä

Teksti perustuu minun, Salla-Maaria Laaksosen ja Bryan Semaanin artikkelikäsikirjoitukseen. Koska akateeminen julkaisu on hidasta, päätin kirjoittaa  tiivistetyn version jo nyt blogimuodossa – onhan tuloksia jo esitelty Rajapinta-meetupeissa. Huomautettakoon, että tekstin näkökulma voi olla monelle yhteiskuntatieteitä edustavalle rajapintalaiselle hiukan outo, koska artikkelin pääyleisönä on käyttöliittymätutkijat.

Kuplien ja polarisaation tutkimiselle on pitkät perinteet myös verkkotutkmuksessa. Vuoden 2004 Yhdysvaltojen vaaleja tutkineet Adamic & Glance (2005) havaitsivat, että demokraattiblogaajat linkkaavat enemmän demokraattilähteisiin ja vastaavasti republikaaniblogaajat republikaanilähteisiin. Vastaavia tuloksia on saatu myös esimerkiksi Gilbertin yms. (2009), Jacobsonin ym. (2016) sekä Merazin (2015) tutkimuksissa.

Myös käyttöliittymätutkijat ovat lukeneet samoja artikkeleita ja alkaneet pohtia, kuinka polarisaatiota voisi teknologiaa kehittämällä vähentää. Tutkimusta on tehty varsin runsaasti. Esimerkiksi Park et al. (2009) ja Munson et al. (2009, 2010, 2013) ovat pyrkineet vaihtamaan uutisten suosittelun tukemaan erilaisten näkökulmien esittelyä. Suosittelu voi myös tapahtua suosittelemalla ihmisille muita ihmisiä joiden näkökulmat ovat aiheeseen voisivat olla erilaisia (esimerkiksi Garimella, 2016, 2017). Artikkelissamme kutsumme tätä vallitsevaksi lähestymistavaksi jonka haluamme haastaa (englanniksi common design agenda).

Empiirinen esimerkki: toimisiko vallitseva lähestymistapa?

Tutkimme Suomessa melko tuoretta, selvästi polarisoitunutta ilmiötä: maahanmuuttokeskustelua. Käytämme aineistona viittä maahanmuuttoa kannattavaa ja viittä maahanmuuttoa vastustavaa Facebook-yhteisöä ja niissä tapahtuvaa linkkien jakoa. Ilmiön kuvaamiseksi teimme verkostoanalyysin, jossa sivuston ja ryhmän vällle syntyy yhteys aina, kun kyseisessä ryhmässä on jaettu jokin kyseisen sivuston alla oleva linkki. Kuten verkostokuvastä näkee, aiemman tutkimuksen havaitsema polarisaatioilmiö on havaittavissa tässäkin keskustelussa: ryhmille yhteisiä sivustoja on vain kourallinen eli ryhmien keskelle jäävät verkoston solmut. Valtaosa jaetuista sivustoista on kullekin ryhmälle erillisiä.

network2
Linkit maahanmuuttoa vastustavissa (A1-5) ja kannattavissa (P1-5) ryhmissä. Aineisto on analyysissa täysin anonymisoitu, eli yksittäisiä käyttäjiä ei voi tunnistaa.

Jos seuraisimme aiemman tutkimuksen johtopäätöksiä, kuvaaja voisi johtaa ajatukseen, että ryhmille voisi tehdä hyvää välillä lukea samoja lähteitä ja ehkä löytää yhteistä maaperää tätä kautta. Aineistossa havaittiin, että noin kaksi prosenttia linkeistä ovat täysin samoja sekä kannattavissa että vastustavissa ryhmissä, eli näiden linkkien sivustot ovat mahdollisia yhteisen maaperän löytymiselle.

Päätimme kuitenkin tarkastella hiukan syvemmälle ja analysoida, mitä näiden yhteisten linkkien alla tapahtuu. Linkken alla olevien Facebook-kommenttien analyysi osoittaa, että yhteistä maaperää ei löytynyt. Linkkien alla varsin usein dissattiin hyvinkin julmasti sitä “toista puolta” – niin maahanmuuttoa vastustavissa kuin sitä kannattavissa ryhmissä. Keskustelu oli hyvin etäällä yrityksistä ymmärtää toisten näkökulmia.

Tulos ei välttämättä ole yllättävä ja uusin poliittinen psykologia (esim. Washburn, painossa) kuvaa, kuinka jopa tilastojen lukeminen värittyy lukijan ennakkokäsityksien kautta. Tästä huolimatta  ajatus yhteisen maaperän luominen esimerkiksi jaettujen linkkien avulla on keskeinen oletus vallitsevassa lähestymistavasssa.

Mitä sitten?

Analyysimme perusteella on selvää, että esitetty yksinkertainen eri uutislähteiden suosittelu sellaisenaan ei riitä. Käyttöliittymätutkimuksessa on palattava työpöydän ääreen ja mietittävä, missä määrin teknologialla voidaan välttää yhteiskunnan polarisaatiota ja mitä vaikutuksia sillä lopulta voi olla. Tämä on selkeästi kutsu rajapintaiselle teknologian ja yhteiskuntatieteen välissä olevalle tutkimukselle jossa voitaisiin huomioida niin teknologian syvällinen ymmärtäminen ja jopa teknologiakonstruktiivinen tutkimusote kuin myös yhteiskuntatieteen kautta ymmärrys ihmisen monimutkaisuudesta.

Käyttöliittymäsuunnittelu voisi lähteä rohkeasti kokeilemaan erilaisia lähestymistapoja pelkän mediadieetin laajentamiseen asemesta. Alla on kolme esimerkkiä siitä mitä voitaisiin esimerkiksi tehdä. Ensimmäisessä koetetaan rakentaa suosittelua heikkojen yhteyksien kautta. Toisessa pyritään tuomaan uutisesta jo käytävää keskustelua ja sitä kautta eri näkemyksiä enemmän esille. Kolmannessa tarjotaan uutisten jakajille vihjettä, että samaan aiheeseen on esitetty monta näkökulmaa.

Nämäkään lähestymistavat eivät välttämättä toimi. Pahimmillaan ne voivat vain aiheuttaa enemmän antisosiaalista toimintaa ja pahaa mieltä. Siitä huolimatta olisi tärkeää, että design-vetoinen käyttöliittymätutkimus tutkisi myös vallitsevaa lähestymistapaa haastavia ratkaisuja pohtisi mitä kaikkea voitaisiin tehdä tämän yhteiskunnallisen ongelman ratkaisemiseksi.

 

Slämärit ja superkäyttäjät: ihmeellinen Internet tutkijan työpöydällä

 

https://www.flickr.com/photos/meddygarnet/8346190491/
(cc) Morgan @Flickr

Smarter Social Media Analytics -tutkimushankkeessa sovellamme ja kehitämme erilaisia koneoppimiseen pohjautuvia menetelmiä sosiaalisen median tekstisisältöjen analysointiin. Fiksumpi  analyysi kuitenkin vaatii algoritmien rinnalle ihmisilmää – vähintäänkin kehitysvaiheessa.

Olen lukenut eilen ja tänään  SSMA-hankkeemme aineistosta läpi parintuhannen viestin otoksen, jossa viestit koskevat kasvissyöntiä tavalla tai toisella. Otos liittyy koko aineistosta tehtyyn aihemallinnukseen, jossa noin puolen miljoonan viestin massasta on ohjaamattoman koneoppimisen avulla erotettu erilaisia topiikkeja tai teemoja. Mallinnuksen syötteenä skripti antaa kasan perusmuotoistettuja sanalistoja, jotka kuvaavat näitä erilaisia aiheita. Lopulta kuitenkin ainoa tapa varmistaa, että tehty analyysi toimii kuten pitää, on ihmisvoimin tarkistaa mistä topiikeissa oikeastaan on kysymys. Tämä tapahtuu esimerkkiviestejä tarkistamalla.

Tarkistuskeikka on pieni matka yhä vain ihmeelliseen Internetiin. Sosiaalisen median tutkimuksen parasta antia ovat usein juuri näkymät vuorovaikutuksen maailmoihin, joita ihmiset verkossa elävät ja tuottavat mikrotasolla. Tässä kaksi hienoa esimerkkiä kasvisruokakeskusteluista.

**

Viestejä läpikäydessä olen kohdannut kymmeniä erilaisia virtuaalislämäreitä. Omassa nuoruudessani slämäri oli vihko, jossa jokaisella sivulla oli eri kysymys ja vastaukset kirjattiin tietyllä symbolilla tai anonyymisti. Nykypäivän slämäri on keskustelupalstalla kiertävä lista numeroituja kysymyksiä, johon kukin kirjoittaja vastaa, tai lista [ ] väittämiä, joista [x] rastitaan kirjoittajaan sopivat kohdat. Arvioin kirjoittajien olevan enimmäkseen melko nuoria.

Tällaiset memeettiset sisällöt ovat toistuvia, mutta kuitenkin niin monipuolisia tekstimuotoja, ettei sanojen yhdessä esiintymisen perusteella aiheita luokitteleva algoritmi osaa niitä niputtaa. Virtuaalislämäreissä kuitenkin kiertää kasvisyöntiä koskevia kysymyksiä, joiden vuoksi kaikki nuo tuhannet viestit näkyvät jokaisessa kasvissyönti-sanalla tehdyssä haussa tai tietyllä sanalla piirretyissä trendikuvaajissa. Toki ne osaltaan trendistä kertovatkin; kasvissyönti puhututtaa.

Toinen ihmettelyn aihe oli aihemallinnuksessa erästä topiikkia kuvaava sana, joka ei ollut mikään suomen kielen tunnistettava sana. Pienen selvittelyn jälkeen paljastui, että kyseessä on yksi Suomi24-foorumin superaktiivinen käyttäjä, joka kirjoittaa palstalle joka päivä keskimäärin kolmetoista viestiä päivässä.

Viestimäärä on ilmeisen tarpeeksi, että saa aikaan oman aiheen aihemallinnuksessa, kun muut käyttäjät mainitsevat kyseisen nimimerkin tarpeeksi usein. Selvästi siis onnistunut keskustelunherättäjä ja oman mikroyleisönsä julkkis, jonka viesteillä voi olla suurikin vaikutus keskustelujen aihepiiriin.

**

Molemmat esimerkit ovat sellaisia, joita on hankala automaattisesti tekstin seasta erottaa ilman laadullista tarkastelua, tai vähintäänkin sen tekeminen vaatisi melkoisia tapauskohtaisia virityksiä koodiin. Viritykset taas ovat varsinkin tuotantokäytössä aika hankalia ja toisaalta tekevät analyysista prosessin, jonka toimintaperiaatteita on vaikea ymmärtää ja tuloksia tulkita.

Silti ne ovat aika oleellisia mikrotason havaintoja siitä dynamiikasta, jolla vuorovaikutus verkossa muodostuu.

Kohti fiksumpaa keskustelujen mallinnusta siis pyritään, mutta todellisuus on aina vaan analytiikkaa ihmeellisempää. Se on jotenkin lohdullista.

Kestävämpiä digitalisia ratkaisuja verkostoitumiseen ja yhteistyökumppanien valintaan?

Rajapinta.co:n kuukausitapaaminen Tampereella 29.9. vahvisti heikkoja siteitä paikallisiin tutkijoihin. Poimintana tapaamisesta, seuraavassa tiivistelmä järjestäjien tutkimusagendasta, joka paitsi sijoittuu teknologian ja yhteiskunnan rajapintaan myös demonstroi usean tieteenalan mielenkiintoista yhteistyötä. Agenda liittyy Thomas Olssonin (ihminen-teknologia vuorovaikutus), Jukka Huhtamäen (verkostoanalytiikka ja datatiede) ja Hannu Kärkkäisen (tietotyö ja arvonluonti) COBWEB-akatemiahankkeeseen sekä Big Match Tekes-hankkeeseen.

Ihmisten välistä sosiaalista sovittamista (engl. social matching tai matchmaking) tapahtuu työelämässä mm. rekrytointiprosesseissa, tiimien muodostamisessa ja verkostoitumisessa. Sopivan henkilön, yhteistyökumppanin tai tiimin tunnistaminen ja valinta vievät paljon aikaa ja intuitiiviset “mätsäämisen” käytännöt ovat alttiita inhimillisille vinoumille. Esim. verkostointitapahtumissa on yleistä, että samankaltaiset ihmiset vetävät puoleensa toisiaan; tällainen homofilia on kuitenkin tietotyön tuottavuudelle vahingollista. Uskomme, että rohkaisemalla ihmisiä kohtaamaan erilaisista taustoista tulevia, eri yhteisöjen jäseniä voidaan edistää tietotyössä olennaista ideoiden ristiinpölyttymistä ja moninäkökulmaista, verkottunutta arvonluontia.

Tavoitteenamme on suunnitella ja toteuttaa sosiaaliseen massadataan, verkostoanalytiikkaan ja koneoppimiseen perustuvaa tietoteknologiaa, joka mahdollistaa digitaalisia tapoja sovittaa, ryhmäyttää ja törmäyttää ihmisiä työelämässä. “Työelämän Tinder” on mainio vertauskuva, mutta parinvalinnan periaatteet ovat työelämässä aivan erilaiset kuin yksityiselämässä. Tutkimuksemme peruslähtökohta on, että datapohjaisilla tavoilla voidaan tunnistaa otollisia, toisiaan sopivasti täydentäviä osaajakombinaatioita ja siten tuottaa positiivista sosiaalista serendipiteettiä. Tavoite voisi konkretisoitua esim. diversiteettiä lisäävinä henkilösuosittelujärjestelminä (diversity-enhancing people recommender systems) tai uudenlaisina yhteistyökumppaneiden haku- tai selausjärjestelminä.

Sosiaalinen massadata eli “Big Social Data” (esim. sosiaalisen median sisällöt ja profiilit, portfoliot, verkostot) voivat rikastaa palvelujen kautta syntyvää kuvaa kustakin käyttäjästä. Nykyiset profiilit esim. työnhaussa ovat yleensä käyttäjän itse laatimia ja siksi kovin staattisia ja sisällöltään rajoittuneita. Esim. twiitit voivat kertoa paljon henkilön tämän hetken kiinnostuksen kohteista ja tulevaisuuden visioista, kun taas esim. verkossa olevat ammatilliset julkaisut ja esitykset voivat kertoa henkilön yksityiskohtaisesta osaamisesta. Tunnistamalla relevantteja yhteisiä teemoja ja komplementaarisia osaamisia esim. tapahtuman osallistujien välillä voidaan automaattisesti tunnistaa potentiaalisia pareja, joiden kannattaisi keskustella lisää. Sosiaalisten verkostojen analyysillä voidaan paitsi arvioida henkilöiden keskinäistä suhdetta ja verkoston kokonaisrakennetta myös tunnistaa yhteisiä kontakteja ja ns. heikkoja siteitä (weak ties).

Tarkoituksenamme on lisäksi tarjota positiivinen skenaario sosiaalisen median datan käytölle ja digitalisaatiolle yleensä. Ehkäpä tällaisten kaikkia hyödyttävien palvelujen kehittäminen hälventää ihmisten yksityisyydensuojan menettämisen pelkoa sekä motivoi yrityksiä avaamaan data-aineistojaan laajemmin hyödynnettäviksi?

Uusien palveluiden ideointi ja utopististen tulevaisuuskuvien maalailu on kuitenkin huomattavasti helpompaa kuin niiden toteuttaminen. Data-keskeisiä haasteita ovat mm. sopivan datan saatavuus eri palvelujen ja palveluntarjoajien siiloista, datan keräämisen ja analysoinnin yksityisyyteen liittyvät ja muut eettiset haasteet sekä massadatan kehittymättömät analyysi- ja visualisointimenetelmät. Sovittamisen sosiaalipsykologiset haasteet ovat jopa vielä monimutkaisempia: “sopivan” henkilön tai organisaation tunnistaminen vaatii ymmärrystä mm. sovitettavien tahojen mahdollisista yhteistyötarpeista, ja jokaisella sovittamistilanteella on uniikki tavoite ja erityispiirteitä, jotka pitäisi ottaa huomioon järjestelmän päätöksenteossa. Digitaalisten sisältöjen suosittelujärjestelmistä tuttuja menetelmiä (esim. social filtering) ei siis voida suoraan hyödyntää.

Kokonaisuuteen vaikuttavat myös käyttäjäkokemukselliset erityispiirteet: miten saada käyttäjä luottamaan teknologian tekemiin päätelmiin ja suosituksiin henkilöistä? Miten saada ihmiset delegoimaan osan päätäntävallastaan ja toimijuudestaan teknologialle, varsinkin näin perustavanlaatuisen inhimillisellä sovellusalueella? Miten sinä kokisit sen, että kännykkäsi yhtäkkiä piippaa kertoakseen, että joku tuntematon, mutta algoritmin mielestä todella relevantti tyyppi on tulossa samaan tapahtumaan ja että teidän kannattaisi tavata?

Keskustelukuplia ja kaikukammioita – missä on demokratian dialogi verkossa?

AmitBorade_17841847105_778599506a_z
(cc) Amit Borade @Flickr

Blogikirjoitus on rinnakkaispostaus Oikeusministeriön #suomi100-blogista.

Yhteiskunnallisen verkkokeskustelun kuplautuminen on ollut vahvasti huolenaiheena julkisessa keskustelussa. Onko teknologia, jonka piti mahdollistaa kaikkien kansalaisten osallistuminen yhteiskunnalliseen keskusteluun, sittenkin sulkenut meidät kaikukammioihin huutelemaan samanmielisten kanssa?

Kuplakeskustelun avasi Eli Pariser (2011) kirjallaan Filter Bubbles, jossa hän osoitti, kuinka eri puolueita kannattavat käyttäjät saavat hakukoneesta samalla hakusanalla aivan erilaisia tuloksia. Samaa ilmiötä on kauhisteltu muun muassa Facebookin kohdalla. Yleisradion toimittaja loi muukalaisvihamielisen feikkiprofiilin Facebookiin ja osoitti, miten muutamassa kuukaudessa käyttäjä sulkeutui vihakuplaan.

Kuplautumisen taustalla on teknologiajättien bisneslogiikka, jossa pyrkimyksenä on maksimoida käyttäjän palveluissa viettämä aika. Uutisvirta ei harjoita journalistista harkintaa, vaan oppii aiemmasta käyttäytymisestä. Facebookissa on tuhansia eri attribuutteja määrittämässä uutisvirtaamme sisältöä – mitä valtaosa käyttäjistä ei edes tiedosta. Sen sijaan he kehittävät luovasti erilaisia sosiaalisia perusteluja sisältöjen piiloutumiselle.

Kuplissa ei kuitenkaan ole kysymys ainoastaan teknologiasta. Sosiaalipsykologia on pitkään tarkastellut sosiaalisen identiteetin muodostumista ja ryhmien merkitystä. Ryhmässä mielipiteet yhtenäistyvät ja ryhmä alkaa suosia omaa ryhmäänsä toisten ryhmien kustannuksella. Lisäksi meillä on vahva taipumus tykästyä ärsykkeisiin, joille altistumme toistuvasti. Kun luemme samaa sisältöä uudelleen ja uudelleen, se alkaa tuntua normaalilta ja hyväksyttävältä.

Kuplautuminen on siis luonnollista, mutta on selvää, että viestintäteknologialla on sitä tukevia ominaisuuksia. Sosiaalinen media mahdollistaa sen, että samalla tavalla ajattelevat ihmiset voivat päätyä kaikukammioihinsa jakamaan virheellisiä väitteitä keskenään myös omaa lähituttavien piiriä laajemmalle.

Kuplasta ulos pääseminen vaatii työtä. Informaatiotulvan keskellä on mahdollista etsiä kattavasti eri mielipiteitä ja vertailla niitä. Käytännössä ihmiset eivät kuitenkaan tee niin, vaan tyytyvät ensimmäisiin tarjokkaisiin. Edelmanin luottamustutkimuksen mukaan hakukoneiden puolueettomuuteen luotetaan enemmän kuin uutismediaan.

Kuplilla pelotteluun liittyy kuitenkin riski siitä, että kaikki verkossa käytävä keskustelu latistetaan kuplissa tapahtuvaksi arvottomaksi huuteluksi, johon teknologia meidät ajaa. Verkkokeskusteluissa käydään myös asiallista poliittista keskustelua ja nostetaan esille kansalaisten huolia. Kuplat tai algoritmit eivät tee niistä vähemmän todellisia. Teknologia ei ole irrallinen yhteiskunnasta eikä mullista sitä kertaheitolla, vaikka vastuuta halutaan mielellään sälyttää teknologialle.

Algoritmeilla ja teknologialla pelottelun sijaan meidän tulisi paremmin ymmärtää niiden hybridi luonne: algoritmit ovat tasan yhtä hyviä kuin mekin. Ihmisten toimintatavat ja virhekäsitykset siirtyvät niihin ohjelmoinnin tai koneoppimisen kautta. Hakukone ja uutisvirrat suoltavat sisältöä, josta ne arvelevat etsijän pitävän aiemman verkkokäyttäytymisen perusteella. Teknologia tuottaa kaikukammioita, koska ihmiset ovat sosiaalisessa toiminnassa mieluiten oman viiteryhmänsä kanssa. Tekoälybotti oppii päivässä rasistiseksi vihapuhujaksi muita Twitter-käyttäjiä seuraamalla. Työnhakualgoritmi syrjii tummaihoisia, koska se oppii käyttäytymismallin aiemmasta aineistosta.

Kupla- ja algoritmikauhistelun sijasta tarvitsemme paitsi sosiaalipsykologista ymmärrystä omasta toiminnastamme, myös algoritmilukutaitoa: ymmärrystä siitä, miten julkisuus rakentuu sosiaalis-teknologisena järjestelmänä, ja miten voimme itse siihen vaikuttaa. Kriittisyys sisältöjä ja lähteitä kohtaan on tärkeää. Tieto kannattaa aina varmistaa monesta eri lähteestä, eikä hakukonekaan ole puolueeton. Omia ennakkoluulojaan voi haastaa etsiytymällä tarkoituksella toisen sosiaalisen ryhmän keskusteluihin. Siihen teknologia tarjoaa parempia mahdollisuuksia kuin paperimedia.

_________________________________________________

Salla-Maaria Laaksonen (VTT) on viestinnän ja teknologian tutkija Viestinnän Tutkimuskeskus CRC:ssa ja Kuluttajatutkimuskeskuksella. Laaksonen on tutkinut muun muassa yritysmainetta, digitaalista vaalijulkisuutta ja organisoitumista verkossa.

Lue lisää:
•    Tristan Harris: How a handful of tech companies control billions of minds every day  
•    TechCrunch: Ultimate Guide to the News Feed
•    Edelman 2017 Trust Barometer

Varovaisuutta aihemallinnuksen kanssa

Eräs laskennallisten menetelmien tällä hetkellä suosituin sovellus on aihemallinnus eli topic modeling. Se mahdollistaa laajojen tekstiaineistojen jakamisen ryhmiin ja tällä tavalla “kaukoluvun” aineistosta. Tietenkään sen ei koskaan ole tarkoitus korvata aineiston lähilukua (esim. Grimmer & Stewart, 2013), mihin voi käyttää vaikka etnograafisia menetelmiä.

Eräs valinta aihemallinnuksesta on aiheiden määrän, eli tutummin, k:n valinta. Kirjallisuudessa usein esiintynyt tapa tähän on katsoa muutama eri arvo ja valita näistä selkeiten tulkittavissa oleva. Kritisoin tapaa jo marraskuun Rajapinta-meetupissa. Yksinkertainen koeasetelma näytti kuinka ihmisten mielipide selkeydestä vaihtelee merkittävästi.

Aihemallinnus: tuloksia eri k:n arvoilla
Alustava luokitus aineiston sisällöstä eri aihemallinnuksilla. Katso vain kuva.

Kuvassa näemme kuinka niiden tulkinnat myös tuottavat hiukan erilaisia näkemyksiä aineistoista. (Varoitus: nämä ovat vielä alustavia nimiä, eli en ole vielä itse täysin tyytyväinen näihin.) Olen pyrkinyt ryhmittelemään aineiston niin, että samanteemaiset aiheet olisivat samalla rivillä.

Kuvasta nähdään esimerkiksi kuinka aiheiden määrän lisääntyminen kahteenkymmeneen aiheeseen selkeästi tuo jotain uusia ajatuksia aineistoon, erityisesti alueelisuuden ja globalisaation. Toisaalta aiheena esimerkiksi suomalaisuus on osassa malleissa mukana ja osassa ei, mikä luultavasti kuvaa aihemallinnusprosessissa olevaa satunnaisuutta. Toisaalta 26 ja 30 aiheen mallit tuovat esille taloudellisuuden, perusturvan sekä edustuksellisuuden aiheita.

Aihemallinnuksen soveltajille uutiset ovat valitettavia: en itse pitäisi sopivana ajaa aihemallinnusta teoreettisesti mielekkäällä lukumäärällä tai tutkimalla muutamaa eri aihemäärää. Riskit vääristä tulkinnoista ovat ilmeiset näissä tapauksissa. Sen sijaan pitäisin itse toivottavana aihemäärän valitsemista laskennallisin kriteerein, kuten log-likelihood arvoja käyttämällä. Vaikka näistäkin käydään ritstiriitaista keskustelua, tämä silti vähentäisi tiettyä epävarmutta mikä nykyiseen käytäntöön tulee.

Erityiskiitos Koneen Säätiölle tutkimuksen tukemisesta sekä Tieteen tietotekniikan keskus CSClle laskenta-ajasta.

Kuinka normatiivisia teorioita voisi hyödyntää käyttöliittymätutkimuksessa?

Slide27Tieteen ja teknologian tutkimuksessa on jo pitkään ymmärretty, että tekniset välineet sisältävät myös arvoja (esim. Nissenbaum, 2005)⁠. Jokainen järjestelmä on eräs valinta useista eri vaihtoehdoista ja mahdollisuuksista järjestelmän suunnittelussa (esimerkiksi Liste & Sørensen, 2015)⁠. Käyttöliittymätutkimuksessa onkin nostettu esille arvojen rooli osana suunnitteluprosessia. Esimerkiksi arvotietoiset suunnitteluprosessit (value sensitive design) perustuvat arvojen parempaan esilletuontiin suunnittelutyön aikana sekä ratkaisemaan mahdollisia arvoristiriitoja. Arvoja voisi kuitenkin käyttää laajemminkin käyttöliittymätutkimusessa – ne tarjoavat mahdollisuuden integroida teoriaa ja empiiristä tutkimusta. “Uuden” teknologian tutkimus kaipaakin tarkempaa teoriaotetta – jopa 70% yhteiskuntatieteellisestä tutkimuksesta oli teoriatonta (Borah, 2015)⁠; samanlaista vertailua ei ole toistaiseksi tehty käyttöliittymätutkimusyhteisöissä, mutta uskon, ettei tulos olisi merkittävästi parempi. Jotta tutkimus siirtyisi pois kuvailevata ja uusimman teknologian perässä juoksevasta tutkimuksesta keskeisempiin kysymyksiin, olisi mielestäni aika ryhdistäytyä ja pohtia teorian roolia osana tutkimustyötä.

Mutta, mikä oikeastaan on teoria? Yhteiskuntatietelijänä huomasin aikaa sitten, että teoria voi olla monelaisessa muodossa. Ennustavat ja selittävät teoriat pyrkivät kuvaamaan yhteyksiä, kun taas kuvailevat teoriat auttavat käsitteellistäään (ja usein jargonisoimaan) ilmiötä. Normatiiviset teoriat taas keskittyvät pohtimaan, että miten asioiden pitäisi olla. Ennustaville, selittäville ja kuvaileville teorioille on paljon ohjeita, mutta normatiiviset teoriat ovat – ainakin minulle – vielä piikki lihassa. Miten normatiivisia teorioita voisi esimerkiksi validoida? Kuitenkin, pidän normatiivisista teorioista koska niissä tuodaan selkeästi esille tutkijan subjektiivinen asema. Tutkija kun ei ole neutraali toimija vaan tutkijan asenne ja näkemykset vaikuttavat niin tutkimuskysymyksen valitaan kuin aina välillä myös tuloksiin. Normatiivissa teorioissa arvot on jo sisällytetty teoriaan itseensä.

Ratkaisuna normatiiviseen teoriaan pohjautuva tutkimus

Sovelsimme Harmasilaista maailmankuvaa julkisesta tilasta ymmärtääksemme tietokoneavusteista viestintää luokkahuoneessa. Havaitsimme, että tietokonevälitteinen viestintännässä on useampia osallistuja verrattuna kasvoikkain tapahtuvaan ryhmäkeskusteluun. Habermasilaista maailmankuvaa noudatellen, osallisuuden lisäksi myös toisten ihmisten arvostaminen sekä rationaalinen keskustelu ovat tärkeitä. Muiden osallistujien arvostamisessa emme havainneet merkittävää eroa muotojen välillä, mutta rationaalisen keskustelun osalta kasvokkain tapahtuva keskustelu oli parempaa. Työn mielenkiintoinen paino ei kuitenkaan ole täysin tässä teoriassa, vaan laajempi pohdinta kietoutuu normatiivisen teorian hyötyjen ympärille.

Normatiivisen teorian ensimmäinen hyöty tulee siitä, että se on teoria. Kuten muihinkin teorioihin, siihen liittyy monia menetelmällisiä ja empiirisiä havaintoja. Esimerkiksi deliberatiivisen teorian kautta käytössämme oli useita validoituja mittareita arvioidaksemme osallistumisen habermasilaisuutta. Lisäksi julkisen tilan käsitteestä on kirjoitettu jopa tietojenkäsittelytieteessä ja tätä kautta tutkimukselle syntyi ympäristö, johon se pystyi sitoutumaan. Tutkimus samassa tilassa olevien henkilöiden tietokonevälitteisestä viestinnästä on ollut varsin hajanaista ja aiheiltaan jopa poppivaa. Normatiivisen teorian kautta sille muodostui kuitenkin mielekäs ympäristö; hajanaisen tutkimuksen sai kursittua kasaan.

Käyttöliittymätutkimus ei ole vain empiiristä, vaan myös konstruktiivistä – vaihtoehtoisia tietokonelaitteita ja ohjelmia luovia. Normatiivisen teorian toinen hyöty onkin nimenomaan konstruktiiviselle tutkimuselle. Konstruktiivisessa tutkimuksessa isoimpia haasteita on perustella tehtyjä valintoja – mitä on aina useita. Miten tietynlainen käyttöliittymäongelma voitaisiin ratkaista mielekkäästi? Normatiivinen teoria auttaa rajaamaan kaikista mahdollisista suunnitteluvaihtoehdoista merkittävimmät teorian kannalta. Samaan aikaan se voi tukea löytämään uusia inspiraation lähteitä, kun muiden alan tutkijoiden työt voivat puhutella työtäsi selvästi – jopa siinä tilanteessa, että heidän sovelluskohde teorialle saattoi olla etäinen.

Tosin, normatiivinen teoria pakottaa myös tuomaan esille arvot jotka on koodattu kaikkiin teknisiin järjestelmiin. Perinteisin esimerkki on Winnerin (1985) esilletuomat Mosesin sillat – jotka olivat tehty niin mataliksi, ettei tiettyihin kaupungin osiin voinut julkisilla kulkea. Ongelma ei ole täysin tuntematon käyttöliittymätutkimuksessakaan. Arvojen mukaanottamiseksi kehittyi arvopohjaisen käyttöliittymätutkimuksen koulu ja siellä keskeinen kysymys on ollut miten eri käyttäjien arvojen välillä tasapainoillaan. Samalla tavoin normatiivisen teorian kohdalla voi hyvällä perusteella kysyä, millä perusteella tutkijat voivat vain ottaa tietyn normatiivisen aseman ja käyttää sitä tutkimuksessa. Tämä on erityisen huolestuttavaa jos tarkoituksena on muokata järjestelmää tarkemmin jotain arvoja noudatettavaksi – onko se eettistä, että koehenkilöt joutuvat käyttämään järjestelmää, missä arvot ovat voimakkaasti läsnä. Minulla ei ole vielä oikeaa vastausta mahdollisiin arvoristiriitoihin, joten jätetään se tässä välissä oman pohdinnan varaan.

Tiivistelmä: mitä oikeastaan opimme?

Tiivistelmänä – olen viettänyt nyt aika kauan pohdiskellen ja tutkien sanassa tilassa tapahtuvaa tietokonevälitteistä viestintää. Tämän tutkimuksen haaste mielestäni on sen teoreetiton luonne. Tutkimuksemme tavoite oli ehdoittaa mahdollisuuksia muodostaa teoriaa käyttäen normatiivisia teorioita ja näytämme, mitä mahdollisuuksia normatiivisilla teorioilla voisi olla käyttöliittymätutkimuksessa. Jäämmekin odottamaan mielenkiintoisia sovelluskohteita normatiivisille teorioille.

Blogipostaus pohjautuu CHI-konfferenssissa 2017 esitettyyn artikkeliin Nelimarkka, M., Salovaara, A., Semaan, B., & Jacucci, G. (2017). Theory-Driven Collocated CMC. An English version is available in Rajapinta’s Medium.com and Matti’s personal blog.