Varovaisuutta aihemallinnuksen kanssa

Eräs laskennallisten menetelmien tällä hetkellä suosituin sovellus on aihemallinnus eli topic modeling. Se mahdollistaa laajojen tekstiaineistojen jakamisen ryhmiin ja tällä tavalla “kaukoluvun” aineistosta. Tietenkään sen ei koskaan ole tarkoitus korvata aineiston lähilukua (esim. Grimmer & Stewart, 2013), mihin voi käyttää vaikka etnograafisia menetelmiä.

Eräs valinta aihemallinnuksesta on aiheiden määrän, eli tutummin, k:n valinta. Kirjallisuudessa usein esiintynyt tapa tähän on katsoa muutama eri arvo ja valita näistä selkeiten tulkittavissa oleva. Kritisoin tapaa jo marraskuun Rajapinta-meetupissa. Yksinkertainen koeasetelma näytti kuinka ihmisten mielipide selkeydestä vaihtelee merkittävästi.

Aihemallinnus: tuloksia eri k:n arvoilla
Alustava luokitus aineiston sisällöstä eri aihemallinnuksilla. Katso vain kuva.

Kuvassa näemme kuinka niiden tulkinnat myös tuottavat hiukan erilaisia näkemyksiä aineistoista. (Varoitus: nämä ovat vielä alustavia nimiä, eli en ole vielä itse täysin tyytyväinen näihin.) Olen pyrkinyt ryhmittelemään aineiston niin, että samanteemaiset aiheet olisivat samalla rivillä.

Kuvasta nähdään esimerkiksi kuinka aiheiden määrän lisääntyminen kahteenkymmeneen aiheeseen selkeästi tuo jotain uusia ajatuksia aineistoon, erityisesti alueelisuuden ja globalisaation. Toisaalta aiheena esimerkiksi suomalaisuus on osassa malleissa mukana ja osassa ei, mikä luultavasti kuvaa aihemallinnusprosessissa olevaa satunnaisuutta. Toisaalta 26 ja 30 aiheen mallit tuovat esille taloudellisuuden, perusturvan sekä edustuksellisuuden aiheita.

Aihemallinnuksen soveltajille uutiset ovat valitettavia: en itse pitäisi sopivana ajaa aihemallinnusta teoreettisesti mielekkäällä lukumäärällä tai tutkimalla muutamaa eri aihemäärää. Riskit vääristä tulkinnoista ovat ilmeiset näissä tapauksissa. Sen sijaan pitäisin itse toivottavana aihemäärän valitsemista laskennallisin kriteerein, kuten log-likelihood arvoja käyttämällä. Vaikka näistäkin käydään ritstiriitaista keskustelua, tämä silti vähentäisi tiettyä epävarmutta mikä nykyiseen käytäntöön tulee.

Erityiskiitos Koneen Säätiölle tutkimuksen tukemisesta sekä Tieteen tietotekniikan keskus CSClle laskenta-ajasta.

Kuinka normatiivisia teorioita voisi hyödyntää käyttöliittymätutkimuksessa?

Slide27Tieteen ja teknologian tutkimuksessa on jo pitkään ymmärretty, että tekniset välineet sisältävät myös arvoja (esim. Nissenbaum, 2005)⁠. Jokainen järjestelmä on eräs valinta useista eri vaihtoehdoista ja mahdollisuuksista järjestelmän suunnittelussa (esimerkiksi Liste & Sørensen, 2015)⁠. Käyttöliittymätutkimuksessa onkin nostettu esille arvojen rooli osana suunnitteluprosessia. Esimerkiksi arvotietoiset suunnitteluprosessit (value sensitive design) perustuvat arvojen parempaan esilletuontiin suunnittelutyön aikana sekä ratkaisemaan mahdollisia arvoristiriitoja. Arvoja voisi kuitenkin käyttää laajemminkin käyttöliittymätutkimusessa – ne tarjoavat mahdollisuuden integroida teoriaa ja empiiristä tutkimusta. “Uuden” teknologian tutkimus kaipaakin tarkempaa teoriaotetta – jopa 70% yhteiskuntatieteellisestä tutkimuksesta oli teoriatonta (Borah, 2015)⁠; samanlaista vertailua ei ole toistaiseksi tehty käyttöliittymätutkimusyhteisöissä, mutta uskon, ettei tulos olisi merkittävästi parempi. Jotta tutkimus siirtyisi pois kuvailevata ja uusimman teknologian perässä juoksevasta tutkimuksesta keskeisempiin kysymyksiin, olisi mielestäni aika ryhdistäytyä ja pohtia teorian roolia osana tutkimustyötä.

Mutta, mikä oikeastaan on teoria? Yhteiskuntatietelijänä huomasin aikaa sitten, että teoria voi olla monelaisessa muodossa. Ennustavat ja selittävät teoriat pyrkivät kuvaamaan yhteyksiä, kun taas kuvailevat teoriat auttavat käsitteellistäään (ja usein jargonisoimaan) ilmiötä. Normatiiviset teoriat taas keskittyvät pohtimaan, että miten asioiden pitäisi olla. Ennustaville, selittäville ja kuvaileville teorioille on paljon ohjeita, mutta normatiiviset teoriat ovat – ainakin minulle – vielä piikki lihassa. Miten normatiivisia teorioita voisi esimerkiksi validoida? Kuitenkin, pidän normatiivisista teorioista koska niissä tuodaan selkeästi esille tutkijan subjektiivinen asema. Tutkija kun ei ole neutraali toimija vaan tutkijan asenne ja näkemykset vaikuttavat niin tutkimuskysymyksen valitaan kuin aina välillä myös tuloksiin. Normatiivissa teorioissa arvot on jo sisällytetty teoriaan itseensä.

Ratkaisuna normatiiviseen teoriaan pohjautuva tutkimus

Sovelsimme Harmasilaista maailmankuvaa julkisesta tilasta ymmärtääksemme tietokoneavusteista viestintää luokkahuoneessa. Havaitsimme, että tietokonevälitteinen viestintännässä on useampia osallistuja verrattuna kasvoikkain tapahtuvaan ryhmäkeskusteluun. Habermasilaista maailmankuvaa noudatellen, osallisuuden lisäksi myös toisten ihmisten arvostaminen sekä rationaalinen keskustelu ovat tärkeitä. Muiden osallistujien arvostamisessa emme havainneet merkittävää eroa muotojen välillä, mutta rationaalisen keskustelun osalta kasvokkain tapahtuva keskustelu oli parempaa. Työn mielenkiintoinen paino ei kuitenkaan ole täysin tässä teoriassa, vaan laajempi pohdinta kietoutuu normatiivisen teorian hyötyjen ympärille.

Normatiivisen teorian ensimmäinen hyöty tulee siitä, että se on teoria. Kuten muihinkin teorioihin, siihen liittyy monia menetelmällisiä ja empiirisiä havaintoja. Esimerkiksi deliberatiivisen teorian kautta käytössämme oli useita validoituja mittareita arvioidaksemme osallistumisen habermasilaisuutta. Lisäksi julkisen tilan käsitteestä on kirjoitettu jopa tietojenkäsittelytieteessä ja tätä kautta tutkimukselle syntyi ympäristö, johon se pystyi sitoutumaan. Tutkimus samassa tilassa olevien henkilöiden tietokonevälitteisestä viestinnästä on ollut varsin hajanaista ja aiheiltaan jopa poppivaa. Normatiivisen teorian kautta sille muodostui kuitenkin mielekäs ympäristö; hajanaisen tutkimuksen sai kursittua kasaan.

Käyttöliittymätutkimus ei ole vain empiiristä, vaan myös konstruktiivistä – vaihtoehtoisia tietokonelaitteita ja ohjelmia luovia. Normatiivisen teorian toinen hyöty onkin nimenomaan konstruktiiviselle tutkimuselle. Konstruktiivisessa tutkimuksessa isoimpia haasteita on perustella tehtyjä valintoja – mitä on aina useita. Miten tietynlainen käyttöliittymäongelma voitaisiin ratkaista mielekkäästi? Normatiivinen teoria auttaa rajaamaan kaikista mahdollisista suunnitteluvaihtoehdoista merkittävimmät teorian kannalta. Samaan aikaan se voi tukea löytämään uusia inspiraation lähteitä, kun muiden alan tutkijoiden työt voivat puhutella työtäsi selvästi – jopa siinä tilanteessa, että heidän sovelluskohde teorialle saattoi olla etäinen.

Tosin, normatiivinen teoria pakottaa myös tuomaan esille arvot jotka on koodattu kaikkiin teknisiin järjestelmiin. Perinteisin esimerkki on Winnerin (1985) esilletuomat Mosesin sillat – jotka olivat tehty niin mataliksi, ettei tiettyihin kaupungin osiin voinut julkisilla kulkea. Ongelma ei ole täysin tuntematon käyttöliittymätutkimuksessakaan. Arvojen mukaanottamiseksi kehittyi arvopohjaisen käyttöliittymätutkimuksen koulu ja siellä keskeinen kysymys on ollut miten eri käyttäjien arvojen välillä tasapainoillaan. Samalla tavoin normatiivisen teorian kohdalla voi hyvällä perusteella kysyä, millä perusteella tutkijat voivat vain ottaa tietyn normatiivisen aseman ja käyttää sitä tutkimuksessa. Tämä on erityisen huolestuttavaa jos tarkoituksena on muokata järjestelmää tarkemmin jotain arvoja noudatettavaksi – onko se eettistä, että koehenkilöt joutuvat käyttämään järjestelmää, missä arvot ovat voimakkaasti läsnä. Minulla ei ole vielä oikeaa vastausta mahdollisiin arvoristiriitoihin, joten jätetään se tässä välissä oman pohdinnan varaan.

Tiivistelmä: mitä oikeastaan opimme?

Tiivistelmänä – olen viettänyt nyt aika kauan pohdiskellen ja tutkien sanassa tilassa tapahtuvaa tietokonevälitteistä viestintää. Tämän tutkimuksen haaste mielestäni on sen teoreetiton luonne. Tutkimuksemme tavoite oli ehdoittaa mahdollisuuksia muodostaa teoriaa käyttäen normatiivisia teorioita ja näytämme, mitä mahdollisuuksia normatiivisilla teorioilla voisi olla käyttöliittymätutkimuksessa. Jäämmekin odottamaan mielenkiintoisia sovelluskohteita normatiivisille teorioille.

Blogipostaus pohjautuu CHI-konfferenssissa 2017 esitettyyn artikkeliin Nelimarkka, M., Salovaara, A., Semaan, B., & Jacucci, G. (2017). Theory-Driven Collocated CMC. An English version is available in Rajapinta’s Medium.com and Matti’s personal blog.

Digitaalinen vaaliteltta: Twitter politiikan areenana eduskuntavaaleissa 2015

#vaalit2015-ehdokkaat_kuukausi-nonamesTänään 15.7. SuomiAreenassa Porissa julkaistaan Eduskuntavaalitutkimus 2015: Poliittisen osallistumisen eriytyminen -kirja, jossa suomalaiset politiikan tutkijat perkaavat edellisten eduskuntavaalien asetelmaa. Julkaisutilaisuuden jälkeen järjestetään myös poliittisen osalistumisen eriytymistä käsittelevä paneeli. Kirjan analyysit perustuvat pääosin vuoden 2015 vaalien jälkeen käyntihaastatteluilla kerättyyn eduskuntavaalitutkimusaineistoon, mutta mukana on myös Digivaalit-projektimme tutkijoiden kirjoittama luku Twitteristä digitaalisena vaalitelttana

Marttila, Mari; Laaksonen, Salla-Maaria; Kekkonen, Arto; Tuokko, Mari & Nelimarkka, Matti (2016). Digitaalinen vaaliteltta: Twitter politiikan areenana eduskuntavaaleissa 2015. Teoksessa Eduskuntavaalitutkimus 2015: Poliittisen osallistumisen eriytyminen. Oikeusministeriön Selvityksiä ja julkaisuja 28/2016. [linkki koko julkaisuun]

Luvussa keskitymme Twitteriin ja sen käyttöön eduskuntavaaleissa 2015. Tarkastelemme ensin eduskuntavaaliehdokkaiden Twitterin käyttöä puolueittain ja vaalipiireittäin. Sen jälkeen luomme katsauksen Twitter-keskustelun aihepiireihin ja rakenteisiin käytettyjen aihetunnisteiden eli hashtagien avulla. Lopuksi tarkastelemme yleisemmän poliittisen Twitter-keskustelun rakennetta verkostoanalyysin keinoin. Luvussa  esitetyt analyysit pohjautuvat kaikkiin eduskuntavaaliehdokkaiden lähettämiin twiitteihin aikavälillä 19.3.—19.4.2015 sekä samalta aikajaksolta #vaalit2015-aihetunnisteen sisältäviin viesteihin. Aineistossa on yhteensä 210 737 twiittiä.

Ehdokkaan näkökulmasta Twitter on potentiaalisesti hyödyllinen vaalikampanjoinnin ja poliittisen keskustelun areena. Se tarjoaa poliitikoille mahdollisuuden viestiä kansalaisten kanssa ja näin paitsi vastaanottaa kysymyksiä ja palautetta, myös luoda itsestään kuvaa helposti lähestyttävänä ja ihmisystävällisenä: omalta osaltaan siis laskea raja-aitaa itsensä ja edustettavien kansalaisten välillä. Twitter on palvelu, jonka avulla yksittäisen ehdokkaan on jossakin määrin mahdollista ohittaa perinteisen median portinvartijat.

Ehdokkaat Twitterissä keväällä 2015

Vaalien alla vaikutti siltä, että ainakin media oletti vuoden 2015 vaalien olevan ensimmäiset todelliset Twitter-vaalit. 2015 eduskuntavaaliehdokkaat käyttivät Suomessa Twitteriä aktiivisemmin kuin koskaan aikaisemmin.  Täpärästi yli puolet (50,8%) ehdokkaista oli läsnä Twitterissä, kun vuoden 2011 vaaleissa luku oli 19 prosenttia. Läsnäolo on kuitenkin vain yksi mittari – eikä kovin hyvä sellainen, sillä ehdokkaiden twiittausaktiivisuus on hyvin jakautunutta niin vaalipiirien kuin puolueidenkin kesken. Twitterin käyttö olikin vaaleissa 2015 varsin keskittynyttä: vain pieni osa ehdokkaista oli äänekkäitä suurimman osan tyytyessä julkaisemaan hyvin vähän. Ehdokkaiden julkaisemien twiittien jakauman perusteella Twitter näyttäytyy lähinnä kokoomuksen ja vihreiden kilpakenttänä, jolla kamppaillaan suurten vaalipiirien äänistä.

Viestinnän näkökulmasta Twitter oli kansanedustajaehdokkaille keväällä 2015 paitsi yksisuuntaisen kampanjoinnin väline myös foorumi, jolla osallistuttiin poliittiseen keskusteluun. Ehdokkaiden tileiltä julkaistuista twiiteistä hieman alle 62 prosenttiin oli lisätty jokin aihetunniste, ja noin 60 prosentissa twiiteistään ehdokkaat mainitsivat toisen käyttäjän. Kuitenkin huomattava määrä edustajien tileiltä julkaistuista twiiteistä ei sisältänyt kumpaakaan näistä toiminnoista. Twitter olikin keväällä 2015 ehdokkaille paitsi poliittisen keskustelun foorumi, ennen kaikkea kampanjoinnin, verkostoitumisen ja “elektronisten esitteiden” jakamisen areena: siis yksi vaaliteltta muiden joukossa.

Vaalien tuloksia tarkasteltaessa on selvää, että ehdokkaiden Twitter-aktiivisuus ei suoraan näy vaalituloksessa — vaaleja ei siis ratkaista Twitterissä (ks. myös Pönkä 2015). Aineistomme kymmenestä aktiivisimmasta ehdokkaasta vain kaksi, Alexander Stubb ja Satu Hassi, tulivat valituiksi eduskuntaan. Aktiivisimpien twiittaajien joukossa oli ehdokkaita sekä pienpuolueista että eduskuntapuolueista, oppositiosta ja hallituspuolueista.

Ero Twitter-aktiivisuudessa eduskuntapuolueiden ja pienpuolueiden ehdokkaiden välillä on kuitenkin pohdinnan arvoinen asia. Yleisenä huomiona voidaan todeta, että Twitteriä kampanjassaan hyödynsivät lähinnä jo jonkinlaisen valta-aseman saaneiden puolueiden ehdokkaat. Vaikuttaakin siltä, että Twitter on ainakin tällä hetkellä osa suurten puolueiden ammattimaista vaalikampanjointia myös Suomessa. Sen sijaan pienpuolueet eivät ole eduskuntapuolueiden lailla onnistuneet innostamaan ehdokkaitaan kampanjoimaan Twitterissä.

Vaalikeskustelun #kuplat

Yleisen vaalikeskustelun tarkastelussa havaitsimme, kuinka vaalikeskustelussa muodostettiin keskusteluyhteisöjä aihetunnisteiden avulla. Esimerkiksi turvallisuuspolitiikkaan liittynyttä keskustelua käytiin #turpo-aihetunnisteen kautta. Aihetunnisteita käytettiin myös eri toimijoiden vaalitenttien (esimerkiksi #kuumatnimet, #olohuonetentti) sekä järjestöjen ja puolueiden kampanjoiden yhteydessä (esimerkiksi #koulutuslupaus, #korjausliike, #feministisetvaalit).Hashtagien määristä olemme bloganneet Rajapinnassa jo viime vuonna.

Aihetunnisteet ovat kätevä keino aihepiirien ja keskustelujen merkitsemiseen. Verkostoanalyyttinen tarkastelumme kuitenkin osoitti, että aihetunnisteet jäivät usein yhden yhteisön sisäiseksi viestinnäksi eivätkä onnistuneet luomaan sellaisia viestinnän areenoita, joilla eri toimijat aidosti kohtaisivat. Vahva eriytyminen keskusteluissa tarkoittaa pahimmillaan muiden näkökantojen puuttumista; keskustelu käymistä omassa kuplassa tai kaikukammiossa.

Twitter on rajattu ja erikoistunut keskusteluareena

Analysoitaessa Twitteriä poliittisen viestinnän areenana on kuitenkin syytä korostaa, että Twitter edustaa hyvin rajattua ja erikoistunutta yleisöä.  Yhteisö- ja mikroblogipalvelu Twitteriä seuraa erilaisten arvioiden mukaan vain noin kymmenen prosenttia suomalaisista (Yleisradio 2015; Nummela 2016). Suomessa Twitter on suosittu erityisesti poliitikkojen, asiantuntijoiden ja toimittajien keskuudessa, ja sitä onkin tituleerattu eliittimediaksi (Vainikka ja Huhtamäki 2015). Kattavaa kuvausta Suomen Twitter-käyttäjäkunnasta ei kuitenkaan ole tehty.

On siis selvää, että pelkästään Twitteriä tutkimalla ei voida tehdä lopullisia johtopäätöksiä poliittisen verkkoviestinnän koko kirjosta. Samoin on syytä huomata, että verkossa tapahtuva poliittinen viestintä ei yleisemminkään edusta koko kansaa, vaan sen on kansainvälisesti havaittu olevan painottunut nuoriin ja yhteiskunnallisesti aktiivisiin toimijoihin (Barbera ja Rivero 2014; Blank 2013; Strandberg 2013).

Sen sijaan luvussa esitetyt tulokset kuvaavat Twitterin haasteita poliittisen viestinnän kentällä. Olemme osoittaneet suurien kaupunkialueiden ja valtapuolueiden ehdokkaiden käyttävän Twitteriä muita ehdokkaita aktiivisemmin. Olemme myös havainneet poliittisen keskustelun tapahtuvan tietyissä sisäänpäin kääntyneissä yhteisöissä myös Suomessa. Näitä havaintoja vasten onkin syytä pohtia, minkä roolin niin poliittiset toimijat kuin politiikan tutkijat ja toimittajatkin antavat Twitterille omassa työssään.