Politiikkaa ja demokratiaa käyttöliittymätutkimuksen näkökulmasta

Politiikka ja demokratia ovat hankalia termejä: ne voivat viitata niin valtiomuotoon, päätöksentekojärjestelmään, yhteisesti sovittuihin sääntöihin, organisaation toimintaan tai vaikka mihin muuhun. Viimeistään nyt on ilmeistä kaikille, että teknologiat vaikuttavat siihen, kuinka demokratia toimii ja politiikka muotoutuu. Ajankohtaisista esimerkeistä mainittakoon presidentti Trumpin sosiaalisen median aktiivisuus ja markkinointi tai kansalaisaloitteiden keräämiseen tarkoitettu verkkoalusta.

Tutkimuskirjallisuudessa teknologian ja demokratian sek√§ politiikan yhteys on toki ollut esill√§ jo pitk√§√§n. Esimerkiksi Dahlberg (2001) sek√§ Becker (2001) molemmat kuvittelivat, ett√§ teknologia voi parantaa demokraattista osallistumista ja mahdollistaa avoimemman sek√§ keskustelevamman kansalaisosallistumisen. Toisaalta, esimerkiksi Hindman (2009) on korostanut uuden teknologian mahdollisesti haittaavan demokraattisen yhteiskunnan kehittymist√§ esimerkiksi hakukoneiden ottaessa vallan informaation v√§lityksest√§. T√§t√§ kirjallisuutta on runsaasti ja kolme l√§hdett√§ ei tee kunniaa kaikille ajatuksille, joita on esitetty. Minua kiinnosti kuitenkin tarkemmin tietyn tieteenalan ‚Äď k√§ytt√∂liittym√§tutkimuksen ‚Äď n√§k√∂kulma t√§h√§n tematiikkaan. K√§ytt√∂liittym√§tutkijoilla on keskeinen rooli teknologian ja ihmisten v√§lisen vuorovaikutuksen tutkimisessa, jolloin teknologian ja yhteiskunnan v√§linen vuorovaikutus olisi varmaan heille kiinnostava aihepiiri.

Yhteensä erilaisilla politiikka- ja demokratia-avainsanoilla artikkeleita löytyi noin 500 kappaletta ACM Digital Librarystä. Tämä voi tuntua paljolta, mutta 1980-luvun alusta syntyneelle yhteisölle artikkelit ovat kuin tippa meressä ja muodostavat noin prosentin käyttöliittymätutkimuksen kokonaisjulkaisuista. Esimerkiksi sosiaalista mediaa on tutkittu noin 1200 artikkelin voimin ja tekstin syöttämistä päälle 300 artikkelin voimin. Systemaattisesti luokittelemalla tunnistin politiikka- ja demokratia-kirjallisuudesta 14 erilaista lähestymistapaa politiikkaan.

Selkeästi isoin ryhmä oli akateemisen yhteisön ylläpitämiseen keskittyneet artikkelit, esimerkiksi työpatjakuvaukset, paneelit ja muut keskustelutilaisuudet. Myös yllättävän monissa esipuheissa mainitaan politiikka sanana, mikä ilmaisee yhteisön mielenkiintoa poliittisia aiheita kohtaan. Ei ole kuitenkaan täysin ilmeistä, johtaako tämä yleinen mielenkiinto akateemiseen tutkimukseen.

Samoin politiikka ja demokratia sallivat käsittelyn monista näkökulmista. Toisaalta, politiikalla voitiin viitata organisaatioihin ja niissä tapahtuvaan sisäiseen politikointiin tai kansalaisjärjestöihin poliittisina toimijoina. Samaan aikaan julkisten palveluiden tuottaminen ja palautteen antaminen tai julkisten palveluiden saavutettavuus ovat myös kysymyksiä demokratiasta ja politiikasta.  Politiikkaan liittyy olennaisesti myös kommentaarit mitä erilaisimmista policyistä käyttöliittymätutkimuksen alalla.

Edelliset esimerkit jo osoittavat, että aihepiirit ovat hyvin erilaisia ja niillä ei välttämättä ole kovinkaan paljon tekemistä toistensa kanssa. Myös teknologian saatavuuden paraneminen (demokratisoituminen) sekä keskustelu arvoista, yhteiskunnasta ja teknologiasta liittyvät artikkelihaussa demokratiaan ja politiikkaan.

Sosiaalinen media on tietysti osana analyysiä, sen voi nähdä jopa kolmena erilaisena lähestymistapana. Tutkijat ovat keskittyneet poliittiseen viestintään eli tutkineet miten sosiaalinen media toimii esimerkiksi vaalien tai muiden isojen poliittisten tapahtumien alla. Toisaalta, menetelmällisesti painottuneet tutkijat liittyvät politiikkaan ja demokratiaan varsin vähäisesti: poliittinen keskustelu muodostaa heille hyvän aineiston, johon soveltaa uusimpia (koneoppimis)menetelmiään ja miettiä niiden toimivuutta. Lisäksi uutisten valikoivasta lukemisella on selvästi oma yhteisönsä.

Kaiken tämän keskellä on vielä kaksi kirjallisuusryhmää, jotka yhteiskunnan vaikuttamisen kannalta ovat mielenkiintoisia. Jotkut tutkijat ovat miettineet, miten teknologia voisi tukea naapurustoja ja niihin osallistumista. Toisaalta, osa tutkijoista on keskittyneet pohtimaan osallistumisen teknologista tukemista ja käyttöliittymätutkimuksen mahdollisuuksia siinä.

Mit√§ t√§st√§ kaikesta siis voi sanoa? P√§√§ns√§ryn lis√§ksi kirjallisuuskatsaus n√§ytt√§√§, ett√§ demokratian ja politiikan sateenvarjo on k√§ytt√∂liittym√§tutkimuksessa varsin laaja. T√§m√§ ei ole v√§ltt√§m√§tt√§ yll√§tys, mutta k√§sitteiden ‚Äď kuten ‚ÄĚcivic engagement‚ÄĚ k√§ytt√∂ eri konteksteissa voi sotkea akateemista yhteis√∂√§ ja haitata omalle tutkimukselle keskeisten artikkelin l√∂yt√§mist√§.

Olen nyt käymässä läpi tarkemmin kirjallisuutta osallistumisen tukemisesta. Mitä osallistumisen tutkimuksen yhteisö voisi oppia käyttöliittymätutkijoilta ja toisaalta mitä käyttöliittymätutkimusyhteisö voisi hyötyä yhteiskuntatieteestä? Puhun näistä ajatuksista tarkemmin 11.4. maksuttomassa HY+aamu-tilaisuudessa.

 

Kuplista ja niiden ehk√§isemisest√§

Teksti perustuu minun, Salla-Maaria Laaksosen ja Bryan Semaanin artikkelik√§sikirjoitukseen. Koska akateeminen julkaisu on hidasta, p√§√§tin kirjoittaa¬† tiivistetyn version jo nyt blogimuodossa ‚Äď onhan tuloksia jo esitelty Rajapinta-meetupeissa. Huomautettakoon, ett√§ tekstin n√§k√∂kulma voi olla monelle yhteiskuntatieteit√§ edustavalle rajapintalaiselle hiukan outo, koska artikkelin p√§√§yleis√∂n√§ on k√§ytt√∂liittym√§tutkijat.

Kuplien ja polarisaation tutkimiselle on pitkät perinteet myös verkkotutkmuksessa. Vuoden 2004 Yhdysvaltojen vaaleja tutkineet Adamic & Glance (2005) havaitsivat, että demokraattiblogaajat linkkaavat enemmän demokraattilähteisiin ja vastaavasti republikaaniblogaajat republikaanilähteisiin. Vastaavia tuloksia on saatu myös esimerkiksi Gilbertin yms. (2009), Jacobsonin ym. (2016) sekä Merazin (2015) tutkimuksissa.

Myös käyttöliittymätutkijat ovat lukeneet samoja artikkeleita ja alkaneet pohtia, kuinka polarisaatiota voisi teknologiaa kehittämällä vähentää. Tutkimusta on tehty varsin runsaasti. Esimerkiksi Park et al. (2009) ja Munson et al. (2009, 2010, 2013) ovat pyrkineet vaihtamaan uutisten suosittelun tukemaan erilaisten näkökulmien esittelyä. Suosittelu voi myös tapahtua suosittelemalla ihmisille muita ihmisiä joiden näkökulmat ovat aiheeseen voisivat olla erilaisia (esimerkiksi Garimella, 2016, 2017). Artikkelissamme kutsumme tätä vallitsevaksi lähestymistavaksi jonka haluamme haastaa (englanniksi common design agenda).

Empiirinen esimerkki: toimisiko vallitseva lähestymistapa?

Tutkimme Suomessa melko tuoretta, selvästi polarisoitunutta ilmiötä: maahanmuuttokeskustelua. Käytämme aineistona viittä maahanmuuttoa kannattavaa ja viittä maahanmuuttoa vastustavaa Facebook-yhteisöä ja niissä tapahtuvaa linkkien jakoa. Ilmiön kuvaamiseksi teimme verkostoanalyysin, jossa sivuston ja ryhmän vällle syntyy yhteys aina, kun kyseisessä ryhmässä on jaettu jokin kyseisen sivuston alla oleva linkki. Kuten verkostokuvastä näkee, aiemman tutkimuksen havaitsema polarisaatioilmiö on havaittavissa tässäkin keskustelussa: ryhmille yhteisiä sivustoja on vain kourallinen eli ryhmien keskelle jäävät verkoston solmut. Valtaosa jaetuista sivustoista on kullekin ryhmälle erillisiä.

network2
Linkit maahanmuuttoa vastustavissa (A1-5) ja kannattavissa (P1-5) ryhmissä. Aineisto on analyysissa täysin anonymisoitu, eli yksittäisiä käyttäjiä ei voi tunnistaa.

Jos seuraisimme aiemman tutkimuksen johtopäätöksiä, kuvaaja voisi johtaa ajatukseen, että ryhmille voisi tehdä hyvää välillä lukea samoja lähteitä ja ehkä löytää yhteistä maaperää tätä kautta. Aineistossa havaittiin, että noin kaksi prosenttia linkeistä ovat täysin samoja sekä kannattavissa että vastustavissa ryhmissä, eli näiden linkkien sivustot ovat mahdollisia yhteisen maaperän löytymiselle.

P√§√§timme kuitenkin tarkastella hiukan syvemm√§lle ja analysoida, mit√§ n√§iden yhteisten linkkien alla tapahtuu. Linkken alla olevien Facebook-kommenttien analyysi osoittaa, ett√§ yhteist√§ maaper√§√§ ei l√∂ytynyt. Linkkien alla varsin usein dissattiin hyvinkin julmasti sit√§ “toista puolta” ‚Äď niin maahanmuuttoa vastustavissa kuin sit√§ kannattavissa ryhmiss√§. Keskustelu oli hyvin et√§√§ll√§ yrityksist√§ ymm√§rt√§√§ toisten n√§k√∂kulmia.

Tulos ei välttämättä ole yllättävä ja uusin poliittinen psykologia (esim. Washburn, painossa) kuvaa, kuinka jopa tilastojen lukeminen värittyy lukijan ennakkokäsityksien kautta. Tästä huolimatta  ajatus yhteisen maaperän luominen esimerkiksi jaettujen linkkien avulla on keskeinen oletus vallitsevassa lähestymistavasssa.

Mitä sitten?

Analyysimme perusteella on selvää, että esitetty yksinkertainen eri uutislähteiden suosittelu sellaisenaan ei riitä. Käyttöliittymätutkimuksessa on palattava työpöydän ääreen ja mietittävä, missä määrin teknologialla voidaan välttää yhteiskunnan polarisaatiota ja mitä vaikutuksia sillä lopulta voi olla. Tämä on selkeästi kutsu rajapintaiselle teknologian ja yhteiskuntatieteen välissä olevalle tutkimukselle jossa voitaisiin huomioida niin teknologian syvällinen ymmärtäminen ja jopa teknologiakonstruktiivinen tutkimusote kuin myös yhteiskuntatieteen kautta ymmärrys ihmisen monimutkaisuudesta.

Käyttöliittymäsuunnittelu voisi lähteä rohkeasti kokeilemaan erilaisia lähestymistapoja pelkän mediadieetin laajentamiseen asemesta. Alla on kolme esimerkkiä siitä mitä voitaisiin esimerkiksi tehdä. Ensimmäisessä koetetaan rakentaa suosittelua heikkojen yhteyksien kautta. Toisessa pyritään tuomaan uutisesta jo käytävää keskustelua ja sitä kautta eri näkemyksiä enemmän esille. Kolmannessa tarjotaan uutisten jakajille vihjettä, että samaan aiheeseen on esitetty monta näkökulmaa.

Nämäkään lähestymistavat eivät välttämättä toimi. Pahimmillaan ne voivat vain aiheuttaa enemmän antisosiaalista toimintaa ja pahaa mieltä. Siitä huolimatta olisi tärkeää, että design-vetoinen käyttöliittymätutkimus tutkisi myös vallitsevaa lähestymistapaa haastavia ratkaisuja pohtisi mitä kaikkea voitaisiin tehdä tämän yhteiskunnallisen ongelman ratkaisemiseksi.

 

Ohjelmoinnin opetusta yhteiskuntatieteilij√∂ille Helsingiss√§ – jotain ajatelmia

English version available at Science & Industry, Matti’s personal blog.

Ensimm√§inen Helsingin yliopiston Programming for social science¬†kurssi pidettiin¬†syksyll√§ 2014. Silloin ei ollut kovinkaan monia kursseja, joista katsoa mallia¬†suunnittelun avuksi. 2014 j√§lkeen olen muuttanut kurssia ja yritt√§nyt mielest√§ni parantaa sit√§. Esimerkiksi kurssin harjoitusteht√§vi√§ on muokattu¬†yhteiskuntatieteit√§ k√§sitteleviksi (kev√§t 2015,¬†syksy 2016). Nykyisin ohjelmointi, yhteiskuntatiede ja ¬īdata science’ on paljon trendikk√§√§mp√§√§ kuin vuonna 2014. Esimerkiksi SAGE Publishing on¬†SAGE Campuselleen¬†luonut kurssin ohjelmoinnista videomateriaaleineen ja kertomuksineen (selkeyden vuoksi: p√§√§sin k√§ytt√§m√§√§n materiaalia ilmaiseksi arviointitarkoituksissa).

Koska ohjelmointi ja ‘data science’ ovat t√§ll√§ hetkel√§ trendikk√§it√§, ajattelin, ett√§ nyt voisi olla hyv√§ hetki v√§h√§n kelata¬†omaa opetustani ja sen kehittymist√§. Uskon, ett√§ on olemassa (v√§hint√§√§n) kaksi erilaista tapaa opettaa ohjelmointia: tietojenk√§sittelytieteellinen ja soveltava. Tietojenk√§sittelytieteellinen l√§hestymistapa n√§kyy parhaiten eri yliopistojen “Johdatus ohjelmointiin”-kursseilla, miss√§ koko tematiikkaa l√§hestytet√§√§n tietojenk√§sittelytieteen perinteest√§. Soveltava tyyli sen sijaan yritt√§√§ integroida ohjelmoinnin¬†jonkin oppiaineen soveltavaan kontekstiin. Esimerkiksi¬†Guzdialin (2003)¬†kurssi keskittyi ohjelmoinnin opettamiseen media-alalle ja keskittyikin esimerkiksi kuvien automaattiseen k√§sittellyn. Samalla tavalla¬†Sullivanin (2013)¬†datavetoinen kurssi painotti laskennallista aineiston k√§sittely√§.

Ensimmäinen, syksyn 2014, kurssi oli ehdottomasti tietojenkäsittylytieteellinen. Teimme kaikki perinteiset tietojenkäsittelytieteen tehtävät, mukaanlukien Fizz-Buzz ja alkulukutestaus. Ovat samoja tehtäviä, millä minut on aikanaan opetettu. Jo silloin käytössä oli artikkeleita, jotka yrittivät vähän taustoittaa siitä, miten laskennallisia menetelmiä voidaan soveltaa yhteiskuntatieteissää. Kuitenkin, kurssin lopulla kuulin palautteessa, ettei ohjelmoinnin ja yhteiskuntatieteen välinen yhteys ollutkaan niin selvää, kun ajattelin sen olevan.Vähän kerrallaan, usean vuoden aikana kasvatin soveltavien tehtävien määrää. Soveltavat tehtävät pohjautuvat jotenkin yhteiskuntatieteellisiin ongelmiin, mutta yksinkertaistetussa muodossa. Tänä vuonna kokeilen liittää kaikki tehtävät yhteiskuntatieteen kannalta kiinnostavaan aineistoon ja kontekstiin. Kuten aiempinakin vuosina, luemme myös useita empiirisiä tapaustutkimuksia.

Katsotaan mit√§ tapahtuu t√§ll√§ kertaa ja opitaan taas seuraavaan kertaan.Ja miten t√§m√§ kaikki liittyi SAGE Publishingingiin? Heid√§n uusi materiaalinsa¬†pyrkii samaan tavoitteeseen kuin min√§: tukemaan¬†yhteiskuntatieteilij√∂iden ohjelmointia. Raktenteensa osalta kurssi on selke√§sti rakennettu tietojenk√§sittelytieteellisest√§ perspektiivist√§. Rakenne seuraa hyvin perinteist√§ ohjelmointikurssia: ohjelmointiymp√§rist√∂n k√§ytt√∂, muuttujien toiminta, kontrollirakenteet¬†ja huomioita hyvist√§ toimintatavoista. Lis√§ksi on selv√§sti on enemm√§n soveltajille¬†mielenkiintoista¬†sis√§lt√∂√§, erityisesti verkkosivujen k√§sittely. Tekij√∂ill√§ on kuitenkin ollut mieless√§ yhteiskuntatietelj√§t ja yhteiskuntatiedett√§ on koitettu tuoda osaksi sis√§lt√∂√§ erillisill√§ “Application to Social Science”-laatikoilla. Valitettavasti ne eiv√§t mielest√§ni olleet sis√§ll√∂llisesti mitenk√§√§n mullistavia:

Ohjelmoinnin osalta materiaali on erittäin hyvätasoista. Videot ovat hyvin tehtyjä ja selkeän oloisia. Kuitenkaan mielestäni valmis itsenäiseksi materiaaliksi, vaan toimii yhteiskuntatieteellisen kurssin rinnalla jossa

  • on enemm√§n k√§yt√§nn√∂n harjoituksia ohjelmoinnista, jotta yleisen tason ymm√§rrys ohjelmoinnista muuttuisi osaamiseksi
  • enemm√§n kertomusta laskennallisen tutkimusprosessin yhteydest√§ yhteiskuntatieteisiin ja sen k√§sitteisiin ja tukea ohjelmoinnin k√§ytt√∂√§ tutkimusmenetelm√§n√§

Tämän kaltaisella kurssilla on kuitenkin Рkokemukseni mukaan Рusein jonkun käsikirjan ohjelmoinnin opettamisesta. Internet toki on pullollaan näitä materiaaleja, mutta niistä tulee herkästi tilkkukäkkimäinen kokoelma erilaisia lähestymistapoja. Ja tämä ei toki ole systemaattinen ja myös aika sekava. SAGEn kurssi voisi toimia systemaattisempana mateiraalina tälläiselle kurssille.

Algoritmit uutisissa: ensimm√§isi√§ havaintoja

Minua kiinnosti kuinka suomenkielisessä mediassa puhutaan algoritmeistä, tekoälystä ja koneoppimisesta; tuosta tämän päivän maagisesta taikuudesta. Ensimmäinen yllätykseni on, että ensimmäinen osuma varsin laajassa media-aineistossamme on vuodelta 1994! Noin muutekin hämmennyin kun Aamulehden uutisoinnissa ei ole selkeää tihentymää tai määrän kasvua Рuutisointi on ollut erittäin aktiivista jo vuodesta 2000. Yleisradiolla sen sijaan nähdään selvästi, kuinka uutisointi on kasvanut noin 2012 vuodesta erittäin paljon, mutta sitä ennen uutisissa nämä taikasanat ovat olleet enemmänkin sivuhuomioita.

Screenshot 2017-07-12 16.42.20
Aamulehden uutiset missä on sana algoritmi, tekoäly tai koneoppiminen
Screenshot 2017-07-12 16.42.09
Yleisradion uutiset missä on sana algoritmi, tekoäly tai koneoppiminen

 

Havaitsimme Aamulehden olleen poikkeuksellisen aktiivinen algoritmiuutisoinnissaan jo 2000-luvun alkupuolella, kun Yle siitä villiintyi vasta 2010-luvun puolella. Selvää kuitenkin on, että 2010-luvulla algoritmeistä puhutaan merkittävästi enemmän kuin 2000-luvulla.

Aiheiden osalta käytimme aina yhtä trendikästä aihemallinnusta ja uutisaineistosta löytyikin 41 erilaista aihetta Рjotka selkeyden takia luokittelimme kymmeneen ryhmään:

  1. Pelit ja peliarvostelut
  2. Tekniikan kehitys, esimerkiksi itsestään ajava auto sekä tekoäly
  3. Elokuvat, viihde ja taide
  4. Kaupalliset palvelut ja niiden algoritmit
  5. Tutkimus algoritmeistä
  6. Tietoturvallisuus
  7. Ohjelmoinnin opetus peruskoulussa
  8. Työllisyys ja työelämän murros
  9. Algoritmien kaupallinen arvo
  10. Algoritmit ja maailmanpolitiikka
timeline.png
Algoritmit uutisissa teemoittain

Havainnoimalla eri teemojen näkyvyyttä mediassa huomaamme, että 2000-luvun alusta tähän päivään on tapahtunut siirtymä viihteistä ja peleistä erityisesti kaupallisten palveluiden algoritmien pohdiskeluun ja esimerkiksi algoritmien vaikutukseen työelämässä.

Temaattinen muutos on tervetullut algoritmisten järjestelmien yhteiskunnallisen merkittävyyden takia, mutta yhteiskuntatieteissä juuri nyt trendikäs kriittinen algoritmitutkimus ei ainakaan tämän analyysin perusteella ollut erityisesti esillä. Ehkäpä peruskoulun ohjelmointiopetuksessa kannattaisi käyttää myös muutama tunti pohtimaan teknologian valtaa eikä vain yrittää oppia ohjelmoinnin alkeita?

Kiitämme Yleisradiota sekä Alma mediaa tutkimukseen käytettyjen aineistojen tuomisesta käyttöömme. Perinteisestihän Suomessa on aina tutkittu Helsingin Sanomia, mutta heidän kautta media-aineistoa ei ole saatavilla.

Varovaisuutta aihemallinnuksen kanssa

Varovaisuutta aihemallinnuksen kanssa

Er√§s laskennallisten menetelmien¬†t√§ll√§ hetkell√§ suosituin sovellus on aihemallinnus eli topic modeling. Se mahdollistaa laajojen tekstiaineistojen jakamisen ryhmiin ja t√§ll√§ tavalla “kaukoluvun” aineistosta. Tietenk√§√§n sen ei koskaan ole tarkoitus korvata aineiston l√§hilukua (esim. Grimmer & Stewart, 2013), mihin voi k√§ytt√§√§ vaikka etnograafisia menetelmi√§.

Eräs valinta aihemallinnuksesta on aiheiden määrän, eli tutummin, k:n valinta. Kirjallisuudessa usein esiintynyt tapa tähän on katsoa muutama eri arvo ja valita näistä selkeiten tulkittavissa oleva. Kritisoin tapaa jo marraskuun Rajapinta-meetupissa. Yksinkertainen koeasetelma näytti kuinka ihmisten mielipide selkeydestä vaihtelee merkittävästi.

Aihemallinnus: tuloksia eri k:n arvoilla
Alustava luokitus aineiston sisällöstä eri aihemallinnuksilla. Katso vain kuva.

Kuvassa näemme kuinka niiden tulkinnat myös tuottavat hiukan erilaisia näkemyksiä aineistoista. (Varoitus: nämä ovat vielä alustavia nimiä, eli en ole vielä itse täysin tyytyväinen näihin.) Olen pyrkinyt ryhmittelemään aineiston niin, että samanteemaiset aiheet olisivat samalla rivillä.

Kuvasta nähdään esimerkiksi kuinka aiheiden määrän lisääntyminen kahteenkymmeneen aiheeseen selkeästi tuo jotain uusia ajatuksia aineistoon, erityisesti alueelisuuden ja globalisaation. Toisaalta aiheena esimerkiksi suomalaisuus on osassa malleissa mukana ja osassa ei, mikä luultavasti kuvaa aihemallinnusprosessissa olevaa satunnaisuutta. Toisaalta 26 ja 30 aiheen mallit tuovat esille taloudellisuuden, perusturvan sekä edustuksellisuuden aiheita.

Aihemallinnuksen soveltajille uutiset ovat valitettavia: en itse pitäisi sopivana ajaa aihemallinnusta teoreettisesti mielekkäällä lukumäärällä tai tutkimalla muutamaa eri aihemäärää. Riskit vääristä tulkinnoista ovat ilmeiset näissä tapauksissa. Sen sijaan pitäisin itse toivottavana aihemäärän valitsemista laskennallisin kriteerein, kuten log-likelihood arvoja käyttämällä. Vaikka näistäkin käydään ritstiriitaista keskustelua, tämä silti vähentäisi tiettyä epävarmutta mikä nykyiseen käytäntöön tulee.

Erityiskiitos Koneen Säätiölle tutkimuksen tukemisesta sekä Tieteen tietotekniikan keskus CSClle laskenta-ajasta.

Kuinka normatiivisia teorioita voisi hyödyntää käyttöliittymätutkimuksessa?

Slide27Tieteen ja teknologian tutkimuksessa on jo pitk√§√§n ymm√§rretty, ett√§ tekniset v√§lineet sis√§lt√§v√§t my√∂s arvoja (esim.¬†Nissenbaum, 2005)‚Ā†. Jokainen j√§rjestelm√§ on er√§s valinta useista eri vaihtoehdoista¬†ja mahdollisuuksista¬†j√§rjestelm√§n suunnittelussa¬†(esimerkiksi¬†Liste & S√łrensen, 2015)‚Ā†. K√§ytt√∂liittym√§tutkimuksessa onkin nostettu esille arvojen rooli osana suunnitteluprosessia. Esimerkiksi arvotietoiset suunnitteluprosessit (value sensitive design) perustuvat arvojen parempaan esilletuontiin¬†suunnitteluty√∂n aikana sek√§ ratkaisemaan mahdollisia arvoristiriitoja. Arvoja voisi kuitenkin k√§ytt√§√§ laajemminkin k√§ytt√∂liittym√§tutkimusessa – ne tarjoavat mahdollisuuden integroida teoriaa ja empiirist√§ tutkimusta. “Uuden” teknologian tutkimus kaipaakin tarkempaa teoriaotetta – jopa 70% yhteiskuntatieteellisest√§ tutkimuksesta oli teoriatonta (Borah, 2015)‚Ā†; samanlaista vertailua ei ole toistaiseksi tehty k√§ytt√∂liittym√§tutkimusyhteis√∂iss√§, mutta uskon, ettei tulos olisi merkitt√§v√§sti parempi. Jotta tutkimus siirtyisi pois kuvailevata ja uusimman teknologian per√§ss√§ juoksevasta tutkimuksesta keskeisempiin kysymyksiin, olisi mielest√§ni aika ryhdist√§yty√§ ja pohtia teorian roolia osana tutkimusty√∂t√§.

Mutta, mikä oikeastaan on teoria? Yhteiskuntatietelijänä huomasin aikaa sitten, että teoria voi olla monelaisessa muodossa. Ennustavat ja selittävät teoriat pyrkivät kuvaamaan yhteyksiä, kun taas kuvailevat teoriat auttavat käsitteellistäään (ja usein jargonisoimaan) ilmiötä. Normatiiviset teoriat taas keskittyvät pohtimaan, että miten asioiden pitäisi olla. Ennustaville, selittäville ja kuvaileville teorioille on paljon ohjeita, mutta normatiiviset teoriat ovat Рainakin minulle Рvielä piikki lihassa. Miten normatiivisia teorioita voisi esimerkiksi validoida? Kuitenkin, pidän normatiivisista teorioista koska niissä tuodaan selkeästi esille tutkijan subjektiivinen asema. Tutkija kun ei ole neutraali toimija vaan tutkijan asenne ja näkemykset vaikuttavat niin tutkimuskysymyksen valitaan kuin aina välillä myös tuloksiin. Normatiivissa teorioissa arvot on jo sisällytetty teoriaan itseensä.

Ratkaisuna normatiiviseen teoriaan pohjautuva tutkimus

Sovelsimme Harmasilaista maailmankuvaa julkisesta tilasta ymmärtääksemme tietokoneavusteista viestintää luokkahuoneessa. Havaitsimme, että tietokonevälitteinen viestintännässä on useampia osallistuja verrattuna kasvoikkain tapahtuvaan ryhmäkeskusteluun. Habermasilaista maailmankuvaa noudatellen, osallisuuden lisäksi myös toisten ihmisten arvostaminen sekä rationaalinen keskustelu ovat tärkeitä. Muiden osallistujien arvostamisessa emme havainneet merkittävää eroa muotojen välillä, mutta rationaalisen keskustelun osalta kasvokkain tapahtuva keskustelu oli parempaa. Työn mielenkiintoinen paino ei kuitenkaan ole täysin tässä teoriassa, vaan laajempi pohdinta kietoutuu normatiivisen teorian hyötyjen ympärille.

Normatiivisen teorian ensimmäinen hyöty tulee siitä, että se on teoria. Kuten muihinkin teorioihin, siihen liittyy monia menetelmällisiä ja empiirisiä havaintoja. Esimerkiksi deliberatiivisen teorian kautta käytössämme oli useita validoituja mittareita arvioidaksemme osallistumisen habermasilaisuutta. Lisäksi julkisen tilan käsitteestä on kirjoitettu jopa tietojenkäsittelytieteessä ja tätä kautta tutkimukselle syntyi ympäristö, johon se pystyi sitoutumaan. Tutkimus samassa tilassa olevien henkilöiden tietokonevälitteisestä viestinnästä on ollut varsin hajanaista ja aiheiltaan jopa poppivaa. Normatiivisen teorian kautta sille muodostui kuitenkin mielekäs ympäristö; hajanaisen tutkimuksen sai kursittua kasaan.

Käyttöliittymätutkimus ei ole vain empiiristä, vaan myös konstruktiivistä Рvaihtoehtoisia tietokonelaitteita ja ohjelmia luovia. Normatiivisen teorian toinen hyöty onkin nimenomaan konstruktiiviselle tutkimuselle. Konstruktiivisessa tutkimuksessa isoimpia haasteita on perustella tehtyjä valintoja Рmitä on aina useita. Miten tietynlainen käyttöliittymäongelma voitaisiin ratkaista mielekkäästi? Normatiivinen teoria auttaa rajaamaan kaikista mahdollisista suunnitteluvaihtoehdoista merkittävimmät teorian kannalta. Samaan aikaan se voi tukea löytämään uusia inspiraation lähteitä, kun muiden alan tutkijoiden työt voivat puhutella työtäsi selvästi Рjopa siinä tilanteessa, että heidän sovelluskohde teorialle saattoi olla etäinen.

Tosin, normatiivinen teoria pakottaa myös tuomaan esille arvot jotka on koodattu kaikkiin teknisiin järjestelmiin. Perinteisin esimerkki on Winnerin (1985) esilletuomat Mosesin sillat Рjotka olivat tehty niin mataliksi, ettei tiettyihin kaupungin osiin voinut julkisilla kulkea. Ongelma ei ole täysin tuntematon käyttöliittymätutkimuksessakaan. Arvojen mukaanottamiseksi kehittyi arvopohjaisen käyttöliittymätutkimuksen koulu ja siellä keskeinen kysymys on ollut miten eri käyttäjien arvojen välillä tasapainoillaan. Samalla tavoin normatiivisen teorian kohdalla voi hyvällä perusteella kysyä, millä perusteella tutkijat voivat vain ottaa tietyn normatiivisen aseman ja käyttää sitä tutkimuksessa. Tämä on erityisen huolestuttavaa jos tarkoituksena on muokata järjestelmää tarkemmin jotain arvoja noudatettavaksi Рonko se eettistä, että koehenkilöt joutuvat käyttämään järjestelmää, missä arvot ovat voimakkaasti läsnä. Minulla ei ole vielä oikeaa vastausta mahdollisiin arvoristiriitoihin, joten jätetään se tässä välissä oman pohdinnan varaan.

Tiivistelmä: mitä oikeastaan opimme?

Tiivistelmänä Рolen viettänyt nyt aika kauan pohdiskellen ja tutkien sanassa tilassa tapahtuvaa tietokonevälitteistä viestintää. Tämän tutkimuksen haaste mielestäni on sen teoreetiton luonne. Tutkimuksemme tavoite oli ehdoittaa mahdollisuuksia muodostaa teoriaa käyttäen normatiivisia teorioita ja näytämme, mitä mahdollisuuksia normatiivisilla teorioilla voisi olla käyttöliittymätutkimuksessa. Jäämmekin odottamaan mielenkiintoisia sovelluskohteita normatiivisille teorioille.

Blogipostaus pohjautuu CHI-konfferenssissa 2017 esitettyyn artikkeliin Nelimarkka, M., Salovaara, A., Semaan, B., & Jacucci, G. (2017). Theory-Driven Collocated CMC.¬†An English version is available in Rajapinta’s Medium.com and Matti’s personal blog.

Nyt malttia Kela – digitalisaatio ja julkinen hallinto

computer2bsays2bnoEräs työkaverini huomasi, että Kelakin on lähtenyt mukaan digitalisaatiopöhinään. Kela hienosti kuvaa, kuinka ensimmäisenä sujuvoitetaan prosesseja ja mietiään, miten tämä pitäisi tehdä; vasta tämän jälkeen asia digitalisoidaan. Samaan aikaan tekstistä kuitnekin huokuu tietty usko siihen, että palveluprosessia voi selkeyttää käyttämällä Suomessa tällä hetkellä ah-niin-trendikästä tekoälyä.

Jansson & Erlingsson (2014) kuvaavat sähköisen hallinnon (e-Government) kehittymistä Ruotsissa 1980-luvulta 2000-luvulle. Heidän mielenkiintoisin löydös liittyi useisiin yrityksiin automatisoida ja vähentää julkishallinnon asiakaspalvelun määrää: automaattiset prosessit eivät koskaan osaa tulkita sääntöjä rivien välistä sekä harkita kokonaisuutta. Toki voidaan sanoa, ettei kokonaistilanteen tulkinta ei ole ollut ennekään Kelan vahvuus, joten ehkä tässä ei menetetä mitään. On kuitenkin syytä pitää mielessä Janssonin & Erlingssonin huomio

The fact that technology does not discriminate, but treats everyone as equal, there- fore becomes both its biggest advantage and disadvantage‚ÄĒthe former because arbitrariness can be avoided and the latter because various needs, issues, or skills are not captured

Kelan kuvaama visio digitalisaation mahdollisuuksista todellakin tuo esille sitä, että vihdoinkin on mahdollista palvella kaikki samalla tavalla ja hehkutetaan, kuinka tämä on parannus nykytilanteeseen. Esimerkiksi Kelan esimerkki siitä kuinka työttömäksi jäänyttä autetaan tulevaisuudessa näyttää tietyn deterministisyyden lähestymistavassa:

Kone voi hahmottaa esimerkiksi työttömäksi jääneen ihmisen tilannetta jatkokysymyksillä. Tiedätkö, milloin uusi työ on alkamassa? Oletko kiinnostunut koulutuksesta? Haetko työttömyysetuutta?

Tarkoitukseni ei ole kuitenkaan vain nurista tai änkyröidä. Digitalisaatiossa on paljon mahdollisuuksia prosessien yksinkertaistamisessa. Esimerkiksi automaatisoitu veroehdotus on hyvä esimerkki siitä, miten kokonaista ajatusmaailmaa voidaan kääntää kerralla oikeaan suuntaan.

Kelassakin on varmasti prosesseja, joita voi automatisoida erittäin helpposti Рesimerkiksi opintotuen myöntäminen sekä lapsilisät. Näissä elämänvaiheissa ei yleensä ole muuten isoa kriisiä missä olisi syytä tarkastella koko yhteiskunnan turvaverkon toimintaa.

Mutta esimerkiksi ty√∂tt√∂myydess√§ – vaikka se perusturvan my√∂nt√§minen on helppoa – voisi olla hyv√§ksi samaan aikaan tarkastella el√§m√§√§ laajemmin. Olisiko syyt√§ yritt√§√§ hakea toimeentulotukea? Miten Kelan, kunnan ja ty√∂voimaviranomaisten palvelut muodostavat yhtenev√§n kokonaisuudeen? N√§it√§ kysymyksi√§ ei sellaisenaan voine j√§tt√§√§ automaation varaan, varsinkaan jos se toteutetaan mit√§ Neyland & M√∂llers (2016) kutsuivat if-then -s√§√§nn√∂ill√§, eli yksinkertaisiksi “jos t√§m√§ pit√§√§ paikkansa tee n√§in”-mallehin. Minun ei ole mit√§√§n syyt√§ ep√§il√§, etteik√∂ Kelan pyrkimys olisi t√§m√§n kaltaiseen automatisaatioon, koska kaikki ehdot voitaisiin silloin ottaa suoraan Kelan s√§√§ntelyst√§. T√§ll√∂in kyseess√§ on joustamaton ja etuk√§teen m√§√§ritelty l√§hestymistapa sosiaaliturvaan.

Toki tekoälyllä voisi tehdä paljon muutakin! Voidaan mielikuva-harjoituksena miettiä osittain ohjattua tai ohjaamatonta koneoppimista sosiaaliturvan osana: sen sijaan, että säädökset sanoisivat tarkkaan, mitä tukea annetaan ja kuinka paljon, annettaisiin tekoälylle hieman vapautta säädellä itseään. voitaisiin miettiä myös muuta tapaa lähteä (mihin uskon Kelan paljon puhuman tekoälyn perustuvan; siellä tuskin on taustalla esimerkiksi pyrkimystä tehdä laajaa koneoppivaa prosessia, joka korjaisi toimintaansa huomattuaan, mitä vaikutuksia sosiaaliturvapäätöksillä oli. (Ei, en pidä tätä hyvänä ideana; mutta venytellään vähän aivoja siitä, mitä tekoälyllä voisi saada aikaan.)

Tiivistäen: digitalisaatio ei mielestäni ole sellaisenaan hyvä tai paha. Kysymys on enemmän löytää tasapaino automatisoitujen palveluiden ja automatisoimattomien palveluiden kohdalla. Koen, että sosiaaliturva on eräs alue, missä tiukka byrokratia (joko algoritmisesti tai algoritmittomasti) ei välttämättä tuota yhteiskunnan kannalta parasta lopputulosta. Sen sijaan pitäisi pyrkiä arvioimaan kokonaiskuvaa ja rakentaa tukijärjestelmiä tämän kautta Рmissä ihmiset ovat usein parempia kuin mikään tekoälyllinen prosessi.

 

Hajaantukaa ‚Äď t√§√§ll√§ ei ole mit√§√§n n√§ht√§v√§√§ – algoritmikeskustelusta Suomessa (osa 1)

Screenshot 2017-03-15 11.42.35Algoritmit ovat kuuma aihe paitsi julkisessa keskustelussa, myös kansainvälisessä yhteiskuntatieteellisessä kirjallisuudessa. Pelkästään viime vuoden aikana julkaistiin ainakin kolme erikoisnumeroa, missä käsiteltiin algoritmeja ja niiden roolia yhteiskunnassa. Niin akateemisessa keskustelussa, kuin populaareissakin teksteissä on aistittavissa tietynlainen algoritmien musta magia. Algoritmit eivät ole mitään taikaotuksia jotka hallitsevat maailmaa. Algoritmi on Wikipedian ensimmäisen lauseen mukaan

yksityiskohtainen kuvaus tai ohje siitä, miten tehtävä tai prosessi suoritetaan; jota seuraamalla voidaan ratkaista tietty ongelma.

Maailma on siis täynnä digitaalisia ja vähemmän digitaalisia algoritmeja. Silti pääpaino tuntuu olevan digitaalisissa ympäristössä, kuten Kari Haakanan suomenkielisessä pohdinnassa, vaikka siinä taitavasti tuodaan yhteen jopa klassista teknologian tutkimuksen argumenttejä. On totta, että digitaalisuus todella muuttaa monia ympäröiviä tapahtumia ja algoritmit ovat digitaalisuudessa  keskeisessä roolissa. Vastaavia yksityiskohtaisia kuvauksia ja ohjeita ongelman ratkaisuun on kuitenkin  aina ollut olemassa.

Esimerkiksi Kelan viimeaikainen toimeentulotukisotku monine muotoineen her√§tt√§√§ varsin paljon kysymyksi√§ toimeentulotuen laskennassa k√§ytetyst√§ algoritmista. En tied√§ onko taustalla tietoj√§rjestelm√§n sotkut vai muuten prosessisuo, mutta julkisuuteen nostetut esimerkit ‚Äď kuten tarve my√∂nt√§√§ henkil√∂lle sentin toimeentulotuki maksusitoumusten saamiseksi eteenp√§in¬† ‚Äď kertovat, ett√§ ‚ÄĚalgoritmi‚ÄĚ ei nyt oikeastaan toimi erityisen j√§rkev√§sti. Ehk√§ t√§ss√§ tullaan keskeiseen huomioon, jota jo Jansson & Erlinngsson (2014)¬†havaitsivat jo aiemmasta tutkimuksesta: haasteena digitaalisissa (sek√§ ei-digitaalisissa) algoritmeissa on s√§√§nt√∂jen joustamattomuus ‚Äď usein todellinen maailma ei sopeudu tiukkaan algoritmin ajattelemaan muotoon.

Tässä kohtaa ehkä voi huokaista helpotuksesta, algoritmit ovat kuin todella tarkkoja byrokraatteja. Mutta missä sitten piilee digitalisaation suuri mullistus? Miksi algoritmit ovat niin tapetilla yhteiskuntatieteellisessä kirjallisuudessa ja miksi niistä vouhkotaan (juuri nyt) niin paljon?

On toki totta, että digitaalisten palveluiden myötä me kaikki altistumme mahdollisesti uudenlaiselle, näkymättömälle byrokratialle ja vallankäytölle. Uutta ehkä on, että nyt päätöksentekijänä voi olla joku kasvottomalta näyttävä järjestelmä (noh, en tiedä onko se Kela yhtään parempi esimerkki kasvollisesta järjestelmästä). Mutta, kuten useimmiten, kaiken takaa löytyy kuitenkin ihminen. Algoritmi on aina ihmistoimijoiden tuottama väline, joka toteuttaa ihmistoimijoiden suunnitteleman prosessin. Teknologia-alan demografian perusteella tuo ihmistoiija on melko varmasti valkoinen mies, vaikkei tosin keski-ikäinen. Ja tässä nyt ei ole mitään uutta taivaan alla, valitettavasti. Jyllääväthän valkoiset (keski-ikäiset) miehet monessa muussakin yhteiskunnan päätöksenteon koneessa.

Yhteiskuntatieteellinen mielenkiinto algoritmeihin selittyy niiden tuoreudella. Kyseess√§ on konkreettinen uusi ‚ÄĚesine‚ÄĚ, jota m√§tki√§ tutkimusmenetelmill√§ ja ajatuksilla. Ja tuoreet aiheet usein her√§tt√§v√§t tutkijoiden mielenkiintoa, koska ne ovat uusia ja tuoreita. Toki on tutkimukselle my√∂s tarvetta. Kuten Kitchin (2017) huomauttaa, kriittist√§ tutkimusta algoritmeista on v√§h√§n ‚Äď varsinkin verrattuna kaikkeen muuhun algoritmitutkimukseen esimerkiksi tietojenk√§sittelytieteess√§ ja insin√∂√∂ritieteiss√§.¬†Pohdinkin siis,

  • Miten julkisessa keskustelussa k√§ytet√§√§n sanaa algoritmi ja mit√§ sill√§ oikeastaan tarkoitetaan?
  • Miten perinteiset vallank√§yt√∂n muodot soveltuvat algoritmien kritisoimsieen ja mit√§ uutta algoritmit tuovat esimerkiksi perinteiseen byrokratian ajatukseen?
  • Voisimmeko silti koettaa olla nostamasta algoritmia kultaiselle jalustalle ja sen sijaan purkaa mit√§ oikeastaan tarkoitamme sill√§?

Postailen kevään aikana enemmän ajatuksiamme tästä aiheesta ja käsittelemme tematiikkaa myös meetupeissamme.

Infrastructures and publics – notes from Conference in Siegen

I attended the First Annual Conference 2016 Infrastructures of Publics ‚ÄĒ Publics of Infrastructures to gain some more insight about the most current thinking in Europe around topics like platforms, society, and algorithms. The University of Siegen organized this conference as they have a new center of excellence around these themes.

Putting it all together

I’ve tried to do some categorization and choose highlights from the conference, but before moving to these smaller bits, I think it’s worth to say something about the whole conference. Throughout the journey of the conference, it became apparent terms such as infrastructures and the public have various meanings. Their focus on infrastructures focused surprisingly lot on physical things to my taste, but give insights e.g., to archeology research (not that far from coding, actually) and enablers for digital interaction. The public was developed primarily from media scholarship.

If I understood it correctly, the center of excellence aims to mingle these two approaches together, to create some ideas how infrastructures and publics interact and shape each other. Sadly, these people seem more prominent in media and culture studies, which I don’t follow that actively, and are publishing less in my favorite venues (CSCW). I do hope that these ideas will move towards the CS people as well, they (we?) tend to forgot these type of research far too often.

Politics and infrastructures

There were several presentations focused on the political aspects of using various tools and infrastructures. So, a huge collection to come here.

Christopher Le Dantec presented his work around using sensors for the public participation. Sadly, I had already read his work in CSCW/CHI domain (e.g. the biking case), and thus the presentation had less interesting novelty aspects. Fundamentally, he has instrumented city bikers to map routes they use and used the data in collaborative design sessions to develop new routes for bikers. He did, however, use a word I have not heard before data literacy. Sadly, there was not a clear definition of this and thus I’m inclined to consider this in similar way computational literacy – just recently under criticism by Matti Tedre and Peter J. Denning.

The more interesting presentation was by M. Six Silberman, a Ph.D. computer science now working in German labor union on new platforms for work. He presented work on Turkopticon, a platform which manages the reputation of those putting out tasks in Mechanical Turk. The idea of this is to balance the current platform by providing those employed through it also insights about their employers. I really like this thinking as it shows how information technology can be used to challenge the society (created by other IT researchers) and try to find balance in platforms.

Finally, Hagen Schölzel presented the concept of communication control, more applied in the business or public relationships literature. The idea behind communication control is actions are planned before hand behind the curtains to shape the communication towards hoped directions; it is precise but does not look like it. Such idea can be applied to various social computing applications, where their interaction is often more strategic than it seems.

Studying the app ecologies

Carolin Gerlitz and Fernando van der Vlist have made an interesting study about the applications types which emerge to support the primarily platform, e.g., in the case of Twitter, all the various Twitter-based applications out there. They concluded that there are at least three application types

  1. strategic engagement, where applications aim to utilize the various forms of data in the app
  2. enhancing functionalities, where applications improve the existing platform functionalities
  3. innovative apps, which add new novel ways to use the application.

These relate further to the grammar of actions, which tell more about how applications are supposed to be used. These relate to the APIs and various rules related to the platform. Finally, the examination fo the extended applications describe the grammar in rather a clear manner.

Archeology and infrastructures

J√ľrgen Richter presented how the cabinets used by archeologist also have shaped the direction of the research domain as a whole. For example, the early focus to classify objects based on their materials have directed research towards different ages, like stone age. The organization of the cabins has become, almost accidentally, materialized politics. I started to think what similar type of things might exist in fields I’m familiar, and suspect that the overuse of demographic variables to explain phenomena might be such historic relic, passed over generations and still shaping how we examine human activity in various social processes.

Furthermore, he presented an interesting temporal observation: as the archaeology collection is generated over generations, the current curator collaborates with the previous curators and aims to understand their logic of data categorisation and storing. To adapt this idea to more digitalised area, programmers collaborate with all the previous coders with the aim to understand what the heck is going on. Naturally, this collaboration might be difficult: the previous actors might be out of reach, i.e., in another company or even passed away.

I’m grateful for the travel grant from the Doctoral Programme in Computer Science at the University of Helsinki. This post has been crossposted to my personal blog.