Digitalisaatio arkkitehtuurisena innovaationa ‚Äď miten se vaikuttaa tutkimuksemme?

Nykyisin kukaan ei varmastikaan kyseenalaista digitalisaation merkitystä yhteiskunnassamme tai elämässämme. Rakkaalla lapsella on toki monta nimeä, tekoäly, algoritmi, tai ihan vain tietojärjestelmä. Yhteiskunnallinen muorros on haaste myös organisaatioille. Kuinka digitalisaatiota tulisi johdetaan ja onko vetovastuu tietotekniikkahallinnon, henkilöstöpuolen, liiketoiminnan vai markkinoinnin alueella? Asia on niin vaikea, että monessa organisaatiossa on päädytty luomaan uusi hieno tehtävä Chief Digital Officer. Tässä tehtävässä keskeisimpiä rooleja on yrittää napata kiinni tästä puuhasta.

Organisaatiot eivät ole ainoita, jotka kärsivät tästä ristiriitaisesta tilanteesta. Myös tieteen puolella on ollut jo pidempään kiivas keskustelu käynnissä aiheesta. Tutkimuksen ja opetuksen näkökulmasta tilanne on haastava: pitäisikö opetus keskittää johonkin laitokselle vai sirotella hajautetusti eri laitoksille? Mikä on tietojenkäsittelytieteen, yhteiskuntatieteen tai esimerkiksi kasvatustieteiden oppiaineiden rooli digitaalisuuden tutkimuskentällä? Ihan kuten organisaatioiden eri funktioiden, tieteenalojen väliin osuva touhu on usein hankalaa.

Miksi tämä on näin hankalaa?

Digitalisaation kotipesän löytäminen on hankalaa. Ilmiönä digitalisaatio muuttaa selvästi vaikuttaa moneen, mutta pohjimmiltaan ne ovat kuitenkin samanlaista. Esimerkiksi Kelan digitaalisen järjestelmä opintotuen hallintaan (joka oli olemassa jo silloin kun minä opiskelin!) on siihen klassiseen paperiseen opintotukilomakkeeseen verrattuna täysin uudenlainen tapa tuottaa palvelua. Samaan aikaan palvelun syvin olemus ei ole muuttunut: tuki myönnetään ehdot täyttävälle korkeakouluopiskelijalle ja sitten valvotaan opintopiste- sekä tulokertymien avulla sitä, kuka on oikeutettu niihin tukiin. Moni digitalisaation tuoma muutos on samanlaisia: keskeiset käsitteet eivät muutu, vaan se miten niiden kanssa toimitaan muuttuu.

Miten tätä digitalisaation tuomaa innovaatiota sitten voisi käsitteellistää? Henderson & Clark (1990) käsitteellistävät innovaatioista nelikenttää. On radikaaleja innovaatioita kun kaikki muuttuu ja inkrementaalisia innovaatioita kun asiat kehittyvät, mutta ne eivät käsitteellistesti muutu vaan vaihvistuvat. Lisäksi he huomioivat kaksi muuta innovaatiotyyppiä: modulaarisen innovaation, jossa käsitteistö kehittyy, mutta käsitteiden yhteys välineeseen pysyy samanlaisena. Esimerkkinä he käyttävät siirtymää analogisesta lankapuhelimesta digitaaliseen lankapuhelimeen: sykäyksien sijaan alettiin siirtämään nollia ja ykkösiä. Viimeinen ja mielestäni mielenkiintoisin innovaation esiintymisasu on arkkitehtuurillinen innovaatio, missä keskeiset käsitteet ja niiden takana olevat teoriat eivät muutu, mutta niistä muodostetaan jotain uutta ja mullistavaa. Esimerkiksi ensimmäinen iPhone oli esimerkki arkkitehtuurillisesta innovaatiosta: siinä ei varsinaisesti ollut insinöörityön osalta mitään radikaalisti uutta ja jopa sen käyttöliittymäideologia oli tutkijoiden tiedossa. Mutta järjestelmänä iPhone yhdisti selaimen, puhelimen, tekstiviestit, Internetin sekä kosketusnäytön uudeksi kokonaisuudeksi.

Hendersonin ja Clarkin (1990) artikkeliin on viitattu noin 10,000 kertaa. Selväsi tutkijoihin on vedonnut ajatus innovaatiosta ei vain teknologian ja käsitteiden murroksessa, vaan niiden kyvykkyytenä koota ja yhdistää asioita toisella tavalla. No miten tämä kaikki sitten liittyy siihen, miksi uskon niin tutkimusmaailman kun organisaatioiden tuskailevan digitalisaation kanssa? Digitalisaatio on malliesimerkki laajasta arkkitehtuurillisesta innovaatiosta: väitän, että harvoin muutoksessa on kysymys siitä, että kaikki laitetaan uusiksi ja useammin siitä, että pitäisi miettiä uudelleen, miten asiat liittyvät toisiinsa uuden lähestymistavan kautta Рmutta ne keskeiset austalla olevat tajatukset eivät välttämättä muutu. Tällainen jää usein huomaamatta organisaatioissa, jotka sitten tulevat yllätetyksi maailman muuttuessa ympärillä. Henderson & Clark (1990) argumentoivat, että eräs syy on organisaatioiden kyvyttömyys havaita ja käydä keskustelua tästä murroksesta, koska toimintaa ohjaavat käsitteet pysyvät muuttumattomina. Tämä legacy-käsitteistö sokeuttaa organisaatioita ja ei pakota välttämättömään muutokseen. Kuten kirjoittajat toteavat (pohdittuaan mikropiirien muutosta):

But it may also be that learning about new architectures requires a different kind of organization and people with different skills. An organization that is structured to learn quickly and effectively about new component technology may be ineffective in learning about changes in product architecture.

Yliopistolla olemme vieläkin jumissa perinteisissä organisaatiorakenteessa. Tietysti iso henkinen ja ainakin Helsingissä fyysinenkin etäisyys yhteiskunnallisten aiheiden ja tietojenkäsittelytieteen kannalta on ilmeistä. Toisaalta, yhteiskuntatieteiden sisälläkin pidämme hyvin yllä tieteenalojen välisiä eroja, kuten on historiallisesti aina ollut. Opetuksen organisaatiota Helsingissä yritettiin kovasti muokata Ison Pyörän aikana, mutta ainakin mitä olen nähnyt ja jutellut joidenkin opiskelijoiden kanssa, vanhat tieteenalat ovat vielä selkeästi esillä erilaisten linjojen, opintosuuntien ynnä muiden myötä. Helsingissä ainakin gradu- ja väitöskirjaseminaarit ovat ensisijaisesti määritelty oppiaineiden, linjojen tai opintosuuntien kautta. Jopa poikkitieteellisissä organisaatioissa, kuten esimerkiksi Helsinki Centre for Digital Humanitissa (HELDIG näin tuttujen kesken) tehtävät määritellään olemassa olevien rakenteiden, kuten tiedekuntien ja laitosten, kautta.

Estääkö nämä vanhat rakenteet meitä näkemästä miten vaikka asiat ovat samanlaisia kuin aina ennen, ne tavat miten ne yhdistyvät toisiinsa ovat muuttuneet? Olisiko tarpeen aidosti miettiä uudelleen sitä, kuinka järjestäydymme opetuksessa ja tutkimuksessa keskittyen tutkimaan muutoksia asioiden välisissä yhteyksissä silloinkin kun käsitteet eivät ole murroksessa? Olemmeko tarpeeksi rohkeita tähän?

Eth√§n kiusaa Anna-Liisa Goritmia

Anna-Liisa on aina ollut nopea laskija. Hän haaveili ammatista ihmislaskijana. Päivät koostuisivat laskemisesta ja lopputuloksen perusteella tehdyistä helpoista päätöksistä. Esimerkiksi hän rakasti aina illalla laskea seuraavan aamun sateen todennäköisyyttä ja jos todennäköisyys oli yli 85%, ottaa aamulla mukaansa sateenvarjon.

Kuitenkin ensimmäisen loskakuuron jälkeen Anna-Liisa oppi, että sateenvarjo olisi hyvä ottaa myös jos sateen todennäköisyys olisi korkea ja lämpötila olisi vähän pakkasella, varsinkin jos on loppusyksy. Kesäisen raekuuron jälkeen Anna-Liisa oppi lisää: sateenvarjoa vaativia tilanteita voisi olla todella monia. Olisi hyvin vaikea muistaa listata nämä kaikki säännöt etukäteen eikä unohtaa jotain. Hän huomasi, että on oikeastaan vaikea tunnistaa näitä etukäteen, ihmisen mielikuvitus kun on rajoittunutta. Tämän takia Anna-Liisa oli hiukan masentunut: voisiko hänestä koskaan tulla ihmislaskijaa?

Mietitty√§√§n asiaa hiukan, Anna-Liisa huomasi, ett√§ koska h√§n on niin nopea laskija ei aina tarvitsisi luoda s√§√§nt√∂j√§. Anna-Liisa tarkkaili kaikkia naapureitaan ja sit√§, koska naapurit ottavat sateenvarjonsa mukaan. Samaan aikaan h√§n katsoi mit√§ edelt√§v√§n illan s√§√§ennusteessa olikaan tapahtunut ja muodosti n√§iden esimerkkien pohjalta itse s√§√§nn√∂t sille, koska sateenvarjo kannattaisi ottaa mukaan. Eih√§n sateenvarjon mukaanotto aina onnistunut t√§ll√§ tavalla. Kerrankin Anna-Liisa ei ottanut sateenvarjoa mukaan, huomasi ett√§ keskip√§iv√§lll√§ satoi kissoja sek√§ koiria ‚Äď ja huomasi, ett√§ moni h√§nen naapurinsa oli ottanut sateenvarjon mukaan. Mutta Anna-Liisa oppi t√§st√§ taas yhdenlaisen tilanteen, jossa sateenvarjo kannattaisi pit√§√§ mukana.

Anna-Liisa huomasi, että moni muukin halusi tehdä päätöksiä samalla tavalla. He lähettivät Anna-Liisalle paljon esimerkkejä, joiden pohjalta Anna-Liisa pystyi itse laskemaan mitä sääntöjä oikeastaan olikaan. Sitten he soittivat Anna-Liisalle miltä tilanne näytti juuri nyt ja kysyivät mitä nyt kannattaisi tehdä. Tämä oli mukavaa ja lisäksi siitä maksettiin varsin hyvin.

Anna-Liisaa pyydettiin esimerkiksi arvioimaan sopivia vuokrien hintoja, arvioimaan ihmisen terveyttä sekä päättämään keille kannattaisi antaa sairasvakuutus tai keiden työhakemuksia tulisi tarkastella lisää. Vuokrien hinnoissa hänellä oli käytössä tietoja alueen kaikkien asuntojen vuokratasot. Kaikki toimi erinomaisesti: Anna-Liisa oppi sääntöjä näiden esimerkkien avulla.

Kuitenkin er√§√§n√§ p√§iv√§n√§ er√§s Anna-Liisan asiakas tuli juttelemaan Anna-Liisan kanssa. H√§nt√§ mietitytti, ett√§ miksi kaikki yli 50-vuotiaiden ty√∂hakemukset on hyl√§tty ep√§illen, ett√§ onko Anna-Liisalla ongelmia vanhempien ihmisten suhteen. Anna-Liisa vakuutti, ett√§ ei ole. Anna-Liisa oli kuullut monista yhdysvaltalaisista tutkimuksista, jotka kertovat kuinka esimerkiksi etnisen tausta vaikuttaa palkkaamiseen. ‚ÄĚEhk√§p√§ ongelma on esimerkeiss√§ eik√§ minun laskelmissa?‚ÄĚ Anna-Liisa pohdiskeli asiakkaansa kanssa.

Tarinan pohdiskelua ja avaamista

Tarina ehkä eniten kuvaa, ettei minusta koskaan olisi tullut erityisen hyvä kirjailija. Samaan aikaan se tuo esille minua ärsyttävää jännitettä yksinkertaistaa algoritmisia järjestelmiä ihmisten mielessä, mediassa sekä myös akateemisessa keskustelussa. Tämä blogipostaus on vastine toisaalta YLEn uutiselle tekoälystä ja syrjinnästä ja toisaalta nimettömälle TikTok-käyttäjälle.

Ylen uutisessa ansiokkaasti havaitaan, että ihmiset ovat mukana monessa osassa algoritmejä.

Dataa analysoiva tekoäly harrastaa nimittäin syrjintää.

‚Äď Data koostuu siit√§, miten ihmiset ovat el√§neet t√§h√§n asti, ja my√∂s teko√§ly on ihmisten kehitt√§m√§, Ollila sanoo.

Emme pääse eroon yhteiskuntamme ennakkoluuloista, vääristymistä tai syrjintämekanismeista ulkoistamalla päätöksemme koneelle

Mutta jo kahden kappaleen päässä ihmisen oma toimijuus on kokonaan unohtunut algoritmikritiikistä:

Siksi esimerkiksi Google-haun on todettu tarjoavan naisille pienempipalkkaisia työpaikkailmoituksia kuin miehille (siirryt toiseen palveluun) (The Guardian), ja työhakemuksia perkaava algoritmi voi aiemmista valinnoista oppineena rankata pois kaikki yli 50-vuotiaat. Samoin voi toimia vakuutusyhtiön tekoäly, vaikka emme niin haluaisi.

Ongelmahan ei varsinaisesti ole työhakemuksia perkaava algoritmi, vaan me ihmiset. Tämän ei pitäisi olla yllätys kenellekään, joka on hiukan tutustunut aihetta sivuavaan tutkimukseen. Työmarkkinoiden syrjintää on kenttäkokeellisilla asetelmilla saatu mitattua jo pitkään (esimerkiksi Bertrand & Mullainathan, 2004). Kun työmarkkinoilla on syrjintää, niin tietenkin työmarkkinoista kerätyssä aineistossa on näitä samoja ongelmia. Toistamme aikaisempia syrjiviä käytänteitä uusin keinoin.

TikTokissa tuntuu olevan myös trendaavana postaustyyppinä tehdä kaksi erilaista videota: toisessa hiukan enemmän paljasta pintaa ja toisessa taas vaatetusta. Tämä on yritys käyttäjiltä ymmärtää videoiden suosiota ja tehdä johtopäätöksiä siitä, suosiiko TikTok videoita, joissa on paljaampaa pintaa. Tässä testaamisessa kuitenkin unohtuu ihmisten oma rooli ja järjestelmän vuorovaikutteinen luonne. Jos katson ja tykkään toisesta videosta, sitä kannattaa näyttää enemmän myös muille: se on jo koukuttanut minut, joten se voi koukuttaa muitakin. Luultavasti tämän testauksen jäljiltä lopulta päädytään puhumaan vähemmän suosittelualgoritmeistä ja enemmän siitä, mitä me ihmiset oikeastaan teemme.

Kärjistetysti usein algoritmit ovat kuin autoja. Kun mediassa puhutaan auto-onnettomuudesta, käytetään usein fraaseja kuten auto ajaa ihmisen yli. Unohdetaan kokonaan, että harvoin ne autot ajavat itseään, vaan ratin takana on ihminen. (Ainakin vielä, suurista toiveistani huolimatta.) Samalla tavalla algoritmisten järjestelmien takana on lopulta ihmisiä.

Mitä sitten?

Mielest√§ni yksi iso ongelma liittyy tapaamme k√§ytt√§√§ sanoja algoritmi ja teko√§ly kun oikeasti tarkoitetaan koodin, aineistojen ja ihmisten muodostamaa algoritmist√§ j√§rjestelm√§√§. Isoin ongelma usein syntyy juuri j√§rjestelm√§n luonteesta. Esimerkiksi P√§√§kk√∂nen et al. (2020) kommentoivat, ett√§ kaikissa j√§rjestelmiss√§ on aina ep√§varmuutta ja sen hallinta luo valta-asetelmia. T√§ll√∂in kun ihmisten tekem√§√§ p√§√§t√∂ksentekoa korvataan algoritmisella j√§rjestelm√§ll√§, ep√§varmuus palloilee uudelle paikalle koodin, aineiston ja ihmisten sekamelskassa. Ja t√§m√§ luo uusia mahdollisuuksia vallank√§yt√∂lle ja kaikelle sekavuudelle ‚Äď josta loppupeleiss√§ usein p√§√§dymme syytt√§m√§√§n algoritmia.

T√§m√§n takia kannustaisin ihmisi√§ jotka pohtivat n√§it√§ asioita enemm√§n miettim√§√§n, miten voisimme laajentaa k√§sitteellist√§ repertuaariamme ja tuoda esille kuinka monimutkaisesti algoritminen p√§√§t√∂ksenteko toimii ja mit√§ kaikkea siell√§ onkaan mukana. T√§m√§n esilletuonti on my√∂s t√§rke√§√§, jotta ihmiset ymm√§rt√§isiv√§t kuinka monissa teko√§lyj√§rjestelmiss√§ lopulta kyse on muiden ihmisten tuottaman ja j√§sent√§m√§n datan hy√∂dynt√§misest√§. Muistatko kuinka yll√§tyksen√§ viime syksyn√§ monille tuli, ett√§ puheentunnistuksessa osaa aineistoa k√§ytet√§√§n laadun tarkkailuun ja parantamiseen ‚Äď ja ett√§ t√§t√§ aineistoa kuuntelevat muut ihmiset. Kuka muukaan voisi onnistuneesti tehd√§ t√§m√§n? Tietokone on vain opetettu n√§ytt√§m√§ll√§ todella paljon esimerkkej√§ √§√§nest√§ ja vastaavasta tekstist√§, mutta ei se ole n√§in √§lyk√§s.¬†

Ehkäpä tulevaisuudessa myös osaamme suunnitella algoritmisia järjestelmiä niin, että niissä tulee paremmin esille järjestelmän kokonaisluonne. Kelalla on jo töissä monia virkakielen huoltajia. Milloin palkataan ensimmäiset algoritmisten järjestelmien luettavuuden parantajat?

 

A critical researcher’s uncritical manifesto: We should fall in love with the Internet again

Video art by Taru N Hohtonen
Video art by Taru N Hohtonen presented at the club.

This is a blog post version of Salla-Maaria Laaksonen’s festive speech at the WorldWideWeb 30-year anniversary party at Lavaklubi, Helsinki, March 12th 2019.

Dear friends of the World Wide Web,

As all of us here today, I definitely would not be here if it wasn’t for the world wide web.

I am a social media researcher, and I represent here a researcher collective Rajapinta that focuses on Internet research. However, my own story with the Internet goes far beyond my researcher career. It is a love story that started over 20 years ago, somewhere between IRC and Java-based online chats. Me and the world wide web grew together, from IRC to KissFM chats, from Jaiku to Twitter.

I believe this is a common story for many. A couple of years ago I attended a professional workshop on¬†influencing. The consultant asked us to write down the name of the biggest influencer of our life. Four out of seven participants, independently, wrote down ‚Äúthe Internet‚ÄĚ. I bet many of you would as well.

Indeed, the Internet has influenced our lives in many ways. It has changed the way we communicate, how we shop and how we read news. It has even changed the way we die or at least how me memorize those who have passed.

Yet, if you follow the current discussions of the Internet or read the news that concern social media, it becomes difficult to find these narratives of the technology that so profoundly changed our lives.

Instead, we talk about hate speech and cyberbullying, we talk about influencing elections, we talk about misusing personal data, and technology addiction. We hear politicians talk about ‘nettiv√§ki’, the ‘social media folk‚Äô to refer to online users who emotionally herd from one topic to another, who need to be civilized and controlled. Behind these claims there¬†often is the idea that the¬†technology is somehow making us humans do these things.

But I think there is so much more to the web than these alarmist notions. The web is also a marvelous place, where many forms of culture and communication live side by side.

And it is precisely this what makes it interesting for a researcher.

For a researcher the Internet is a bird-watching tower to climb into and see what is happening in the world, or sometimes a small campfire for storytelling.

In my own studies, I have climbed that bird-watching tower and sat on that campfire to study political discussions, online protests, social media influencers and social media stirs.

In all these what I see is genuine conversations, I see learning and I see peer support, I see real political debates.

This brings me to my title and my manifesto:

For a researcher, the world wide web is a sociotechnical system, constituted by both humans and technology.

This means the web is a technology that affords and limits what it’s users can do, but it is also constantly shaped by us users, it has to adapt to the practices we invent on that technology. So¬†it’s not that¬†the web can dictate¬†what we do with it, but we have¬†power to use it for own purposes.

That is why we can also shape the web and make it a something we want it to be.

We can keep alive the anonymous peer support from the 90s forums.

We can support the flat communication arenas, where a citizen can go and talk to a politician.

We can build the tower of Babel, where people speaking different languages around the globe can exchange ideas.

What I’m describing here sounds like the lost¬†Internet imaginary of the 90s, but it is still alive somewhere over there. I see it on my researcher’s table and I want to bring it back to the public communication as well.

So, I will end with a call for us all: to celebrate the 30 years, let’s¬†cherish the best parts of online communication and make sure we are acting so that our actions are building and rebuilding that web that exists in those early utopias. It is up to us to shape the web.

Happy birthday, dear WWW! We will take care of you!

Eettinen teko√§ly toteutuu punnituissa k√§yt√§nn√∂iss√§

Tekoälyä kuvataan maiden tai maanosien välisenä kilpajuoksuna, jonka ennakkosuosikkeina ovat USA ja Kiina, sekä haastajana EU. Asetelma näkyy EU-maissa tekoälystrategioina, ohjelmina ja rahoitusinstrumentteina.

Valtioneuvoston tuoreen eettistä tietopolitiikkaa koskevan selonteon mukaan Suomi tavoittelee kilpailuetua eettisesti kestävällä tekoälyn kehittämisellä ja soveltamisella. Päämääränä ovat hyödyt yhteiskunnalle ja tavallisille ihmisille, esimerkkinä maailman parhaat julkiset palvelut. Eettisyyttä tavoitellaan yhteisesti sovituilla periaatteilla, joita palveluiden kehittäjät ja ihmisiä koskevien tietoaineistojen hyödyntäjät noudattavat.

Eettisesti kest√§v√§n teko√§lyn viitekehys korostaa yleisi√§ periaatteita kuten l√§pin√§kyvytt√§, ihmiskeskeisyytt√§, ymm√§rrett√§vyytt√§, syrjim√§tt√∂myytt√§ ja ihmisarvoa ‚Äď ylevi√§ p√§√§m√§√§ri√§, joiden arvoa tuskin kukaan kiist√§√§. Periaatteita edistet√§√§n vetoamalla yritysten itses√§√§telyn tarpeeseen muuttuvassa teknologiaymp√§rist√∂ss√§, jossa ajantasainen s√§√§ntely lakien tai m√§√§r√§ysten avulla on vaikeaa.

Eettiset viitekehykset ovat erityisen tärkeitä silloin, kun sääntely tai yhteiskunnalliset oikeudenmukaisuuden normit eivät auta jäsentämään toiminnan reunaehtoja. Periaatteet rajaavat toimintatapoja, jotka ilmiselvästi rikkovat ihmisten itsemääräämisoikeutta tai tuottavat epäterveitä käytäntöjä arkeen ja työelämään. Yleisten periaatteiden ongelma voi kuitenkin piillä niiden tulkinnallisessa avoimuudessa. Se mikä on yhdelle yritykselle vastuullisuutta tai syrjimättömyyttä, ei välttämättä ole sitä toiselle.

Olemme seuranneet vuosien ajan eettisen tietopolitiikan vahvuudeksi tunnistetun MyData-ajattelun kehittymistä Suomessa ja kansainvälisesti. MyDatan, tai omadatan, perusajatuksen mukaan kansalaisten tulee saada hallita itseään koskevien tietojen käyttöä yrityksissä ja julkisella sektorilla. MyDatassa yksilöä ajatellaan digitaalisen talouden keskuksena ja datavirtojen keskipisteenä. Tavoitteena on haastaa henkilökohtaisten tietojen taloudellisen hyödyntämisen epätasa-arvoisuus siirtämällä kontrolli yrityksiltä ihmisille, joista aineistoja kerätään.

MyDatan edistäjät ovat tehokkaasti osoittaneet ihmiskeskeisyyden tarpeellisuuden datatalouden rakenteissa. Samalla ihmiskeskeisyyttä kuitenkin tulkitaan varsin joustavasti. Se voi tarkoittaa kansalaiselle tasavertaista osallistumista digitaaliseen yhteiskuntaan, yritykselle taas väylää päästä yksilön kautta käsiksi datajättien hallussa oleviin aineistoihin.

Mikä merkitsee yhdelle toimijalle kaikkien digitaalisten oikeuksien suojaamista, voi toiselle tarkoittaa mahdollisuutta tarjota maksukykyisille yksityisyyttä turvaavia palveluja. Ihmiskeskeisyydestä tulee eräänlainen musteläiskä, jossa toimijat näkevät omasta näkökulmastaan edistämisen arvoisia piirteitä.

Yleiset eettiset periaatteet eivät siis takaa tavoiteltujen yhteiskunnallisten seurausten toteutumista. Pikemminkin yleisellä tasolla pysyminen tuottaa epämääräistä puhetta ja mitäänsanottamia vastauksia. Siksi eettisiä periaatteita tulee konkretisoida ja koetella käytännössä. Jotta käytännön toimijat saavat tukea päätöksilleen, tarvitaan yksityiskohtaisia esimerkkejä palveluista, joissa eettiset periaatteet toteutuvat. Inspiraatiota eettisyyteen voi hakea myös yhteistä hyvää tuottavista digitaalisista palveluista kuten Wikipediasta, tai osuuskuntaperiaatteella toimivista yrityksistä.

Henkilökohtaisten tietojen käytön eettiset periaatteet toteutuvat, kun pääsy aineistoihin pohditaan huolellisesti ja samalla määritetään, kuka voi hyötyä aineistojen käytöstä ja miten. Keskeisiä ovat aineistojen käyttöön liittyvän päätöksenteon säännöt. Tässä ei itse asiassa ole mitään uutta. Vaikka teknologia kehittyykin nopeasti, henkilökohtaisten aineistojen käytön rajoja ja mahdollisuuksia on pohdittu vuosikymmenien ajan.

On päätettävä millaista aineistoa voi kerätä tai käyttää, mihin tarkoituksiin ja kenen toimesta, missä kulkevat hyväksyttävän ja vältettävän rajat, ja kuka niihin voi vaikuttaa ja millä aikavälillä. Vastaukset eivät kumpua yleisistä periaatteista, eivätkä ole yleispäteviä. Se mikä esimerkiksi liikenteen älypalveluissa on hyväksyttävää, voi terveyden kentällä olla eettisesti arveluttavaa.

Tämän ajan suuri haaste on digitaalisen ympäristön ohjaus ja hallinnointi. Pikemminkin kuin teknologian kehittäjien kilpajuoksusta, tässä on kysymys eri näkökulmien ja käytäntöjen huolellisesta yhteensovittamisesta. Kilpailuetua tulisi hakea eettisten tavoitteiden toteutumisesta eri alojen osaamisten risteyskohdissa. Siinä missä tekoälykisaajat näkevät maalin edessään, eettinen kestävyys löytyy pikemminkin yhdistelemällä kekseliäästi vanhaa ja uutta.

– –
Tuukka Lehtiniemi (@tlehtiniemi) & Minna Ruckenstein (@minruc).
Kirjoittajat ovat tutkijoita Helsingin yliopiston Kuluttajatutkimuskeskuksessa.

Kirjoitus on rinnakkaisjulkaistu Etiikka.fi-sivulla.

8 tapaa pyristell√§ irti digij√§ttien verkoista

https://www.flickr.com/photos/treehouse1977/36015094302/
Photo (cc) Jim Champion@Flickr

Tällä viikolla vietetään Mediataitoviikkoa. Myös digitaalisen yksityisyyden varjelemisen taidot ovat tärkeä osa nykypäivän mediataitoja. Sen kunniaksi Rajapinnassa päätimme koota muutaman helpon keinon parantaa verkkoyksityisyyttä ja vähentää digijättien valtaa elämässäsi.

  1. Tiukenna yksityisyysasetuksia. Monissa palveluissa voit itse valita, mitä kaikkea tietoja sinusta kerätään ja tallennetaan ja minne muualle kyseinen palvelu niitä saa jakaa. Esimerkiksi Googlessa voit määritellä, saako se tallentaa lokaatiotietoja, tietoja sovellusten käytöstä, tai nauhoittaa Google Assistentin kanssa käymäsi keskustelut. Facbookissa kannattaa säännöllisesti tarkistaa mitkä ulkopuoliset sovellukset saavat käyttää tietojasi. Omat mainosprofilointitietosi voi tarkistaa ja niiden asetuksia säätää. Voit esimerkiksi kieltää Facebookia näyttämästä sinua ystävillesi suosittelijana sellaisessa mainoksessa, jonka on tehnyt tykkäämäsi sivu.
  2. Rajoita sovellusten oikeuksia √§lypuhelimessasi. √Ąlypuhelimissa sovellusten k√§ytt√∂j√§rjestelm√§lt√§ saamia tietoja voi s√§√§t√§√§ sovelluskohtaisesti. iPhonessa kannattaa k√§yd√§ katsomassa puhelimen asetuksista hieman ep√§intuitiivisesti Screen Time -sovelluksen alle sijoitetut sovelluskohtaiset sis√§lt√∂- ja yksityisyysrajoitukset. Android-laitteissa asetusten alta l√∂ytyy kohta Sovellukset / Sovelluksen k√§ytt√∂oikeudet (Apps / App Permissions), josta voit s√§√§t√§√§ erikseen kunkin sovelluksen oikeuksia esimerkiksi mikrofoniin tai konktakteihin.
  3. Eristä digijätit. Monet alustapalvelut, erityisesti Facebook ja Google seuraavat upotusten avulla myös sitä, mitä teet muilla verkkosivuilla. Tätä voi estää esimerkiksi käyttämällä näitä palveluita eri selaimelle, jolla et tee muuta. Lisäksi on olemassa erilaisia selainlisäosia, jolla haluamansa palvelun voi eristää muusta selainkäytöstä. Esimerkiksi Firefoxin lisäosa Facebook Container eristää Facebookin muusta nettikäytöstä. Facebookia voi mobiilissakin pyörittää selaimella, tosin hieman Facebook-sovellusta kankeammin. Esimerkiksi yksityisviesteihin ei helposti pääse mobiiliselaimesta käsiksi.
  4. Estä seuranta. Selaimiin löytyy erilaisia lisäosia, joiden avulla kolmansien osapuolien palvelut (esim. mainostajat) eivät voi seurata jälkiäsi eri sivustojen yli. Esimerkiksi useaan eri selaimeen sopiva Ghostery tai Firefoxiin Lightbeam. Lightbeam myös havainnollistaa visualisaatioilla verkon jäljittäjien piilevää infrastruktuuria. Sama onnistuu kännykässäkin, esim. iPhonessa tämä tapahtuu sisällön lataamista estävän sovelluksen avulla (engl. content blocker, esimerkiksi AdGuard), jonka voi yhdistää eri selaimiin.
  5. Harhauta mainostajia. Monet palvelut ja lis√§osat harhauttavat mainostaloutta my√∂s ik√§√§n kuin sotkemalla profiilisi. Esimerkiksi Adnauseam-lis√§osa klikkaa jokaista selaimessasi n√§kyv√§√§ mainosta, mik√§ voi tehd√§ kohdennusprofiilistasi melkoisen sekamelskan. Omaa Google-historiaansa. Ruin My Search History -palvelu puolestaan tekee selaimellasi valtavan m√§√§r√§n omituisia Google-hakuja ja yritt√§√§ siten sotkea profiilisi ‚Äď ja tarjoaa hyv√§t naurut kaupan p√§√§lle. Kannattaa pohtia haluaako t√§llaisia palveluita k√§ytt√§√§ vai ei. Mainostus- ja hakuprofiilien sotkeminen on digiajan vastarinnan muoto, jonka k√§√§nt√∂puolena suositukset ja mainokset voivat muuttua oudoiksi tai jossain tilanteissa jopa kiusallisiksi.
  6. Käytä vaihtoehtoista hakukonetta. Esimerkiksi DuckDuckGo lupaa olla träkkäämättä käyttäjien tekemisiä. Se kuitenkin käyttää hyväkseen Googlen hakuindeksiä, eli eroon Googlen hakukoneesta et tällä tavalla pääse vaikka sen datankeruusta ehkä pääsetkin. Muita vaihtoehtoja on myös tarjolla, esim. ainoaksi eurooppalaiseksi hakukoneeksi itseään mainostava Qwant.
  7. Poista historiatiedot eri palveluista säännöllisesti. Jotkut alustat tarjoavat mahdollisuuden poistaa kerralla tai aikarajauksella historiatietoja esimerkiksi tehdyistä hauista. Esimerkiksi Googlen palveluista voi poistaa lokitietojaan data-asetuksista. Facebookin kohdalla tilanne on hiukan mutkikkaampi ellet ole valmis poistamaan koko tiliä, mutta vaihtoehtoisia keinoja on listattu esimerkiksi tässä iMoren artikkelissa. Yksi ratkaisu on myös tuhota tili ja luoda se sitten kokonaan uudestaan.
  8. Suosi vaihtoehtoisia viestintävälineitä. Digijättien palveluille on myös vaihtoehtoja, joiden puolesta voi puhua. Sosiaaliset verkostot liikkuvat hitaasti, mutta pikaviestien kohdalla vaihto onnistuu helpommin. Asenna puhelimeesi vaikkapa Signal ja käytä sitä viestittelyyn Facebookin omistaman WhatsAppin tai Facebook-viestien sijaan. Vaikka Facebook lupaa WhatsApp-viestien sisällön olevan päästä päähän salattuja, viestinnän metatietojen käytöstä ei luvata mitään.
  • BONUS: Vaalivahti Kev√§√§ll√§ 2019 Suomessa j√§rjestet√§√§n kahdet vaalit, mik√§ todenn√§k√∂isesti saa poliittiset mainostajat liikkeelle. Vaalivahti on Open Knowledge Foundation Finlandin tutkimusprojekti, joka ker√§√§ tietoa Facebookissa tehdyist√§ mainoskohdennuksista vaalien aikana. Asenna projektin tarjoama WhoTargetsMe-lis√§osa selaimeesi, niin pystyt seuraamaan kuka yritt√§√§ kohdentaa kaltaisiisi k√§ytt√§jiin ja lahjoitat samalla tiedot tutkimukselle.

Lopuksi: Tutkijan huomio

Digitaalisessa ympäristössä on tärkeää oppia ajattelemaan tekemisiään tiedonkeruun mahdollisuuksien ja seurausten kannalta. Jokapäiväisen tiedonkeruun estäminen, tai ainakin vähentäminen, voi myös ajatella olevan osa tämän päivän kansalaistaitoja. Samaan aikaan kansalaistaidoista puhumalla tulee korostaneeksi yksilön vastuuta omista tekemisistään tilanteessa, jossa tiedonkeruun tavat ja tiedon käytön seuraukset ovat vaikeasti hahmotettavia ja koko ajan muutoksessa, eikä ns. tavallinen tallaaja mitenkään pysy niiden perässä.

On hyv√§ pit√§√§ mieless√§ ett√§ palveluntarjoajan omat yksityisyysasetukset eiv√§t v√§ltt√§m√§tt√§ ole sit√§ milt√§ ne vaikuttava, ja esimerkiksi k√§ytt√§j√§n sijaintia on seurattu yksityisyysasetuksista riippumatta. Samoin profiilin tietoja poistaessa ja selaimen lis√§osia tai yksityist√§ selausmoodia k√§ytt√§ess√§ olemme palveluntarjoajan tai asiantuntijoiden vakuuttelujen varassa siit√§, ett√§ tiedot todella poistuvat tai ett√§ meit√§ ei todella en√§√§ seurata. Dataj√§ttien poistaminen omasta el√§m√§st√§ omalla aktiivisuudella on vaikeaa tai mahdotonta, jos haluaa pysy√§ jollain tavalla nyky-yhteiskunnan j√§senen√§ ‚ÄĒ monen palvelun k√§ytt√∂ ei esimerkiksi √§√§rimm√§isen suojatun Tor-verkon kautta edes onnistu.

Viime kädessä ratkaisua ongelmiin täytyy etsiä muualtakin kuin yksilöiden käyttäytymisen muutoksista. Tasapainoisempaa ja reilumpaa digiympäristöä odotellessa ei ole kuitenkaan pahitteeksi pitää verhojaan suljettuna ja oviaan lukittuna.

– –
Tekstiä varten on kerätty vinkkejä Rajapinta ry:n Slackissa. Tekstin ovat kirjoittaneet Salla-Maaria Laaksonen ja Tuukka Lehtiniemi ja sen ideointiin ovat osallistuneet Jesse Haapoja ja Jukka Huhtamäki.

Eliitti, mitä haluatte Рbulkkikoodareita liukuhihnalta vai digitalisaatiovelhoja?

Joukko ohjelmistoalan yrittäjiä, liikejohtajia ja muuta yhteiskunnan eliittiä argumentoivat (HS 18.6.), että Suomi tarvitsee enemmän koodareita. He esimerkiksi sanovat, että

Koodarivajeen paikkaaminen on suomalaisyritysten kasvun elinehto. Tarvitsemme lisää koodauksen koulutuspaikkoja, rohkeita uudelleenkouluttautujia, jatkuvaa osaamisen kehittämistä ja kansainvälisten huippujen aktiivista houkuttelemista Suomeen.

Samanlaista puhetta on kuulunut nyt vuoden-kahden ajan, esimerkiksi Elinkeinoelämän valtuuskunta EVA sekä valtavirran media (Talouselämä, YLE) ovat nostaneet esille täysin samaa kriisiä. 2010-luku ei ole ensimmäinen vuosikymmen kun koodarien puutetta on valiteltu. Nokian vaatimuksesta ohjelmistoalan koulutusta lisättiin merkittävästi aikanaan; tyydyttämään sen aikaista koodaripulaa. Kuitenkin, nyt on ilmeistä ettei koodarien koulutuksen lisääminen pelastanut matkapuhelinliiketoimintaa. Miksi olettaa siis, että tilanne olisi nyt toisenlainen Рja miksi ratkaisu olisi nimenomaan kouluttaa koodareita?

Digitaalinen murros on muuttanut ja tulee muuttamaan yhteiskunnan ja liike-elämän toimintaa. Digitaaliset työvälineet ja ympäristöt ovat läsnä yhä useamman työläisen arjessa. Myös niiden suunnittelu sekä kehittäminen koskettaa yhä useampia työpaikoilla.. Tietotekniikan pohdinta leviää aloille, joissa ei ole perinteisesti mietitty tietotekniikkaa kovinkaan paljon. Mutta tämä on eri asia kuin tarve koodareille!

Vaikka puhutaankin koodarivajeesta, niin ei ole selvää tarvitaanko lisää tietotekniikan koulutusputken läpikäyneitä koodareita. Myös HSn mielipidekirjoituksessa kuvataan tulevaisuuden koodareita varsin laajasti, kritisoiden nykyistä koulutustamme:

Ammattitaitoisten koodaajien joukko on tätä nykyä paitsi liian pieni myös liian homogeeninen. Suomi tarvitsee lisää alan koulutusta sekä uuden käsityksen siitä, kenelle koodaus on oikea ammatinvalinta. Tulevaisuuden koodareilta tarvitaan matemaattisen tai teknisen taidon rinnalle luovaa ja yhteiskunnallista ajattelua. Psykologiaa, sosiologiaa, palvelumuotoilua. Tulevaisuuden taiteilijat ja tuloksentekijät, innovaattorit ja muotoilijat ovat myös koodaajia.

Vastaus koodaripulaan ei siis voi olla vain koulutuksen kasvattaminen tietojenkäsittelytieteen ja tietotekniikan koulutuksessa. Koodaamisen ja ohjelmistotuotannon sijaan ensiarvoisen tärkeää olisi, että yhä useampi ihminen osaisi ottaa käyttöönsä teknologian suomia mahdollisuuksia. Digitaalisen murroksen keskeinen muutos on ymmärtää mitä voidaan automatisoida, tai kuten nykyaikana sanottaisiin, siirtää tekoälyn hoidettavaksi. Digitalisaation avulla voidaan luoda uudenlaisten tuotteiden ja palveluita, mutta missä koulutamme tällaisia taitoja esimerkiksi psykologeille, sosiologeille tai palvelumuotoilijoille?

Koulutukseksi ei uskoakseni riitä tietojenkäsittelytieteen sivuainekokonaisuus. Sen sijaan  tarvitaan uudenlaisia kurssikokonaisuuksia, jotka käsittelevät informaatioteknologiaa alan oman oppihistorian ehtojen mukaisesti. Esimerkiksi opettamani valtiotieteellisen tiedekunnan ohjelmointikurssi eroaa tietojenkäsittelytieteen laitoksen kurssista. Ohjelmoinnin opetus kytkettyy osaksi  yhteiskuntatieteen tutkimusta. Esimerkiksi luemme yhteiskuntatieteellisiä artikkeleita, joissa ohjelmoimalla on tehty mielenkiintoisia osia tutkimuksesta. Toivon, että kurssin lopulla opiskelijat eivät vain osaa ohjelmoida, vaan myös näkevät paremmin, miten ohjelmointia voidaan käyttää yhteiskuntatieteen kannalta mielekkäästi. Ohjelmointiopetuksen lisäksi olisi välttämätöntä muodostaa selkeitä kokonaisuuksia informaatioteknologian ymmärtämisen, analyysin ja hyödyntämisen ympärille. Rajapinta-kurssi on ollut hyvä avaus tässä, mutta onko se tarpeeksi?

Ymmärrän täysin huolen osaamisvajeesta. Kuitenkin osaamisvajeen käsitteleminen nimenomaisesti koodarien puutteena voi johtaa väärintulkintaan ongelmasta. Uskon, että ongelma ei ole vain tietotekniikan koulutuksen vähäisyys vaan myös digitalisaation ymmärtämistä käsittelevän koulutuksen puute muilla aloilla.

Viime vuosina ainakin Helsingin yliopistolla on otettu varovaisia ensiaskelia digitaalisuuden ymmärryksen tukemiseen. Askeleet ovat varmasti olleet hitaita ja varovaisia, koska digitaalisuus nykymaailmassa on poikkitieteellinen ilmiö: sen sijoittaminen tieteenalojen päällä toimivalle yliopistolle ei ole ollut helppoa. Kansainvälisestihän ongelma on ratkaistu perustamalla vanhoista tieteenaloista irrallisia rakenteita.

Ehkäpä koodarien massakoulutuksen sijaan kansakuntamme kannattaisi vihdoin panostaa digitaalisuutta käsittelevien poikkitieteellisien koulutus- ja tutkimusinstituutioiden pitkäjänteiseen kehittämiseen.

Hate speech detection with machine learning ‚ÄĒ a guest post from Futurice

This blog post is a cross-posting from Futurice and written by Teemu Kinnunen (edits, comments and suggestions given by project participants Matti and Salla from Rajapinta)

* *

(Foreword by Teemu Turunen, Corporate Hippie of Futurice)

The fast paced and fragmented online discussion is changing the world and not always to the better. Media is struggling with moderation demands and major news sites are closing down commenting on their articles, because they are being used to drive an unrelated political agenda, or just for trolling. Moderation practice cannot rely on humans anymore, because a single person can easily generate copious amounts of content, and moderation needs to be done with care. It’s simply much more time consuming than cut and pasting your hate or ads all across the internet. Anonymity adds to the problem, as it seems to bring out the worst in people.

Early this year the nonprofit Open Knowledge Finland approached [Futurice] with their request to get pro bono data science help in prototyping and testing a machine learning hate speech detection system during our municipal elections here in Finland.

The solution would monitor public communications of the candidates in social media and attempt to flag those that contain hate speech, as it is defined by the European Commission and Ethical Journalism Network.

The Non-Discrimination Ombudsman (government official appointed by our government to oversee such matters) would review the results. There are also university research groups involved. This would be an experiment, not something that would remain in use.

After some discussion and head scratching and staring into the night we [at Futurice] agreed to take the pro bono project.

A tedious and time consuming repetitive task is a good candidate for machine learning, even if the task is very challenging. Moderation by algorithms is already done, just not transparently. An example? Perspective API by Jigsaw (formerly Google Ideas) uses machine learning models to score the perceived impact a comment might have on a conversation. The corporations that run the platforms we broadcast our lives on are not very forthcoming in opening up these AI models. The intelligence agencies of course even less so.

So we feel there’s a need for more open science. This technology will reshape our communication and our world. We all need to better understand its capabilities and limitations.

We understand that automatic online discussion monitoring is a very sensitive topic, but we trust the involved parties ‚Äď specifically the non-discrimination ombudsman of Finland ‚Äď to use the technology ethically and in line with the Finnish law.

In this article [Futurice’s] Data Scientist Teemu Kinnunen shares what we have done.

Technology

The hate speech detection problem is very challenging. There are virtually unlimited ways how people can express thoughts including also hate speech. Therefore, it is impossible to write rules by hand or a list of hate words, and thus, we crafted a method using machine learning algorithms.

The main goal in the project was to develop a tool that can process messages in social media and highlight the most likely messages containing hate speech for manual inspection. Therefore, we needed to design a process to find potential hate speech messages and to train the hate speech detector during the experiment period. The process we used in the project is described in Fig. 1.

Figure 1: Process diagram for hate speech detection.

At first, a manually labeled training set was collected by a University researcher. A subset from a dataset consists of public Facebook discussions from Finnish groups, collected for a University research project HYBRA, as well as another dataset containing messages about populist politicians and minorities from the Suomi24 discussion board. The training set was coded by several coders to confirm agreement of the data (kappa > .7). The training set was used to select a feature extraction and machine learning method and to train a model for hate speech detection. Then we deployed a trained model that was trained with manually labeled training samples. Next, we downloaded social media messages from a previous day and predicted their hate speech scores. We sorted the list of messages based on predicted hate speech scores and send messages and their scores to a manual inspection. After the manual inspection, we got new training samples which we used to retrain the hate speech detection model.

Feature extraction

Bag-of-features

There are many methods to extract features from text. We started with standard Natural Language Processing methods such as stemming and Bag-of-Words (BoW). At first, we stemmed words in the messages using Snowball method in the Natural Language Toolkit library (NLTK). Next, we generated a vocabulary for bag-of-words using the messages in manually labelled training samples. Finally, to extract features for each message, we computed a distribution of different words in the message i.e. how many times each word in the vocabulary exists in the message.

Some of the words appear nearly in each message, and therefore, provide less distinctive information. Therefore, we gave different weights for each word based on how often they appear in different messages using the Term Frequency – Inverse Document Frequency weighting (TF-IDF). TF-IDF gives higher importance for the words which are only in few documents (or messages in our case).

Word embeddings

One of the problems in bag-of-features is that it does not have any knowledge about semantics of words. The similarity between two messages is calculated based on how many matching words there are in the messages (and their weights from TF-IDF). Therefore, we tried word embeddings which encodes words that are semantically similar with similar vectors. For example, a distance from an encoding of ‚Äėcat‚Äô to an encoding of ‚Äėdog‚Äô is smaller than a distance from an encoding of ‚Äėcat‚Äô to an encoding of ‚Äėice-cream ‚Äô. There is an excellent tutorial to word embeddings on Tensorflow site for those who wants to learn more.

In practice, we used the fastText library with pre-trained models. With fastText, one can convert words into vector space where semantically similar words tend to appear close by each other. However, we need to have a single vector for each message instead of having varying number of vectors depending on the number of words in a message. Therefore, we used a very simple, yet effective, method: we computed a mean of word encodings.

Machine learning

The task in this project was to detect hate speech, which is a binary classification task. I.e the goal was to classify each sample into a no-hate-speech or a hate-speech class. In addition to the binary classification, we gave a probability score for each message, which we used to sort messages based on how likely they were hate speech.

There are many machine learning algorithms for binary classification task. It is difficult to know which of the methods would perform the best. Therefore, we tested a few of the most popular ones and choose the one that performed the best. We chose to test Naive Bayes, because it has been performing well in spam classification tasks and hate speech detection is similar to that. In addition we chose to test Support Vector Machine (SVM) and Random Forest (RF), because they tend to perform very well in the most challenging tasks.

Experiments and results

There are many methods for feature extraction and machine learning that can be used to detect hate speech. It is not evident which of the methods would work the best. Therefore, we carried out an experiment where we tested different combinations of feature extraction and machine learning methods and evaluated their performance.

To carry out an experiment, we needed to have a set of known sample messages containing hate speech and samples that do not contain hate speech. Aalto researcher Matti Nelimarkka, Juho Pääkkönen, HU researcher Salla-Maaria Laaksonen and Teemu Ropponen (OKFI) labeled manually 1500 samples which were used for training and evaluating models.

1500 known samples is not much for such as challenging problem. Therefore, we used k-Fold cross-validation with 10 splits (k=10). In this case, we can use 90% sample for training and 10% for testing the model. We tested Bag-of-Words (BOW) and FastText (FT) (Word embeddings) feature extraction methods and Gaussian Naive Bayes (GNB), Random Forest (RF) and Support Vector Machines (SVM) machine learning methods. Results of the experiment are shown in Fig. 2.

Figure 2: ROC curves for each feature extraction – machine learning method combination. True Positive Rate (TPR) and False Positive Rate (FRP). The FPR axis describes the ratio of mistake (lower is better) and the TPR axis describe the overall success (higher is better). The challenge is to find a balance between TPR and FPR so that TPR is high but FPR is low.

Based on the results presented in Fig. FIGEXP, we chose to use BOW + SVM to detect hate speech. It clearly outperformed other methods and provided the best TPR which was important for us, because we wanted to sort the messages based on how likely they were hate speech.

Model deployment

Based on the experiment, we chose a feature extraction and machine learning method to train a model for hate speech detection. In practice, we used the score of the binary classifier to sort the messages for manual inspection and annotation.

We ran the detector once a day. At first, we downloaded social media messages from a previous day, then predicted hate speech (scored each message) and stored the result in a CSV file. Next, we converted this CSV file to Excel for manual inspection. After manual inspection, we got new training samples which were used to retrain the hate speech detection model.

During the field experiment, we found out that the model was able to sort the messages based on the likelihood of containing hate speech. However, the model was originally trained with more biased set of samples, and therefore, it gave rather high scores also for messages not containing hate speech. Therefore, manual inspection was required to make the final decision for the most prominent messages. Further measures concerning these messages were done by the Non-Discrimination Ombudsman, who in the end contacted certain parties regarding the findings.

Conclusions

In a few weeks, we built a tool for hate speech detection to assist officials to harvest social media for hate speech. The model was trained with rather few samples for such a difficult problem. Therefore, the performance of the model was not perfect, but it was able to find a few most likely messages containing hate speech among hundreds of messages published each day.

In this work, training -> predicting -> manual inspection -> retraining – iteration loop was necessary, because in the beginning, we had quite limited set of training samples and the style of the hate speech can change rapidly e.g. when something surprising and big happens (A terrorist attack in Sweden happened during the pilot). The speed of the iteration loop defines how efficiently the detector works.

Hackathons in Finland: free labor or open innovation?

Those following the Finnish technology scene have most likely observed that hackathons are this year‚Äôs megatrend. Everyone seems to be organizing a hackathon to get developers work with problems. You know, digitalisation is coming and everyone – public sector, private sector – need solutions that revolutionalize their operations using digitalisation … and hackathon is one of the trendy ways to bring digitalization gurus to the organization.

As an old-time hackathon participant, I have certain doubts about the whole concept, but as they are trendy, I think I should have something to say about them. I think we‚Äôre using hackathons in rather interesting ways ‚Äď such as supplement procurement of software in public administration – which have some merits. However, there are also cases which seem more as exploitation of participants. I will first shortly address the academic literature around hackathons after which I move to my rant about hackathons.

What do we know about hackathons?

Sadly, the scholarly literature is still emerging around the whole phenomena (and, will most likely be fully developed only after hackathons are passé). But, let’s give it a try anyway and see what we know about hackathon based on the existing works.

Overall, hackathons can be technology-oriented (i.e., focus on particular platforms) or focused on problems; in particular solving societal problems in issue-based hackathons (Lodato & DiSalvo, 2016). These issue-based hackathons can serve multiple purposes; Johnson & Robinson (2014) see these type of hackathons mixed of a procurement process, civic engagement and innovation taking place. What these findings indicate is that people have motivations beyond just hacking things together; like improving the society or to make their views more concrete.

In general, hackathons have three phases; pre-hackathon, hackathon, and post-hackathon. Hackathons are intense collaborations require participants to set up the goals of the hack and the means of collaboration, including work processes. The hackathon itself is a face-to-face activity where participants work together intensively, but can also seek help from others in the team and engage in iterative development and critique. The challenge with post-hackathon activities is to continue with the same team without the collocated settings, as often the hacks need more love to be ready (Lodato & DiSalvo, 2016, Trainer et al., 2016).

Matti’s rant about some recent hackathons and challenges in Finland

Hackathons are a great way to bring bright people together to create something cool. While the process itself is difficult ‚Äď as seen in above discussed literature ‚Äď it may be rewarding for participants. Furthermore, at least my experience, hackathons are a great way to get uninterrupted thinking time for a problem in a¬†creative manner. Having space, catering and time reserved in the calendar make it easy to focus on the problem.

In my view, the best hackathons have a somewhat open goal, allowing the developers to take different angles to the problem and demonstrate a variety of approaches, or to invent something new. Usually, the organizers in these cases seek out questions like ‚Äúwhat is possible?‚ÄĚ and in best cases contribute their skills and knowledge to help hackers. However, I‚Äôve recently seen the term hackathon being used for events I don‚Äôt think live up to my ideals.

Hackathons and challenges should not be cheap software development

Some hackathons are organized with a super-specific goal already defined. In the Open Finland Challenge this year, there was a challenge organized by Aller Media, with the goal of

We want to add location data for discussions by offering the user an opportunity to find relevant information about ones’ surroundings. [shortly translated]

When reading this, I think the jury already had a¬†rather clear vision of what they want to get as an outcome. Naturally, you can break the rules ‚Äď and I did ask this in when the challenges were made public ‚Äď it‚Äôs OK to hack whatever you want. But the jury will naturally read the challenge also. Just compare the challenge made by YLE in the same challenge competition

YLE has opened Elävä arkisto Data through an API. What interesting can you build using this information Рmaybe a new service to a special user group or something totally new? [shortly translated]

I think this challenge is open-ended, allowing participants to work in rather creative ways with the data. This aligns more within the ideas like open innovation, exposing the company to new ideas and approaches, and the creativity of hackathons. The former instead sounded to me that they might just want to consult a software company to produce a prototype of their idea and test it.

Hackathons and challenges should not be cheap consulting

The more recent case of this was from L√§hiTapiola Hack, where the goal was to develop ‚Äúnew digital solutions for inspiring young people to save and invest money. During the 5-day business hackathon teams will develop a new business or product concept for L√§hiTapiola (LocalTapiola), and finally pitch it to a jury consisting of L√§hiTapiola executives and business angels.‚ÄĚ

I think this is a nicely open-ended problem to hack with, giving rather free hands to work with. There is opportunity for true creativity. However, in a closer look at the hackathon policies showed that there was something fishy about the IPR.

In hackathons I‚Äôve attended, the IPR usually belongs to participants or its considered to become public domain. In this hackathon, instead, the conceptual innovations (whatever those are) are explicitly stated to belong to hackathon organizers if they emerge from data and materials by L√§hiTapiola. This means that these guys get free business consulting and ideas by buying food, space and 5,000 ‚ā¨ reward¬†for the winning team. If you want my ideas, you can just contact my consulting firm and we‚Äôll discuss my pricing in detail. Or as it seems, they are actually incubating some business opportunities and startups for them ‚Äď weirdly called a hackathon.

How to move forward?

I think the first step is to ensure we don‚Äôt call all things hackathons or challenges just to look trendy. If you aim to incubate startups or run public procurement, are you really doing a hackathon or something else which may have similar characteristics of a hackathon ‚Äď collocated fast-paced and solution centric work, aiming to produce some concrete outcome by the final day. I would even avoid the name hackathon for everything that‚Äôs not what I would call traditional hackathon, a day or two of hard work in open context ‚Äď just to make sure you don‚Äôt market the event in a wrong manner and get weirdos like me attending.

Second, if you’re sure you’re organizing a traditional hackathon, check that your hackathon task is semi-open to participation. Naturally, seasoned hackathon participants know how to read the tasks in an open manner and produce something cool. But it might be more inviting even for them if they can see that the organizer is truly seeking something novel and cool. Remember that hackathons, as I see them, should be much about open collaboration, open innovation and facilitating great minds to come together.

Finally, have some answer to the question ‚Äėwhat next?‚Äô If there are ideas the hackathon participants want to move further, how can your organization support those moving forward? I do have good experiences of these, including seed investment from organisations to develop the quick proof of concept into a true product and even launching those. And if you have plans like this, remember to tell about those beforehand and check you continue to support teams throughout the further process as well.

Acknowledgement

I was motivated to write this post thanks to the poor case from LähiTapiola hack and discussions with my nerd friends in the #fixme-irc channel. All views presented in this text are naturally my own and may not reflect the #fixme-community, the Rajapinta-community, my employer, my supporters, nor the future self.

Cross-posted to my personal blog, Science & Industry.

Vaihtoehtoja alustatalouteen?

Digitaaliset alustat ovat toimijoiden välisten vuorovaikutusten välittäjiä. Ne toimivat paitsi uusien markkinoiden luojina ja olemassa olevien markkinoiden tehostajina, myös näiden markkinoiden sääntelijöinä. Arvonluontia varten alustat keräävät ja käsittelevät laajasti tietoja alustan käyttäjistä. Motiivit markkinoiden luomiseen, sääntelyyn ja datan käsittelyyn juontuvat alustan omistuspohjasta ja organisointitavasta. Käsittelen lyhyesti näitä alustatoimijoiden rooleja sekä esittelen kaksi vaihtoehtoa alustojen organisointiin. Teksti perustuu puheenvuoroon Eduskunnan Tulevaisuusvaliokunnan kuulemisessa jakamistaloudesta ja alustataloudesta.

Alustat markkinoiden välittäjinä

Digitaaliset alustat toimivat vuorovaikutusten välittäjinä. Taloudellisessa mielessä alustoja ylläpitävät alustatoimijat tarjoavat tuotteita ja palveluita, joiden avulla markkinaosapuolet, esimerkiksi kuluttaja ja tuottajat, löytävät toisensa ja tekevät vaihtoja (Evans 2011). Alustatoimijat siis luovat markkinoita. Alustan arvonluonnin perusta on, että markkinaosapuolet eivät kohtaisi ilman alustan välittämiä markkinoita, ainakaan ilman korkeampia kustannuksia. Alustojen välittämät vuorovaikutukset voivat olla luonteeltaan monenlaisia: Uber välittää kyytien tarvitsijoiden ja kyytien tarjoajien vuorovaikutuksia, Googlen hakualusta taas välittää kolmen osapuolen vuorovaikutuksia kahdella eri segmentillä: yhtäältä haun käyttäjien ja internetin sisällöntuottajien, toisaalta mainostajien ja haun käyttäjien vuorovaikutuksia.

Alustatoimijat ovat usein yrityksiä, ja ne luovat markkinoita ja sääntelevät luomiaan markkinoita hyötyäkseen niistä taloudellisesti. Alustatoimijoiden harjoittama markkinoiden yksityinen sääntely voi kohdistua siihen, mitkä toimivat voivat kohdata markkinoilla, tai kuka pääsee käytännössä tarjoamaan tuotteita ja palveluita ja kenelle. Myös hinnoittelumallit, hinnat itsessään, tai alustan määrittelemistä säännöistä poikkeamisen sanktioinnit voivat olla sääntelyn kohteena. Keskeistä on pitää mielessä alustatoimijoiden harjoittaman markkinoiden sääntelyn pääasiallinen motiivi, liiketoiminnan ja arvonluonnin tukeminen. Tämä ei välttämättä ole yhdenmukainen esimerkiksi julkisen sääntelyn tavoitteiden kanssa. Luodessaan uusia markkinoita alustatoimijoilla on lisäksi ollut pyrkimys toimia normittamattomalle alueelle ja ratkoa juridiset tai muut seuraamukset jälkikäteen. Esimerkiksi Uberin ja Google Street View -palvelun toiminta on useissa maissa käynnistynyt ennen kuin niiden laillinen asema on ollut selvä.

Alustan toiminnallisuuksien kautta alustatoimijat voivat käyttää merkittävää vaikutusvaltaa suhteessa alustan käyttäjiin. Esimerkiksi Googlella on kannustin ohjata hakukonealustan avulla haun käyttäjien näkemiä hakutuloksia ja mainoksia niin, että sen keräämät mainostulot ovat mahdollisimman suuret (Rieder & Sire 2013). Koska alustojen tarkemmat toimintaperiaatteet eivät yleensä ole julkisia, tällainen vaikutusvallan käyttäminen on suurelta osin läpinäkymätöntä, ja käyttäjät voivat vain arvailla sen merkitystä erilaisissa alustoissa. Lisäksi alustan sisällä alustan teknisten toimintojen kautta tapahtuva sääntely ja vaikuttaminen ovat pakottavia siinä mielessä, että käyttäjillä on käytössään varsin vähän keinoja puuttua niihin.

Käyttäjistä kerätyn tiedon merkitys

Digitaalisten alustojen Рja ylipäätään informaatioteknologian Рominaisuus on, että erilaisten prosessien tehokkaan automatisoinnin lisäksi ne tuottavat informaatiota näistä prosesseista. Informaatioteknologia tekee aikaisemmin näkymättömistä asioista näkyviä, ja aikaisemmin mittaamattomista asioista mitattavia. Tärkeäksi kysymykseksi muodostuu, miten tätä tiedon tuottamiskykyä käytetään (Zuboff 2015). Mitä tietoa kerätään? Kuka käyttää kerättyjä tietoja? Mihin tarkoitukseen niitä käytetään? Kuka näistä päättää ja millä perustein? Alustojen järjestämien markkinoiden kannalta nämä kysymykset ovat oleellisia, koska alustojen arvonluonnissa keskeistä on alustan käyttäjistä kerätyn tiedon jalostaminen käyttäytymisen ennusteiksi, tuotteiden ja palveluiden personoinniksi ja kohdentamiseksi, suosituksiksi, sekä kysynnän ja tarjonnan ennakoinniksi ja yhteensovittamiseksi. Näiden tuottamiseksi tarvitaan tietoja ihmisten toiminnasta, ominaisuuksista ja valinnoista.

Jonkinlaista alustamarkkinoiden oletusmallia voisi tyypitellä suurten alustatoimijoiden toiminnan perusteella (Zuboff 2015). Alustatoimija pyrkii keräämään alustan käyttäjistä mahdollisimman paljon tietoa tuottaakseen mahdollisimman tarkkoja ennusteita käyttäjien ominaisuuksista ja tekemisistä. Ennusteiden perusteella alustatoimija muokkaa käyttäjän kokemaa palvelua ja suuntaa alustan välittämiä vuorovaikutuksia. Käyttäjät eivät usein itse osallistu itseään koskevien ennusteiden markkinoille Рesimerkiksi mainosrahoitteisten alustojen tapauksessa alustatoimija myy ennusteet mainostajille kohdentamisen muodossa. Ihmisen rooliksi ennusteiden tuottamisessa jää lähinnä alustapalvelun käyttöehtojen hyväksyminen, mikä ei usein käytännössä mahdollista merkityksellistä päätöksentekoa omien tietojen käytöstä (Solove 2013). Huomattavaa on myös alustatoimijoiden pyrkimys levittää alustan vaikutuspiiriä sen välittömien rajojen ulkopuolelle avoimeen internetiin (Helmond 2015), yhtenä tavoitteena laajemmat tiedonkeruun mahdollisuudet.

Vaihtoehtoja alustojen organisointiin?

Yllä esitetyn perusteella alustat kykenevät monin tavoin tehostamaan markkinoilla toimivien tuotteiden ja palveluiden kysyjien ja tarjoajien löytämistä ja kohtaamista. Tehostamiskyky perustuu merkittäviltä osin alustan käyttäjistä kerättyihin tietoihin ja niiden pohjalta tuotettuihin ennusteisiin. Vaikka alustat ovat tällä hetkellä pääsääntöisesti (suurten yhdysvaltalais)yritysten hallinnoimia ja tietynlainen tapa organisoida alustan välittämiä markkinoita on tällä hetkellä normi, eivät alustojen tuottamat hyödyt sinänsä edellytä tietynlaista alustan omistusrakennetta tai markkinoiden organisoinnin tapaa. Alustatalouden valtavirran ulkopuolelta löytyy vaihtoehtoisia kehityssuuntia, joista voi ajan oloon tulla merkittäviäkin uusia toimintamalleja. Kaksi esimerkkiä valottavat vaihtoehtoisia alustatalouden kehityssuuntia: osuuskuntapohjaisesti omistettu alusta sekä henkilödatan hallintaan erikoistuneet palvelut.

Ajatus osuuskuntapohjaisista alustoista on luultavimmin lähtenyt liikkeelle havainnosta, että ei ole mitään erityistä syytä sille, että taksi- tai siivouspalveluiden välittämiseen tarvittaisiin riskirahoitettu, kaupallisista lähtökohdista toimiva teknologiayritys. Saman palvelun voisi toteuttaa myös työntekijöiden yhdessä omistama osuuskunta. Alustojen käyttämän teknologian ei pitäisi olla niin kallista tai monimutkaista, että se olisi yhteistoiminnallisesti järjestäytyneiden alustan käyttäjien saavuttamattomissa. Osuuskuntamallin tavoitteena on, että alustan organisointi tapahtuisi nykyistä demokraattisemmin. Tällöin alustan käyttäjät osallistuisivat alustan toimintaa koskeviin päätöksiin ja alustan välittämien markkinoiden sääntelyyn, ja voisivat vaikuttaa esimerkiksi omiin työehtoihin ja palkkaukseen nykyisiä työnvälitysalustoja paremmin. Osuuskuntamuotoisen organisoitumisen mahdollistama läpinäkyvyys voisi lisätä alustan käyttäjien Рpalvelujen kysyjien ja tarjoajien Рluottamusta alustan toimintaan. Kysymyksiin tiedon keräämisestä ja käytöstä osuuskuntamuotoinen alusta tarjoaa vastaukseksi, että alusta päättää edelleen, mutta käyttäjät osallistuvat päätöksiin alustan omistajina.

Toinen suunta alustojen toiminnan muuttamiseksi ovat henkilödatan hallintapalvelut. Ne keskittyvät alustojen rooliin ihmisiä koskevan tiedon keräämisessä. Tällöin ajatellaan, että ihmisillä täytyisi olla mahdollisuus vaikuttaa nykyistä enemmän itseään koskevien tietojen käyttöön. Pragmaattisesti ajatellen kyse on datan ohjaamisesta ihmisille itselleen hyödyllisiin palveluihin. Moraalisesti kyse voisi olla itseisarvosta, eräänlaisesta digitaalisesta ihmisoikeudesta. Yksi kehityssuunta on luoda henkilödatan hallintaan välittäjä, uusi alustatoimija, jonka kautta käyttäjät olisivat suhteessa dataa käyttäviin ja kerääviin muihin alustoihin. Kysymyksiin tiedon keräämisestä ja käytöstä henkilötiedon hallintaan erikoistuneet palvelut tarjoavat ratkaisuksi käyttäjien lisääntynyttä vaikutusvaltaa alustojen kannalta keskeisen raaka-aineen, alustan käyttäjiä koskevan tiedon, virtoihin.

Osuuskuntamuotoisista alustoista on olemassa lähinnä kehitteillä olevia aloitteita, henkilödatan hallintapalveluista jo toimiviakin esimerkkejä, mutta valtavirtaa ne eivät ole. Näiden ja muiden vaihtoehtoisten kehityssuuntien liikkeelle saaminen riippuu alustojen toiminnassa keskeisistä verkostovaikutuksista. Alustojen käyttäjille luoma arvo kasvaa, kun niihin eri puolilta kytkeytyneiden toimijoiden määrä kasvaa. Yksi ehdotettu ratkaisu tähän ns. muna-kana -ongelmaan on alustojen yhteentoimivuus, jolloin esimerkiksi paikallisten osuuskunta-alustojen teknologia voisi toimia osuuskuntien rajojen yli.

Lopuksi: joitain ajatuksia

  • Voisiko alustoilla luoda tilaa uudenlaisille j√§rjest√§ytymisen muodoille, voiko yhteistoiminnallisesti organisoiduista alustoista synty√§ internet-ajan ty√∂v√§enliike?
  • Jos ihmisi√§ koskevan datan hallinta on alustojen ytimess√§, olisiko se toimiva regulaation kanava puuttua alustatalouden markkinoiden keskittymiseen tarvittaessa?
  • Onko oikeus hallita itse√§√§n koskevia tietoja digitaalinen ihmisoikeus? Jos on, tulisiko kansalaisille taata ty√∂kalut ja keinot itse√§√§n koskevan tiedon hallintaan?

Lähteet

Evans, David S. 2011. Platform Economics: Essays on Multi-Sided Businesses. Competition Policy International.

Helmond, A. 2015. ‚ÄúThe Platformization of the Web: Making Web Data Platform Ready.‚ÄĚ Social Media + Society 1(2).

Rieder, B., and G. Sire. 2013. ‚ÄúConflicts of Interest and Incentives to Bias: A Microeconomic Critique of Google‚Äôs Tangled Position on the Web.‚ÄĚ New Media & Society 16(2):195‚Äď211.

Solove, Daniel J. 2013. ‚ÄúPrivacy Self-Management and the Consent Dilemma.‚ÄĚ Harvard Law Review 126(7):1880‚Äď1903.

Zuboff, Shoshana. 2015. ‚ÄúBig Other: Surveillance Capitalism and the Prospects of an Information Civilization.‚ÄĚ Journal of Information Technology 30:75‚Äď89.

Alustatalous ja vallan uusjako

Perustuu puheenvuorooni Eduskunnan tulevaisuusvaliokunnalle jakamistaloudesta ja alustataloudesta.

Alustatalouden vaikutuksista käytävä keskustelu on pääsääntöisesti pohtinut taloudellisia, erityisesti verotukseen liittyviä vaikutuksia ja alustatoimijoiden lainmukaisuutta. Näiden lisäksi alustat teknologisina välineinä vaikuttavat myös arkipäiväisesti kansalaisten elämään. Esittelen lyhyesti tieteen ja teknologian tutkimuksen kirjallisuutta, jossa pohdiskellaan teknologiaa vallankäyttäjinä ja esittelen tätä kirjallisuutta alustatalouden näkökulmasta.

Teknologian kehittäminen vallankäyttönä

Tällä hetkellä alustataloudesta (platform economy) puhutaan paljon. Alusta yhdistää tuottajan ja kuluttajan ja tukee heidän arvoaan tuottavaa vuorovaikutusta (Evans 2011). Esimerkiksi kauppakeskusta voi pitää alustana. Digitaalisessa muodossa alustojen toiminta voi helposti ylittää perinteisiä sijaintiin ja aikaan liittyviä rajoitteita ja vähentää viestintäkuluja. Nämä muutokset ovat luonteenomaisia digitaalisille palveluille. Digitaaliset palvelut perustuvat teknologian soveltamiseen, ja sen vallan roolista on keskustelu paljon akateemisessa kirjallisuudessa.

Tieteen ja teknologian tutkijat (science and technology studies, STS) ovat korostaneet kuinka teknologiaa voidaan k√§ytt√§√§ vallank√§yt√∂n v√§lineen√§. Klassikko alalla on Winnerin (1985) essee ‚ÄúDo artifacts have politics?‚ÄĚ jossa pohditaan suunnittelijan mahdollisuuksia k√§ytt√§√§ valtaa k√§ytt√§ji√§ kohtaan. H√§nen yksi keskeinen argumentti on ns. Winnerin silta, joka oli niin matala ettei julkinen liikenne voinut kulkea sen ali – erist√§en n√§in osan kaupunkia autottomilta yhteiskuntaluokilta. Vaikka perusajatus onkin yksinkertainen, on samaa ajattelua sovellettu my√∂hemmin esimerkiksi algoritmien (esim. Gillespie 2012) osalta. Vaikkakin my√∂hempi kirjallisuus on korostanut, ettei kyseess√§ ole n√§in yksiselitteinen ‚Äúteknologian m√§√§rittelee vallank√§yt√∂n‚ÄĚ-ajatus, on ilmeist√§ ettei teknologian kehitt√§j√§n valtaa ole syyt√§ j√§tt√§√§ huomiotta alustataloudessa. Esimerkiksi ajankohtainen akateeminen kirjallisuus kysyy, onko Netflixin suosittelualgoritmien kehitys muuttanut kulttuurin m√§√§rittelyn humanistisesta ongelmasta insin√∂√∂ritieteiden ongelmaksi (Hallinan & Striphas 2016).

Keskeiset alustatoimijat vallankäyttäjinä

Alustataloudessa keskeinen ominaisuus on monopolisoituminen ja voittavan alustan ylivoimaisuus (esim. Brynjolfsson & McAfee 2014). Voittavien alustojen kehittäjät myös käyttävät valtaa Рtietoisesti tai tiedostamatta Рliittyen erityisesti käyttäjän ja alustan vuorovaikutukseen. Esimerkkejä vallankäytöstä ovat

  • Miten k√§ytt√§j√§ tunnistetaan verkossa (esimerkiksi: Facebookin vaatimus ‚Äúoikean nimen‚ÄĚ k√§yt√∂st√§ k√§ytt√§jien tunnuksissa 2012-2015)
  • Miten k√§ytt√§jien v√§list√§ vuorovaikutusta tuetaan alustan kautta (esimerkiksi: Uberin alustalla ei ole ollut mahdollista antaa juomarahaa kuljettajalle)
  • Mink√§ maan regulaation piiriss√§ k√§ytt√§j√§n oletetaan toimivan (esimerkiksi: Airbnb:n k√§ytt√∂ehtojen mukaisesti sovelletaan Irlannin lakia)

Kuten esimerkeistä havaitaan, valta ilmenee niin käyttäjän ja järjestelmän kuin käyttäjän ja käyttäjän välisessä vuorovaikutuksessa, koska alustat määrittelevät ihmisten välisen vuorovaikutuksen muotoja. Edelleen, valtaa käytetään erilaisin välinein: muunmuassa alustan omien sääntöjen muodossa, muokkaamalla alustan toimintatapaa tai määrittelemällä alustan ja kansallisen lainsäädännön suhdetta. Samoin vallankäyttöä voivat olla loppukäyttäjälle näkymättömät muutokset alustan toiminnassa, kuten muutokset haussa tai käyttäjän mittaamisessa. Esimerkiksi Facebook voi muuttaa käyttäjänsä tunnetilaa muokkaamalla uutisvirran sisältöä (Kramer et al. 2014). Koska muokkaus käyttäjältä salassa, nostaa esimerkki esille vallankäytön haasteita erityisesti läpinäkyvyyden osalta.

Vallankäytön kannalta on kuitenkin syytä korostaa, ettei monia yllä kuvattuja muutoksia välttämättä pidettäisi vallankäyttönä, vaan normaalina alustan kehittämisenä ja alustan liiketoimintamallien suunnitteluna ja verifiointina (vertaa Hallinan & Striphas 2016) Olen tietoisesti valinnut hyvin kriittisen näkökulman voidakseni korostaa vallan ja alustaratkaisuiden välistä yhteyttä. Tällä hetkellä useat kuluttaja-alustapalvelut (mm. Google, Microsoft, Apple, Facebook, Amazon) ovat yhdysvaltalaisia ja tällöin alustaa koskevat  päätökset tehdään Yhdysvalloissa. Samaan aikaan alustatalouden keskeinen lupaus on globaali toiminta ja mahdollisuus skaalautua kansainvälisiksi, kansallisvaltioita suuremmiksi kokonaisuuksiksi.

Mikä on kansallisvaltioiden rooli?

Yksittäisen pienen valtion, kuten Suomen, mahdollisuudet vaikuttaa ylikansalliseen alustatoimijaan ovat vähäiset. Suomessa on ehdotettu sääntöjen soveltavaa tulkintaa alustatalouden toimijoita kohtaan, jotta voitaisiin tukea alustatalouden syntymistä Suomessa (esim. Allisto et al. 2016). Uskon, että kansainvälinen ulottuvuus, erityisesti Euroopan unioni, on mielekkäämpi tapa pyrkiä muokkaamaan alustatalouden toimintaympäristöä. Ensinnäkin, eurooppalainen yhteinen markkina-alue (European Digital Single Marketplace) tukisi myös Suomessa syntyviä alustatoimijoita. Toiseksi Euroopan unioni on onnistuneesti Рvaikkakin hitaasti Рpystynyt haastavaan toimijoita, kuten Microsoft yli kymmenen vuotta kestäneessä rajapintojen avoimuutta käsitelleessä prosessissa. Haasteena alustatoimijoiden säännöstelyssä voi kuitenkin olla jähmeys ja hitaus (julkishallinnon lainsäädäntötyössä, esimerkiksi Nelimarkka 2011). Usein säännöstely on reaktiivista, kun alustatoimijat ovat jo muodostaneet oman toimintatapansa. Olisikin tärkeää nopeuttaa kykyä reagoida uusiin alustatoimijoihin ja toimintatapoihin.

Avoimia kysymyksiä

  • Miten alustatalouden vallank√§ytt√∂ n√§kyy ihmisten arjessa ja mit√§ regulaatiotarpeita t√§m√§ vallank√§ytt√∂ nostaa esille?
  • Miten regulaatio voi puuttua digitaalisiin alustatoimijoihin, jos tarvetta?
  • Kuinka eurooppalaisella tasolla voi kehitt√§√§ valtaa paremmin jakavia alustatalouden muotoja?

Viitteet

Evans, David S. 2011. Platform Economics: Essays on Multi-Sided Businesses. Competition Policy International.

Winner, L. (1985). Do artifacts have politics? In D. MacKenzie & J. Wajcman (Eds.), The social shaping of technology (pp. 26‚Äď38). Buckingham: Open University Press.

Gillespie, T. (2012). The relevance of algorithms. In Media Technologies: Essays on Communication, Materiality, and Society (pp. 167‚Äď194).

Hallinan, B., & Striphas, T. (2016). Recommended for you: The Netflix Prize and the production of algorithmic culture. New Media & Society, 18(1), 117‚Äď137.

Brynjolfsson, E., & McAfee, A. (2014). The second machine age: work, progress, and prosperity in a time of brilliant technologies. WW Norton & Company.

Kramer, Adam DI, Jamie E. Guillory, and Jeffrey T. Hancock (2014). “Experimental evidence of massive-scale emotional contagion through social networks.”Proceedings of the National Academy of Sciences 111(24), 8788-8790.

Ailisto, Heikki (toim.), Jari Collin  (toim.), Jari Juhanko (toim.), Martti Mäntylä (toim.), Sampsa Ruutu (toim.), Timo Seppälä (toim.), Marco Halén, Kari Hiekkanen, Kirsi Hyytinen,, Eeva Kiuru, Heidi Korhonen , Jukka Kääriäinen , Päivi Parviainen, Jaakko Talvitie: Onko Suomi jäämässä alustatalouden junasta? Valtioneuvoston selvitys- ja tutkimustoiminnan julkaisusarja 19/2016

Nelimarkka, M. (2011). Viranomaiset ja s√§hk√∂inen kansalaisosallistuminen – asiantuntijahaastatteluiden perusteella luotu aktantiaalinen malli. Hallinnon Tutkimus, 30(2), 158‚Äď169.