What does it mean to look at an algorithmic system as a game?

One of the games designed at the
2nd NOS-HS workshop for Nordic
Perspectives on Algorithmic
Systems. Photo copyright:
Salla-Maaria Laaksonen

It is not uncommon to hear the phrase “gaming the system” when someone fools an algorithm, but game as a metaphor can go beyond this perspective. Besides calculation, games are also about meanings and design.

We recently published an article called “Gaming Algorithmic Hate-Speech Detection: Stakes, Parties, and Moves” with Salla-Maaria Laaksonen and Airi Lampinen in the Social Media+ Society journal. In it, building on Erving Goffman’s work, we use the game metaphor to study the implementation of and subsequent resistance to an automatic hate-speech detection system. This blogpost describes my perspective on how games can be used as a metaphor to approach algorithmic systems from different angles. It is not meant as a comprehensive list, but more as an example of some of my thoughts on the topic during my Ph.D. journey so far.

I leave the concept of an algorithmic system intentionally vague here. You may consider recommender systems that suggest content to you in Netflix or Youtube as one type of an example, and social network services such as Facebook as another one. Generally, many of the information systems we interact with on a daily basis can be thought of as algorithmic systems. Thus, a tongue in cheek way of describing algorithmic systems in the context of this blog post could be “any information system that uses algorithms in a way that interests the author of this blog post”.

A game as a general metaphor

This is a category where I would group approaches such as the one which we took in the aforementioned article: if everyday life is (sometimes) a game, what can we learn if we approach it analytically as such? At least two different ways of understanding this type of approach can be identified: ideas about gaming the system, which often refer to behavior where someone is seen to “cheat” an algorithm and, on the other hand, following the rules, where individuals maximize their gains by acting in line with how they consider the designers of the system(s) wish them to act. Cotter’s article “Playing the visibility game: How digital influencers and algorithms negotiate influence on Instagram” wonderfully illuminates and also problematizes this distinction when discussing simulated and relational influence in terms of how Instagram influencers attempt to increase their visibility. Additionally, in her recent article “Algorithmic Experts: Selling Algorithmic Lore on YouTube”, Bishop notes that algorithms may be treated as ‘games’ by those attempting to figure out how they could be used to one’s advantage.

This line of consideration also raises questions about who or what are players in a particular game playing for. Companies specializing in search engine optimization are obviously trying to make their clients’ pages generate more traffic, and fans of musical groups might be trying to give the target of their fandom more visibility. We certainly do not play only for ourselves.

Algorithmic systems as world creating

For me, this second way of looking at algorithmic systems – algorithmic systems as world creating – entails looking at what kind of a ‘micro-cosmos’ of meanings the encounter with the system holds. In a game of chess, pieces have different values for the player based on their shape, but the relationship between the shape and the value only makes sense in the context of chess. Goffman points out that other encounters share this element of encounter-specific meanings: “It is only around a small table that one can show coolness in poker or the capacity to be bluffed out of a pair of aces; but, similarly, it is only on a road that the roles of motorist and pedestrian takes on full meaning”. Encounters, then, are world-creating events, and encounters with algorithmic systems are no exception.

Algorithmic systems have different kinds of transformation rules. The concept originates from Goffman, but I find Di Filippo’s use of it in his book chapter “MMORPG as Locally Realized Worlds of Action” easier to grasp than the original definition. Di Filippo states that these transformation rules refer to “the fact that individuals adapt resources to match the relevance of the situation”. In the aforementioned chapter, Di Filippo uses the concept to analyze how the world created in fantasy books is transformed to serve as a backdrop for a video game. When considering recommender systems, transformations occur on how behavior should be understood: clicks or other forms of behavior such as decisions to buy something are transformed into recommendations. If a couple of strangers in front of us in a café buy the same kind of coffees, we most likely do not consider it as a recommendation: however, it could very well be transformed into one based on the data collected from the transaction that happens between the clients and the café. We have followed this line of inquiry with Airi Lampinen in a study that drew from Goffman’s Frame Analysis by analyzing interviews of users and the head designer of a recommender system that used reading time to generate its recommendations.

Game-likeness from a design perspective

This third category – game-likeness in the context of design – focuses on the design perspective of algorithmic systems, or more specifically, what algorithmic systems that are not intended as games may share with the design of games. Algorithmic systems may incorporate elements that make them “game-like” or gamified. Instagram and Facebook quantify “likes” other users can give to one’s content, making these systems potentially more enthralling for their users. From a perhaps more serious perspective, Chan (2019) has pointed out in his article “The rating game: The discipline of Uber’s user-generated ratings” that the on-demand taxi service Uber’s customer reviews make drivers attempt to maximize positive ratings as their livelihoods may be on the line: get enough negative reviews and you won’t be getting customers anymore. 

Game design can also be a method that ties together some of the elements from the first two categories. In the 2nd NOS-HS workshop for Nordic Perspectives on Algorithmic Systems, Michael Hockenhull and Mace Ojala organized a session where the participants designed tabletop-games from empirical research cases Bastian Jørgensen, Cæcilie Laursen, Silja Vase and Rikke Torenholt were working on and were kind enough to let us use as starting points for the games. This activity was inspired by Dumit’s article “Game Design as STS Research”. The process of designing a game based on an algorithmic system forced one to consider both the calculative nature of interactions individuals may have with such systems and the ways these interactions could be transformed into a playable format.

Conclusion

As pointed above, games can be used as a metaphor to illuminate different kinds of things about algorithmic systems. The focus can be placed on the strategic nature of everyday dealings with them, the set of meanings interactions with them contain, or the design aspects that may mimic those we encounter in actual games. One could probably discover further perspectives that the concept of a game might afford, but these are the three that I have identified in the extant literature and found productive for my own research.

Jesse Haapoja is a Ph.D. student in Social Psychology at the University of Helsinki who has the privilege of working on topics such as the one presented here in the Kone Foundation funded project “Algorithmic Systems, Power, and Interaction”.

Thanks to Airi Lampinen for comments on a draft of this blog post

Ethän kiusaa Anna-Liisa Goritmia

Anna-Liisa on aina ollut nopea laskija. Hän haaveili ammatista ihmislaskijana. Päivät koostuisivat laskemisesta ja lopputuloksen perusteella tehdyistä helpoista päätöksistä. Esimerkiksi hän rakasti aina illalla laskea seuraavan aamun sateen todennäköisyyttä ja jos todennäköisyys oli yli 85%, ottaa aamulla mukaansa sateenvarjon.

Kuitenkin ensimmäisen loskakuuron jälkeen Anna-Liisa oppi, että sateenvarjo olisi hyvä ottaa myös jos sateen todennäköisyys olisi korkea ja lämpötila olisi vähän pakkasella, varsinkin jos on loppusyksy. Kesäisen raekuuron jälkeen Anna-Liisa oppi lisää: sateenvarjoa vaativia tilanteita voisi olla todella monia. Olisi hyvin vaikea muistaa listata nämä kaikki säännöt etukäteen eikä unohtaa jotain. Hän huomasi, että on oikeastaan vaikea tunnistaa näitä etukäteen, ihmisen mielikuvitus kun on rajoittunutta. Tämän takia Anna-Liisa oli hiukan masentunut: voisiko hänestä koskaan tulla ihmislaskijaa?

Mietittyään asiaa hiukan, Anna-Liisa huomasi, että koska hän on niin nopea laskija ei aina tarvitsisi luoda sääntöjä. Anna-Liisa tarkkaili kaikkia naapureitaan ja sitä, koska naapurit ottavat sateenvarjonsa mukaan. Samaan aikaan hän katsoi mitä edeltävän illan sääennusteessa olikaan tapahtunut ja muodosti näiden esimerkkien pohjalta itse säännöt sille, koska sateenvarjo kannattaisi ottaa mukaan. Eihän sateenvarjon mukaanotto aina onnistunut tällä tavalla. Kerrankin Anna-Liisa ei ottanut sateenvarjoa mukaan, huomasi että keskipäivälllä satoi kissoja sekä koiria – ja huomasi, että moni hänen naapurinsa oli ottanut sateenvarjon mukaan. Mutta Anna-Liisa oppi tästä taas yhdenlaisen tilanteen, jossa sateenvarjo kannattaisi pitää mukana.

Anna-Liisa huomasi, että moni muukin halusi tehdä päätöksiä samalla tavalla. He lähettivät Anna-Liisalle paljon esimerkkejä, joiden pohjalta Anna-Liisa pystyi itse laskemaan mitä sääntöjä oikeastaan olikaan. Sitten he soittivat Anna-Liisalle miltä tilanne näytti juuri nyt ja kysyivät mitä nyt kannattaisi tehdä. Tämä oli mukavaa ja lisäksi siitä maksettiin varsin hyvin.

Anna-Liisaa pyydettiin esimerkiksi arvioimaan sopivia vuokrien hintoja, arvioimaan ihmisen terveyttä sekä päättämään keille kannattaisi antaa sairasvakuutus tai keiden työhakemuksia tulisi tarkastella lisää. Vuokrien hinnoissa hänellä oli käytössä tietoja alueen kaikkien asuntojen vuokratasot. Kaikki toimi erinomaisesti: Anna-Liisa oppi sääntöjä näiden esimerkkien avulla.

Kuitenkin eräänä päivänä eräs Anna-Liisan asiakas tuli juttelemaan Anna-Liisan kanssa. Häntä mietitytti, että miksi kaikki yli 50-vuotiaiden työhakemukset on hylätty epäillen, että onko Anna-Liisalla ongelmia vanhempien ihmisten suhteen. Anna-Liisa vakuutti, että ei ole. Anna-Liisa oli kuullut monista yhdysvaltalaisista tutkimuksista, jotka kertovat kuinka esimerkiksi etnisen tausta vaikuttaa palkkaamiseen. ”Ehkäpä ongelma on esimerkeissä eikä minun laskelmissa?” Anna-Liisa pohdiskeli asiakkaansa kanssa.

Tarinan pohdiskelua ja avaamista

Tarina ehkä eniten kuvaa, ettei minusta koskaan olisi tullut erityisen hyvä kirjailija. Samaan aikaan se tuo esille minua ärsyttävää jännitettä yksinkertaistaa algoritmisia järjestelmiä ihmisten mielessä, mediassa sekä myös akateemisessa keskustelussa. Tämä blogipostaus on vastine toisaalta YLEn uutiselle tekoälystä ja syrjinnästä ja toisaalta nimettömälle TikTok-käyttäjälle.

Ylen uutisessa ansiokkaasti havaitaan, että ihmiset ovat mukana monessa osassa algoritmejä.

Dataa analysoiva tekoäly harrastaa nimittäin syrjintää.

– Data koostuu siitä, miten ihmiset ovat eläneet tähän asti, ja myös tekoäly on ihmisten kehittämä, Ollila sanoo.

Emme pääse eroon yhteiskuntamme ennakkoluuloista, vääristymistä tai syrjintämekanismeista ulkoistamalla päätöksemme koneelle

Mutta jo kahden kappaleen päässä ihmisen oma toimijuus on kokonaan unohtunut algoritmikritiikistä:

Siksi esimerkiksi Google-haun on todettu tarjoavan naisille pienempipalkkaisia työpaikkailmoituksia kuin miehille (siirryt toiseen palveluun) (The Guardian), ja työhakemuksia perkaava algoritmi voi aiemmista valinnoista oppineena rankata pois kaikki yli 50-vuotiaat. Samoin voi toimia vakuutusyhtiön tekoäly, vaikka emme niin haluaisi.

Ongelmahan ei varsinaisesti ole työhakemuksia perkaava algoritmi, vaan me ihmiset. Tämän ei pitäisi olla yllätys kenellekään, joka on hiukan tutustunut aihetta sivuavaan tutkimukseen. Työmarkkinoiden syrjintää on kenttäkokeellisilla asetelmilla saatu mitattua jo pitkään (esimerkiksi Bertrand & Mullainathan, 2004). Kun työmarkkinoilla on syrjintää, niin tietenkin työmarkkinoista kerätyssä aineistossa on näitä samoja ongelmia. Toistamme aikaisempia syrjiviä käytänteitä uusin keinoin.

TikTokissa tuntuu olevan myös trendaavana postaustyyppinä tehdä kaksi erilaista videota: toisessa hiukan enemmän paljasta pintaa ja toisessa taas vaatetusta. Tämä on yritys käyttäjiltä ymmärtää videoiden suosiota ja tehdä johtopäätöksiä siitä, suosiiko TikTok videoita, joissa on paljaampaa pintaa. Tässä testaamisessa kuitenkin unohtuu ihmisten oma rooli ja järjestelmän vuorovaikutteinen luonne. Jos katson ja tykkään toisesta videosta, sitä kannattaa näyttää enemmän myös muille: se on jo koukuttanut minut, joten se voi koukuttaa muitakin. Luultavasti tämän testauksen jäljiltä lopulta päädytään puhumaan vähemmän suosittelualgoritmeistä ja enemmän siitä, mitä me ihmiset oikeastaan teemme.

Kärjistetysti usein algoritmit ovat kuin autoja. Kun mediassa puhutaan auto-onnettomuudesta, käytetään usein fraaseja kuten auto ajaa ihmisen yli. Unohdetaan kokonaan, että harvoin ne autot ajavat itseään, vaan ratin takana on ihminen. (Ainakin vielä, suurista toiveistani huolimatta.) Samalla tavalla algoritmisten järjestelmien takana on lopulta ihmisiä.

Mitä sitten?

Mielestäni yksi iso ongelma liittyy tapaamme käyttää sanoja algoritmi ja tekoäly kun oikeasti tarkoitetaan koodin, aineistojen ja ihmisten muodostamaa algoritmistä järjestelmää. Isoin ongelma usein syntyy juuri järjestelmän luonteesta. Esimerkiksi Pääkkönen et al. (2020) kommentoivat, että kaikissa järjestelmissä on aina epävarmuutta ja sen hallinta luo valta-asetelmia. Tällöin kun ihmisten tekemää päätöksentekoa korvataan algoritmisella järjestelmällä, epävarmuus palloilee uudelle paikalle koodin, aineiston ja ihmisten sekamelskassa. Ja tämä luo uusia mahdollisuuksia vallankäytölle ja kaikelle sekavuudelle – josta loppupeleissä usein päädymme syyttämään algoritmia.

Tämän takia kannustaisin ihmisiä jotka pohtivat näitä asioita enemmän miettimään, miten voisimme laajentaa käsitteellistä repertuaariamme ja tuoda esille kuinka monimutkaisesti algoritminen päätöksenteko toimii ja mitä kaikkea siellä onkaan mukana. Tämän esilletuonti on myös tärkeää, jotta ihmiset ymmärtäisivät kuinka monissa tekoälyjärjestelmissä lopulta kyse on muiden ihmisten tuottaman ja jäsentämän datan hyödyntämisestä. Muistatko kuinka yllätyksenä viime syksynä monille tuli, että puheentunnistuksessa osaa aineistoa käytetään laadun tarkkailuun ja parantamiseen – ja että tätä aineistoa kuuntelevat muut ihmiset. Kuka muukaan voisi onnistuneesti tehdä tämän? Tietokone on vain opetettu näyttämällä todella paljon esimerkkejä äänestä ja vastaavasta tekstistä, mutta ei se ole näin älykäs. 

Ehkäpä tulevaisuudessa myös osaamme suunnitella algoritmisia järjestelmiä niin, että niissä tulee paremmin esille järjestelmän kokonaisluonne. Kelalla on jo töissä monia virkakielen huoltajia. Milloin palkataan ensimmäiset algoritmisten järjestelmien luettavuuden parantajat?

 

Julkisuuteen tuodun tiedon ja sen unohtamisen oikeutus – yleisen edun ja kehkeytymisen haasteita

Tutkija toimii osana laein säädeltyä yhteiskuntaa, joten tutkimukseen vaikuttavien lakien muutoksista on hyvä olla perillä – ne usein vaikuttavat tutkijoiden käytännön työhön. Tämän tekstin tarkoitus on osoittaa, että julkiseksi saatetun tiedon muuttuminen, esimerkiksi ryhmien ja identiteettien kehkeytymisen takia, on suuri laskennallisen yhteiskuntatieteen eteen avautuva eettinen rajaseutu. Yksittäisen tutkijan on tutkimastaan ilmiöstä riippuen hahmotettava erilaisten kehkeytymisprosessien luonnetta ja otettava huomioon, miten tutkittavien mieli ja sitä myötä tulkinnat saattavat ajan kuluessa muuttua.

cocoons-329070_1920

Taustaa

Online-aineistojen hankintaa ja käsittelyä formalisoi taannoin niin kutsuttu tietosuoja-asetus, lyhyemmin GDPR (Euroopan parlamentin ja neuvoston asetus luonnollisten henkilöiden suojelusta henkilötietojen käsittelyssä sekä näiden tietojen vapaasta liikkuvuudesta (yleinen tietosuoja-asetus), 2016). Nykyisen tietosuoja-asetuksen edeltäjä (Henkilötietolaki 1999) määritteli erikseen arkaluontoiset tiedot, joukossaan poliittinen suuntaus ja terveystieto. Koska arkaluontoisia tietojakin koskeva tutkimustyö oli aina sallittu, tutkijat määrittelivät sisäisillä säännöillään sen, millainen tieto täsmälleen käsitetään vaikkapa terveystiedoksi, ja miten sen arkaluontoisuuteen pitäisi käytännössä suhtautua.

GDPR-käsitteistössä arkaluontoisten, eli “erityisten henkilötietoryhmien” (9. artikla) käsittely ei ole kiellettyä sikäli kun se “koskee henkilötietoja, jotka rekisteröity on nimenomaisesti saattanut julkisiksi”. ”Julkisuuteen saatetulla tiedolla” on kuitenkin muuttuva luonne. Yksi tutkijan uudistunut vastuu tietosuoja-asetuksen ja eräiden muiden viimeaikaisten lakien ja tulkintojen jälkeen onkin hahmottaa, mikä milloinkin on se täsmällinen tieto, joka on nimenomaisesti saatettu julkiseksi. Kehkeytyvien ryhmien ja identiteettien tutkimuksen esimerkit osoittavat uudistuneita eettisten ja tulkinnallisten pohdintojen paikkoja.

Mikä halutaan unohtaa, mikä tieto milloinkin saatettiin julkiseksi ja mistä ei vielä tiedetä mitä julkisuuteen ollaan laittamassa tai miltä se voi tulevaisuudessa näyttää?

Jotkut tiedot on jossain vaiheessa saatettu julkisiksi, mutta myöhemmin ne halutaan poistaa julkisuudesta. GDPR:n tunnetuimpia seurauksia lienee niin kutsuttu “oikeus tulla unohdetuksi”; rekisteröidyn oikeus pyytää itseään koskevien tietojen poistamista. Tämä oikeus on linjassa tutkimuksen kanssa, jonka mukaan enemmistö online-tutkimuksen kohteista pitää epämukavana ajatusta, että heidän myöhemmin poistamaansa Twitter-viestiä käytettäisiin tutkimuksessa (Fiesler and Proferes 2018). ”Oikeus tulla unohdetuksi” onkin hyvä esimerkki siitä, kuinka lakeja kirjoitetaan ajan myötä uudelleen ja tulkitaan eri paikoissa eri tavoilla. Aiempi Suomen henkilötietolaki (1999) ei tunnistanut unohtamisen oikeutta lainkaan, jolloin tietojen poistamisen huomioon ottaminen jäi tieteen sisäisen ja jopa yksittäisen tutkijan pohdinnan varaan. GDPR:n (2016) mukaan henkilötietojen käsittely ei ole lainmukaista enää sen jälkeen kun rekisteröity on perunut suostumuksensa, erityisesti silloin kun rekisteröity on antanut suostumuksensa lapsena. Käsittelyn tulisi silti edelleen olla lainmukaista tutkimustarkoituksiin. Vaikka Fieslerin ja Proferesin (2018) tavoittamat tutkittavat eivät siitä pitäisikään, GDPR ei kiellä tutkijaa hyödyntämästä tutkimuksessaan myös poistettuja henkilötietoja (kuten poliittisen kannan ilmaisevia Twitter-viestejä). Muotoilullaan GDPR silti alleviivaa, että muissa konteksteissa moinen ei olisi mahdollista. Suomen tietosuojavaltuutettu ohjaa tutkijaa tässä linjauksellaan, että rekisteröidyllä ”ei ole oikeutta” poistattaa häntä koskevia tietoja, jos tieto on “tarpeen” “yleisen edun” mukaisessa tutkimustarkoituksessa[1]. Suomalaisessa tulkinnassa ”yleinen etu” menee näin yhdysvaltalaisten Fieslerin ja Proferesin tutkiman yksityisen edun edelle. GDPR ei kuitenkaan sitä edellytä.

Mitä tämä ”yleinen etu” sitten käytännössä tarkoittaa? COVID-epidemian pyörteissä voidaan nostaa esiin tietosuojavaltuutetun linjaama kansanterveyteen liittyvä yleinen etu, jota hahmottelee myös hiljattain säädetty, niin kutsuttu toisiolaki (Laki sosiaali- ja terveystietojen toissijaisesta käytöstä 2019). Tutkimukseen vaikuttavassa lainsäädännössä on kuitenkin määritelty muitakin yleisiä etuja. Niin kutsutut tiedustelulait, (Laki sotilastiedustelusta 2019), sekä (Laki henkilötietojen käsittelystä rikosasioissa ja kansallisen turvallisuuden ylläpitämisen yhteydessä 2018), hahmottelevat nykyään myös Suomessa rajalinjoja tutkijalle ja tutkittaville, joiden toimien voisi tulkita olevan kansallisen turvallisuuden kannalta kiinnostavia. Tämän tyyppiset tutkimusaiheet eivät ole suorastaan harvinaisia – esimerkkinä palvelkoon kapinallisryhmien mobilisoituminen onlinealustoilla, kuten (Käihkö 2020):n Ukrainaa käsittelevässä julkaisussa. Tutkijan luonnollisesti kuuluu pohdiskella esimerkiksi sitä, kuka kuuluu kapinallisryhmään, millä perusteella, ja millä perustein tutkittavat sekä tutkittava ryhmä valitaan ja identifioidaan. Asiaa mutkistaa se, että Internetissä myös leikitellään identiteeteillä (Lampinen, Lehtinen, and Cheshire 2014), ja toisaalta poliittisten ryhmien päämäärät muokkautuvat vähitellen diskursiivisessa prosessissa (Tilly 2002). On siis oltava sensitiivinen sille, kuinka vakaasti joku on saattanut julkiseksi tiedon siitä, että edustaa tiettyä poliittista kantaa. Tutkijan valinnoilla voi olla viime kädessä tuomioistuinseuraamuksia.

”Oikeus unohtaa” ei siis koske aivan kaikkia tilanteita, mutta lainsäädännön aluevaltaukset eivät ole pelkästään syy hämärtää tutkittavien poliittista kantaa viranomaisten pelossa. Laajemmin ymmärrettynä tutkija tarvitsee sensitiivisyyttä niin sille, miten tutkittava tutkimuksessa kullakin hetkellä nimetään, kuin sille, kuinka hänen annetaan suhtautua menneisyyteensä. GDPR:ssä esimerkkinä ”oikeudesta unohtaa” käytetään lapsena annetun suostumuksen peruuttamista. ”Success kid”-meemi on kuitenkin ambivalentti ääriesimerkki tapauksesta, jossa yhtä lapsuuden hetkeään ei voi koskaan unohtaa, koska siitä on tullut osa kulttuurista kuvastoa[2]. Nuorison tutkimista Internet-kontekstissa on aiemmin ansiokkaasti pohtinut esimerkiksi (Tikka 2014), mutta kuinka tutkijoina otammekaan huomioon aikuiset, joiden suhtautuminen julkisuuteen saattamaansa tietoon muuttuu? Esimerkkejä usein staattisiksi oletettujen tietojen muutoksesta voidaan nimetä kaksi. Poliittisen kannan muuttumisen esimerkkinä palvelkoon radikaalin suomalaisen vastarintaliikkeen perustaja, joka katsoo menneisyyttään katumuksella, ja on kirjan julkaisemalla tehnyt aiempiin ajatuksiinsa pesäeron (Holappa 2016). Toisen tyyppinen esimerkki ovat henkilöt, jotka haluavat jossain vaiheessa muuttaa usein staattiseksi oletettua ominaisuutta kuten julkiseksi saatettua ”sukupuoli”-kategoriaa. Julkisiin esimerkkeihin kuuluvat sukupuoltaan korjanneet suomalainen kirkkoherra Aalto[3] ja yhdysvaltalainen ex-urheilija-televisiotähti Jenner[4]. Jälkimmäiset kaksi eivät haastatteluissaan Holapan tavoin tuomitse aiempaa elämänvaihettaan. Näitä hyvin erilaisia esimerkkejä yhdistää kuitenkin se, etteivät ihmiset aina näytä kaipaavan ”oikeutta unohtaa”. He työstävät julkiseksi tiedoksi päätynyttä menneisyyttään ja nykyisyyttään osana ympäristöään. Tämä tutkijan tulee ymmärtää silloinkin, kun työstäminen saatetaan vain osittain julkiseksi.

Pohdinnat kiertyvät lopulta yhden ja saman aiheen ympärille: Online-tutkijalle tarjoutuva julkisuuteen saatettu tieto on muuttuvaa. Se voi olla alkujaankin tulkinnanvaraista, ja mahdolliset tulkinnat muuttuvat ajan myötä. Esimerkiksi kehkeytyvät poliittiset ryhmät eivät suinkaan ole alusta asti päämäärätietoisia ja stabiileja. Niiden ideologia ja jäsenyys on etenkin alkuvaiheessa yleensä huokoista; rajat ovat vasta kehkeytymässä (Abbott 2014, 2016; Tilly 1978). Toisaalta erityisesti marginaalista nouseviin identiteetteihin on kehkeytymässä intersektionaalisuutta, jossa eri lähtökohdista ponnistavat identiteetit löytävätkin yhteneväisyyksiä toistensa kanssa (Abbott 2001; Crenshaw 1989; Tormos 2017). Käymistilassa olevien identiteettien kantajat toisaalta käyvät läpi omaa identiteettiprosessiaan, toisaalta hahmottelevat niin henkilökohtaisen kuin ryhmäidentiteettinsä intersektionaalisuutta muiden identiteettien kanssa.

On selvää, että erityisesti kehkeytyviä ilmiöitä hahmottelevan tutkijan on aktiivisesti suhteutettava aineistonsa ja tutkimuksensa eritasoisten kehkeytymisprosessien vaiheisiin, sekä ”unohtamisen” ja ”yleisen edun” problematiikkaan. Vaikka johtopäätös olisi, että tänään on ”yleisen edun” mukaista tutkia transsukupuolisuuttaan 2010-luvun alussa kipuilleen nuoren online-viiltelykertomuksia, ei liene haittaa hahmotella silloin tällöin myös sitä, miten omien aiempien aineistojen tulkinta muuttuisi ajan myötä.

Viitteet

Abbott, Andrew. 2001. Chaos of Disciplines. University of Chicago Press.

———. 2014. The System of Professions: An Essay on the Division of Expert Labor. University of Chicago press.

———. 2016. “Social Order and Process.” In Processual Sociology, University of Chicago Press, 198–232.

Crenshaw, Kimberle. 1989. “Demarginalizing the Intersection of Race and Sex: A Black Feminist Critique of Antidiscrimination Doctrine, Feminist Theory and Antiracist Politics.” The University of Chicago Legal Forum: 139–68.

Fiesler, Casey, and Nicholas Proferes. 2018. “‘Participant’ Perceptions of Twitter Research Ethics.” Social Media and Society 4(1).

Henkilötietolaki. 1999. Finland. https://www.finlex.fi/fi/laki/ajantasa/kumotut/1999/19990523.

Holappa, Henrik. 2016. Minä Perustin Uusnatsijärjestön – Suomen Vastarintaliikkeen Ex-Johtajan Muistelmat. Into Kustannus.

Käihkö, Ilmari. 2020. “Conflict Chatnography: Instant Messaging Apps, Social Media and Conflict Ethnography in Ukraine.” Ethnography 21(1): 71–91.

Laki Henkilötietojen Käsittelystä Rikosasioissa Ja Kansallisen Turvallisuuden Ylläpitämisen Yhteydessä. 2018. Finland. https://www.finlex.fi/fi/laki/alkup/2018/20181054.

Laki Sosiaali- Ja Terveystietojen Toissijaisesta Käytöstä. 2019. Finland. https://www.finlex.fi/fi/laki/alkup/2019/20190552#Lidp446465968.

Laki Sotilastiedustelusta. 2019. Finland. https://www.finlex.fi/fi/laki/alkup/2019/20190590.

Lampinen, Airi, Vilma Lehtinen, and Coye Cheshire. 2014. “Media Choice and Identity Work: A Case Study of Information Communication Technology Use in a Peer Community.” In Communication and Information Technologies Annual, Studies in Media and Communications, Emerald Group Publishing Limited, 103–30. https://doi.org/10.1108/S2050-206020140000008020.

Tikka, Minttu. 2014. “Tutkija Nuorten Mediamaailmassa.” Nuorisotutkimus 32(3).

Tilly, Charles. 1978. From Mobilization to Revolution. Addison-Wesley.

———. 2002. Stories, Identities, and Political Change. Rowman & Littlefield.

Tormos, F. 2017. “Intersectional Solidarity.” Politics, Groups, and Identities 5(4): 707–20. https://doi.org/10.1080/21565503.2017.1385494.

 

[1] https://tietosuoja.fi/oikeus-poistaa-tiedot

[2] https://thetab.com/uk/2020/02/11/success-kid-meme-now-142830

[3] https://yle.fi/uutiset/3-11228614

[4] https://www.vanityfair.com/hollywood/2015/06/caitlyn-jenner-bruce-cover-annie-leibovitz

Lectio Praecursoria: Imagining the Data Economy

4839933569_7732d0cdf7_o
cc: Loguy

Lectio Praecursoria presented in the public defence of my PhD thesis “Imagining the Data Economy” on April 25th, 2020 at 12 noon, using remote connections via Zoom. The lectio has been lightly edited for online publication. Full PDF version of the PhD thesis is available online: https://www.utupub.fi/handle/10024/149155.

***

Learned Custos in Turku, my esteemed Opponent in Hamburg, ladies and gentlemen in the audience,

Before imagining the data economy, let us start with something from the past. The history of capitalism is a history of transforming things into resources and commodities. Consider the things we call natural resources. Coal was once a rock in the ground, and fisheries were fish in the water. Environmental historians1 remind us that coal and fish did not become resources by themselves. It took specific economic relations and specific cultural conditions for this to happen.

Digital data is also a thing that has become a resource. You can often hear the claim that data is like a natural resource2, but data is always created on purpose. There was never a time when data was like a rock in the ground; just strings of ones and zeros that somehow ended up on the hard drive or the Hadoop cluster. But the role of data as an economic resource has certainly changed. Our digital habitat is now built and run by firms that rely on data about people for the production of services and the creation of economic value.

The productive activities that involve data about people form something that we might call a personal data economy; a system that uses personal data to provide things that meet human needs.

A short while ago, it seemed that citizens will mostly derive agency and empowerment from new technologies that rely on data. With hindsight, it seems somehow naive that we were so optimistic about web 2.0 services, free as the radical new price, and the democratization of information production. We have begun to understand the relations of power that underlie these technologies, and their implications for our lives. We are increasingly aware of the potential that data has for social change, for surveillance, for economic exploitation, and for control of others and the self.

If things are transformed into resources and do not simply become resources, how was data turned into the resource it is today? How did we get to the data economy we now live with? 

The underlying technological change came with information technology. Already in the 1980’s, Shoshana Zuboff3 pointed out that information technology does not just automate, but it also informates, or produces information about what it automates. Today, a more common concept for this is datafication4. We use technologies to communicate, but those technologies also produce data about us communicating. We use technologies to search for things, but the same technologies also find us. Technologies help us travel and transfer things efficiently, but also make these movements visible and available for others.

Datafication technologies make the production and exchange of data possible. They are a necessary condition for today’s data economy. But an economy does not emerge from technology. Since Max Weber, sociological views of the economy have underlined that economies consist also of the social, cultural and institutional context in which production and exchange take place. This means that to take a sociological view of the data economy, we must pay attention to the socio-cultural and institutional context of data production and its economic use.

There is extensive literature on this context of the data economy, but it is not always framed as such. Surveillance studies, data studies and data privacy research have examined the imperatives driving the production of data, the arrangements that go into that production, and their implications for people as data subjects, citizens and consumers. 

Taken as an analysis of the data economy5, this literature reveals a distinct logic that underpins how datafication is used to produce things that meet human needs. Competition drives firms to collect more and more data about people’s lives. Simultaneously, people have become accustomed, or even resigned, to commercial surveillance practices. The markets in which exchanges of data happen are often business-to-business. These markets are not accessible for you and I. Also the formal institution of data protection seems to act as a sort of partner-in-crime6 here: it makes people responsible for their data, but data is not an easy object of individual calculations of costs or value. 

While we benefit in many ways from things provided with our data, we lack the means to make data serve our own ends on our own terms.

Could the data economy work in a different way? 

When conditions change, resources might turn into something else again. Consider coal and fish. Coal might turn from a resource into a lump of condensed carbon emission. Fish might become an unethical source of protein or an endangered species. Nothing inherent in coal or fish needs to change, if the socio-cultural and economic context changes.

Data could also be turned into a different resource, and the data economy could work in a different way. Many ideas about a different data economy are out there, and today you don’t even have to look very hard. 

Not long ago, a government minister in Finland launched a programme related to personal data by mobilising a Finnish cultural trope. He asked, “Can Moomin Valley challenge Silicon Valley?” You might be excited or disappointed to hear that this Moomin Valley of personal data is about data governance. But when the data economy only exists in a socio-cultural and institutional context, a different model for data governance is also a vision about how the data economy should work. Moomin Valley’s data economy is supposedly different from the one they run from Silicon Valley.

In the thesis, I examine an idea for data governance – and therefore, an idea for the data economy – that has been developed in the context of data activism. Here, I follow Stefania Milan and colleagues7, who suggest data activism as a heuristic device. This means I use data activism as a tool to examine engagement and political action that take a critical stance in relation to data and their distribution. 

My empirical case is MyData. It is based on a vision of a more just digital environment that is achieved when people have the right and the practical capability to manage their data. Framed in terms of the data economy, MyData envisions an alternative economic order, in which data is not just a resource for companies, but also something that people themselves decide about. When people manage data about themselves, it is thought to become available for novel ways to produce value.

The original research in the thesis was published in four articles that examine data activism from different standpoints. Two of the articles focus on end-user technologies that aim to realise the practical capability to manage data. The other two focus on investigating MyData as an emerging form of data activism.

To draw together this research, I adopt and adapt the theoretical concept of collective imagination.

I use the concept in two senses. The first one follows Charles Taylor8, who discusses collective imagination as that which helps people to make sense of the society around them. Taylor talks about social imaginaries, or widely shared understandings that are taken for granted and that have achieved general legitimacy. To put in short, the social imaginary concerns how things work in the world and what is normal. Following this line of thought, I consider the current social, cultural and institutional context of datafication as the dominant imaginary about the data economy.

The second sense in which I employ collective imagination is to examine alternatives to this dominant imaginary. According to Sheila Jasanoff9, collective imagination produces socio-technical imaginaries, or shared visions of a desirable future which are achievable by means of technoscientific advancement. Socio-technical imaginaries have a distinct forward-looking element to them. Sometimes they are counter-imaginaries to dominant ones; in these cases, they are visions of avoiding an undesirable future. Following this idea, I look at data activism as a source of alternative imaginaries about the data economy. A further insight gained with this theoretical lens is that there can be many concurrent imaginaries about the data economy within data activism, or alternatives within the alternative. They can embrace contested values and can work towards different – and divergent – futures. Examining these alternatives makes it possible to do research on different potential data economies that are contained within data activism.

There are three main research questions in the thesis. I will discuss them briefly one by one. The first research question concerns how alternative imaginaries developed in data activism compare with the dominant imaginary.

The issue at stake here is data agency. By this, I refer to the capacity to act intentionally in relation to personal data. In the thesis, I describe different forms of imagined data agency. The bottom line is that they concern economic participation. In the alternative data economy, people are imagined as agentic participants in managing their lives in situations that involve the production and use of personal data.

Data agency is imagined not only to turn people into economic participants, but also to make data move. When people control data, it is imagined to become available for businesses that currently lack access to it. This means that two different goals are combined here: empowerment of people in datafied times, along with new opportunities to do business with data.

The second research question concerns how different alternative imaginaries developed in data activism compare with each other. The answer is that while data agency is a shared goal, there are different notions about what data agency means. These different notions serve as entry points into different imaginaries about the data economy. I call these the market imaginary and the citizen imaginary

In the market imaginary, data agency is the capability to make choices on the collection, sharing, and use of personal data. People examine market offerings and use data to improve their lives, making personal data serve their own ends. Data governance happens by market forces, and efficient data markets guarantee desirable societal outcomes. The value expected from data is related to the improvement and efficiency of personalization, use experience and service provision. As I argue in the thesis, this imaginary does not so much question dominant economic rationales, but rather transforms them to serve the ends of data activism.  

The citizen imaginary, in contrast, views reliance on the market as dubious. In the citizen imaginary, data agency is rather the collective capability to participate in processes that determine how data is used. Data is viewed as a collective rather than individual resource, and outcomes for people collectively are brought to the foreground. This relies on explicit models for collective governance of the collective data resource. As I suggest in the thesis, this imaginary contains possibilities for novel ways of making data valuable, which are rooted in the good of the collective that produces and sustains the data resource.

The third research question of the thesis is, how can we identify and promote desirable imaginaries about the data economy?

Given the critical research on datafication, it seems justified that a researcher does not only observe attempts to shape a different data economy, but also participates in this shaping. But remaining committed to a critical position means that also the agendas and problem settings of data activism require critical attention. The four published articles that form the core of the thesis reflect different ways to engage with data activism in a manner that has been indicated by Bruno Latour: doing critique that does not only debunk, but also assembles. Throughout the research, my aim has been to produce knowledge that is relevant in a social scientific sense, and can also be relevant for data activism practice.

The answers to the question about desirability are far from conclusive. This is, after all, about imaginaries and potential outcomes. As I describe in the thesis, the market imaginary seems likely to expand to agendas beyond data activism. But reliance on individual market agency appears as a precarious effort to shape a desirable data economy. Given the nature of data as a resource and given the power relations in the data economy, the citizen imaginary seems like a more promising point of departure. 

What I suggest in the thesis as a desirable data economy imaginary is something like a synthesis. It builds on the notions of collective data governance and new, collective ways to make our data valuable. At the same time, to take hold of the broader collective imagination, it should attach onto things that already provide economic and social value with data. Collective forms of governance can regulate the use of our data as an economic resource, but this does not mean precluding the production of economic value. 

An imaginary about the data economy is not a recipe for building services or a model that can be implemented. It is rather a way of looking at the world and the relations between people and data, and the production of things that meet people’s needs. 

But different imaginaries lead to different material things, different technologies. Different technologies can have different societal outcomes. 

For data activism, the implication of this research would be to move beyond the individual as the locus of data control. Unlike us social scientists, data activists have the capability of putting together experimental data technologies and governance structures. It is important to experiment with different – and diverse – ways of forming resources based on data, different ways governing these resources, and different ways of relating and attaching these resources to the data economy that is already there.

How we collectively imagine makes a difference. Imaginaries matter and have consequences for the present and the future. 

Data technologies will continue to have implications for our lives, whether we want it or not. Their development is shaped by imaginaries about how the data economy functions and should function. Social-scientific scholarship has a role to play in shaping the data economy. It can identify and kindle those imaginaries that shape pathways towards a desirable digital environment, a data future that we would rather live in.

Professor Ingrid Schneider, I respectfully ask you, as the Opponent duly appointed by the Faculty of Social Sciences for my disputation, to present any criticisms you may have against my doctoral dissertation.

***

1 – Such as Jason Moore. For this particular argument, see for example: https://jasonwmoore.wordpress.com/2013/07/04/anthropocene-capitalocene-the-myth-of-industrialization-ii/ 

2 – For an elegant discussion on data vis-à-vis natural resources, see Kelly Pendergrast’s essay “The Next Big Cheap” in Real Life Magazine https://reallifemag.com/the-next-big-cheap/

3 – See Zuboff, S. (1985). Automate / informate: The two faces of intelligent technology. Organizational Dynamics, 14(2), 5–18. http://dx.doi.org/10.1016/0090-2616(85)90033-6 

4 – “Datafication” was introduced into social-scientific lingo by José van Dijck: van Dijck, J. (2014). Datafication, dataism and dataveillance: Big Data between scientific paradigm and ideology. Surveillance & Society, 12(2), 197–208. https://doi.org/10.24908/ss.v12i2.4776 

5 – This deserves more references than can be listed here. See Chapter 3 of my PhD thesis for a more thorough discussion on the social, cultural and institutional context of data production and data use: https://www.utupub.fi/handle/10024/149155

6 – This felicitous phrasing was first used by Sami Coll: Coll, S. (2014). Power, knowledge, and the subjects of privacy: Understanding privacy as the ally of surveillance. Information, Communication & Society, 17(10), 1250–1263. https://doi.org/10.1080/1369118X.2014.918636

7 – For discussion on data activism as a heuristic, see Milan, S., & van der Velden, L. (2016). The alternative epistemologies of data activism. Digital Culture & Society, 2(2), 57–74. https://doi.org/10.14361/dcs-2016-0205 

8 – See Taylor, C. (2002). Modern social imaginaries. Public Culture, 14(1), 91–124. https://doi.org/10.1215/08992363-14-1-91. For an extended discussion, see Taylor’s 2004 book with the same name. For an accessible overview and discussion on related literature, see Ruppert, E. (2018). Sociotechnical Imaginaries of Different Data Futures. An Experiment in Citizen Data. Erasmus University Rotterdam. https://www.eur.nl/sites/corporate/files/2018-06/3e%20van%20doornlezing%20evelyn%20ruppert.pdf 

9 – For an STS take on the topic of collective imagination, see Jasanoff, S. (2015a). Future imperfect: Science, technology and the imaginations of modernity. In: Jasanoff, S., & Kim, S-H. (Eds.) Dreamscapes of Modernity. Sociotechnical Imaginaries and the Fabrication of Power, 1–33. Chicago, IL: University of Chicago Press.

Koronavirus ja numeroiden tenho

https://www.flickr.com/photos/k0rry/8216995942/
(cc) Korry Benneth Flickr

Maailma on päätynyt poikkeustilaan uuden koronaviruksen vuoksi. Sen vaikutukset heijastuvat myös digitaaliseen arkeen ennennäkemättömällä tavalla. Digitaalisessa viestinnässä näkyy paitsi kansalaisten huoli, myös tarve järkeistää kriisiä numeroiden ja tilastojen avulla.

Keskeinen strategia globaalissa viranomaisviestinnässä on ollut epidemiatilanteeseen liittyvien numeroiden julkaiseminen: montako tartuntaa todettu, montako kuollutta, montako parantunutta. Samaan aikaan on alkanut käydä selväksi ja väistämättömäksi, että terveydenhuoltojärjestelmän haaviin osuu vain osa tartunnoista. Virusta löytyy myös täysin oireettomilta (esim. tutkimukset Hollannissa ja muualla) ja toisaalta monet tartunnan saaneet ovat vähäoireisia eivätkä siksi päädy hakeutumaan hoitoon.

Numeroiden julkaisu, niiden visualisointi kartalle ja kuvaajien piirtäminen on tärkeä ja luonteva tapa paitsi seurata epidemiaa, myös luoda kuvaa siitä, että tilanne on hallinnassa. Tätä toisintavat yhtä lailla niin viranomaiset, media kuin kansalaisetkin.

Lukuisat yhteiskuntatietelijät ovat kirjoittaneet numeroiden ja niihin perustuvan datan merkityksestä arjen ja yhteiskunnan hallinnassa, organisoitumisessa ja viestinnässä. Esimerkiksi tieteenhistorioitsija Theodore Porter [1] kirjoittaa luottamuksesta numeroihin yhteiskunnallisena käytänteenä, joilla rakennetaan objektiivisuutta ja puolueettomuutta. Samalla mittaukset ovat performatiivisia, rakentavia: ne luovat yhteiskuntaa, jota mitataan. Tämä pätee erityisesti esimerkiksi väestötiedon ja taloudellisen tiedon tuottamiseen [2]. Tieteenfilosofi Ian Hacking [3] kirjoittaa kriittisesti numerofetissistä: numeroita kerätään vain koska voidaan, mutta siitä huolimatta niitä aletaan käyttää ongelmanratkaisun välineenä.

Koronaviruksen tapauksessa lukuja käytetään helposti myös maiden ja alueiden keskinäiseen vertailuun. Sosiologi David Beer [4] muistuttaakin numeroiden usein kehystyvän paitsi havaintojen luokitteluun, myös kilpailuun kapitalismissa. Tässä tapauksessa kilpailu on kenties sitä, kuka maa pystyy parhaiten estämään taudin leviämistä. Mittaustavat kuitenkin vaihtelevat maittain ja ajankohdittain, mikä hankaloittaa vertailujen tekemistä. Reunaehdoista huolimatta numerot helposti alkavat elää omaa elämäänsä: karkaavat alkuperäisestä kontekstista ja tehokkaasti piilottavat sen, miten niitä on tuotettu.

Kiinnostavinta viime päivien verkkojulkisuudessa ovat olleet erilaiset rogue-tilastot, laskelmat ja kuvaajat, joilla erilaiset kansalaisyhteiskunnan toimijat ovat pyrkineet haastamaan virallista tilannekuvaa ja viranomaisten toimenpiteitä. Sekä suomenkielisessä että kansainvälisessä sosiaalisessa mediassa on tullut vastaan lukuisia twiittajia ja bloggaajia, jotka pyörittävät omia laskelmiaan siitä millä käyrällä koronatartuntojen kanssa mennään, montako kuollutta meillä on pääsiäiseen mennessä ja miten rajoituskeinot toimivat.

Nämä viestit ovat vakuuttavia ja vetoavia, vaikuttavat asiantuntevalta ja niitä jaetaan helposti. Viestit rakentavat teknologian taianomaisuuden ja suurten lupausten päälle [5,6], mikä tekee niistä pelottavan tehokkaita. Maallikko harvoin uskaltaa epäillä tai väittää vastaan tilastoille ja mallinnuksille.

Sama logiikka on toki läsnä viranomaisviestinnässä ja tieteellisessä viestinnässä, mutta ainakin tietoa tuottavilla tahoilla on takanaan ymmärrys epidemioiden luonteesta ja käytössään kansainvälisessä yhteistyössä valmistellut data ja vertaisarvioituun tutkimukseen perustuvat mallit. On vähän syitä olettaa, että maallikko pystyisi ajattelemaan tai löytämään jotakin sellaista, mitä asiantuntijat eivät. Tällaisessa tilanteessa myös tieto ja tilannekuva muuttuvat koko ajan, ja tuorein tieto on todennäköisesti juuri viranomaisten saatavilla.

Ehkä tässä tilanteessa olisi parasta siis jättää numerot ja visualisoinnit asiantuntijoille. Tämän ehdotuksen ovat muutkin verkossa jo esittäneet hieman suorasanaisemmin:


Disclaimer:
Koska verkkokeskustelu käy tällä hetkellä kuumana, todettakoon vielä että en ole itsekään epidemologi vaan verkkoviestinnän ja teknologian tutkija. En siis tällä kirjoituksella kritisoi viranomaisten tekemää tapausten seurantaa tai seurantatapoja, vaan huomioin yhteiskuntatieteellisestä näkökulmasta yleisemmin kiinnostavaa numeroiden ja tilastojen käyttötapaa globaalin kriisin keskellä.

Kirjallisuutta;
[1] Porter, T. M. (1995). Trust in Numbers: The Pursuit of Objectivity in Science and Public Life. Princeton: Princeton University Press. https://doi.org/10.1017/CBO9781107415324.004

[2] MacKenzie, D., Muniesa, F., & Siu, L. (2007). Do Economists Make Markets? On the Performativity of Economics. Princeton and Oxford: Princeton University Press.
[3] Hacking I. (1990) The Taming of Chance. Cambridge: Cambridge University Press.
[4] Beer, D. (2016). Metric power. Metric Power. https://doi.org/10.1057/978-1-137-55649-3
[5] Beer, D. (2019). The Data Gaze: Capitalism, Power and Perception. London: SAGE. https://doi.org/10.4135/9781526463210
[6] Bowker, G., & Star, S. L. (2000). Sorting things out. MIT press.

Onko maailma erilainen riippuen siitä kenen tekoäly sitä katselee?

Jokainen verkkomedian tutkija on varmasti havainnut, kuinka mediaympäristössä kuvilla on yhä suurempi merkitys. Melkein jokaisella on mukana vähintään yksi kamera jatkuvasti, jolla otetaan ja jaetaan kuvia arkipäivistä ja juhlista. Samoin uutisissa visuaalisuuden rooli on edelleen tärkeä – teksti ilman kuvaa ei välttämättä vetoa lukijoihin samoin kuin aikaisemmin. Internetissä video- ja kuvamateriaalin määrä on kasvanut ja useat suositut palvelut, kuten TikTok sekä Instagram pohjautuvat suurimmalta osin audio-visuaaliseen materiaaliin.

Tämä luo yhteiskuntatieteen tutkijoille taas uusia haasteita. Olemme vasta oppimassa menetelmiä suurten teksiaineistojen analyysin, mutta maailma on ollut meitä nopeampi ja vaatii jälleen uusia näkökulmia ja menetelmiä asioiden ymmärtämiseen. Visuaalinen big data myös välttää tekstiaineistojen analyysin joitain haasteita ja esimerkiksi kuvien leviämistä voidaan seurata sosiaalisen median ryhmissä hyvinkin helposti jopa kansainvälisesti – kieli ei muutu. Usein meitä kuitenkin kiinnostaa ymmärtää sisältöjä paremmin, esimerkiksi sisällön erittelyn kautta.

2019-11-10 16.16.00
Koneoppijan mielestä tämä kuva on: Daytime, Sky, City, Public Space, Human Settlement, Road, Residential Area, Urban Area, Asphalt, Metropolitan Area, Tree, Infrastructure, Park, Road Surface, Downtown, Architecture, Neighbourhood, Skyline, Real Estate, Thoroughfare, Building, Suburb, Urban Design, Street, Lane, Walkway, Cloud, Recreation, Plaza, Town Square, Sidewalk, Nonbuilding Structure.

Ei hätää! Koneoppimisen, tai trendikkäämmin tekoälyn, avulla voimme automaattisesti sanoa, mitä kuvissa on. Se ei tietenkään ole täysin tarkkaa, mutta ei se ole myöskään täysin satunnaista. Useat isot alustat ovatkin rakentaneet omia mallejaan kuvien automaattiseen tunnistamiseen sekä “tagaamiseen”, eli sisällön erotteluun. Palveluita löytyy niin Microsoftilta kuin Googlelta. Mutta! Mitä palvelua yhteiskuntatieteilijän kannattaisi käyttää, jotta tulokset olisivat mahdollisimman oikein? Toinen muotoilu tälle kysymykselle on: mitä eroja eri kuvatunnistuspalveluiden välillä on?

Otin satunnaisen 150 kuvan ryhmän ja laitoin niissä olleet kuvat Microsoftin, Googlen, Amazonin ja IBMn kuvatunnistuspalveluihin. Olen juuri työstämässä tarkempaa analyysiä sekä menetelmistöä analyysipalveluiden välisten erojen tunnistamiseen, mutta tässä on alustava yleiskuva palveluista – kuten näkyy, eroja siinä miten nämä 150 kuvaa nähdään tuntuu olevan.

Tule kuulemaan tarkempia alustavia tuloksia Digital Humanities Research Seminar-tapahtumaan 26.3. kello 16 Metsätalolle (Sali 10, Unioninkatu 40) – sekä toki myöhemmin tänne blogiin tulevien päivitysten kautta. Esitys on englanniksi, mutta blogiin teksti tulee suomeksi.

Puolueiden vuorovaikutuksesta vaaleissa – varhaisia ajatuksia

Olen mukana pohtimassa pohjoismaisten puolueiden puheenjohtajien ja puoluetilien käyttöä viimisimmissä vaaleissa muutaman muun tutkijan kanssa. Sen takia olen nyt tuijoitellut sosiaalisen median tilien sisältöä ja olemme pähkäilleet mikä on tarina jonka haluamme datalla kertoa. Täysin eksploratiivista tutkimusta siis. Yksi suunta jota olemme kovasti pohtineet on ollut ymmärtää miten yleisö reagoi, eli kuinka he uudelleenjakavat, kommentoivat tai käyttävät hienoja reaktiohymiöitä Facebookissa puolueiden viestien kohdalla. Koska tästä tulee kivasti kolme dimensioita, kokeilin miten tässä voisi käyttää hienoja kolmiulotteisia käppyröitä apuna.

Esimerkiksi näemme, että vihreiden viestit saavat melko hyvin reaktioita, jonkun verran jakoja ja vhähän kommentteja. Sinisten viestit taas saavat kyllä jonkun verran jakoja, mutta vähän reaktioita ja kommentteja. SDP taas on selvästi aktiivisempi, saa enemmän reaktioita ja jakoja mutta vähän kommentteja.

No mitä tästä saa, paitsi toki pääsäryn? Osaltaan uskoisin, että nämä kuviot kertovat myös erilaisista Facebookin käyttötavoista puolueiden välillä. Vaikka tässä tulkitaan sitä mitä yleisö tekee – miten yleisö reagoi – niin selvästi esimerkiksi Perussuomalaisten ja Kokoomuksen yleisöt reagoivat varsin samalla tavalla. Samoin SDP, Vasemmistoliitto sekä jossain määrin vihreät vaikuttavat varsin samanlaisilta. Sen takia nämä kuviot eivät vaikuta sattumalta, vaan niissä näkyy puolueiden välillä yhtenäisyyttä – ja selvästi painottumista tiettyyn kohtaan jakamisen, kommentoinnin ja reaktoiden kolmikentällä. Käppyrät eivät ole mitenkään selkeästi tasajakautuneita.

Mahdollisesti eroja voisi selittää osittain yleisöjen lukumääräiset erot. Mutta kun vähän yrittää miettiä näitä esimerkiksi äänestystuloksiin (koska muuta erinomaista arviota puolueiden sosiaalisen median yleisöistä ei heti tulee mieleen), niin samankokoisetkin puolueet sijoittuvat eri tavalla kolmikenttään. Varmasti tätä voisi yrittää hallita, jos sosiaalisen median palvelusta vain saisi vielä enemmän tietoja irti.

Mutta mitä tämä sitten tarkoittaa? Verkkotutkimuksessa puhutaan aika usein vuorovaikutuksesta. Noh, vuorovaikutamme sisällön kanssa jakamalla sitä, jotkut ovat puhuneet reaktioista pieninä poliittisen tuen osoituksina (slacktivism) ja kommentit ovat erittäin tiivistä vuorovaikutusta jo. Miettivätkö puolueiden viestintäihmiset minkälaista vuorovaikutusta he haluavat yleisöltään ja miten tälläistä saisi irti tietynlaisella sisällöllä? Silloin voidaan esimerkiksi strategisesti suunnitella viesti sillä tavalla, että se kannustaa esimerkiksi kommentoimaan, tai käyttämään erilaisia reaktioita. Liittyvätkö nämä jopa jotenkin erilaisiin ajatuksiin Facebookin algoritmisesta suosittelujärjestelmästä ja pyrkimyksestä kehittää sisältöä suhteessa siihen.

Paljon avoimia kysymyksiä ja pohdintoja, vähän valmiita vastauksia vielä toistaiseksi. Mutta kolmiuloitteiset käppyrät tuovat esille mielestäni hyvin ei keskimääräistä massaa ja eroja siinä, vaan kuinka postaukset sijoittuvat samaan aikaan näillä kolmella akselilla.

 

Yhdistyksen kokous ja pikkujoulut 18.12.2019 – Annual General Meeting 18.12.2019

rp-kuvasomeen-xmasHyvä Rajapinta ry:n jäsen,
(scroll down for English)

Olet lämpimästi tervetullut yhdistyksen vuosikokoukseen 18.12.2019 kello 15:00 Metsätalolle Kuluttajatutkimuskeskuksen kahvihuoneeseen (Unioninkatu 40 C, Helsinki – opasteet rakennuksen aulasta).

Yhdistyksen kokouksessa käsitellään sääntömääräiset asiat, mm. toimintasuunnitelma 2020 sekä uusien jäsenten valitseminen hallitukseen. Materiaalit ovat nähtävillä kokouksessa sekä myöhemmin tällä viikolla yhdistyksen verkkosivuilla tässä blogipostauksessa.

Yhdistyksen vuosikokouksessa käsitellään seuraavat asiat:

1. Kokouksen avaus
2. Valitaan kokouksen puheenjohtaja, sihteeri, kaksi pöytäkirjantarkastajaa sekä varapöytäkirjantarkastaja ja kaksi ääntenlaskijaa
3. Todetaan kokouksen laillisuus ja päätösvaltaisuus
4. Hyväksytään kokouksen työjärjestys
5. Esitetään tilinpäätös, vuosikertomus ja toiminnantarkastajien lausunto vuodelta 2018
6. Päätetään tilinpäätöksen vahvistamisesta ja vastuuvapauden myöntämisestä hallitukselle 2018 sekä muille vastuuvelvollisille
7. Vahvistetaan toimintasuunnitelma sekä tulo- ja menoarvio vuodelle 2020
8. Vahvistetaan varsinaisten jäsenten liittymis- ja jäsenmaksun suuruus sekä kannattajajäsenten liittymis- ja kannattajajäsenmaksun suuruus
9. Valitaan hallitus 5 §:n mukaan
10. Valitaan yksi toiminnantarkastaja ja varatoiminnantarkastaja
11. META

Yhdistyksen säännöt täällä.

Mikäli olet kiinnostunut yhdistyksen hallituksen jäsenyyden hakemisesta, mutta et pääse paikalle kokoukseen, otathan yhteyttä ennen kokousta chair@rajapinta.co. Vastaamme myös mielellämme kysymyksiin aiheesta!

Ystävällisin terveisin,
Hallitus

After the meeting it’s Pikkujoulu time! See the FB event

Dear Rajapinta member,

We invite you to our annual general meeting on Dec 18, 2019 at 3pm sharp (at Metsätalo, Centre for Consumer Society Research premises, Unioninkatu 40 C, Helsinki – entrance in the lobby).

During the meeting, we will discuss topics as stated in the association’s charter, e.g. as the annual plan for 2020 as well as electing new members to the executive committee. The materials (in Finnish) will be available later this week on the association’s website.

If you consider applying for a position in the executive committee but cannot attend the meeting, please contact us at chair@rajapinta.co. We are also happy to answer any questions regarding committee work!

Best wishes,
Executive committee

After the meeting it’s Pikkujoulu time! See the FB event

Rajapinnan opinnäytetyöpalkinnot 2019 myönnetty digitaalisen kulttuurin ja datatieteen pro graduille

thesis-pile-kuvitus-flickr-organprinter
Photo: (cc) organprinter Flickr

Digitaalisten yhteiskuntatieteiden yhdistys Rajapinta ry on myöntänyt kaksi opinnäytetyöpalkintoa akateemisen vuoden 2018–2019 aikana valmistuneille opinnäytetöille. Rajapinta jakaa vuosittaisen palkinnon nyt jo kolmatta kertaa. Tänä vuonna palkintoa haki kaikkiaan kymmenen työtä.

Palkinnon saivat:

Molemmat työt edustavat Rajapinta ry:n ytimessä olevaa digitaalista otetta yhteiskuntatieteellisten kysymysten ratkaisemisessa. Ne ovat laadukkaita, tieteidenvälisiä töitä, jotka ottavat uusia rohkeita hyppyjä teoreettisten, metodologisten tai epistemologisten raja-aitojen yli. Arviointiraati arvosti myös töiden ajankohtaisia, yhteiskunnallisia aiheita sekä omaperäistä otetta niiden tarkastelussa.

Toivasen tutkimus selvittää, miten suomalainen vastamedia käyttää ja kehystää valtamedian uutisia, sekä soveltaa ohjattua koneoppimista eri kehystämisen tapojen tunnistamiseen. Tulokset osoittavat, että kehystyksessä kannattaa sisällön lisäksi tarkastella tekstin rakennetta. Työ tarttuu mielenkiintoiseen ja ajankohtaiseen aiheeseen ja tuottaa lisää ymmärrystä siitä, miten mediajulkisuuden dynamiikkaa voi tutkia laskennallisten menetelmien avulla. Työ keskustelee kahden eri tieteenalan kirjallisuuden kanssa ottamalla yhteiskuntatieteellisen käsitteen ja soveltamalla menestyksekkäästi koneoppimisen menetelmiä sen ratkaisemiseksi. Työ on selkeä esimerkki “Rajapinta-alan perustutkimuksesta”, jollaista arviointiraati peräänkuuluttaa lisää.

Vaahensalon tutkimuksen lähtökohtana on uusi käsite ’toiseuttava verkkokeskustelu’, jota määrittelemällä yritetään löytää vihapuheen käsitettä neutraalimpi ja monipuolisempi tutkimuksellinen tarkastelukulma. Tutkimuksessa yhdistetään mediakulttuurin ja kielentutkimuksen sekä jossain määrin sosiaalipsykologista näkökulmaa. Työssä tarkastellaan digitaalisten aineistojen käyttöliittymiä ja pohditaan niitä kriittisesti käyttämällä Suomi24-aineistoa ja Korp-työkalua esimerkkinä. Työssä osoitetaan konkreettisesti, miten digitaalista analyysiä voi tehdä määrällisesti ja argumentoidaan samalla laadullisen tutkimusotteen selittävää voimaa. Usein digitaalista yhteiskuntatiedettä vaivaa tietynlainen muutoksen nopeus ja siitä aiheutuva käsitteellinen köyhyys, mihin tämä gradu tarjoaa oivallisen kontribuution.

Rajapinta ry. toivottaa onnea palkituille ja kiittää kaikkia osallistuneita!

– –
Rajapinta palkitsee vuosittain erinomaisia pro gradu tai diplomitöitä, joiden aihepiiri kytkeytyy yhdistyksen tavoitteisiin: yhteiskuntatieteellisesti pohjautuneita töitä teknologiasta tai teknologiaa hyödyntäviä yhteiskuntatieteellisiä tutkimuksia. Yhden palkinnon arvo on 500 euroa. Yhdistyksen toimintaa ja siten myös tätä palkintoa rahoittaa Koneen Säätiö.

Arviointiraatiin kuuluivat: Veikko Eranti (HY), Merja Koskela (VY), Matti Nelimarkka (HY/Aalto), Thomas Olsson (TAU), Merja Porttikivi (HY/Aalto), Risto Sarvas (Aalto) ja Anu Sivunen (JYU). Kunkin työn arvioi kaksi raatilaista, jotka valittiin niin, että mahdolliset eturistiriidat, ohjaussuhteet ja kollegasuhteet vältettiin. Töiden arviointi perustui niiden akateemiseen laatuun sekä siihen, miten hyvin ne toteuttivat Rajapinta ry:n toiminnan painopisteitä, jotka oli mainittu myös palkintokutsussa. Työn tekijän aktiivisuus Rajapinta-yhdistyksessä ei ollut arvioinnissa etu eikä haitta.

Facebook-kirppikset ja käytettyjen vaatteiden myyntisivustot muuttivat shoppailua – kuluttajia ohjaa tuotteiden laatu ja jälleenmyyntiarvo

Tiedätkö, mikä on ollut viime vuosien nopeimmin kasvava vaatekategoria? Käytetyt vaatteet. Verkossa toimivat käytettyjen vaatteiden jälleenmyyntipalvelut ja sosiaalisen median kiihdyttämä kirpputoritoiminta ovat lisänneet kuluttajien kiinnostusta myydä omia käytettyjä (ja jopa käyttämättömiä) vaatteitaan ja ostaa niitä muilta. Selvityksen mukaan käytettyjen vaatteiden markkinan kasvun taustalla ovat ennen kaikkea nuoret kuluttajat, joiden kiinnostus käytettyjen vaatteiden ostamista ja myymistä kohtaan saattaa jopa vähentää kiinnostusta ostaa vaatteita uutena.

Olemassa oleva tutkimus tarkastelee käytettyjen tuotteiden ostamista tyypillisesti joko säästämisen tai ympäristöystävällisyyden näkökulmasta. Vaikka nämä ovat tärkeitä syitä ostaa vaatteita käytettynä, halusimme selvittää, mitä muita motiiveja käytettyjen vaatteiden ostamiseen liittyy. Valitsimme tutkimuskohteeksi käytetyt luksusvaatteet ja -asusteet, joiden ostamiseen uutena liittyy erityisen paljon hedonistisia ja symbolisia motiiveja.

Haastattelimme 22 kuluttajaa, jotka ovat hiljattain ostaneet luksustuotteita toisilta kuluttajilta. Kaikki haastateltavat olivat suomalaisia 25–40-vuotiaita naisia, ja heihin oltiin yhteydessä luksusvaatteisiin ja -asusteisiin keskittyvän Facebook-kirpputorin kautta. Haastatteluaineistoa tarkasteltiin ns. ostostyylien näkökulmasta.

Tutkimuksessa huomattiin, että käytettyjen luksustuotteiden ostajia määrittää erityisesti hinta-laatutietoisuus sekä arvostus käytetyn tuotteen kaunista ikääntymistä ja sen laatua kohtaan. Laatutietoisuutta kuvailtiin esimerkiksi näin: “Brändin todellisen laadun ja käsityön näkee mielestäni vasta käytettynä hankituista käsilaukuista. Laadukkuus kestää aikaa.”

Lisäksi haastatteluaineistosta tunnistettiin uusi ostostyyli: jälleenmyyntiarvotietoisuus. Muun muassa tällaiset lausunnot kuvasivat kyseistä ostostyyliä: “Ostin tämän Chanelin huomatessani, että klassisten luksustuotteiden hinnat nousevat jatkuvasti. Myyn sen kyllä jossain vaiheessa, ja tiedän, että tulen saamaan siitä 50% enemmän mitä alun perin itse maksoin.” Nämä kuluttajat kokivat olevansa vain yksi useista omistajista tuotteen elinkaaren aikana. He uskoivat, että ostamalla joko ikonisia tai nousussa olevia brändejä he voivat saada maksamansa hinnan takaisin jälleenmyynnin yhteydessä.

Vaateteollisuuden korkean ympäristökuormittavuuden huomioon ottaen tutkimuslöydökset ovat kannustavia; Ostaessaan käytettyjä tuotteita kuluttajat kiinnittävät huomiota tuotteen laatuun, kestävyyteen ja jälleenmyyntiarvoon. Verkossa toimivat kulutustavaroiden jälleenmyyntisivustot ja -palvelut ovat keskeisessä asemassa kulutustottumusten muutoksessa. Ilman toimivia käytetyn tuotteen markkinoita kuluttajat eivät löydä itseään kiinnostavia tuotteita ja voi luottaa, että saavat omat tuotteensa myytyä eteenpäin. Alan toimijoiden tulee kiinnittää huomiota tuotteiden laadun esilletuomiseen ja oikean kuluttajasegmentin löytämiseen.

Tutkimus on julkaistu International Journal of Consumer Studies -lehden marraskuun numerossa: Linda Turunen & Essi Pöyry (2019). Shopping with the Resale Value in Mind: A Study on Second‐Hand Luxury Consumers. International Journal of Consumer Studies, 43(6), 549–556.