Digital technologies, data analytics and social inequality

We were recently involved in organizing a working group on what might be called “digital inequalities” at the Annual Finnish Sociology Conference. Based on the working group, we reflect on the relationship between digital technologies and social inequalities, and on the role of critical scholarship in addressing the issue.

To paraphrase Kranzberg’s (1986) well-known first law of technology, while digital technologies and their capability to produce data are not a force for good or ill, they are not neutral either. With the increasing use of data analytics and new digital technologies, as well as the ever-intensifying hype over them, it is extremely important to examine the connection between technological and social divides

A rich body of research on “digital divides” has focused on the issues of unequal access to technology and differences in its usage (e.g. van Dijk, 2013). With the aim of expanding the view beyond the ideas of access and usage, Halford and Savage (2010) have proposed the concept of “digital social inequality”, emphasizing the interlinking between social disadvantages and digital technologies. This means that the development, use and effects of digital technologies are often related to social categories such as gender, race/ethnicity, age and social class

Examining the divisions connected to the use of data, Andrejevic (2014) points out “the big data divide”, a concept with which he refers to the asymmetric relationship between those who are able to produce and use large quantities of data, and those who are the targets of data collection. This divide highlights not only access to data and the means of making use of data, but also differential access to ways of thinking about and using data. D’lgnazio and Klein (2019) further discuss the power structures inherent in the collection and usage of data, pointing out that these structures are often made invisible and thus taken as an objective viewpoint of how “the numbers speak for themselves”. Through many empirical examples D’lgnazio and Klein demonstrate that even the choices of what topics data is collected on, analyzed and communicated rest on power relations in terms of whose voices and interest are represented and whose are marginalized

Partly inspired by the above-mentioned research, we recently organized a working group at the Annual Finnish Sociology Conference, The Shifting Divides of Our Digital Lives, to discuss old and new forms of inequalities, the reactions they provoke, and their societal consequences. To guide our presenters, we posed some additional questions: What hinders or facilitates equal participation in the digital society? How are social institutions adapting to digital change? What forms of civic engagement and activism arise given digital society’s asymmetries?

Here we summarize selected findings of presentations that provided insights into how digital technologies and the use of data analytics shape our differential opportunities for social participation even when we, as citizens, might not be fully aware of it.

In her presentation Contested technology: Behavior-based insurance in critical data studies, Maiju Tanninen (University of Tampere) pointed out the many concerns that data studies literature has identified in connection to the use of self-tracking technologies in personalized insurance. These include the possibility of data-based discrimination, heightened surveillance, and control of clients’ behavior. However, Tanninen argued that while these critiques paint a rather dystopian picture of the field, they are largely focused on the US context, they fail to differentiate between insurance types, and are often lacking in empirical engagement. In practice, the use of self-tracking devices for the development of personalized insurance looks often doubtful, amongst other reasons due to poor quality of data. Tanninen pointed out that in order for critical research on the topic to be constructive, and to better understand the benefits of these technologies and offer new insights, we need empirically grounded research in the European and more specifically Finnish contexts.

In his presentation Ageing migrants’ use of digitalised public services: Ethnographic study, Nuriiar Safarov (University of Helsinki) emphasized the need for intersectional perspective in studying access and utilization of e-services among different groups of migrants. In his doctoral project, Safarov examines the impact of the digitalization of public services in Finland on the group of older Russian-speaking migrants who permanently live in Finland. Safarov pointed out that this specific group of migrants may face particular barriers to access e-services not only because of their age, but also because of lack of language skills and social networks. Empirical work on such groups can, in turn, offer insight into the interplay of digital-specific and more ‘traditional’ social divides.

In her presentation Facebook Groups interaction affecting access to nature, Annamari Martinviita (University of Oulu) compared a popular Finnish Facebook group on the topic of national parks, and the official information website of Metsähallitus. Martinviita demonstrated that while both platforms might aim to be inclusive when they advertise access and exploration of nature, in practice they might produce various divides by means of presenting and constructing ‘correct’ ways of visiting national parks.

In their presentation Political orientation, political values and digital divides – How does political orientation associate with the political use of social media? Ilkka Koiranen and colleagues (University of Turku) demonstrated that while social media provides new ways for political participation, there are significant differences between political parties in how their supporters use social media for political purposes. The research was based on a nationally representative survey dataset. The results showed that newer political movements with younger and more educated supporters representing post-material values are more successful in social media, echoing also previous findings in the digital divides research.

In his presentation How data activism allies with firms to seek equal participation in the digital society, Tuukka Lehtiniemi (University of Helsinki) discussed the case of MyData, a data activism initiative aiming to enhance citizens’ agency by providing them with the means to control the use of their personal data, in an attempt to address injustices related equal societal participation. Various interest parties are involved in MyData, including technology-producing firms that seek market and policy support for their products. Lehtiniemi argued that particular ways to frame MyData’s objectives are employed to support this involvement. While it is important to develop alternative imaginaries for the data economy, a central question remains to be resolved: how to move from abstract concepts such as citizen centricity and data agency to actual alternatives that challenge dominant imaginaries of data’s value.

These presentations highlight that the promises of equal participation so often associated with digital technologies and use of data analytics are often challenging to reclaim in practice. If approached without care, they may reproduce and extend existing patterns of biases, injustices or discrimination.

Thus, it is important to keep in mind that as digital technologies and data analytics are forged by humans in specific societal settings and power relations, these technologies contain traces of societal conditions in which they are coined and manufactured. Consequently, it is salient to explore what kinds of potentially biased assumptions are embedded in these technologies used so extensively in today’s society. This is why we think that it is urgent to advance critical approaches and support collective citizen actions to create and implement technologies and data analytics that improve opportunities for all

At the same time, as some of the presentations in the working group also indicated, criticism by itself may not lead to constructive input in the development and usage of digital technologies. We should therefore not only point out the ways how digital technologies and data analytics, their current usage, and the potential future trajectories can bring up or exacerbate societal problems. In addition, we should engage in conceptual and empirical research that can help identify preferable alternatives and steer technological developments toward societally more desirable and sustainable ones

By: Marta Choroszewicz, Marja Alastalo and Tuukka Lehtiniemi

Choroszewicz is a Postdoc Researcher at University of Eastern Finland, Alastalo is a University Lecturer at University of Eastern Finland, and Lehtiniemi is a Doctoral Candidate at University of Helsinki.

– –


Andrejevic, M (2014) The big data divide. International Journal of Communication, 8: 1673–1689.

D’lgnazio, C and Klein, L (2019) Data Feminism. MIT Press Open. Available at:

Halford, S and Savage, M (2010) Reconceptualising digital social inequality. Information, Communication and Society 13(7): 937–955.

Kranzberg, M (1986) Technology and history: “Kranzberg’s laws“. Technology and Culture, 27(3): 544–560.

Van Dijk, JAGM (2013) A theory of the digital divide. In: Ragnedda, M., & Muschert, G. W. (Eds.) The digital divide: The Internet and social inequality in international perspective. Routledge, 36–51.

Riidankylvämistä ja rauhanrakentamista anonyymeissa verkkokeskusteluissa

Underwater conversations by Thomas Hawk Flickr
(cc) Thomas Hawk Flickr

Ovatko verkkokeskustelut kivettyneiden asenteiden pakkotoistoa vai tuottavatko ne uudenlaisia näkökulmia tuttuihin ilmiöihin? Suomi24-foorumin parissa tehty tutkimus paljastaa ääripäät: verkkokeskustelu on yhtä aikaa likapyykkilinko ja arjen rauhankone.

Anonyymeja verkkokeskusteluja on verrattu vessakirjoitteluun, mihin viittaa Suomi24:n vakiintunut lempinimi Suoli24. Vihan lietsonta ja holtiton huutelu on verkkokeskustelun vakiintunut piirre. Keskustelu takoo eteenpäin yhteiskuntavastaisuudella ja ihmisvihamielisyydellä. Vääränlaisia ihmisiä nimitellään ja kiusataan. ”Saan kirjoittaa juuri niin kuin ajattelen eikä tarvitse suvaitsevaisista välittää”, kertoo Suomi24:n käyttäjille suunnatun kyselyn avovastaus. Paljastukset tyydyttävät lukijoiden uteliaisuutta ja antavat tunnevoimaa omille mielipiteille ja oikeassa olemisen tunteelle.

Verkkokysely käyttäjille oli avoinna Suomi24-keskustelualueilla kahden viikon ajan joulukuussa 2016. Vastauksia kertyi lähes 1400. Kyselyssä haettiin käyttäjien näkökulmaa siihen, millaisena he näkevät foorumilla käydyn keskustelun. Verkon likapyykkilinko on lukijoille arkista viihdettä. Törkyviestejä pidetään humoristisina. Toisaalta kirjoittajien reaktioita pidetään eksoottisina tai kuriositeettina. Suomi24 on kävijöille ikään kuin lintutorni, josta bongaillaan vieraslajeja. ”Kaipaan masokistisuuteni takia välillä sitä, että voin lukea perehtymättömien tekstejä ja vajota syvään epätoivoon”, kirjoittaa yksi vastaajista. Joistakin kyselyn vastauksista huokuu ylemmyydentunne palstan kirjoittajia kohtaan, mutta toiset kuvaavat myös vilpitöntä halua ymmärtää tuntemattomia tai oppimattomia lajitovereita.

Kyselyn sadoista avovastauksista hahmottuu erilaisia keskustelukulttuureja. Nimittelyn ja leimaamisen rinnalla Suomi24-palstoilla elävät täysin vastakkaiset pyrkimykset: kirjoittajien halu paneutua toisten ongelmiin ja kannustaa aikalaisia vaikeissa elämäntilanteissa. Käyttäjäkyselyn myönteisisissä Suomi24-kokemuksissa toistuu avun saaminen. Ihmisiä askarruttavat terveyteen, ruoanlaittoon, remontteihin. raha-asioihin ja lemmikkieläimiin liittyvät kysymykset. Kyselyyn vastanneet kiittävät kirjoittajia, jotka aikaa ja vaivaa säästämättä paneutuvat käytännön pulmiin ja toisten ongelmiin. ”Monta hyvää neuvoa ja niksiä ois jäänyt saamatta”, kuvaa yksi vastaajista.

Käyttäjäkyselyn vastaukset muistuttavat verkkokeskustelun pitkästä historiasta. Ihmiset ovat hakeneet Suomi24:n palstoilta kaikupohjaa epätietoisuuden ja yksinäisyyden hetkiin jo yli viidentoista vuoden ajan. ”En ole yksin”, kirjoittaa yksi kyselyyn vastanneista. ”Chatti on saattanut pelastaa vuosien varrella ihmishenkiä”, arvelee toinen. Yksi kirjoittajista toteaa anonyymin verkkoviestinnän ansion ehkä viitaten seksuaalivähemmistöjen asemaan: ”Olisipa nuorena ollut internet noin yleensä. Kaikille asioille ei ollut nimiä 70-luvulla”.

Poliittiset vaikuttajat ja virkamiehet puhuvat usein verkkokeskusteluista etäältä – keskustelua käy ”someväki”, jota ohjaa ”someraivo”. Yhteiskunnalliseksi voimaksi tunnistettu ”somekansa” kulkee laumana keskustelunaiheesta toiseen. Suomi24-tutkimuksemme perusteella tällaista yhtenäistä joukkoa ei keskustelufoorumilta löydy. Suomi24-palstat muodostavat pikemminkin keskustelujen saariston, joka kehittyy tai kuihtuu muun maailman ja eri keskustelufoorumeiden mukana. Yli kahden tuhannen palstan joukosta löytyy riitaisia, harmonisia ja yhdentekeviä palstoja. Osa palstoista on kuollut keskustelijoiden puutteeseen.

Someraivo ja nettiviha – monine variaatioineen – ovat häiritseviä ilmiöitä, jotka rikkovat yleistä oikeustajua. Silti niihin ei pitäisi jäädä kiinni. Yksinomaan vihaan ja raivoon kiinnittynyt tarkkailija päätyy helposti toistamaan nettikeskustelujen jähmettyneitä lähtökohtia. Silloin jää näkemättä keskustelun yhteiskuntaa kannatteleva voima. Kivettyneistä ja junnaavista asetelmista pääsee eteenpäin suuntaamalla katseen verkkokeskustelujen arkisiin kuvitteluvoimiin; ihmisten loputtomaan kykyyn asettua toisten asemaan ja kannatella viesteillään arjen rauhankonetta.

Kirjoittajat: Mika Pantzar ja Minna Ruckenstein

– –

  • Harju A. (2018). Suomi24-keskustelut kohtaamisten ja törmäysten tilana. Media & viestintä, 41(1). [koko teksti]
  • Pantzar M. & Ruckenstein M. (2018) Verkkokeskustelut: Riidan kylvämistä ja rauhan rakentamista. Teoksessa Autio J., Autio M., Kylkilahti E. & Pantzar M. (toim.) (2018) Kulutus ja talous – Näkökulmia yhteiskunnan muutokseen. Helsingin yliopisto, taloustieteen osaston julkaisuja 70, s. 69-76.

Pitäisikö algoritmien pelastaa meidät epävarmuudelta?
Kuva (cc) Belgapixel @Flickr

Viimeisten vuosien aikana on puhuttu paljon algoritmien vallasta, mutta keskusteluissa esiintyy monia erilaisia näkökulmia siitä, minkälaista tuo valta oikeastaan on. Yhtäältä on keskusteltu algoritmien kyvystä rajata ja muokata ihmistoiminnan mahdollisuuksia, esimerkiksi luokittelemalla ihmisiä ja ohjaamalla tiedon kulkua [1,2,3]. Toisaalta huomiota on kiinnitetty algoritmeja koskevien käsitysten ja odotusten rooliin toiminnan ohjaamisessa [4]. Tässä kirjoituksessa pohdimme yhtä mahdollista syytä sille, miksi algoritmit ylipäätään saavat valtaa.

Michel Crozier käsittelee kirjassaan The Bureaucratic Phenomenon [5] sitä, miten byrokraattisissa organisaatioissa valtaa keskittyy henkilöille, joilla on kyky hallita organisaation toimintaan liittyvää epävarmuutta. Hän kirjoittaa esimerkiksi tehtaan koneiden huoltohenkilökunnasta ryhmänä, jolle valtaa keskittyi, koska he kykenivät vähentämään tuotantokoneisiin liittyvää epävarmuutta.

Tuotantokoneiston huoltaminen oli tehtaiden toiminnan kannalta keskeistä ja huoltohenkilökunta muodosti asiantuntijaryhmän, jolla yksin oli huoltamiseen tarvittavaa osaamista. Tämä osaaminen antoi huoltohenkilöstökunnalle strategisen etulyöntiaseman suhteessa tehtaan muihin henkilöstöryhmiin. Byrokraattisesta rakenteesta huolimatta organisaatio oli kykenemätön hallitsemaan henkilöstöryhmien epämuodollista kanssakäymistä. Tästä johtuen koneiden rikkoutumiseen liittyvän epävarmuuden hallinta loi huoltohenkilökunnalle valtaa, jota he käyttivät neuvotellessaan ryhmänsä eduista.

Crozierin analyysissa byrokraattisten organisaatioiden keskeinen pyrkimys on kontrolloida organisaation toimintaan liittyviä epävarmuuden lähteitä. Epävarmuus organisaation toiminnassa luo hallitsematonta valtaa, joka tekee byrokraattisen järjestelmän toiminnasta epätehokasta.

Yksi byrokraattisten järjestelmien toimintaan liittyvän määrällistämisen tavoitteena on etäännyttää järjestelmien toiminta subjektiivisista ihmisarvioista [6]. Sama ilmiö näkyy myös erilaisten algoritmisten sovellusten käytössä. Algoritmien toivotaan paitsi eliminoivan epävarmuuden lähteitä, myös parantavan toiminnan tehokkuutta.  Usein toiveena on, että ihmisen päätöksenteon subjektiivisuuteen tai muihin heikkouksiin liittyvät ongelmat voidaan ratkaista uusilla datapohjaiseen analytiikkaan perustuvilla teknologisilla sovelluksilla [7,8]. Tämä epävarmuuden kontrollointi näkyy tapauksissa, joissa algoritmien käyttöä perustellaan niiden systemaattisuudella tai tasalaatuisuudella, kuten esimerkiksi algoritmisen analytiikan tehokkuutta ja ennustekykyä koskevissa odotuksissa [9]. Ennustekyvyn tarkentumisen ja toiminnan tehostamisen onkin esitetty olevan nykyanalytiikkaa keskeisesti ohjaavia odotuksia [10]. Yksi käytännön esimerkki ovat itseohjautuvat autot, joiden toivotaan olevan ihmisten ohjaamia autoja turvallisempia [esim. 11]. Personalisoidun terveydenhuollon taas toivotaan tarjoavan yksilöille entistä parempia tapoja hallita terveyttään [12]. Myös esimerkiksi tekoälyn käyttö yritysten rekrytointiprosesseissa on yleistymässä. Automatisoituja rekrytointiprosesseja perustellaan vedoten tehokkuuteen ja algoritmisen arvioinnin tasalaatuisuuteen [esim. 13].

Erving Goffman on käsitellyt esseessään Where the action is? [14] kohtalokkuutta. Hän liittää käsitteen päätöksiin, jotka ovat ongelmallisia ja seuraamuksellisia. Puhtaan ongelmalliset päätökset ovat sellaisia, joissa oikea päätös ei ole selvä, mutta päätöksellä ei ole laajemman elämän kannalta juurikaan väliä. Valinta sen suhteen, mitä katsoa televisiosta, on esimerkki tällaisesta päätöksestä. Esimerkiksi päätös lähteä joka aamu töihin taas on esimerkki seuraamuksellisesta päätöksestä, jossa oikea valinta on selvä. Kotiin jäämisellä voisi olla haitallisia seurauksia, joten valinnalle lähteä töihin on selkeät perusteet. Kohtalokkaat päätökset ovat sellaisia, joissa valinnalle ei ole selkeitä perusteita, mutta sen tekemisellä on laajakantoisia seurauksia Goffmanin mukaan pyrimme järjestämään arkemme niin, että päätöksemme eivät yleensä olisi kohtalokkaita.

Sama kohtalokkuuden vähentäminen on läsnä niissä toiveissa, joita esitämme algoritmeille. Toivomme niiltä apua tilanteissa joissa oikea päätös on epäselvä. Emme kuitenkaan pysty pakenemaan kohtalokkuutta kokonaan. Päätöksillä voi aina olla ennakoimattomia seurauksia. Koska olemme aina läsnä omana, fyysisenä itsenämme, yllättävissä tilanteissa kehomme voi esimerkiksi aina vahingoittua. Kaikkeen olemiseen liittyy riskejä.

Ajatuksella kohtalokkuuden eliminoimisesta on yhtymäkohta Crozierin byrokratia-analyysiin. Byrokraattiset järjestelmät kehittyvät juuri olosuhteissa, joissa toimintaan liittyvää epävarmuutta pyritään eliminoimaan. Paradoksaalisesti juuri epävarmuuden eliminointiin käytetty menetelmä – tiukka toimintaa ohjaava formaali säännöstö – johtaa vallan keskittymiseen organisaation niihin osiin, joista epävarmuutta ei saada kitkettyä. Samaten kohtalokkuuden eliminoiminen algoritmien avulla voi johtaa vallan toimimiseen juuri niiden teknologioiden välityksellä, joilla epävarmuutta pyritään hallitsemaan. Tästä näkökulmasta yksi syy sille, että algoritmeille syntyy valtaa, on pyrkimys kontrolloida epävarmuutta, jota ei kuitenkaan täydellisesti kyetä hallitsemaan. Algoritmisissa järjestelmissä valta toimii algoritmien kautta, mutta syntyy osana laajempaa ihmistoiminnan kontekstia. Näin ollen algoritmista valtaa voitaisiinkin kenties tutkia kysymällä, minkälaisia epävarmuustekijöitä algoritmien käytöllä pyritään hallitsemaan, ja mikä mahdollisesti jää hallitsematta?

Jos joku lupaa auttaa meitä tekemään aina oikean päätöksen epävarmassa maailmassa, ei ole ihme että kuuntelemme. On kuitenkin syytä kiinnittää huomiota siihen, että samalla auttajille keskittyy valtaa.

Teksti: Jesse Haapoja & Juho Pääkkönen

– –
Kiitokset kommenteista Salla-Maaria Laaksoselle, Airi Lampiselle ja Matti Nelimarkalle. Tämä teksti kirjoitettiin osana Koneen Säätiön rahoittamaa Algoritmiset järjestelmät, valta ja vuorovaikutus -hanketta.

Eettinen tekoäly toteutuu punnituissa käytännöissä

Tekoälyä kuvataan maiden tai maanosien välisenä kilpajuoksuna, jonka ennakkosuosikkeina ovat USA ja Kiina, sekä haastajana EU. Asetelma näkyy EU-maissa tekoälystrategioina, ohjelmina ja rahoitusinstrumentteina.

Valtioneuvoston tuoreen eettistä tietopolitiikkaa koskevan selonteon mukaan Suomi tavoittelee kilpailuetua eettisesti kestävällä tekoälyn kehittämisellä ja soveltamisella. Päämääränä ovat hyödyt yhteiskunnalle ja tavallisille ihmisille, esimerkkinä maailman parhaat julkiset palvelut. Eettisyyttä tavoitellaan yhteisesti sovituilla periaatteilla, joita palveluiden kehittäjät ja ihmisiä koskevien tietoaineistojen hyödyntäjät noudattavat.

Eettisesti kestävän tekoälyn viitekehys korostaa yleisiä periaatteita kuten läpinäkyvyttä, ihmiskeskeisyyttä, ymmärrettävyyttä, syrjimättömyyttä ja ihmisarvoa – yleviä päämääriä, joiden arvoa tuskin kukaan kiistää. Periaatteita edistetään vetoamalla yritysten itsesäätelyn tarpeeseen muuttuvassa teknologiaympäristössä, jossa ajantasainen sääntely lakien tai määräysten avulla on vaikeaa.

Eettiset viitekehykset ovat erityisen tärkeitä silloin, kun sääntely tai yhteiskunnalliset oikeudenmukaisuuden normit eivät auta jäsentämään toiminnan reunaehtoja. Periaatteet rajaavat toimintatapoja, jotka ilmiselvästi rikkovat ihmisten itsemääräämisoikeutta tai tuottavat epäterveitä käytäntöjä arkeen ja työelämään. Yleisten periaatteiden ongelma voi kuitenkin piillä niiden tulkinnallisessa avoimuudessa. Se mikä on yhdelle yritykselle vastuullisuutta tai syrjimättömyyttä, ei välttämättä ole sitä toiselle.

Olemme seuranneet vuosien ajan eettisen tietopolitiikan vahvuudeksi tunnistetun MyData-ajattelun kehittymistä Suomessa ja kansainvälisesti. MyDatan, tai omadatan, perusajatuksen mukaan kansalaisten tulee saada hallita itseään koskevien tietojen käyttöä yrityksissä ja julkisella sektorilla. MyDatassa yksilöä ajatellaan digitaalisen talouden keskuksena ja datavirtojen keskipisteenä. Tavoitteena on haastaa henkilökohtaisten tietojen taloudellisen hyödyntämisen epätasa-arvoisuus siirtämällä kontrolli yrityksiltä ihmisille, joista aineistoja kerätään.

MyDatan edistäjät ovat tehokkaasti osoittaneet ihmiskeskeisyyden tarpeellisuuden datatalouden rakenteissa. Samalla ihmiskeskeisyyttä kuitenkin tulkitaan varsin joustavasti. Se voi tarkoittaa kansalaiselle tasavertaista osallistumista digitaaliseen yhteiskuntaan, yritykselle taas väylää päästä yksilön kautta käsiksi datajättien hallussa oleviin aineistoihin.

Mikä merkitsee yhdelle toimijalle kaikkien digitaalisten oikeuksien suojaamista, voi toiselle tarkoittaa mahdollisuutta tarjota maksukykyisille yksityisyyttä turvaavia palveluja. Ihmiskeskeisyydestä tulee eräänlainen musteläiskä, jossa toimijat näkevät omasta näkökulmastaan edistämisen arvoisia piirteitä.

Yleiset eettiset periaatteet eivät siis takaa tavoiteltujen yhteiskunnallisten seurausten toteutumista. Pikemminkin yleisellä tasolla pysyminen tuottaa epämääräistä puhetta ja mitäänsanottamia vastauksia. Siksi eettisiä periaatteita tulee konkretisoida ja koetella käytännössä. Jotta käytännön toimijat saavat tukea päätöksilleen, tarvitaan yksityiskohtaisia esimerkkejä palveluista, joissa eettiset periaatteet toteutuvat. Inspiraatiota eettisyyteen voi hakea myös yhteistä hyvää tuottavista digitaalisista palveluista kuten Wikipediasta, tai osuuskuntaperiaatteella toimivista yrityksistä.

Henkilökohtaisten tietojen käytön eettiset periaatteet toteutuvat, kun pääsy aineistoihin pohditaan huolellisesti ja samalla määritetään, kuka voi hyötyä aineistojen käytöstä ja miten. Keskeisiä ovat aineistojen käyttöön liittyvän päätöksenteon säännöt. Tässä ei itse asiassa ole mitään uutta. Vaikka teknologia kehittyykin nopeasti, henkilökohtaisten aineistojen käytön rajoja ja mahdollisuuksia on pohdittu vuosikymmenien ajan.

On päätettävä millaista aineistoa voi kerätä tai käyttää, mihin tarkoituksiin ja kenen toimesta, missä kulkevat hyväksyttävän ja vältettävän rajat, ja kuka niihin voi vaikuttaa ja millä aikavälillä. Vastaukset eivät kumpua yleisistä periaatteista, eivätkä ole yleispäteviä. Se mikä esimerkiksi liikenteen älypalveluissa on hyväksyttävää, voi terveyden kentällä olla eettisesti arveluttavaa.

Tämän ajan suuri haaste on digitaalisen ympäristön ohjaus ja hallinnointi. Pikemminkin kuin teknologian kehittäjien kilpajuoksusta, tässä on kysymys eri näkökulmien ja käytäntöjen huolellisesta yhteensovittamisesta. Kilpailuetua tulisi hakea eettisten tavoitteiden toteutumisesta eri alojen osaamisten risteyskohdissa. Siinä missä tekoälykisaajat näkevät maalin edessään, eettinen kestävyys löytyy pikemminkin yhdistelemällä kekseliäästi vanhaa ja uutta.

– –
Tuukka Lehtiniemi (@tlehtiniemi) & Minna Ruckenstein (@minruc).
Kirjoittajat ovat tutkijoita Helsingin yliopiston Kuluttajatutkimuskeskuksessa.

Kirjoitus on rinnakkaisjulkaistu

8 tapaa pyristellä irti digijättien verkoista
Photo (cc) Jim Champion@Flickr

Tällä viikolla vietetään Mediataitoviikkoa. Myös digitaalisen yksityisyyden varjelemisen taidot ovat tärkeä osa nykypäivän mediataitoja. Sen kunniaksi Rajapinnassa päätimme koota muutaman helpon keinon parantaa verkkoyksityisyyttä ja vähentää digijättien valtaa elämässäsi.

  1. Tiukenna yksityisyysasetuksia. Monissa palveluissa voit itse valita, mitä kaikkea tietoja sinusta kerätään ja tallennetaan ja minne muualle kyseinen palvelu niitä saa jakaa. Esimerkiksi Googlessa voit määritellä, saako se tallentaa lokaatiotietoja, tietoja sovellusten käytöstä, tai nauhoittaa Google Assistentin kanssa käymäsi keskustelut. Facbookissa kannattaa säännöllisesti tarkistaa mitkä ulkopuoliset sovellukset saavat käyttää tietojasi. Omat mainosprofilointitietosi voi tarkistaa ja niiden asetuksia säätää. Voit esimerkiksi kieltää Facebookia näyttämästä sinua ystävillesi suosittelijana sellaisessa mainoksessa, jonka on tehnyt tykkäämäsi sivu.
  2. Rajoita sovellusten oikeuksia älypuhelimessasi. Älypuhelimissa sovellusten käyttöjärjestelmältä saamia tietoja voi säätää sovelluskohtaisesti. iPhonessa kannattaa käydä katsomassa puhelimen asetuksista hieman epäintuitiivisesti Screen Time -sovelluksen alle sijoitetut sovelluskohtaiset sisältö- ja yksityisyysrajoitukset. Android-laitteissa asetusten alta löytyy kohta Sovellukset / Sovelluksen käyttöoikeudet (Apps / App Permissions), josta voit säätää erikseen kunkin sovelluksen oikeuksia esimerkiksi mikrofoniin tai konktakteihin.
  3. Eristä digijätit. Monet alustapalvelut, erityisesti Facebook ja Google seuraavat upotusten avulla myös sitä, mitä teet muilla verkkosivuilla. Tätä voi estää esimerkiksi käyttämällä näitä palveluita eri selaimelle, jolla et tee muuta. Lisäksi on olemassa erilaisia selainlisäosia, jolla haluamansa palvelun voi eristää muusta selainkäytöstä. Esimerkiksi Firefoxin lisäosa Facebook Container eristää Facebookin muusta nettikäytöstä. Facebookia voi mobiilissakin pyörittää selaimella, tosin hieman Facebook-sovellusta kankeammin. Esimerkiksi yksityisviesteihin ei helposti pääse mobiiliselaimesta käsiksi.
  4. Estä seuranta. Selaimiin löytyy erilaisia lisäosia, joiden avulla kolmansien osapuolien palvelut (esim. mainostajat) eivät voi seurata jälkiäsi eri sivustojen yli. Esimerkiksi useaan eri selaimeen sopiva Ghostery tai Firefoxiin Lightbeam. Lightbeam myös havainnollistaa visualisaatioilla verkon jäljittäjien piilevää infrastruktuuria. Sama onnistuu kännykässäkin, esim. iPhonessa tämä tapahtuu sisällön lataamista estävän sovelluksen avulla (engl. content blocker, esimerkiksi AdGuard), jonka voi yhdistää eri selaimiin.
  5. Harhauta mainostajia. Monet palvelut ja lisäosat harhauttavat mainostaloutta myös ikään kuin sotkemalla profiilisi. Esimerkiksi Adnauseam-lisäosa klikkaa jokaista selaimessasi näkyvää mainosta, mikä voi tehdä kohdennusprofiilistasi melkoisen sekamelskan. Omaa Google-historiaansa. Ruin My Search History -palvelu puolestaan tekee selaimellasi valtavan määrän omituisia Google-hakuja ja yrittää siten sotkea profiilisi – ja tarjoaa hyvät naurut kaupan päälle. Kannattaa pohtia haluaako tällaisia palveluita käyttää vai ei. Mainostus- ja hakuprofiilien sotkeminen on digiajan vastarinnan muoto, jonka kääntöpuolena suositukset ja mainokset voivat muuttua oudoiksi tai jossain tilanteissa jopa kiusallisiksi.
  6. Käytä vaihtoehtoista hakukonetta. Esimerkiksi DuckDuckGo lupaa olla träkkäämättä käyttäjien tekemisiä. Se kuitenkin käyttää hyväkseen Googlen hakuindeksiä, eli eroon Googlen hakukoneesta et tällä tavalla pääse vaikka sen datankeruusta ehkä pääsetkin. Muita vaihtoehtoja on myös tarjolla, esim. ainoaksi eurooppalaiseksi hakukoneeksi itseään mainostava Qwant.
  7. Poista historiatiedot eri palveluista säännöllisesti. Jotkut alustat tarjoavat mahdollisuuden poistaa kerralla tai aikarajauksella historiatietoja esimerkiksi tehdyistä hauista. Esimerkiksi Googlen palveluista voi poistaa lokitietojaan data-asetuksista. Facebookin kohdalla tilanne on hiukan mutkikkaampi ellet ole valmis poistamaan koko tiliä, mutta vaihtoehtoisia keinoja on listattu esimerkiksi tässä iMoren artikkelissa. Yksi ratkaisu on myös tuhota tili ja luoda se sitten kokonaan uudestaan.
  8. Suosi vaihtoehtoisia viestintävälineitä. Digijättien palveluille on myös vaihtoehtoja, joiden puolesta voi puhua. Sosiaaliset verkostot liikkuvat hitaasti, mutta pikaviestien kohdalla vaihto onnistuu helpommin. Asenna puhelimeesi vaikkapa Signal ja käytä sitä viestittelyyn Facebookin omistaman WhatsAppin tai Facebook-viestien sijaan. Vaikka Facebook lupaa WhatsApp-viestien sisällön olevan päästä päähän salattuja, viestinnän metatietojen käytöstä ei luvata mitään.
  • BONUS: Vaalivahti Keväällä 2019 Suomessa järjestetään kahdet vaalit, mikä todennäköisesti saa poliittiset mainostajat liikkeelle. Vaalivahti on Open Knowledge Foundation Finlandin tutkimusprojekti, joka kerää tietoa Facebookissa tehdyistä mainoskohdennuksista vaalien aikana. Asenna projektin tarjoama WhoTargetsMe-lisäosa selaimeesi, niin pystyt seuraamaan kuka yrittää kohdentaa kaltaisiisi käyttäjiin ja lahjoitat samalla tiedot tutkimukselle.

Lopuksi: Tutkijan huomio

Digitaalisessa ympäristössä on tärkeää oppia ajattelemaan tekemisiään tiedonkeruun mahdollisuuksien ja seurausten kannalta. Jokapäiväisen tiedonkeruun estäminen, tai ainakin vähentäminen, voi myös ajatella olevan osa tämän päivän kansalaistaitoja. Samaan aikaan kansalaistaidoista puhumalla tulee korostaneeksi yksilön vastuuta omista tekemisistään tilanteessa, jossa tiedonkeruun tavat ja tiedon käytön seuraukset ovat vaikeasti hahmotettavia ja koko ajan muutoksessa, eikä ns. tavallinen tallaaja mitenkään pysy niiden perässä.

On hyvä pitää mielessä että palveluntarjoajan omat yksityisyysasetukset eivät välttämättä ole sitä miltä ne vaikuttava, ja esimerkiksi käyttäjän sijaintia on seurattu yksityisyysasetuksista riippumatta. Samoin profiilin tietoja poistaessa ja selaimen lisäosia tai yksityistä selausmoodia käyttäessä olemme palveluntarjoajan tai asiantuntijoiden vakuuttelujen varassa siitä, että tiedot todella poistuvat tai että meitä ei todella enää seurata. Datajättien poistaminen omasta elämästä omalla aktiivisuudella on vaikeaa tai mahdotonta, jos haluaa pysyä jollain tavalla nyky-yhteiskunnan jäsenenä — monen palvelun käyttö ei esimerkiksi äärimmäisen suojatun Tor-verkon kautta edes onnistu.

Viime kädessä ratkaisua ongelmiin täytyy etsiä muualtakin kuin yksilöiden käyttäytymisen muutoksista. Tasapainoisempaa ja reilumpaa digiympäristöä odotellessa ei ole kuitenkaan pahitteeksi pitää verhojaan suljettuna ja oviaan lukittuna.

– –
Tekstiä varten on kerätty vinkkejä Rajapinta ry:n Slackissa. Tekstin ovat kirjoittaneet Salla-Maaria Laaksonen ja Tuukka Lehtiniemi ja sen ideointiin ovat osallistuneet Jesse Haapoja ja Jukka Huhtamäki.

Kuka saa päättää, mitä dataa tutkijalla on käytössään? Ei ainakaan amerikkalainen suuryritys

social media logos and light beams
Photo (cc) Kevin Dooley Flickr, edits by Salla L

Sosiaalisen median datan käyttöä tutkimuksessa suitsitaan nyt monelta kantilta. Tämän vuoden keväällä paljastuneen Cambridge Analytica -skandaalin jälkeen sekä Facebook että Twitter ovat uudistaneet pikavauhdilla datapolitiikkaansa. Samaan aikaan tutkijoita ja yliopistojen lakimiehiä on huolestuttanut toukokuussa voimaan tullut GDPR sekä Suomen tuleva uusi tietosuojalaki, joka on hyväksytty eduskunnassa marraskuussa.

On pelkästään hyvä asia, että aineistojen käyttöön kiinnitetään enemmän huomiota, ja että tutkijat joutuvat entistä tarkemmin miettimään aineistojen käytön oikeutuksia. Pohdinnoissa näyttäisi kuitenkin kummallisesti sekoittuvan aineiston tekninen saatavuus, laillisuus ja eettisyys.

Teknisestä näkökulmasta aineistojen saatavuus on hiukan hankaloitunut. Esimerkiksi Facebookin julkisilta sivuilta ei pysty enää rajapinnan (API) kautta lataamaan koneluettavassa muodossa viestejä kirjoittaneiden käyttäjien nimiä. Ryhmistä dataa saa ladata ainoastaan ryhmän ylläpitäjän luvalla. Yksittäisistä profiileista ladattavan datan käyttöä Facebook on rajoittanut jo huomattavasti aiemmin; toki käyttäjä voi halutessaan edelleen sovellusten kautta luovuttaa aineistojaan. Tämän kevään uudistusten myötä kuitenkin myös laajempia käyttäjätietoja tarvitsevat sovellukset joutuvat Facebookilla tarkempaan syyniin. Samanlainen prosessi on syntymässä myös Twitterin osalta: jatkossa jokaisen rajapintaa käyttävän sovelluksen on saatava Twitterin hyväksyntä.

Tutkijayhteisössä keskustelu API-rajoituksista on ollut varsin dramaattista. Tutkijat ovat kansainvälisesti huolestuneet Facebook-tutkimuksen tulevaisuudesta siinä määrin, että aiheesta on julkaistu kirjelmiä ja tehty listauksia rajapintojen avulla tehdyistä tutkimuksista. Akateemiset tutkijat ovat – oikeutetusti – huolissaan siitä, että aineistojen saatavuuden rajoittaminen rajaa myös tiettyjä tutkimusaiheita pois ja siten ohjaa tutkimusta. Toisaalta rajapintojen rajoitukset eivät estä tutkijaa tutkimuseettisten rajojen ja lainsäädännön puitteissa keräämästä laadullista aineistoa esimerkiksi Facebook-ryhmistä.

Toiset ovat huolestuneet palvelujen käyttöehdoissa (Terms of Service, TOS) mainittavista käytön rajoituksista. Joidenkin tulkintojen mukaan esimerkiksi YouTuben käyttö tutkimusaineistona ei ole lainkaan sallittua, koska palvelun käyttöehdot kieltävät palvelun muun kuin yksityisen käytön (jos tilanne olisi tämä Googlen mielestä, luulisi että joku niistä melkein kolmesta miljoonasta YouTube-hakusanalla löytyvästä tutkimusartikkelista olisi jo päätynyt raastupaan). Todennäköisesti amerikkalaisyrityksen ehdoista puuttuu erillismaininta akateemisesta käytöstä, koska se sisältyy jo Yhdysvaltojen lainsäädännössä olevaan fair use -pykälään.

GDPR:n ja Suomen tulevaisuudessa voimaan astuvan tietosuojalain myötä sosiaalisen median aineistojen henkilötietomaisuus on noussut uudella tavalla valokeilaan, vaikka tilanne ei käytännössä juuri ole muuttunut Suomen vanhaan henkilötietolakiin verrattuna.  Sosiaalisen median aineisto on käyttäjänimien vuoksi usein henkilödataa, ja tuoreiden tiukimpien tulkintojen mukaan sen kerääminen on nyt tietosuojasyistä kokonaan kielletty.

Sekä GDPR, tuleva tietosuoja-asetus että Suomen nykyinen henkilötietolaki mainitsevat kuitenkin tieteellisen tutkimuksen poikkeuksena henkilötietojen käsittelyyn. Tutkimus on erityisasemassa myös arkaluontoisia tietoja käsiteltäessä sekä rekisteröityjen oikeudessa tietojen poistoon (ns. oikeus tulla unohdetuksi ei automaattisesti päde, ks. Kohta 2.3.8). Henkilötietojen käsittely vaatii rekisteriselosteen ja GDPR:n ohjeistuksien mukaan myös vaikutustenarvioinnin, jos aineistossa on arkaluontoisia tietoja.

Lain noudattaminen ja tutkimuksen poikkeusasema eivät kuitenkaan tarkoita, että kaikenlainen henkilötietojen käsittely olisi eettisesti oikein, tai että kaikenlaisen avoimen aineiston käyttö olisi eettistä. Tämän määrittelee tutkimuseettinen harkinta, jonka periaatteet tiedeyhteisö on itse määritellyt ja joita se myös valvoo. Siksi GDPR:n nostattama keskustelu on tervetullutta ja omiaan parantamaan tutkittavien oikeuksia ja lisäämään tutkimusaineistoista käyttävää eettistä keskustelua. Aiemmin on ehkä luotettu liikaakin siihen, että TOS ratkaisee suostumuksen ongelmat, jotka on ikään kuin ulkoistettu yrityksen tuottamalle dokumentille. Samaan aikaan on varsin hyvin tiedossa, etteivät käyttäjät juuri lue käyttöehtoja.

Eettisen keskustelun keskiössä on usein tutkittavan suostumus (informed consent). Tutkimuseettisen neuvottelukunnan ihmistieteiden eettinen ohjeistus muistuttaa, että tutkittavan “suostumuksen periaatteesta voidaan poiketa tutkittaessa julkistettuja ja julkisia tietoja sekä arkistoaineistoja”. Tästä näkökulmasta sosiaalisen median aineistojen käyttöön ei tarvita tutkittavan suostumusta, jos aineisto on julkisesti saatavilla.

Oleellisempi on kuitenkin ohjeistuksen toinen kohta: vahingoittamisen välttäminen. Siihen keskittyy myös esimerkiksi Association of Internet Researchers AoIR:n eettinen ohjeistus. Vahingoittamisen välttäminen tarkoittaa esimerkiksi sosiaalisten ja taloudellisten haittojen minimointia sekä tutkimustulosten julkaisemisen mahdollisten seurausten pohdintaa. Se on keskeinen osa tutkimuseettistä harkintaa ja tutkijan ammattitaitoa.

Mutta tutkijalla on myös toinen ammatillinen ja eettinen velvoite: tuottaa yhteiskunnalle kriittistä tietoa. Yhteiskunnalliset ilmiöt Suomessa ja muualla heijastuvat entistä isommin myös digitaalisille alustoille. Siksi ei ole eettisesti kestävää tulkita lakeja ja käyttösääntöjä tiukasti niin, että amerikkalainen alustayritys sanelisi, mitä suomalainen tieteellinen tutkija saa sosiaalisesta mediasta tutkia. Sen sijaan se tarkoittaa, että eettisten pohdintojen perusteella toisinaan voi olla jopa perusteltua rikkoa käyttöehtoja – alkaen esimerkiksi siitä, että käyttöehtojen vastaisesti anonymisoidaan tutkimusaineisto. Tällaista tieteen vapautta puolustaa myös Suomen tuleva tietosuoja-asetus.

* Teksti: Salla-Maaria Laaksonen (Helsingin yliopisto, @jahapaula) & Margareta Salonen (Jyväskylän yliopisto, @MaakeSalonen)

Ps. Rajapinta ry. yhdessä MEVI ry:n kanssa järjestää 10. tammikuuta Tieteiden yössä tapahtuman, jossa kerromme sosiaalisen median aineistojen tutkimuskäytöstä. Työpajassa pääset myös itse penkomaan someaineistoja. Tervetuloa mukaan Tieteiden talolle!

Pps. Erinomaista pohdintaa tutkijoiden ja käyttöehtojen yhteiselosta kriminologian professori Matthew Williamsin ja kumppaneiden artikkelissa Sociology-lehdessä.

Bitit ja politiikka: Tervetuloa, laskennallinen politiikan tutkimus
(cc) Kevin Simpson @Flickr

Teksti on julkaistu 8.8. ilmestyneessä Politiikka-lehden numerossa 2/2018 “Bitit ja politiikka” -minisymposiumin johdantona.

Tietoyhteiskuntakehitys ja teknologian muutokset ovat vaikuttaneet yhteiskuntatieteisiin, mukaan lukien politiikan tutkimukseen. Digitaalisissa toimintaympäristöissä tapahtuva poliittinen toiminta näyttäytyy houkuttelevana tutkimuskohteena ja toisaalta esimerkiksi digitaalisten alustojen ja algoritmien tutkimus nostaa esille politiikan perimmäisiä kysymyksiä vallasta (esim. Gillespie 2010; Beer 2017; Neyland ja Möllers 2016). Monet kiinnostavista kysymyksistä kytkeytyvät poliittiseen viestintään: sosiaalinen media on jo haastanut perinteisiä viestinnän portinvartijateorioita (esim. Chadwick 2014, Castells 2007) ja uudet digitaaliset viestintävälineet muuttavat kansalaisosallistumisen tapoja (esim. Bennett ja Segerberg 2013; Juris 2012). Myös marxilainen pohdinta on tehnyt paluun alustatalouden myötä tapahtuneen pääoman jakautumisen seurauksena (esim. Spencer 2018). Jo tämä  tutkimusnäkökulmien lyhyt lista osoittaa, että politiikan tutkimusperinteet ovat tärkeässä roolissa myös nykyisen digitaalisen yhteiskunnan aikana.

Digitaalisuus ei muuta vain tutkimuskohteita, vaan myös aineistoja ja menetelmiä. Digitaaliset jalanjäljet (digital trace data) ja massadata (big data) mahdollistavat uudenlaisten kysymysten esittämisen: aiemmin tutkijoilla ei ollut käytettävissä samankaltaisia yksityiskohtaisia ja laajoja aineistoja ihmisten, organisaatioiden ja liikkeiden toiminnasta, vaan tutkimuksessa on turvauduttu havainnointiin, haastatteluihin, kyselyaineistoihin ja rekisteriaineistoihin. Lazerin ja kumppaneiden (2009) mukaan uudet digitaaliset aineistot ja niitä hyödyntävät laskennalliset menetelmät ovat kuin uusi mikroskooppi yhteiskuntatieteelliseen tutkimukseen. Sekä Rob Kitchin (2014) että danah boyd ja Kate Crawford (2012) kehottavat tutkijoita kuitenkin kriittisesti arvioimaan niitä tapoja, joilla tutkimusta tehdään massadatan aikana ja sitä, kuinka laskennalliset menetelmät muokkaavat yhteiskuntatieteellistä tutkimusta. Hyvä esimerkki peräänkuulutetusta kriittisyydestä on Grimmerin ja Stewartin (2013) artikkeli, jossa he perinteisiin laadullisiin lähestymistapohin verraten pohtivat, miten tekstianalyysiä voidaan toteuttaa esimerkiksi sanojen esiintymisfrekvenssejä tarkastelemalla.

Uusien menetelmien ja aineistojen myötä myös muut tieteenalat ovat innostuneet tarkastelemaan yhteiskuntatieteellisiä kysymyksiä. Justin Grimmerin (2015) mukaan laskennallisten menetelmien avulla yhteiskuntatieteellisiä kysymyksiä käsittelevät yhteiskuntatieteilijöiden lisäksi myös datatietelijät, tietojenkäsittelytietelijät ja fyysikot, usein monitieteisissä ryhmissä. Poikkitieteellinen lähestymistapa helposti tukee tietynlaisia institutionalisoituneita politiikan tutkimuksen muotoja. Se voi aiheuttaa esimerkiksi behavioralistisen politiikan tutkimuksen paluun, koska perspektiivin ajatus teoriapohjaisesta mallintamisesta on yhteensopiva perinteisten laskennallisten tieteen osaajien kanssa — eivätkä he tunne behavioralistista politiikan tutkimusta kohtaan esitettyä ansiokasta kritiikkiä. Toisaalta yhteiskuntatieteilijöiden perinteinen koulutus ei ole sisältänyt opetusta laskennallisista menetelmistä ja niiden käytöstä. Siksi yhteiskuntatieteellisen koulutuksen ulkopuolelta on helppo tarjota näkökantoja ja lähestymistapoja yhteiskuntatieteellisten kysymysten käsittelyyn, vaikka ne yhteiskuntatieteellisin silmin voivat näyttää naiiveilta. Hanna Wallach (2018) muistuttaakin tietojenkäsittelytieteilijöille, että yhteiskuntatiedettä ei synny automaattisesti käyttämällä yhteiskuntatieteellistä aineistoa. Vastaavasti Grimmer (2015) argumentoi, että jos haluamme luoda yhteiskuntatieteellisemmän lähestymistavan laskennalliseen yhteiskuntatieteeseen, on välttämätöntä että yhteiskuntatieteilijät ovat mukana tekemässä ja kehittämässä laskennallisten menetelmien käyttöä.

Tämän symposiumin artikkelit ovat esimerkkejä tällaisesta yhteistyöstä ja menetelmäkehityksestä. Symposium koostuu kolmesta toisiaan täydentävästä tekstistä. Kaksi ensimmäistä esittelevät laskennallisten menetelmien käyttöä politiikan tutkimuksen kentällä, kolmas pohtii laskennallisten menetelmien institutionalisoitumista suomalaiseen politiikan tutkimukseen. Tekstit siis omalta osaltaan vastaavat Grimmerin (2015) ehdotukseen pyrkiä muodostamaan selkeämmin yhteiskuntatieteellisesti painottunut näkökulma laskennallisten menetelmien käyttöön ja kehitykseen.

Salla-Maaria Laaksosen ja Matti Nelimarkan artikkeli tutkii digitaalista vaalijulkisuutta vuoden 2015 eduskuntavaaleissa. Tutkimuksessa laskennallisesti analysoidaan vaalien julkisella agendalla olleet teemat ja yhdistetään saatua tietoa toisaalta poliittisen viestinnän agendatutkimuksen teorioihin ja puolueiden aiheomistajuuden analyysiin. Tuukka Ylä-Anttila, Veikko Eranti ja Anna Kukkonen taas käsittelevät katsauksessaan ilmastonmuutoksesta käytyä julkista keskustelua aihemallinnuksen avulla. Kirjoittajat käyvät läpi menetelmän reunaehtoja ja ehdottavat laadullista validointiprosessia, jonka avulla menetelmää voisi käyttää tekstien kehysanalyysina.

Molemmat tekstit tarkastelevat agendan muodostumista laskennallisesti ja osoittavat samalla, että laskennalliset menetelmät voivat tarjota uusia työkaluja poliittisten argumenttien tutkimiseen ja sellaisiin politiikan ja poliittisen viestinnän polttaviin klassisiin kysymyksiin kuten agendan rakentaminen ja teemojen kehystäminen. Ennen kaikkea menetelmät mahdollistavat tällaisen analyysin tekemisen paljon aiempaa laajemmilla aineistoilla. Molemmat tekstit käyttävät menetelmänä ohjaamatonta koneoppimista, tarkemmin aihemallinnusta, mutta sitovat valitun menetelmän perinteiseen yhteiskuntatieteelliseen kysymyksenasetteluun. Lisäksi tekstit käyvät keskustelua laskennallisia menetelmiä soveltavan yhteiskuntatieteen käsitteiden kanssa — nähdäksemme tämä ei ole vain tarpeellinen, vaan myös välttämätön keskustelu.

Professori Pertti Ahonen luo katsauksessaan näkymän laskennallisten menetelmien institutionalisoitumiseen politiikan tutkimuksessa. Hän keskittyy nimenomaisesti laskennallisiin menetelmiin, joita on kehitetty politiikan tutkimuksen institutionalisoituneiden kysymysten tarkasteluun politiikan tutkijoiden toimesta. Ahonen päätyy toteamaan, että laskennallisten menetelmien käyttö politiikan tutkimuksessa on yhä sivupolku, ja varsinkin suomalaisessa politiikan tutkimuksessa melko vähäistä. Ahonen myös aiheellisesti peräänkuuluttaa syvällisempää keskustelua menetelmien filosofisista taustaoletuksista.

Menetelmäkeskustelua onkin yhä syytä käydä, ja sitä tulisi käydä poikkitieteellisesti. Poikkitieteellisyyden haasteeseen on herätty myös tietojenkäsittelytieteilijöiden joukossa (vrt. Wallach, 2018). Oleellista on, että vaikka laskennallisia menetelmiä voi usein soveltaa suoraan “out of the box”, ne eivät ole taikalaatikoita, jotka ratkaisevat aiemmat tutkimukseen liittyvät ongelmat ja luotettavuuskysymykset; laadullista tarkastelua ja teorialähtöisyyttä tarvitaan yhä rinnalle. Robotti ei vie politiikan tutkijan töitä, kuten Tuukka Ylä-Anttila ja kumppanit toteavat analyysinsa päätteeksi – eikä ehkä datatieteilijäkään.

Matti Nelimarkka & Salla-Maaria Laaksonen
Nelimarkka on tutkijatohtori Tietotekniikan laitoksella ja Tietotekniikan tutkimuslaitos HIIT:llä Aalto-yliopistossa ja opettaja Menetelmäkeskuksessa (Valtiotieteellinen tiedekunta, Helsingin yliopisto). Laaksonen on tutkijatohtori Kuluttajatutkimuskeskuksessa (Valtiotieteellinen tiedekunta, Helsingin yliopisto)

  • Beer, David. 2017. The social power of algorithms. Information, Communication & Society 20:1, 1–13.
  • Bennett, Lance ja Segerberg Alexandra. 2013. The Logic of Connective Action : Digital Media and the Personalization of Contentious Politics. Cambridge: Cambridge University Press.
  • boyd, danah ja Crawford, Kate. 2012. Critical Questions for Big Data. Information, Communication & Society 15:5, 662–679.
  • Castells, Manuel. 2007. Communication, Power and Counter-Power in the Network Society. International Journal of Communication 1:29, 238-266.
  • Chadwick, Andrew. 2013. The Hybrid Media System: Politics and Power. Oxford: Oxford University Press.
  • Gillespie, Tarleton. 2010. The politics of “platforms.” New Media and Society 12:3, 347–364.
  • Grimmer, Justin. 2015. We Are All Social Scientists Now: How Big Data, Machine Learning, and Causal Inference Work Together. PS: Political Science & Politics 48:01, 80–83.
  • Grimmer, Justin ja Stewart, Brandon M. 2013. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis 21:3, 267–297.
  • Juris, Jeffrey. 2012. Reflections on #Occupy Everywhere: Social Media, Public Space, and Emerging Logics of Aggregation. American Ethnologist 39:2, 259–79.
  • Kitchin, Rob. 2014. Big Data, new epistemologies and paradigm shifts. Big Data & Society 1:1, 1–12.
  • Lazer, David, Pentland Alex, Adamic Lada, ym. 2009. Life in the network: the coming age of computational social science. Science 323:5915, 721–723.
  • Neyland, Daniel ja Möllers, Norma. 2016. Algorithmic IF … THEN rules and the conditions and consequences of power. Information, Communication & Society 4462, 1–18.
  • Spencer, David. 2018. Fear and hope in an age of mass automation: debating the future of work. New Technology, Work and Employment 33:1, 1–12.
  • Wallach, Hanna. 2018. Computational social science ≠ computer science + social data. Communications of the ACM 61:3, 42–44.