Julkisuuteen tuodun tiedon ja sen unohtamisen oikeutus – yleisen edun ja kehkeytymisen haasteita

Tutkija toimii osana laein säädeltyä yhteiskuntaa, joten tutkimukseen vaikuttavien lakien muutoksista on hyvä olla perillä – ne usein vaikuttavat tutkijoiden käytännön työhön. Tämän tekstin tarkoitus on osoittaa, että julkiseksi saatetun tiedon muuttuminen, esimerkiksi ryhmien ja identiteettien kehkeytymisen takia, on suuri laskennallisen yhteiskuntatieteen eteen avautuva eettinen rajaseutu. Yksittäisen tutkijan on tutkimastaan ilmiöstä riippuen hahmotettava erilaisten kehkeytymisprosessien luonnetta ja otettava huomioon, miten tutkittavien mieli ja sitä myötä tulkinnat saattavat ajan kuluessa muuttua.

cocoons-329070_1920

Taustaa

Online-aineistojen hankintaa ja käsittelyä formalisoi taannoin niin kutsuttu tietosuoja-asetus, lyhyemmin GDPR (Euroopan parlamentin ja neuvoston asetus luonnollisten henkilöiden suojelusta henkilötietojen käsittelyssä sekä näiden tietojen vapaasta liikkuvuudesta (yleinen tietosuoja-asetus), 2016). Nykyisen tietosuoja-asetuksen edeltäjä (Henkilötietolaki 1999) määritteli erikseen arkaluontoiset tiedot, joukossaan poliittinen suuntaus ja terveystieto. Koska arkaluontoisia tietojakin koskeva tutkimustyö oli aina sallittu, tutkijat määrittelivät sisäisillä säännöillään sen, millainen tieto täsmälleen käsitetään vaikkapa terveystiedoksi, ja miten sen arkaluontoisuuteen pitäisi käytännössä suhtautua.

GDPR-käsitteistössä arkaluontoisten, eli “erityisten henkilötietoryhmien” (9. artikla) käsittely ei ole kiellettyä sikäli kun se “koskee henkilötietoja, jotka rekisteröity on nimenomaisesti saattanut julkisiksi”. ”Julkisuuteen saatetulla tiedolla” on kuitenkin muuttuva luonne. Yksi tutkijan uudistunut vastuu tietosuoja-asetuksen ja eräiden muiden viimeaikaisten lakien ja tulkintojen jälkeen onkin hahmottaa, mikä milloinkin on se täsmällinen tieto, joka on nimenomaisesti saatettu julkiseksi. Kehkeytyvien ryhmien ja identiteettien tutkimuksen esimerkit osoittavat uudistuneita eettisten ja tulkinnallisten pohdintojen paikkoja.

Mikä halutaan unohtaa, mikä tieto milloinkin saatettiin julkiseksi ja mistä ei vielä tiedetä mitä julkisuuteen ollaan laittamassa tai miltä se voi tulevaisuudessa näyttää?

Jotkut tiedot on jossain vaiheessa saatettu julkisiksi, mutta myöhemmin ne halutaan poistaa julkisuudesta. GDPR:n tunnetuimpia seurauksia lienee niin kutsuttu “oikeus tulla unohdetuksi”; rekisteröidyn oikeus pyytää itseään koskevien tietojen poistamista. Tämä oikeus on linjassa tutkimuksen kanssa, jonka mukaan enemmistö online-tutkimuksen kohteista pitää epämukavana ajatusta, että heidän myöhemmin poistamaansa Twitter-viestiä käytettäisiin tutkimuksessa (Fiesler and Proferes 2018). ”Oikeus tulla unohdetuksi” onkin hyvä esimerkki siitä, kuinka lakeja kirjoitetaan ajan myötä uudelleen ja tulkitaan eri paikoissa eri tavoilla. Aiempi Suomen henkilötietolaki (1999) ei tunnistanut unohtamisen oikeutta lainkaan, jolloin tietojen poistamisen huomioon ottaminen jäi tieteen sisäisen ja jopa yksittäisen tutkijan pohdinnan varaan. GDPR:n (2016) mukaan henkilötietojen käsittely ei ole lainmukaista enää sen jälkeen kun rekisteröity on perunut suostumuksensa, erityisesti silloin kun rekisteröity on antanut suostumuksensa lapsena. Käsittelyn tulisi silti edelleen olla lainmukaista tutkimustarkoituksiin. Vaikka Fieslerin ja Proferesin (2018) tavoittamat tutkittavat eivät siitä pitäisikään, GDPR ei kiellä tutkijaa hyödyntämästä tutkimuksessaan myös poistettuja henkilötietoja (kuten poliittisen kannan ilmaisevia Twitter-viestejä). Muotoilullaan GDPR silti alleviivaa, että muissa konteksteissa moinen ei olisi mahdollista. Suomen tietosuojavaltuutettu ohjaa tutkijaa tässä linjauksellaan, että rekisteröidyllä ”ei ole oikeutta” poistattaa häntä koskevia tietoja, jos tieto on “tarpeen” “yleisen edun” mukaisessa tutkimustarkoituksessa[1]. Suomalaisessa tulkinnassa ”yleinen etu” menee näin yhdysvaltalaisten Fieslerin ja Proferesin tutkiman yksityisen edun edelle. GDPR ei kuitenkaan sitä edellytä.

Mitä tämä ”yleinen etu” sitten käytännössä tarkoittaa? COVID-epidemian pyörteissä voidaan nostaa esiin tietosuojavaltuutetun linjaama kansanterveyteen liittyvä yleinen etu, jota hahmottelee myös hiljattain säädetty, niin kutsuttu toisiolaki (Laki sosiaali- ja terveystietojen toissijaisesta käytöstä 2019). Tutkimukseen vaikuttavassa lainsäädännössä on kuitenkin määritelty muitakin yleisiä etuja. Niin kutsutut tiedustelulait, (Laki sotilastiedustelusta 2019), sekä (Laki henkilötietojen käsittelystä rikosasioissa ja kansallisen turvallisuuden ylläpitämisen yhteydessä 2018), hahmottelevat nykyään myös Suomessa rajalinjoja tutkijalle ja tutkittaville, joiden toimien voisi tulkita olevan kansallisen turvallisuuden kannalta kiinnostavia. Tämän tyyppiset tutkimusaiheet eivät ole suorastaan harvinaisia – esimerkkinä palvelkoon kapinallisryhmien mobilisoituminen onlinealustoilla, kuten (Käihkö 2020):n Ukrainaa käsittelevässä julkaisussa. Tutkijan luonnollisesti kuuluu pohdiskella esimerkiksi sitä, kuka kuuluu kapinallisryhmään, millä perusteella, ja millä perustein tutkittavat sekä tutkittava ryhmä valitaan ja identifioidaan. Asiaa mutkistaa se, että Internetissä myös leikitellään identiteeteillä (Lampinen, Lehtinen, and Cheshire 2014), ja toisaalta poliittisten ryhmien päämäärät muokkautuvat vähitellen diskursiivisessa prosessissa (Tilly 2002). On siis oltava sensitiivinen sille, kuinka vakaasti joku on saattanut julkiseksi tiedon siitä, että edustaa tiettyä poliittista kantaa. Tutkijan valinnoilla voi olla viime kädessä tuomioistuinseuraamuksia.

”Oikeus unohtaa” ei siis koske aivan kaikkia tilanteita, mutta lainsäädännön aluevaltaukset eivät ole pelkästään syy hämärtää tutkittavien poliittista kantaa viranomaisten pelossa. Laajemmin ymmärrettynä tutkija tarvitsee sensitiivisyyttä niin sille, miten tutkittava tutkimuksessa kullakin hetkellä nimetään, kuin sille, kuinka hänen annetaan suhtautua menneisyyteensä. GDPR:ssä esimerkkinä ”oikeudesta unohtaa” käytetään lapsena annetun suostumuksen peruuttamista. ”Success kid”-meemi on kuitenkin ambivalentti ääriesimerkki tapauksesta, jossa yhtä lapsuuden hetkeään ei voi koskaan unohtaa, koska siitä on tullut osa kulttuurista kuvastoa[2]. Nuorison tutkimista Internet-kontekstissa on aiemmin ansiokkaasti pohtinut esimerkiksi (Tikka 2014), mutta kuinka tutkijoina otammekaan huomioon aikuiset, joiden suhtautuminen julkisuuteen saattamaansa tietoon muuttuu? Esimerkkejä usein staattisiksi oletettujen tietojen muutoksesta voidaan nimetä kaksi. Poliittisen kannan muuttumisen esimerkkinä palvelkoon radikaalin suomalaisen vastarintaliikkeen perustaja, joka katsoo menneisyyttään katumuksella, ja on kirjan julkaisemalla tehnyt aiempiin ajatuksiinsa pesäeron (Holappa 2016). Toisen tyyppinen esimerkki ovat henkilöt, jotka haluavat jossain vaiheessa muuttaa usein staattiseksi oletettua ominaisuutta kuten julkiseksi saatettua ”sukupuoli”-kategoriaa. Julkisiin esimerkkeihin kuuluvat sukupuoltaan korjanneet suomalainen kirkkoherra Aalto[3] ja yhdysvaltalainen ex-urheilija-televisiotähti Jenner[4]. Jälkimmäiset kaksi eivät haastatteluissaan Holapan tavoin tuomitse aiempaa elämänvaihettaan. Näitä hyvin erilaisia esimerkkejä yhdistää kuitenkin se, etteivät ihmiset aina näytä kaipaavan ”oikeutta unohtaa”. He työstävät julkiseksi tiedoksi päätynyttä menneisyyttään ja nykyisyyttään osana ympäristöään. Tämä tutkijan tulee ymmärtää silloinkin, kun työstäminen saatetaan vain osittain julkiseksi.

Pohdinnat kiertyvät lopulta yhden ja saman aiheen ympärille: Online-tutkijalle tarjoutuva julkisuuteen saatettu tieto on muuttuvaa. Se voi olla alkujaankin tulkinnanvaraista, ja mahdolliset tulkinnat muuttuvat ajan myötä. Esimerkiksi kehkeytyvät poliittiset ryhmät eivät suinkaan ole alusta asti päämäärätietoisia ja stabiileja. Niiden ideologia ja jäsenyys on etenkin alkuvaiheessa yleensä huokoista; rajat ovat vasta kehkeytymässä (Abbott 2014, 2016; Tilly 1978). Toisaalta erityisesti marginaalista nouseviin identiteetteihin on kehkeytymässä intersektionaalisuutta, jossa eri lähtökohdista ponnistavat identiteetit löytävätkin yhteneväisyyksiä toistensa kanssa (Abbott 2001; Crenshaw 1989; Tormos 2017). Käymistilassa olevien identiteettien kantajat toisaalta käyvät läpi omaa identiteettiprosessiaan, toisaalta hahmottelevat niin henkilökohtaisen kuin ryhmäidentiteettinsä intersektionaalisuutta muiden identiteettien kanssa.

On selvää, että erityisesti kehkeytyviä ilmiöitä hahmottelevan tutkijan on aktiivisesti suhteutettava aineistonsa ja tutkimuksensa eritasoisten kehkeytymisprosessien vaiheisiin, sekä ”unohtamisen” ja ”yleisen edun” problematiikkaan. Vaikka johtopäätös olisi, että tänään on ”yleisen edun” mukaista tutkia transsukupuolisuuttaan 2010-luvun alussa kipuilleen nuoren online-viiltelykertomuksia, ei liene haittaa hahmotella silloin tällöin myös sitä, miten omien aiempien aineistojen tulkinta muuttuisi ajan myötä.

Viitteet

Abbott, Andrew. 2001. Chaos of Disciplines. University of Chicago Press.

———. 2014. The System of Professions: An Essay on the Division of Expert Labor. University of Chicago press.

———. 2016. “Social Order and Process.” In Processual Sociology, University of Chicago Press, 198–232.

Crenshaw, Kimberle. 1989. “Demarginalizing the Intersection of Race and Sex: A Black Feminist Critique of Antidiscrimination Doctrine, Feminist Theory and Antiracist Politics.” The University of Chicago Legal Forum: 139–68.

Fiesler, Casey, and Nicholas Proferes. 2018. “‘Participant’ Perceptions of Twitter Research Ethics.” Social Media and Society 4(1).

Henkilötietolaki. 1999. Finland. https://www.finlex.fi/fi/laki/ajantasa/kumotut/1999/19990523.

Holappa, Henrik. 2016. Minä Perustin Uusnatsijärjestön – Suomen Vastarintaliikkeen Ex-Johtajan Muistelmat. Into Kustannus.

Käihkö, Ilmari. 2020. “Conflict Chatnography: Instant Messaging Apps, Social Media and Conflict Ethnography in Ukraine.” Ethnography 21(1): 71–91.

Laki Henkilötietojen Käsittelystä Rikosasioissa Ja Kansallisen Turvallisuuden Ylläpitämisen Yhteydessä. 2018. Finland. https://www.finlex.fi/fi/laki/alkup/2018/20181054.

Laki Sosiaali- Ja Terveystietojen Toissijaisesta Käytöstä. 2019. Finland. https://www.finlex.fi/fi/laki/alkup/2019/20190552#Lidp446465968.

Laki Sotilastiedustelusta. 2019. Finland. https://www.finlex.fi/fi/laki/alkup/2019/20190590.

Lampinen, Airi, Vilma Lehtinen, and Coye Cheshire. 2014. “Media Choice and Identity Work: A Case Study of Information Communication Technology Use in a Peer Community.” In Communication and Information Technologies Annual, Studies in Media and Communications, Emerald Group Publishing Limited, 103–30. https://doi.org/10.1108/S2050-206020140000008020.

Tikka, Minttu. 2014. “Tutkija Nuorten Mediamaailmassa.” Nuorisotutkimus 32(3).

Tilly, Charles. 1978. From Mobilization to Revolution. Addison-Wesley.

———. 2002. Stories, Identities, and Political Change. Rowman & Littlefield.

Tormos, F. 2017. “Intersectional Solidarity.” Politics, Groups, and Identities 5(4): 707–20. https://doi.org/10.1080/21565503.2017.1385494.

 

[1] https://tietosuoja.fi/oikeus-poistaa-tiedot

[2] https://thetab.com/uk/2020/02/11/success-kid-meme-now-142830

[3] https://yle.fi/uutiset/3-11228614

[4] https://www.vanityfair.com/hollywood/2015/06/caitlyn-jenner-bruce-cover-annie-leibovitz

Lectio Praecursoria: Imagining the Data Economy

4839933569_7732d0cdf7_o
cc: Loguy

Lectio Praecursoria presented in the public defence of my PhD thesis “Imagining the Data Economy” on April 25th, 2020 at 12 noon, using remote connections via Zoom. The lectio has been lightly edited for online publication. Full PDF version of the PhD thesis is available online: https://www.utupub.fi/handle/10024/149155.

***

Learned Custos in Turku, my esteemed Opponent in Hamburg, ladies and gentlemen in the audience,

Before imagining the data economy, let us start with something from the past. The history of capitalism is a history of transforming things into resources and commodities. Consider the things we call natural resources. Coal was once a rock in the ground, and fisheries were fish in the water. Environmental historians1 remind us that coal and fish did not become resources by themselves. It took specific economic relations and specific cultural conditions for this to happen.

Digital data is also a thing that has become a resource. You can often hear the claim that data is like a natural resource2, but data is always created on purpose. There was never a time when data was like a rock in the ground; just strings of ones and zeros that somehow ended up on the hard drive or the Hadoop cluster. But the role of data as an economic resource has certainly changed. Our digital habitat is now built and run by firms that rely on data about people for the production of services and the creation of economic value.

The productive activities that involve data about people form something that we might call a personal data economy; a system that uses personal data to provide things that meet human needs.

A short while ago, it seemed that citizens will mostly derive agency and empowerment from new technologies that rely on data. With hindsight, it seems somehow naive that we were so optimistic about web 2.0 services, free as the radical new price, and the democratization of information production. We have begun to understand the relations of power that underlie these technologies, and their implications for our lives. We are increasingly aware of the potential that data has for social change, for surveillance, for economic exploitation, and for control of others and the self.

If things are transformed into resources and do not simply become resources, how was data turned into the resource it is today? How did we get to the data economy we now live with? 

The underlying technological change came with information technology. Already in the 1980’s, Shoshana Zuboff3 pointed out that information technology does not just automate, but it also informates, or produces information about what it automates. Today, a more common concept for this is datafication4. We use technologies to communicate, but those technologies also produce data about us communicating. We use technologies to search for things, but the same technologies also find us. Technologies help us travel and transfer things efficiently, but also make these movements visible and available for others.

Datafication technologies make the production and exchange of data possible. They are a necessary condition for today’s data economy. But an economy does not emerge from technology. Since Max Weber, sociological views of the economy have underlined that economies consist also of the social, cultural and institutional context in which production and exchange take place. This means that to take a sociological view of the data economy, we must pay attention to the socio-cultural and institutional context of data production and its economic use.

There is extensive literature on this context of the data economy, but it is not always framed as such. Surveillance studies, data studies and data privacy research have examined the imperatives driving the production of data, the arrangements that go into that production, and their implications for people as data subjects, citizens and consumers. 

Taken as an analysis of the data economy5, this literature reveals a distinct logic that underpins how datafication is used to produce things that meet human needs. Competition drives firms to collect more and more data about people’s lives. Simultaneously, people have become accustomed, or even resigned, to commercial surveillance practices. The markets in which exchanges of data happen are often business-to-business. These markets are not accessible for you and I. Also the formal institution of data protection seems to act as a sort of partner-in-crime6 here: it makes people responsible for their data, but data is not an easy object of individual calculations of costs or value. 

While we benefit in many ways from things provided with our data, we lack the means to make data serve our own ends on our own terms.

Could the data economy work in a different way? 

When conditions change, resources might turn into something else again. Consider coal and fish. Coal might turn from a resource into a lump of condensed carbon emission. Fish might become an unethical source of protein or an endangered species. Nothing inherent in coal or fish needs to change, if the socio-cultural and economic context changes.

Data could also be turned into a different resource, and the data economy could work in a different way. Many ideas about a different data economy are out there, and today you don’t even have to look very hard. 

Not long ago, a government minister in Finland launched a programme related to personal data by mobilising a Finnish cultural trope. He asked, “Can Moomin Valley challenge Silicon Valley?” You might be excited or disappointed to hear that this Moomin Valley of personal data is about data governance. But when the data economy only exists in a socio-cultural and institutional context, a different model for data governance is also a vision about how the data economy should work. Moomin Valley’s data economy is supposedly different from the one they run from Silicon Valley.

In the thesis, I examine an idea for data governance – and therefore, an idea for the data economy – that has been developed in the context of data activism. Here, I follow Stefania Milan and colleagues7, who suggest data activism as a heuristic device. This means I use data activism as a tool to examine engagement and political action that take a critical stance in relation to data and their distribution. 

My empirical case is MyData. It is based on a vision of a more just digital environment that is achieved when people have the right and the practical capability to manage their data. Framed in terms of the data economy, MyData envisions an alternative economic order, in which data is not just a resource for companies, but also something that people themselves decide about. When people manage data about themselves, it is thought to become available for novel ways to produce value.

The original research in the thesis was published in four articles that examine data activism from different standpoints. Two of the articles focus on end-user technologies that aim to realise the practical capability to manage data. The other two focus on investigating MyData as an emerging form of data activism.

To draw together this research, I adopt and adapt the theoretical concept of collective imagination.

I use the concept in two senses. The first one follows Charles Taylor8, who discusses collective imagination as that which helps people to make sense of the society around them. Taylor talks about social imaginaries, or widely shared understandings that are taken for granted and that have achieved general legitimacy. To put in short, the social imaginary concerns how things work in the world and what is normal. Following this line of thought, I consider the current social, cultural and institutional context of datafication as the dominant imaginary about the data economy.

The second sense in which I employ collective imagination is to examine alternatives to this dominant imaginary. According to Sheila Jasanoff9, collective imagination produces socio-technical imaginaries, or shared visions of a desirable future which are achievable by means of technoscientific advancement. Socio-technical imaginaries have a distinct forward-looking element to them. Sometimes they are counter-imaginaries to dominant ones; in these cases, they are visions of avoiding an undesirable future. Following this idea, I look at data activism as a source of alternative imaginaries about the data economy. A further insight gained with this theoretical lens is that there can be many concurrent imaginaries about the data economy within data activism, or alternatives within the alternative. They can embrace contested values and can work towards different – and divergent – futures. Examining these alternatives makes it possible to do research on different potential data economies that are contained within data activism.

There are three main research questions in the thesis. I will discuss them briefly one by one. The first research question concerns how alternative imaginaries developed in data activism compare with the dominant imaginary.

The issue at stake here is data agency. By this, I refer to the capacity to act intentionally in relation to personal data. In the thesis, I describe different forms of imagined data agency. The bottom line is that they concern economic participation. In the alternative data economy, people are imagined as agentic participants in managing their lives in situations that involve the production and use of personal data.

Data agency is imagined not only to turn people into economic participants, but also to make data move. When people control data, it is imagined to become available for businesses that currently lack access to it. This means that two different goals are combined here: empowerment of people in datafied times, along with new opportunities to do business with data.

The second research question concerns how different alternative imaginaries developed in data activism compare with each other. The answer is that while data agency is a shared goal, there are different notions about what data agency means. These different notions serve as entry points into different imaginaries about the data economy. I call these the market imaginary and the citizen imaginary

In the market imaginary, data agency is the capability to make choices on the collection, sharing, and use of personal data. People examine market offerings and use data to improve their lives, making personal data serve their own ends. Data governance happens by market forces, and efficient data markets guarantee desirable societal outcomes. The value expected from data is related to the improvement and efficiency of personalization, use experience and service provision. As I argue in the thesis, this imaginary does not so much question dominant economic rationales, but rather transforms them to serve the ends of data activism.  

The citizen imaginary, in contrast, views reliance on the market as dubious. In the citizen imaginary, data agency is rather the collective capability to participate in processes that determine how data is used. Data is viewed as a collective rather than individual resource, and outcomes for people collectively are brought to the foreground. This relies on explicit models for collective governance of the collective data resource. As I suggest in the thesis, this imaginary contains possibilities for novel ways of making data valuable, which are rooted in the good of the collective that produces and sustains the data resource.

The third research question of the thesis is, how can we identify and promote desirable imaginaries about the data economy?

Given the critical research on datafication, it seems justified that a researcher does not only observe attempts to shape a different data economy, but also participates in this shaping. But remaining committed to a critical position means that also the agendas and problem settings of data activism require critical attention. The four published articles that form the core of the thesis reflect different ways to engage with data activism in a manner that has been indicated by Bruno Latour: doing critique that does not only debunk, but also assembles. Throughout the research, my aim has been to produce knowledge that is relevant in a social scientific sense, and can also be relevant for data activism practice.

The answers to the question about desirability are far from conclusive. This is, after all, about imaginaries and potential outcomes. As I describe in the thesis, the market imaginary seems likely to expand to agendas beyond data activism. But reliance on individual market agency appears as a precarious effort to shape a desirable data economy. Given the nature of data as a resource and given the power relations in the data economy, the citizen imaginary seems like a more promising point of departure. 

What I suggest in the thesis as a desirable data economy imaginary is something like a synthesis. It builds on the notions of collective data governance and new, collective ways to make our data valuable. At the same time, to take hold of the broader collective imagination, it should attach onto things that already provide economic and social value with data. Collective forms of governance can regulate the use of our data as an economic resource, but this does not mean precluding the production of economic value. 

An imaginary about the data economy is not a recipe for building services or a model that can be implemented. It is rather a way of looking at the world and the relations between people and data, and the production of things that meet people’s needs. 

But different imaginaries lead to different material things, different technologies. Different technologies can have different societal outcomes. 

For data activism, the implication of this research would be to move beyond the individual as the locus of data control. Unlike us social scientists, data activists have the capability of putting together experimental data technologies and governance structures. It is important to experiment with different – and diverse – ways of forming resources based on data, different ways governing these resources, and different ways of relating and attaching these resources to the data economy that is already there.

How we collectively imagine makes a difference. Imaginaries matter and have consequences for the present and the future. 

Data technologies will continue to have implications for our lives, whether we want it or not. Their development is shaped by imaginaries about how the data economy functions and should function. Social-scientific scholarship has a role to play in shaping the data economy. It can identify and kindle those imaginaries that shape pathways towards a desirable digital environment, a data future that we would rather live in.

Professor Ingrid Schneider, I respectfully ask you, as the Opponent duly appointed by the Faculty of Social Sciences for my disputation, to present any criticisms you may have against my doctoral dissertation.

***

1 – Such as Jason Moore. For this particular argument, see for example: https://jasonwmoore.wordpress.com/2013/07/04/anthropocene-capitalocene-the-myth-of-industrialization-ii/ 

2 – For an elegant discussion on data vis-à-vis natural resources, see Kelly Pendergrast’s essay “The Next Big Cheap” in Real Life Magazine https://reallifemag.com/the-next-big-cheap/

3 – See Zuboff, S. (1985). Automate / informate: The two faces of intelligent technology. Organizational Dynamics, 14(2), 5–18. http://dx.doi.org/10.1016/0090-2616(85)90033-6 

4 – “Datafication” was introduced into social-scientific lingo by José van Dijck: van Dijck, J. (2014). Datafication, dataism and dataveillance: Big Data between scientific paradigm and ideology. Surveillance & Society, 12(2), 197–208. https://doi.org/10.24908/ss.v12i2.4776 

5 – This deserves more references than can be listed here. See Chapter 3 of my PhD thesis for a more thorough discussion on the social, cultural and institutional context of data production and data use: https://www.utupub.fi/handle/10024/149155

6 – This felicitous phrasing was first used by Sami Coll: Coll, S. (2014). Power, knowledge, and the subjects of privacy: Understanding privacy as the ally of surveillance. Information, Communication & Society, 17(10), 1250–1263. https://doi.org/10.1080/1369118X.2014.918636

7 – For discussion on data activism as a heuristic, see Milan, S., & van der Velden, L. (2016). The alternative epistemologies of data activism. Digital Culture & Society, 2(2), 57–74. https://doi.org/10.14361/dcs-2016-0205 

8 – See Taylor, C. (2002). Modern social imaginaries. Public Culture, 14(1), 91–124. https://doi.org/10.1215/08992363-14-1-91. For an extended discussion, see Taylor’s 2004 book with the same name. For an accessible overview and discussion on related literature, see Ruppert, E. (2018). Sociotechnical Imaginaries of Different Data Futures. An Experiment in Citizen Data. Erasmus University Rotterdam. https://www.eur.nl/sites/corporate/files/2018-06/3e%20van%20doornlezing%20evelyn%20ruppert.pdf 

9 – For an STS take on the topic of collective imagination, see Jasanoff, S. (2015a). Future imperfect: Science, technology and the imaginations of modernity. In: Jasanoff, S., & Kim, S-H. (Eds.) Dreamscapes of Modernity. Sociotechnical Imaginaries and the Fabrication of Power, 1–33. Chicago, IL: University of Chicago Press.

Koronavirus ja numeroiden tenho

https://www.flickr.com/photos/k0rry/8216995942/
(cc) Korry Benneth Flickr

Maailma on päätynyt poikkeustilaan uuden koronaviruksen vuoksi. Sen vaikutukset heijastuvat myös digitaaliseen arkeen ennennäkemättömällä tavalla. Digitaalisessa viestinnässä näkyy paitsi kansalaisten huoli, myös tarve järkeistää kriisiä numeroiden ja tilastojen avulla.

Keskeinen strategia globaalissa viranomaisviestinnässä on ollut epidemiatilanteeseen liittyvien numeroiden julkaiseminen: montako tartuntaa todettu, montako kuollutta, montako parantunutta. Samaan aikaan on alkanut käydä selväksi ja väistämättömäksi, että terveydenhuoltojärjestelmän haaviin osuu vain osa tartunnoista. Virusta löytyy myös täysin oireettomilta (esim. tutkimukset Hollannissa ja muualla) ja toisaalta monet tartunnan saaneet ovat vähäoireisia eivätkä siksi päädy hakeutumaan hoitoon.

Numeroiden julkaisu, niiden visualisointi kartalle ja kuvaajien piirtäminen on tärkeä ja luonteva tapa paitsi seurata epidemiaa, myös luoda kuvaa siitä, että tilanne on hallinnassa. Tätä toisintavat yhtä lailla niin viranomaiset, media kuin kansalaisetkin.

Lukuisat yhteiskuntatietelijät ovat kirjoittaneet numeroiden ja niihin perustuvan datan merkityksestä arjen ja yhteiskunnan hallinnassa, organisoitumisessa ja viestinnässä. Esimerkiksi tieteenhistorioitsija Theodore Porter [1] kirjoittaa luottamuksesta numeroihin yhteiskunnallisena käytänteenä, joilla rakennetaan objektiivisuutta ja puolueettomuutta. Samalla mittaukset ovat performatiivisia, rakentavia: ne luovat yhteiskuntaa, jota mitataan. Tämä pätee erityisesti esimerkiksi väestötiedon ja taloudellisen tiedon tuottamiseen [2]. Tieteenfilosofi Ian Hacking [3] kirjoittaa kriittisesti numerofetissistä: numeroita kerätään vain koska voidaan, mutta siitä huolimatta niitä aletaan käyttää ongelmanratkaisun välineenä.

Koronaviruksen tapauksessa lukuja käytetään helposti myös maiden ja alueiden keskinäiseen vertailuun. Sosiologi David Beer [4] muistuttaakin numeroiden usein kehystyvän paitsi havaintojen luokitteluun, myös kilpailuun kapitalismissa. Tässä tapauksessa kilpailu on kenties sitä, kuka maa pystyy parhaiten estämään taudin leviämistä. Mittaustavat kuitenkin vaihtelevat maittain ja ajankohdittain, mikä hankaloittaa vertailujen tekemistä. Reunaehdoista huolimatta numerot helposti alkavat elää omaa elämäänsä: karkaavat alkuperäisestä kontekstista ja tehokkaasti piilottavat sen, miten niitä on tuotettu.

Kiinnostavinta viime päivien verkkojulkisuudessa ovat olleet erilaiset rogue-tilastot, laskelmat ja kuvaajat, joilla erilaiset kansalaisyhteiskunnan toimijat ovat pyrkineet haastamaan virallista tilannekuvaa ja viranomaisten toimenpiteitä. Sekä suomenkielisessä että kansainvälisessä sosiaalisessa mediassa on tullut vastaan lukuisia twiittajia ja bloggaajia, jotka pyörittävät omia laskelmiaan siitä millä käyrällä koronatartuntojen kanssa mennään, montako kuollutta meillä on pääsiäiseen mennessä ja miten rajoituskeinot toimivat.

Nämä viestit ovat vakuuttavia ja vetoavia, vaikuttavat asiantuntevalta ja niitä jaetaan helposti. Viestit rakentavat teknologian taianomaisuuden ja suurten lupausten päälle [5,6], mikä tekee niistä pelottavan tehokkaita. Maallikko harvoin uskaltaa epäillä tai väittää vastaan tilastoille ja mallinnuksille.

Sama logiikka on toki läsnä viranomaisviestinnässä ja tieteellisessä viestinnässä, mutta ainakin tietoa tuottavilla tahoilla on takanaan ymmärrys epidemioiden luonteesta ja käytössään kansainvälisessä yhteistyössä valmistellut data ja vertaisarvioituun tutkimukseen perustuvat mallit. On vähän syitä olettaa, että maallikko pystyisi ajattelemaan tai löytämään jotakin sellaista, mitä asiantuntijat eivät. Tällaisessa tilanteessa myös tieto ja tilannekuva muuttuvat koko ajan, ja tuorein tieto on todennäköisesti juuri viranomaisten saatavilla.

Ehkä tässä tilanteessa olisi parasta siis jättää numerot ja visualisoinnit asiantuntijoille. Tämän ehdotuksen ovat muutkin verkossa jo esittäneet hieman suorasanaisemmin:


Disclaimer:
Koska verkkokeskustelu käy tällä hetkellä kuumana, todettakoon vielä että en ole itsekään epidemologi vaan verkkoviestinnän ja teknologian tutkija. En siis tällä kirjoituksella kritisoi viranomaisten tekemää tapausten seurantaa tai seurantatapoja, vaan huomioin yhteiskuntatieteellisestä näkökulmasta yleisemmin kiinnostavaa numeroiden ja tilastojen käyttötapaa globaalin kriisin keskellä.

Kirjallisuutta;
[1] Porter, T. M. (1995). Trust in Numbers: The Pursuit of Objectivity in Science and Public Life. Princeton: Princeton University Press. https://doi.org/10.1017/CBO9781107415324.004

[2] MacKenzie, D., Muniesa, F., & Siu, L. (2007). Do Economists Make Markets? On the Performativity of Economics. Princeton and Oxford: Princeton University Press.
[3] Hacking I. (1990) The Taming of Chance. Cambridge: Cambridge University Press.
[4] Beer, D. (2016). Metric power. Metric Power. https://doi.org/10.1057/978-1-137-55649-3
[5] Beer, D. (2019). The Data Gaze: Capitalism, Power and Perception. London: SAGE. https://doi.org/10.4135/9781526463210
[6] Bowker, G., & Star, S. L. (2000). Sorting things out. MIT press.

Onko maailma erilainen riippuen siitä kenen tekoäly sitä katselee?

Jokainen verkkomedian tutkija on varmasti havainnut, kuinka mediaympäristössä kuvilla on yhä suurempi merkitys. Melkein jokaisella on mukana vähintään yksi kamera jatkuvasti, jolla otetaan ja jaetaan kuvia arkipäivistä ja juhlista. Samoin uutisissa visuaalisuuden rooli on edelleen tärkeä – teksti ilman kuvaa ei välttämättä vetoa lukijoihin samoin kuin aikaisemmin. Internetissä video- ja kuvamateriaalin määrä on kasvanut ja useat suositut palvelut, kuten TikTok sekä Instagram pohjautuvat suurimmalta osin audio-visuaaliseen materiaaliin.

Tämä luo yhteiskuntatieteen tutkijoille taas uusia haasteita. Olemme vasta oppimassa menetelmiä suurten teksiaineistojen analyysin, mutta maailma on ollut meitä nopeampi ja vaatii jälleen uusia näkökulmia ja menetelmiä asioiden ymmärtämiseen. Visuaalinen big data myös välttää tekstiaineistojen analyysin joitain haasteita ja esimerkiksi kuvien leviämistä voidaan seurata sosiaalisen median ryhmissä hyvinkin helposti jopa kansainvälisesti – kieli ei muutu. Usein meitä kuitenkin kiinnostaa ymmärtää sisältöjä paremmin, esimerkiksi sisällön erittelyn kautta.

2019-11-10 16.16.00
Koneoppijan mielestä tämä kuva on: Daytime, Sky, City, Public Space, Human Settlement, Road, Residential Area, Urban Area, Asphalt, Metropolitan Area, Tree, Infrastructure, Park, Road Surface, Downtown, Architecture, Neighbourhood, Skyline, Real Estate, Thoroughfare, Building, Suburb, Urban Design, Street, Lane, Walkway, Cloud, Recreation, Plaza, Town Square, Sidewalk, Nonbuilding Structure.

Ei hätää! Koneoppimisen, tai trendikkäämmin tekoälyn, avulla voimme automaattisesti sanoa, mitä kuvissa on. Se ei tietenkään ole täysin tarkkaa, mutta ei se ole myöskään täysin satunnaista. Useat isot alustat ovatkin rakentaneet omia mallejaan kuvien automaattiseen tunnistamiseen sekä “tagaamiseen”, eli sisällön erotteluun. Palveluita löytyy niin Microsoftilta kuin Googlelta. Mutta! Mitä palvelua yhteiskuntatieteilijän kannattaisi käyttää, jotta tulokset olisivat mahdollisimman oikein? Toinen muotoilu tälle kysymykselle on: mitä eroja eri kuvatunnistuspalveluiden välillä on?

Otin satunnaisen 150 kuvan ryhmän ja laitoin niissä olleet kuvat Microsoftin, Googlen, Amazonin ja IBMn kuvatunnistuspalveluihin. Olen juuri työstämässä tarkempaa analyysiä sekä menetelmistöä analyysipalveluiden välisten erojen tunnistamiseen, mutta tässä on alustava yleiskuva palveluista – kuten näkyy, eroja siinä miten nämä 150 kuvaa nähdään tuntuu olevan.

Tule kuulemaan tarkempia alustavia tuloksia Digital Humanities Research Seminar-tapahtumaan 26.3. kello 16 Metsätalolle (Sali 10, Unioninkatu 40) – sekä toki myöhemmin tänne blogiin tulevien päivitysten kautta. Esitys on englanniksi, mutta blogiin teksti tulee suomeksi.

Puolueiden vuorovaikutuksesta vaaleissa – varhaisia ajatuksia

Olen mukana pohtimassa pohjoismaisten puolueiden puheenjohtajien ja puoluetilien käyttöä viimisimmissä vaaleissa muutaman muun tutkijan kanssa. Sen takia olen nyt tuijoitellut sosiaalisen median tilien sisältöä ja olemme pähkäilleet mikä on tarina jonka haluamme datalla kertoa. Täysin eksploratiivista tutkimusta siis. Yksi suunta jota olemme kovasti pohtineet on ollut ymmärtää miten yleisö reagoi, eli kuinka he uudelleenjakavat, kommentoivat tai käyttävät hienoja reaktiohymiöitä Facebookissa puolueiden viestien kohdalla. Koska tästä tulee kivasti kolme dimensioita, kokeilin miten tässä voisi käyttää hienoja kolmiulotteisia käppyröitä apuna.

Esimerkiksi näemme, että vihreiden viestit saavat melko hyvin reaktioita, jonkun verran jakoja ja vhähän kommentteja. Sinisten viestit taas saavat kyllä jonkun verran jakoja, mutta vähän reaktioita ja kommentteja. SDP taas on selvästi aktiivisempi, saa enemmän reaktioita ja jakoja mutta vähän kommentteja.

No mitä tästä saa, paitsi toki pääsäryn? Osaltaan uskoisin, että nämä kuviot kertovat myös erilaisista Facebookin käyttötavoista puolueiden välillä. Vaikka tässä tulkitaan sitä mitä yleisö tekee – miten yleisö reagoi – niin selvästi esimerkiksi Perussuomalaisten ja Kokoomuksen yleisöt reagoivat varsin samalla tavalla. Samoin SDP, Vasemmistoliitto sekä jossain määrin vihreät vaikuttavat varsin samanlaisilta. Sen takia nämä kuviot eivät vaikuta sattumalta, vaan niissä näkyy puolueiden välillä yhtenäisyyttä – ja selvästi painottumista tiettyyn kohtaan jakamisen, kommentoinnin ja reaktoiden kolmikentällä. Käppyrät eivät ole mitenkään selkeästi tasajakautuneita.

Mahdollisesti eroja voisi selittää osittain yleisöjen lukumääräiset erot. Mutta kun vähän yrittää miettiä näitä esimerkiksi äänestystuloksiin (koska muuta erinomaista arviota puolueiden sosiaalisen median yleisöistä ei heti tulee mieleen), niin samankokoisetkin puolueet sijoittuvat eri tavalla kolmikenttään. Varmasti tätä voisi yrittää hallita, jos sosiaalisen median palvelusta vain saisi vielä enemmän tietoja irti.

Mutta mitä tämä sitten tarkoittaa? Verkkotutkimuksessa puhutaan aika usein vuorovaikutuksesta. Noh, vuorovaikutamme sisällön kanssa jakamalla sitä, jotkut ovat puhuneet reaktioista pieninä poliittisen tuen osoituksina (slacktivism) ja kommentit ovat erittäin tiivistä vuorovaikutusta jo. Miettivätkö puolueiden viestintäihmiset minkälaista vuorovaikutusta he haluavat yleisöltään ja miten tälläistä saisi irti tietynlaisella sisällöllä? Silloin voidaan esimerkiksi strategisesti suunnitella viesti sillä tavalla, että se kannustaa esimerkiksi kommentoimaan, tai käyttämään erilaisia reaktioita. Liittyvätkö nämä jopa jotenkin erilaisiin ajatuksiin Facebookin algoritmisesta suosittelujärjestelmästä ja pyrkimyksestä kehittää sisältöä suhteessa siihen.

Paljon avoimia kysymyksiä ja pohdintoja, vähän valmiita vastauksia vielä toistaiseksi. Mutta kolmiuloitteiset käppyrät tuovat esille mielestäni hyvin ei keskimääräistä massaa ja eroja siinä, vaan kuinka postaukset sijoittuvat samaan aikaan näillä kolmella akselilla.

 

Yhdistyksen kokous ja pikkujoulut 18.12.2019 – Annual General Meeting 18.12.2019

rp-kuvasomeen-xmasHyvä Rajapinta ry:n jäsen,
(scroll down for English)

Olet lämpimästi tervetullut yhdistyksen vuosikokoukseen 18.12.2019 kello 15:00 Metsätalolle Kuluttajatutkimuskeskuksen kahvihuoneeseen (Unioninkatu 40 C, Helsinki – opasteet rakennuksen aulasta).

Yhdistyksen kokouksessa käsitellään sääntömääräiset asiat, mm. toimintasuunnitelma 2020 sekä uusien jäsenten valitseminen hallitukseen. Materiaalit ovat nähtävillä kokouksessa sekä myöhemmin tällä viikolla yhdistyksen verkkosivuilla tässä blogipostauksessa.

Yhdistyksen vuosikokouksessa käsitellään seuraavat asiat:

1. Kokouksen avaus
2. Valitaan kokouksen puheenjohtaja, sihteeri, kaksi pöytäkirjantarkastajaa sekä varapöytäkirjantarkastaja ja kaksi ääntenlaskijaa
3. Todetaan kokouksen laillisuus ja päätösvaltaisuus
4. Hyväksytään kokouksen työjärjestys
5. Esitetään tilinpäätös, vuosikertomus ja toiminnantarkastajien lausunto vuodelta 2018
6. Päätetään tilinpäätöksen vahvistamisesta ja vastuuvapauden myöntämisestä hallitukselle 2018 sekä muille vastuuvelvollisille
7. Vahvistetaan toimintasuunnitelma sekä tulo- ja menoarvio vuodelle 2020
8. Vahvistetaan varsinaisten jäsenten liittymis- ja jäsenmaksun suuruus sekä kannattajajäsenten liittymis- ja kannattajajäsenmaksun suuruus
9. Valitaan hallitus 5 §:n mukaan
10. Valitaan yksi toiminnantarkastaja ja varatoiminnantarkastaja
11. META

Yhdistyksen säännöt täällä.

Mikäli olet kiinnostunut yhdistyksen hallituksen jäsenyyden hakemisesta, mutta et pääse paikalle kokoukseen, otathan yhteyttä ennen kokousta chair@rajapinta.co. Vastaamme myös mielellämme kysymyksiin aiheesta!

Ystävällisin terveisin,
Hallitus

After the meeting it’s Pikkujoulu time! See the FB event

Dear Rajapinta member,

We invite you to our annual general meeting on Dec 18, 2019 at 3pm sharp (at Metsätalo, Centre for Consumer Society Research premises, Unioninkatu 40 C, Helsinki – entrance in the lobby).

During the meeting, we will discuss topics as stated in the association’s charter, e.g. as the annual plan for 2020 as well as electing new members to the executive committee. The materials (in Finnish) will be available later this week on the association’s website.

If you consider applying for a position in the executive committee but cannot attend the meeting, please contact us at chair@rajapinta.co. We are also happy to answer any questions regarding committee work!

Best wishes,
Executive committee

After the meeting it’s Pikkujoulu time! See the FB event

Rajapinnan opinnäytetyöpalkinnot 2019 myönnetty digitaalisen kulttuurin ja datatieteen pro graduille

thesis-pile-kuvitus-flickr-organprinter
Photo: (cc) organprinter Flickr

Digitaalisten yhteiskuntatieteiden yhdistys Rajapinta ry on myöntänyt kaksi opinnäytetyöpalkintoa akateemisen vuoden 2018–2019 aikana valmistuneille opinnäytetöille. Rajapinta jakaa vuosittaisen palkinnon nyt jo kolmatta kertaa. Tänä vuonna palkintoa haki kaikkiaan kymmenen työtä.

Palkinnon saivat:

Molemmat työt edustavat Rajapinta ry:n ytimessä olevaa digitaalista otetta yhteiskuntatieteellisten kysymysten ratkaisemisessa. Ne ovat laadukkaita, tieteidenvälisiä töitä, jotka ottavat uusia rohkeita hyppyjä teoreettisten, metodologisten tai epistemologisten raja-aitojen yli. Arviointiraati arvosti myös töiden ajankohtaisia, yhteiskunnallisia aiheita sekä omaperäistä otetta niiden tarkastelussa.

Toivasen tutkimus selvittää, miten suomalainen vastamedia käyttää ja kehystää valtamedian uutisia, sekä soveltaa ohjattua koneoppimista eri kehystämisen tapojen tunnistamiseen. Tulokset osoittavat, että kehystyksessä kannattaa sisällön lisäksi tarkastella tekstin rakennetta. Työ tarttuu mielenkiintoiseen ja ajankohtaiseen aiheeseen ja tuottaa lisää ymmärrystä siitä, miten mediajulkisuuden dynamiikkaa voi tutkia laskennallisten menetelmien avulla. Työ keskustelee kahden eri tieteenalan kirjallisuuden kanssa ottamalla yhteiskuntatieteellisen käsitteen ja soveltamalla menestyksekkäästi koneoppimisen menetelmiä sen ratkaisemiseksi. Työ on selkeä esimerkki “Rajapinta-alan perustutkimuksesta”, jollaista arviointiraati peräänkuuluttaa lisää.

Vaahensalon tutkimuksen lähtökohtana on uusi käsite ’toiseuttava verkkokeskustelu’, jota määrittelemällä yritetään löytää vihapuheen käsitettä neutraalimpi ja monipuolisempi tutkimuksellinen tarkastelukulma. Tutkimuksessa yhdistetään mediakulttuurin ja kielentutkimuksen sekä jossain määrin sosiaalipsykologista näkökulmaa. Työssä tarkastellaan digitaalisten aineistojen käyttöliittymiä ja pohditaan niitä kriittisesti käyttämällä Suomi24-aineistoa ja Korp-työkalua esimerkkinä. Työssä osoitetaan konkreettisesti, miten digitaalista analyysiä voi tehdä määrällisesti ja argumentoidaan samalla laadullisen tutkimusotteen selittävää voimaa. Usein digitaalista yhteiskuntatiedettä vaivaa tietynlainen muutoksen nopeus ja siitä aiheutuva käsitteellinen köyhyys, mihin tämä gradu tarjoaa oivallisen kontribuution.

Rajapinta ry. toivottaa onnea palkituille ja kiittää kaikkia osallistuneita!

– –
Rajapinta palkitsee vuosittain erinomaisia pro gradu tai diplomitöitä, joiden aihepiiri kytkeytyy yhdistyksen tavoitteisiin: yhteiskuntatieteellisesti pohjautuneita töitä teknologiasta tai teknologiaa hyödyntäviä yhteiskuntatieteellisiä tutkimuksia. Yhden palkinnon arvo on 500 euroa. Yhdistyksen toimintaa ja siten myös tätä palkintoa rahoittaa Koneen Säätiö.

Arviointiraatiin kuuluivat: Veikko Eranti (HY), Merja Koskela (VY), Matti Nelimarkka (HY/Aalto), Thomas Olsson (TAU), Merja Porttikivi (HY/Aalto), Risto Sarvas (Aalto) ja Anu Sivunen (JYU). Kunkin työn arvioi kaksi raatilaista, jotka valittiin niin, että mahdolliset eturistiriidat, ohjaussuhteet ja kollegasuhteet vältettiin. Töiden arviointi perustui niiden akateemiseen laatuun sekä siihen, miten hyvin ne toteuttivat Rajapinta ry:n toiminnan painopisteitä, jotka oli mainittu myös palkintokutsussa. Työn tekijän aktiivisuus Rajapinta-yhdistyksessä ei ollut arvioinnissa etu eikä haitta.