Algoritmit, ihmiset, ja vallankäyttö

Mitä algoritmit ovat ja miksi niistä pitäisi käydä yhteiskunnallista keskustelua?

Puhuin viime perjantaina meppi Liisa Jaakonsaaren järjestämässä “Älä elä kuplassa: Algoritmit ja digitaalinen sivistys EU:SSA” -seminaarissa. Saatuani kutsun tulla puhumaan algoritmeista, lupasin osallistua, kunhan puhuttaisiin myös ihmisistä ja vallankäytöstä.

Tässä muutama keskeinen ajatus esityskalvoja täydentämään:

1. Mitä algoritmit ovat?

Perinteisen teknisen määritelmän mukaan algoritmi on kuin resepti: yksityiskohtainen kuvaus tai ohje, jota seuraamalla tehtävä, prosessi tai ongelmanratkaisu suoritetaan. Tästä kelpaa esimerkiksi vaikka jakokulma. Nykyään algoritmeista puhuttaessa viitataan kuitenkin useammin oppiviin algoritmeihin ja koneoppimiseen: algoritmit oppivat ja kehittyvät käyttämänsä datan pohjalta, eivätkä lopputulokset siten ole samalla tavalla sääntömääräisiä kuin perinteinen määritelmä antaa ymmärtää.

Yhä useammin käytetään termiä algoritminen järjestelmä viittaamaan laajempaan kokonaisuuteen, joka pitää sisällään paitsi yksittäisiä koodinpätkiä, myös laajempia tietojärjestelmiä, ihmisiä, ja organisaatioita. Algoritmit eivät ole ympäristöstään irrallisia. On myös hyvä huomata, että siinä missä nyt puhutaan algoritmeista, muutama vuosi sitten puhuttiin big datasta. Paljolti on kyse samasta asiasta.

2. Algoritmeista puhuttaessa on puhuttava myös datasta

Algoritmeja tarvitaan, jotta voidaan käsitellä suuria määriä dataa, ja algoritmit tarvitsevat dataa toimiakseen ja oppiakseen. Niinpä algoritmeista puhuttaessa on puhuttava myös datasta:  Miten dataa tuotetaan & kootaan? Miten dataa luokitellaan & käytetään? Dataa tuotetaan ja kootaan yhä enemmän ja erilaisista tilanteista. Arkinen toimintamme jättää jälkiä, usein silloinkin, kun emme ajattele olevamme tekemisissä digitaalisten systeemien kanssa.

3. Kohtaamisemme algoritmien kanssa ovat arkisia, poliittisia, ja usein huomaamattomia

Google ja muut hakukoneet auttavat meitä löytämään tarvitsemaamme tietoa. Samalla ne kuitenkin määrittävät sitä, mitä näemme ja tiedämme. Ne heijastavat käyttämänsä datan vuoksi niitä ympäröivän yhteiskunnan vääristymiä, eivätkä ne toki ole itsekään neutraaleja välikäsiä. Facebookin uutisvirran kohdalla algoritmista sisällönkäsittelyä tarvitaan valikoimaan mediatulvasta kuvia ja kirjoituksia, jotka järjestelmä arvioi yksittäistä käyttäjää kiinnostaviksi. Pyrkiessään pitämään käyttäjät pauloissaan ja löytämään meitä kiinnostavia sisältöjä, Facebook voi päätyä vahvistamaan valintojamme (yhä enemmän kissavideoita kissavideoista pitäville).

Kolmantena esimerkkinä musiikkipalvelu Spotifyssakin toimintamme tuottaa dataa, joka ohjaa sitä, mitä meille tarjotaan. Emme ehkä ajattele tuottavamme dataa musiikkia kuunnellessa, mutta valintamme ovat osaltaan mukana palautekehässä, joka vahvistaa taipumuksiamme ja ohjaa sitä, millaisia uusia sisältöjä löydämme. Neljäntenä esimerkkinä tuotamme dataa myös kaupunkipyörällä ajellessa ja monissa muissa tilanteissa, joita emme ehkä tunnista digitaaliseksi vuorovaikutukseksi. Tuottamallamme datalla voi olla poliittisia seurauksia, kun sitä käytetään järjestelmien kehittämiseen. Jos vaikkapa kaupunkipyöräjärjestelmää kehitetään datavetoisesti, saatetaan päätyä vahvistamaan palvelua siellä, missä sitä on jo helppo käyttää, sen sijaan, että suunnattaisiin voimavarat sinne, missä tarve on suurin. Kenen ääni kuuluu ja huomaammeko tekevämme jotain poliittista silloin, kun arkisen toimintamme oheistuotteena syntyy dataa?

4. Teknologiaa on helpompi muuttaa kuin kulttuuria.

Kun puhutaan algoritmeista, ollaan usein huolissaan niiden vallasta ja vääristymistä, joita ne tuottavat. Yhteiskunnan vääristymät ja virheet löytävät kuitenkin tiensä myös digitaalisiin järjestelmiin. Esimerkiksi algoritmisten järjestelmien näkyväksi tekemä syrjintä on monesti lähtöisin datasta, jota järjestelmät käyttävät ja joka heijastaa yhteiskunnan historiallisia tai vallitsevia vinoutumia. Järjestelmiä voidaan muuttaa, jotta ne eivät vahvistaisi tai ylläpitäisi syrjintää, mutta syrjinnän kitkemiseksi on muutettava yhteiskuntaa laajemmin.

5. Algoritmiset järjestelmät muistuttavat byrokratiaa.

Tämänhetkisen algoritmikohinan keskellä on hyvä miettiä, mikä näissä järjestelmissä on oikeastaan uutta. Joiltain osin algoritmit muistuttavat byrokratiaa. On siis puhuttava siitä, miten algoritmit ja ihmiset toimivat yhdessä ja millaista valtaa toimintaan kulloinkin liittyy. Uhkana on, että puhumalla algoritmien vallasta vältytään puhumasta algoritmeista vallankäytön välineenä.

Lue lisää:

CFP: Rajapintapäivät 15.-16.11.2018

rajapintalogo150px01round-reunatRajapintapäivät on avoin ja maksuton tapahtuma kaikille, jotka ovat kiinnostuneita yhteiskuntatieteellisestä informaatioteknologian tutkimuksesta tai digitaalisten ja laskennalisten menetelmien käytöstä yhteiskuntatieteissä. Rajapintapäivät järjestetään Espoon Otaniemessä 15.-16.11.2018.

Torstaina 15.11. on työpajapäivä, ja perjantaina 16.11. tapahtuman muoto on epäkonferenssi. Tervetuloa mukaan!

(Scroll down for the English version)

ESITYSKUTSU EPÄKONFERENSSIIN

Perjantain 16.11. epäkonferenssi (unconference) on avoin ja osallistumiseen pohjaava tapahtuma, jonka agenda muodostuu osallistujien yhteistyössä. Kaikki teknologiaa, yhteiskuntaa ja digitaalisia menetelmiä pohtivat tai kehittävät aiheet ovat erinomaisen tervetulleita!

Epäkonferenssi järjestetään osallistujien tapahtumaan tuoman sisällön ympärille. Pyydämmekin tapahtuman osallistujilta ehdotuksia sisällöksi mielellään 31.10. mennessä. Tapahtumassa on 25 minuutin mittaisia sessioita, joita osallistujat voivat varata etukäteen. Ajan voi käyttää perinteiseen esitykseen keskusteluineen, mutta kannustamme kokeilemaan myös muunlaisia formaatteja ja jättämään runsaasti aikaa keskustelulle.

Aiheen tulisi sopia sisällöllisesti Rajapinta ry:n teemoihin: teknologia, yhteiskunta ja digitaaliset menetelmät. Sessioita on neljää eri tyyppiä:

  • Tätä tutkin (esim. paperi, väitöskirjan aihe tai gradun esittely, keskeneräinen tutkimus)
  • Tätä haluaisin tutkia tai ymmärtää paremmin (esim. keskustelu uudesta tutkimusnäkökulmasta tai projekti-idean tai aineistoyhteistyön esittely)
  • How to (esim. analyysimenetelmän tai aineistonkeruutyökalun demo, mahdollisesti jonkin esimerkkitapauksen avulla)
  • Kokeellinen sessio (esim. jotain ihan muuta)

Ehdota omaa aihettasi lisäämällä se suoraan Rajapintapäivien Wiki-sivulle:

https://wiki.helsinki.fi/display/rajapintapaivat

Esitysten kieli on vapaa.

ESITYSKUTSU ETIIKKATYÖPAJAAN JA OPINNÄYTETYÖSEMINAARIIN 15.11.

Torstaina 15.11. järjestämme kolme työpajaa aiheista, jotka kumpuavat Rajapinta ry:n tavoitteesta kehittää teknologian ja yhteiskunnan tutkimuksen toimintaedellytyksiä Suomessa.

Tutkimusetiikkatyöpaja 15.11.18 klo 10:00 – 12:00
Digitaalisiin aineistoihin ja menetelmiin liittyvät tutkimuseettiset käytännöt ovat liikkeessä ja eri tutkimusasetelmista nouseviin kysymyksiin löytyy harvoin selkeitä vastauksia. Tässä työpajassa pohdimme ja ratkomme käytännönläheisesti tutkimusprosessin eri vaiheista nousevia tutkimuseettisiä kysymyksiä. Jos haluat tulla esittelemään omasta tutkimuksestasi nousevia eettisiä haasteita ja/tai ratkaisuja, ota yhteyttä Minttu Tikkaan (minttu.mt.tikka (a) helsinki.fi).

Opinnäytetyöseminaari 15.11.18 klo 10:00 – 12:00/13:00
Teetkö opinnäytetyötä liittyen digitaaliseen yhteiskuntaan, käytätkö laskennallisia menetelmiä tai digiaineistoja? Tule esittelemään ja keskustelemaan työstäsi Rajapintapäivien opinnäytetyöseminaariin. Jokaiselle työlle yritetään varata sopiva aika (riippuen osallistujien määrästä) esittelyä sekä keskustelua varten. Kutsumme paikalle myös ilmoittautuneiden aihealueisiin erikoistuneita tutkijoita kommentoimaan töitä.

Laskennallisen yhteiskuntatieteen infrastruktuurit 15.11. klo 13:00-16:00
Avoimessa työpajassa työstetään skenaariotyöskentelyn avulla yhdessä ajatuksia siitä, minkälaisia teknologisia infrastruktuureja ja toisaalta osaamista tarvittaisiin suomalaisen laskennallisen yhteiskuntatieteen edistämiseksi. Työpajassa ei tarvita ennakkotietoja laskennallisesta yhteiskuntatieteestä tai koodaustaitoja – itse asiassa se on samalla erinomainen intro siihen, mistä asiassa oikein on kyse! Työpajaa ovat järjestämässä myös CSC Tieteen tietotekniikan keskus ja Futusome Oy.

Lisätietoja Rajapintapäivien wikissä.

Työpajojen tarkoituksena saada aikaa konkreettista yhteistä toimintaa työpajan aiheen ympärille. Osallistujilta ei vaadita aiempaa aiheeseen tutustumista.

Ilmoittautuminen

Ilmoittaudu mukaan verkkolomakkeella 31.10. mennessä. Rajapintapäiville voi osallistua myös ilman omaa sisältöehdotusta.

Tilaisuus on maksuton.

– –

Call for Proposals: Rajapinta Days 2018

Our annual unconference will be organized in Otaniemi, Espoo 15.-16.11.2018. The event is open for all interested in the study of digital society and digital methods.

Thursday 15.11. is a workshop day that includes Rajapinta’s thesis seminar for undergrads, as well as workshops on research ethics challenges of research projects and on infrastructures for computational social science.

Friday 16.11. is an unconference day, which builds upon the ideas and proposals of the participants. You can also participate as a non-presenter.

More information and proposal guidelines here:

https://wiki.helsinki.fi/display/rajapintapaivat

*We hope submissions and registrations to be done on October 31th the latest.*

– – Rajapinta ry is an association that focuses in the study of digital society and application of digital methods to social research. We are supported by Kone Foundation. Rajapinta Days are also supported by Helsinki Institute for Information Technology HIIT.

Rajapinta-opinnäytetyöpalkintoa havittelemassa

Yhdistyksemme järjesti nyt jo toisen kerran Rajapinta-opinnäytetyökilpailun ja saimme taas kahdeksan erinomaista opinnäytettä arvioitavaksemme. Arviointiraatimme on työn touhussa, pohtien mitkä seuraavista mielenkiintoisista töistä ovat parhaita:

  1. Hanna Stenhammar: Pictures of Illness: Photo Elicitation for Studying Patient Experience at Children’s Hospital (Aalto-yliopisto, informaatioverkostot
  2. Juulia Juutilainen: Understory (Aalto-yliopisto, new media)
  3. Katriina Penttilä: History of Escape Games : examined through real-life-and digital precursors and the production of Spygame (Turun yliopisto, digitaalinen kulttuuri)
  4. Mikael Ala-Ketola: Pelillinen 3D-suunnittelusovellus osallistumisen välineenä Vanhan Hiukkavaaran suunnittelussa. Tulevaisuuden tilojen haltuunottoa vai hallintaa? (Tampereen yliopisto, ympäristöpolitiikan ja aluetieteen koulutusohjelma)
  5. Mira Matilainen: Ei ne palkat ja pallomeret, vaan ne fiksut työkaverit – Ohjelmistokehittäjien näkemyksiä työnantajabrändäämisestä (Helsingin yliopisto, viestintä)
  6. Riitta Uusisalmi: Teknologisoituva koulu – Toimijaverkostoteoreettinen analyysi teknologisten laitteiden vaikutuksista peruskoulun tasa-arvoon (Lapin yliopisto, sosiologia)
  7. Susi Salovaara Tietojärjestelmät osana lastensuojelun tiedonmuodostusta (Lapin yliopisto, sosiaalityö)
  8. Tuomas Soila: Potilas, kansalainen vai kuluttaja? Laskennallinen analyysi sosiaali- ja terveyspalveluiden kuluttajakuvasta Ylen ja Alma Median uutisaineistoissa 2007–2017 (Helsingin yliopisto, kuluttajaekonomia)

Kuten edelllisenäkin vuonna, tieteenalojen sekä yliopistojen kirjo tekee arviointityöstä varmasti varsin haastavan. Kerromme lisää palkintoprosessista loppusyksystä.

Digitaalisen yhteiskunnan rajapinnoilla -luentosarja 2018 käynnistyy 4.9.

https://www.flickr.com/photos/hinkelstone/2435823037/
(cc) Karl-Ludwig Poggemann @Flickr

Monitieteinen, teknologiavälitteisen sosiaalisen toiminnan ulottuvuuksia käsittelevä Rajapinta-luentokurssi järjestetään jälleen Helsingin yliopistolla 4.9.-16.10 klo 9-15-10.45. Luennot ovat kaikille avoimia ja osa niistä striimataan verkkoon. Tervetuloa kuulolle!

Digitaalisuus ja teknologiset laitteet ovat muodostuneet erottamattoksi osaksi arkeamme. WhatsAppissa lähetetään yhdessä minuutissa 21 miljoonaa viestiä ja pyyhkäistään lähes miljoona kertaa Tinderissä. Suomessa tehdään päivittäin 30 miljoonaa Google-hakua. Vaalikeskustelut käydään vaaliteltan sijasta Twitterissä. Miten digitalisoituminen vaikuttaa sosiaalisen ja yhteiskunnalliseen toimintaan? Minkälaisia poliittisia, taloudellisia ja kulttuurillisia kytköksiä teknologian taustalla on? Rajapinnoilla-luentosarjassa aiheesta alustavat Suomen eturivin teknologiayhteiskuntatieteilijät.

Monitieteisellä luentokurssilla käsitellään teknologiavälitteisen sosiaalisen toiminnan ulottuvuuksia eri digitaalisilla areenoilla. Yhdistämme klassisia teoreettisia näkökulmia tuoreimpiin tutkimustuloksiin yksilöiden ja ryhmien toiminnasta digitaalisessa verkossa. Kurssilla käsiteltävät teemat kytkeytyvät yhteiskuntatieteelliseen tutkimukseen sosiologian, sosiaalipsykologian, viestinnän ja politiikan tutkimuksen näkökulmista. Lähtökohtana on tieteen ja muun yhteiskunnan välinen vuoropuhelu; tutkijoiden lisäksi luennoimassa on teknologian kanssa työskenteleviä tekijöitä.

Kurssi järjestetään yhteistyössä Kuluttajtutkimuskeskuksen ja Helsingin yliopiston sosiaalitieteiden maisteriohjelman kanssa. Helsingin yliopiston opiskelijat voivat suorittaa luentosarjan kurssina, jolloin suoritukseen kuuluu myös lukupiirisessio luentojen jälkeen (klo 11-11.45).

Striimi löytyy täältä.

Kurssin ohjelma:

*** 4.9. Avausluento (PR aud XII)
Rajapinta ry. esittäytyy
Minna Ruckenstein: Digitaalinen kulttuuri ja sosiaalisuus – tutkimuksellisia lähtökohtia
Veikko Eranti: Teoria, toimijuus ja digitaaliset menetelmät

*** 11.9. Identiteetti, teknologia ja mediasukupolvet (Kielikesk. Sali 115) [tallenne]

Janne Matikainen (HY) & Suvi Uski (Someturva Oy, tutkija)
Janne Matikaisen luennon tavoite on jäsentää uutta mediasukupolvea, jota lähestytään käsitteellisesti ja empiirisen tutkimuksen kautta. Tavoitteena on löytää sukupolven objektiivisia (median ja verkon käyttö ja kulutus) ja subjektiivisia (sukupolvikokemus) elementtejä.  Suvi Uski luennon aiheena on yksilön identiteetti ja teknologia. Yksilön toiminta digitaalisissa ympäristössä ei pääse eroon ihmisen psykologian lainalaisuuksista. Luento pureutuu tutkimustietoon sekä tällä hetkellä tarjolla olevaan ongelma-avaruuteen, joka koskettaa kaikkia digitaalisissa ympäristöissä toimivia.

*** 18.9. Teknologia, addiktio ja nuorten pelikulttuurit (Kielikesk. Sali 115) [tallenne]

Eeva Raita (Futurice Oy) & Mikko Meriläinen (HY/UTA)
Eeva Raita puhuu siitä, miten k okemus, addiktio ja mobiiliteknologia liittyvät toisiinsa. Jokaisen menestyvän digitaalisen palvelun takana on syvällinen ymmärrys ihmisten kokemuksellisuudesta. Luennolla keskustellaan siitä miten, miksi ja millä seurauksilla kokemus on noussut teknologian kehittämisen keskiöön. Mikko Meriläinen luennoi nuorten pelaamisesta. Keskustelu nuorten digitaalisesta pelaamisesta jumiutuu usein hyötyjen ja haittojen listaamiseen, mutta kokonaiskuva jää suppeaksi. Luennolla tarkastellaan ilmiön erilaisia puolia yhteiskunnan eri osa-alueilla.

*** 25.9. Sosiaalinen media organisaatioiden sisäisessä käytössä (PR sali 6)

Anu Sivunen (professori, Jyväskylän yliopisto) & Kaisa Hildén (Yleisradio)
Sosiaalinen media on paitsi julkisuuden areena, yhä useammin myös organisaatioiden sisäisen vuorovaikutuksen työkalu. Luennolla Anu Sivunen ja Kaisa Hildén peilaavat tutkimustietoa ja käytännön kokemuksia erilaisista teknologisista ratkaisuista sisäisen viestinnän, vuorovaikutuksen ja yhteistyön tukijoina.

*** 2.10. Jakamistalous, digitaaliset alustat, ja yhteistoiminta (Kielikesk. Sali 115) [tallenne]

Airi Lampinen (dosentti, Tukholman yliopisto) & Juho Makkonen (Founder, Sharetribe Oy)
Airi Lampinen luennoi otsikolle “Valtavirtaa ja vaihtoehtoja: Sosiaalinen vuorovaikutus ja yhteistoiminta verkkoalustoilla”. Sosiaalinen ja taloudellinen vuorovaikutus nivoutuvat yhteen alustapalveluiden avulla järjestettävässä toiminnassa. Luennolla tarkastellaan niin jakamistalouden valtavirtaa kuin vaihtoehtojakin. Digitalisoitunutta sosiaalisuutta lähestytään vuorovaikutuksen, yhteisöjen ja vaihtoehtoisen toimintakulttuurin näkökulmista. Sharetriben perustaja ja toimitusjohtaja Juho Makkonen jatkaa otsikolla “Omistaminen on uusi jakaminen, eli kuinka jakamistalous demokratisoidaan”.

*** 9.10. Datatalous (Kielikesk. Sali 115)

Tuukka Lehtiniemi (HY/Aalto/UTU) & Sonja Baer, Futusome Oy [tallenne]
Ihmisiä koskevasta datasta, henkilödatasta, on tullut digitaalisessa taloudessa keskeinen arvonluonnin raaka-aine. Tästä hyvänä esimerkkinä ovat verkon alustapalvelut. Luennolla kuvataan alustatoimijoiden keskeiseen asemaan johtaneita tekijöitä, avataan viimeaikaisia pyrkimyksiä ymmärtää datatalouden toimintalogiikkaa sekä pyrkimyksiä ravistella datatalouden raameja. Sosiaalisen median datajalostamo Futusome Oy kertoo omassa osuudessaan liiketoimintansa tarinan.

*** 16.10. Vaikuttajaviestintä ja vaikuttajamarkkinointi verkossa (PR aud XIII)

Essi Pöyry & Emma Naumanen/Matilde Pelkonen, Monochrome Oy
Julkkisten eli niin kutsuttujen vaikuttajien valta kasvaa sosiaalisessa mediassa. Some-julkkikset eivät ole ainoastaan koko kansan tuntemia julkkiksia, vaan myös rajatumpien yhteisöjen vaikuttajilla voi olla merkittävää valtaa yhteisönsä mielipiteisiin ja tekemisiin. Tällä luennolla käsitellään vaikuttajaviestintää ja -markkinointia somessa ja sen vaikuttavimpia muotoja niin kaupallisessa kuin yhteiskunnallisessa kontekstissa.

Lisätietoa luentopaikoista:

  • PR = Helsingin yliopiston päärakennus, Fabianinkatu 33. Sisäänkäynti aud XIII:hin Senaatintorin puoelta.
  • Kielikeskus = Fabianinkatu 26

SICSS Helsinki final reflections

The SICSS Helsinki partner site was organized in Helsinki, Finland. We organized it as a two-week institute: the first week was focused on lectures and the second week on group projects. We had a total of 19 participants, an instructor and two TAs. Participants were both from Finland (University of Helsinki, Aalto University, Tampere University of Technology, Turku University) as well as from other European countries (Netherlands, Poland, Germany, Denmark) and rest of the world (India, Turkey). The overall net promoter score (based on the after-course evaluation) was 9 – indicating that the participants considered the course successful and would recommend it to their colleagues. Similarly, the textual feedback suggested that the course was found helpful, engaging and even fun.

This is a final reflection document for the SICSS organized at Helsinki. Similar reflection documents have been written in all SICSS sites.

Group dynamics

We had made a deliberate decision at Helsinki to take the student group to an offsite location for the first week in Tvärminne. Beyond providing a fabulous venue in terms of scenery, outdoor activities and food, it also forced participants to have an on-campus experience for the first week, and socialize. Based on my random observations, this seemed to be happening during the evenings, after the classes. Similarly, we chose to organize after work activities during the second week, which aimed to help to mitigate some of the challenges of lack of residential accommodation and social activities which emerges from that collocation.

What I found challenging and surprising was the need to facilitate group processes during the second week focused on group work. This was not extensive, and rather often groups seemed to manage on their own with this. We were rather pressed for time during the second week, but I’m thinking should we organize dailies similar to agile software production: each team member would speak for a few minutes what they are doing next, what have they done and if they have any major challenges. It might help us to intervene quickly in the group processes facilitation to potential problems and help the groups to manage the time and workload of such a short project. Ideally, over the week, we should move the responsibility of organizing these dailies to the groups.

Something I was disappointed myself was lack of a “global” community of SICSS in the course Slack community. I believe that majority of comments from Helsinki to the public channel came from me or our TAs. Reasons for this may include the time difference between Europe and the US – but maybe also some failures to motivate and incentive this correctly by my side. Maybe next year, the Slack community management could consider establishing smaller channels for particular topics (“communities of practices”) to help people finding smaller venues where they can collaborate and share ideas and comments. Another aspect which I think might be helpful would be to start the online community building way before the event, also content wise. For example, maybe we could create for some of the pre-readings cross-national reading groups or other activities which would encourage them to speak with people from other communities?

Instruction and activities during the first week

Something we spend a lot of time discussing with my TAs (in our debrief after SICSS) was the scope of the instruction. We covered many different things during the first week to provide a general overview of several different method families in computational social science. However, the question was if there should be a more extensive discussion about some methods to ensure that students are able to fully understand them and not just rush through them. It was even proposed that we should really go through some basics of algorithms and computer science for the students.

However, I believe that the current idea of providing a rich overview of different methods is a good choice. It will familiarize students with many opportunities and help them to rethink social research. However, this is a communication challenge: this type of pedagogical choice needs to be explained and articulated. I did a few rounds of talks focused on this topic, but having that mentioned already on day one would be nice. (For example, one student commented in the feedback form that we could have a separate institute on any of these topics – which is true – and thus indicating that we should have been much more clear on the scope and idea behind that scope).

The second aspect which we discussed with my TAs and some participants explicitly commented: the course was a good crash course for people entering computational social science from a social science background, but for people coming from computer sciences and familiar with data science things many aspects of these lectures were rather boring and even useless. We tried to introduce to some activities (ad hoc) refocus on aspects such as teaching qualitative research methods to those not familiar with them or directing them to consider social science theory of their data analysis. These types of aspects could be more baked into the activities material next year (and I’m happy to help editing them towards this goal).

I will discuss video lectures later, but we had a mix of content coming from Helsinki (i.e., I was instructing the content) and some parts we choose to take as video lectures. Something I found difficult when instructing was to find the correct balance between audience participation and me lecturing topics. (To be honest, I actually don’t usually enjoy lecturing that much.) In some of my regular computational social science classes at the University of Helsinki, I usually ask students to read a case study before the class which applies the approach or method we are learning. It serves two aspects: first, we can use that article to develop fruitful discussions with the students and therefore, I don’t need to lecture as much. Second and more importantly, the case studies provide the students with an opportunity to see how “social science theory” (whatever that means) is integrated into the computational work – which I also believe to be a core skill in computational social sciences. If I’m organizing a class like this next year, I would integrate a component like this to balance the me-speaking – students-speaking a bit.

The video lectures

Overall, given the time difference organizing the video lectures was somewhat challenging. For the guest lectures (given at Duke in the evening) we opted to watch them delayed the next day. This reduced some aspects of their liveliness, which many students commented in a somewhat negative tone. We tried to stop these lectures when possible to discuss the lectures in our group (a proposal by one of the students) and this seemed to make them somewhat more engaging. I would recommend the similar idea to other locations which must follow lectures in non-live format.

On the instruction (given at Duke during the morning), we chose some topics where we followed the Duke stream while on other topics I chose to hold the lectures myself. The student feedback suggested that they liked these locally provided lectures more than following live streams from Duke, so I think we made the right decision to develop some instruction on our own. Naturally, the challenge with this is that the quality and content between the institutes may vary somewhat (for example, for text analysis, I chose to start the lecture by speaking about traditional qualitative research methods). However, I think that some quality bonus we had from organizing these locally – such as a high level of interactivity and ability to react to local situations – was worth of this extra investment. In future years, I would examine to replace even more of these lectures when possible and to support on that, produce the materials early enough to allow discussions of them within the instructor community to find potential areas of improvements.

The project week

My only concerns which emerged from the project week related to the group dynamics and lack of proper theoretical reflections during them. I think our group creation process could have been clearer for people; we asked everyone to list topics they find interesting and in collaborative manner, mark which of them they might consider working on. Initial groups were formed based on that and even while I tried to encourage participants to not stay in what seemed like the local optimum, these groupings were set. I think next time, I would force people to change the groups and have similar discussions once or twice to show them the range of opportunities. Furthermore, facilitation of the project management as discussed above may have helped in this. Similarly, on the theoretical reflection, I did ask people to produce a mind map on the first day about theoretical concepts and literature and relationship between those and what they planned to do. Sadly, this itself did not seem to help students enough to engage in this thinking and follow that throughout the week. Again, scaffolding and facilitation may provide helpful in this.

Facilities

While the first week facilities were excellent, the second-week facilities were in our use daily only from 8am to 4pm. This limited some activities and influenced our scheduling. As the summer institute is during summer, many spaces at the University of Helsinki just closed a bit too early. Next year, I would reconsider the second-week location to have a few more hours of shared time. Also, I would have a clear single location for all non-Helsinki visitors and recommend they stay there to reduce some extra coordination efforts.

Negotiating interdisciplinary and cultural boundaries

Something I tried to bring you in fishbowl discussions was the interdisciplinary nature of computational social science and some of the challenges and problems related to this. Sadly, while I enjoyed these discussions, their intention may not have been as clear for participants as it was to me. I have been working across different academic communities for a long time and thus, rather familiar in interdisciplinary collaborations. They take time and often require a lot of flexibility and openness. However, I think that I understand the difficulties of these jumps as I’m so familiar with them and thus, didn’t provide as much support as one could have provided during the two weeks. For example, the fact that I rarely addressed traditional social science theories and methods in the instruction could have helped participants to follow the teaching more and made the classes more engaging to people from computer science background as well.

Similarly, the problem with teaching interdisciplinary groups is their internal heterogeneity in terms of skills. One solution worth of consideration could be to separate the group based on skills or provide even more modular learning activities, where we could assign different participants and groups slight variations of the same tasks to make them more engaging or to allow participants to enter the zone of proximal development. This again would most likely push us to reconsider the role of lectures and instruction.

Finally, people did come from different cultures (not only country wise, but also academic cultures), which meant that their understandings of – among other things – research contributions, the value of group work and ideas of good instruction differed. These were not something major challenges in the project. However, for me better managing this boundary work in the future is critical and having tools and approaches to facilitate students with these is necessary. Sadly, I don’t yet have a clear and good solution to this problem.

Conclusion

The aim of this reflection has been to pinpoint potential areas for improvement, both for myself as well as other SICSS communities and their organization. Therefore, I have aimed to address challenges and problems and discuss them in an extensive manner. However, as said in the beginning, most participants had a positive and engaging experience with this summer institute. The ideas and comments throughout this text may help to further improve the learning and clarify some of the difficulties observed.

We thank the support from Russell Sage Foundation, Alfred P. Sloan Foundation and Helsinki Institute for Information Technology HIIT for their generous financial support.

Bitit ja politiikka: Tervetuloa, laskennallinen politiikan tutkimus

https://www.flickr.com/photos/videocrab/4630988238/
(cc) Kevin Simpson @Flickr

Teksti on julkaistu 8.8. ilmestyneessä Politiikka-lehden numerossa 2/2018 “Bitit ja politiikka” -minisymposiumin johdantona.

Tietoyhteiskuntakehitys ja teknologian muutokset ovat vaikuttaneet yhteiskuntatieteisiin, mukaan lukien politiikan tutkimukseen. Digitaalisissa toimintaympäristöissä tapahtuva poliittinen toiminta näyttäytyy houkuttelevana tutkimuskohteena ja toisaalta esimerkiksi digitaalisten alustojen ja algoritmien tutkimus nostaa esille politiikan perimmäisiä kysymyksiä vallasta (esim. Gillespie 2010; Beer 2017; Neyland ja Möllers 2016). Monet kiinnostavista kysymyksistä kytkeytyvät poliittiseen viestintään: sosiaalinen media on jo haastanut perinteisiä viestinnän portinvartijateorioita (esim. Chadwick 2014, Castells 2007) ja uudet digitaaliset viestintävälineet muuttavat kansalaisosallistumisen tapoja (esim. Bennett ja Segerberg 2013; Juris 2012). Myös marxilainen pohdinta on tehnyt paluun alustatalouden myötä tapahtuneen pääoman jakautumisen seurauksena (esim. Spencer 2018). Jo tämä  tutkimusnäkökulmien lyhyt lista osoittaa, että politiikan tutkimusperinteet ovat tärkeässä roolissa myös nykyisen digitaalisen yhteiskunnan aikana.

Digitaalisuus ei muuta vain tutkimuskohteita, vaan myös aineistoja ja menetelmiä. Digitaaliset jalanjäljet (digital trace data) ja massadata (big data) mahdollistavat uudenlaisten kysymysten esittämisen: aiemmin tutkijoilla ei ollut käytettävissä samankaltaisia yksityiskohtaisia ja laajoja aineistoja ihmisten, organisaatioiden ja liikkeiden toiminnasta, vaan tutkimuksessa on turvauduttu havainnointiin, haastatteluihin, kyselyaineistoihin ja rekisteriaineistoihin. Lazerin ja kumppaneiden (2009) mukaan uudet digitaaliset aineistot ja niitä hyödyntävät laskennalliset menetelmät ovat kuin uusi mikroskooppi yhteiskuntatieteelliseen tutkimukseen. Sekä Rob Kitchin (2014) että danah boyd ja Kate Crawford (2012) kehottavat tutkijoita kuitenkin kriittisesti arvioimaan niitä tapoja, joilla tutkimusta tehdään massadatan aikana ja sitä, kuinka laskennalliset menetelmät muokkaavat yhteiskuntatieteellistä tutkimusta. Hyvä esimerkki peräänkuulutetusta kriittisyydestä on Grimmerin ja Stewartin (2013) artikkeli, jossa he perinteisiin laadullisiin lähestymistapohin verraten pohtivat, miten tekstianalyysiä voidaan toteuttaa esimerkiksi sanojen esiintymisfrekvenssejä tarkastelemalla.

Uusien menetelmien ja aineistojen myötä myös muut tieteenalat ovat innostuneet tarkastelemaan yhteiskuntatieteellisiä kysymyksiä. Justin Grimmerin (2015) mukaan laskennallisten menetelmien avulla yhteiskuntatieteellisiä kysymyksiä käsittelevät yhteiskuntatieteilijöiden lisäksi myös datatietelijät, tietojenkäsittelytietelijät ja fyysikot, usein monitieteisissä ryhmissä. Poikkitieteellinen lähestymistapa helposti tukee tietynlaisia institutionalisoituneita politiikan tutkimuksen muotoja. Se voi aiheuttaa esimerkiksi behavioralistisen politiikan tutkimuksen paluun, koska perspektiivin ajatus teoriapohjaisesta mallintamisesta on yhteensopiva perinteisten laskennallisten tieteen osaajien kanssa — eivätkä he tunne behavioralistista politiikan tutkimusta kohtaan esitettyä ansiokasta kritiikkiä. Toisaalta yhteiskuntatieteilijöiden perinteinen koulutus ei ole sisältänyt opetusta laskennallisista menetelmistä ja niiden käytöstä. Siksi yhteiskuntatieteellisen koulutuksen ulkopuolelta on helppo tarjota näkökantoja ja lähestymistapoja yhteiskuntatieteellisten kysymysten käsittelyyn, vaikka ne yhteiskuntatieteellisin silmin voivat näyttää naiiveilta. Hanna Wallach (2018) muistuttaakin tietojenkäsittelytieteilijöille, että yhteiskuntatiedettä ei synny automaattisesti käyttämällä yhteiskuntatieteellistä aineistoa. Vastaavasti Grimmer (2015) argumentoi, että jos haluamme luoda yhteiskuntatieteellisemmän lähestymistavan laskennalliseen yhteiskuntatieteeseen, on välttämätöntä että yhteiskuntatieteilijät ovat mukana tekemässä ja kehittämässä laskennallisten menetelmien käyttöä.

Tämän symposiumin artikkelit ovat esimerkkejä tällaisesta yhteistyöstä ja menetelmäkehityksestä. Symposium koostuu kolmesta toisiaan täydentävästä tekstistä. Kaksi ensimmäistä esittelevät laskennallisten menetelmien käyttöä politiikan tutkimuksen kentällä, kolmas pohtii laskennallisten menetelmien institutionalisoitumista suomalaiseen politiikan tutkimukseen. Tekstit siis omalta osaltaan vastaavat Grimmerin (2015) ehdotukseen pyrkiä muodostamaan selkeämmin yhteiskuntatieteellisesti painottunut näkökulma laskennallisten menetelmien käyttöön ja kehitykseen.

Salla-Maaria Laaksosen ja Matti Nelimarkan artikkeli tutkii digitaalista vaalijulkisuutta vuoden 2015 eduskuntavaaleissa. Tutkimuksessa laskennallisesti analysoidaan vaalien julkisella agendalla olleet teemat ja yhdistetään saatua tietoa toisaalta poliittisen viestinnän agendatutkimuksen teorioihin ja puolueiden aiheomistajuuden analyysiin. Tuukka Ylä-Anttila, Veikko Eranti ja Anna Kukkonen taas käsittelevät katsauksessaan ilmastonmuutoksesta käytyä julkista keskustelua aihemallinnuksen avulla. Kirjoittajat käyvät läpi menetelmän reunaehtoja ja ehdottavat laadullista validointiprosessia, jonka avulla menetelmää voisi käyttää tekstien kehysanalyysina.

Molemmat tekstit tarkastelevat agendan muodostumista laskennallisesti ja osoittavat samalla, että laskennalliset menetelmät voivat tarjota uusia työkaluja poliittisten argumenttien tutkimiseen ja sellaisiin politiikan ja poliittisen viestinnän polttaviin klassisiin kysymyksiin kuten agendan rakentaminen ja teemojen kehystäminen. Ennen kaikkea menetelmät mahdollistavat tällaisen analyysin tekemisen paljon aiempaa laajemmilla aineistoilla. Molemmat tekstit käyttävät menetelmänä ohjaamatonta koneoppimista, tarkemmin aihemallinnusta, mutta sitovat valitun menetelmän perinteiseen yhteiskuntatieteelliseen kysymyksenasetteluun. Lisäksi tekstit käyvät keskustelua laskennallisia menetelmiä soveltavan yhteiskuntatieteen käsitteiden kanssa — nähdäksemme tämä ei ole vain tarpeellinen, vaan myös välttämätön keskustelu.

Professori Pertti Ahonen luo katsauksessaan näkymän laskennallisten menetelmien institutionalisoitumiseen politiikan tutkimuksessa. Hän keskittyy nimenomaisesti laskennallisiin menetelmiin, joita on kehitetty politiikan tutkimuksen institutionalisoituneiden kysymysten tarkasteluun politiikan tutkijoiden toimesta. Ahonen päätyy toteamaan, että laskennallisten menetelmien käyttö politiikan tutkimuksessa on yhä sivupolku, ja varsinkin suomalaisessa politiikan tutkimuksessa melko vähäistä. Ahonen myös aiheellisesti peräänkuuluttaa syvällisempää keskustelua menetelmien filosofisista taustaoletuksista.

Menetelmäkeskustelua onkin yhä syytä käydä, ja sitä tulisi käydä poikkitieteellisesti. Poikkitieteellisyyden haasteeseen on herätty myös tietojenkäsittelytieteilijöiden joukossa (vrt. Wallach, 2018). Oleellista on, että vaikka laskennallisia menetelmiä voi usein soveltaa suoraan “out of the box”, ne eivät ole taikalaatikoita, jotka ratkaisevat aiemmat tutkimukseen liittyvät ongelmat ja luotettavuuskysymykset; laadullista tarkastelua ja teorialähtöisyyttä tarvitaan yhä rinnalle. Robotti ei vie politiikan tutkijan töitä, kuten Tuukka Ylä-Anttila ja kumppanit toteavat analyysinsa päätteeksi – eikä ehkä datatieteilijäkään.

Matti Nelimarkka & Salla-Maaria Laaksonen
Nelimarkka on tutkijatohtori Tietotekniikan laitoksella ja Tietotekniikan tutkimuslaitos HIIT:llä Aalto-yliopistossa ja opettaja Menetelmäkeskuksessa (Valtiotieteellinen tiedekunta, Helsingin yliopisto). Laaksonen on tutkijatohtori Kuluttajatutkimuskeskuksessa (Valtiotieteellinen tiedekunta, Helsingin yliopisto)
Lähteet

  • Beer, David. 2017. The social power of algorithms. Information, Communication & Society 20:1, 1–13.
  • Bennett, Lance ja Segerberg Alexandra. 2013. The Logic of Connective Action : Digital Media and the Personalization of Contentious Politics. Cambridge: Cambridge University Press.
  • boyd, danah ja Crawford, Kate. 2012. Critical Questions for Big Data. Information, Communication & Society 15:5, 662–679.
  • Castells, Manuel. 2007. Communication, Power and Counter-Power in the Network Society. International Journal of Communication 1:29, 238-266.
  • Chadwick, Andrew. 2013. The Hybrid Media System: Politics and Power. Oxford: Oxford University Press.
  • Gillespie, Tarleton. 2010. The politics of “platforms.” New Media and Society 12:3, 347–364.
  • Grimmer, Justin. 2015. We Are All Social Scientists Now: How Big Data, Machine Learning, and Causal Inference Work Together. PS: Political Science & Politics 48:01, 80–83.
  • Grimmer, Justin ja Stewart, Brandon M. 2013. Text as Data: The Promise and Pitfalls of Automatic Content Analysis Methods for Political Texts. Political Analysis 21:3, 267–297.
  • Juris, Jeffrey. 2012. Reflections on #Occupy Everywhere: Social Media, Public Space, and Emerging Logics of Aggregation. American Ethnologist 39:2, 259–79.
  • Kitchin, Rob. 2014. Big Data, new epistemologies and paradigm shifts. Big Data & Society 1:1, 1–12.
  • Lazer, David, Pentland Alex, Adamic Lada, ym. 2009. Life in the network: the coming age of computational social science. Science 323:5915, 721–723.
  • Neyland, Daniel ja Möllers, Norma. 2016. Algorithmic IF … THEN rules and the conditions and consequences of power. Information, Communication & Society 4462, 1–18.
  • Spencer, David. 2018. Fear and hope in an age of mass automation: debating the future of work. New Technology, Work and Employment 33:1, 1–12.
  • Wallach, Hanna. 2018. Computational social science ≠ computer science + social data. Communications of the ACM 61:3, 42–44.