Let’s get organized – Rajapinta ry perustettu

2017-01-16-15-55-52

Tapaamisessamme 16.1.2017 pidimme perustamiskokouksen Rajapinta ry -nimiselle yhdistykselle, jonka tarkoituksena on tukea tieto- ja viestintäteknologian yhteiskuntatieteellistä tutkimusta. Täsmällisemmin, PRH:lla nyt hyväksyttävänä olevista säännöistä lainaten:

Yhdistyksen tarkoituksena on ylläpitää, tukea ja kehittää tieto- ja viestintäteknologian yhteiskunnallista tutkimusta, ylläpitää, tukea ja kehittää tietoteknologiaa soveltavia tutkimusmenetelmiä yhteiskuntatieteelliseen tutkimukseen, sekä seurata ja ottaa kantaa tieto- ja viestintäteknologian yhteiskunnallista vaikutusta tai niiden soveltamista koskeviin kysymyksiin. Yhdistys edistää alan tutkimuksen kotimaista sekä kansainvälistä yhteistyötä.

Miksi tällainen yhdistys tarvitaan? Toisin kuin useissa muissa maissa, Suomessa ei ole vielä muodostettu erillistä akateemista tutkimusyksikköä tieto- ja viestintäteknologian yhteiskunnallisista vaikutuksista kiinnostuneille yhteiskuntatieteilijöille. Teemaan erikoistuminen esimerkiksi maisteriopinnoissa ei ole mahdollista missään yhteiskuntatieteellisessä koulutusohjelmassa tällä hetkellä. Siksi päätimme ketterästi ryhtyä rakentemaan tutkimusyhteisöä itse, monitieteiselle pohjalle eri tutkimusorganisaatioiden yhteistyönä. Rajapinta on tutkimusyhteisö tieto- ja viestintäteknologian ja yhteiskunnan välissä oleville tutkijoille ja opiskelijoille.

Toimintaamme kuuluu muun muassa tieteen popularisointia ja ajankohtaisten ilmiöiden asiantuntevaa käsittelyä tämän Rajapinta.co-blogin kautta, kuukausittaiset tutkijatapaamiset sekä vuosittainen Rajapinta-päivä, jossa esitetään alan suomalaista tutkimusta ja kutsutaan kansainvälisiä vierasluennoitsijoita. Tervetuloa meetup-tapaamisiin tutustumaan toimintaamme!

Yhdistyksen toimintaa tukee seuraavat neljä vuotta Koneen Säätiö vuoden 2016 lopulla myönnetyllä apurahalla. Yhdistyksen puheenjohtajana toimii Matti Nelimarkka.

– –

Same briefly in English: in out meetup on Monday Jan 16th we founded an association for social science orientated ICT research, under the name Rajapinta ry. The purpose of the association is to support and develop social science orientated research on information and communication technologies in the Finnish academia. Currently there are no institutions in Finnish universities that would specialize on ICT with a social scientific orientation, and for example no master programs allow students to specialize in these questions. Therefore, we decided to start a lean format of collaboration between Finnish researchers and universities to promote and support theoretical, methodological and practical issues related to ICTs and the society. Most of our activities are bilingual in Finnish and in English – you are most welcome to our future meetups!

DCCS October meetup: topic models, data economy and computer vision

Last Friday our Rajapinta/DCCS meetup was organized for a third time. We were kindly hosted by Aleksi Kallio and CSC IT Center for Science. CSC is a non-profit company owned by the state of Finland and administered by the Ministry of Education and Culture. CSC maintains and develops the centralised IT infrastructure for research, libraries, archives, museums and culture. Their services have mostly been used by researchers in sciences or life sciences, but recently we have been discussing and collaborating with them in social sciences, especially computational social sciences as well. For instance, the data processing in Digivaalit 2015 was mostly done on CSC servers.

In the meetup we had three presentation each followed by a lively discussion.

dccs2810-matti.gifFirst, Matti Nelimarkka discussed topic models and the ways how to employ them in social sciences, and in particular the different ways of selecting the “k”, i.e. the number of topics you want to extract from the data.

Computer science uses measures such as loglikelihood, perplexity or gibbs sampler to find the best estimate for k. Social science people, however, often select a few k numbers, check and compare the results (i.e., word lists) and using some heuristics pick the one that seems best.

Matti ran an experiment to where he asked participants to examine topic model results from a given data set for 10-30 k’s and select the k that seemed to best with the given research problem. After this, the participants were interviewed about the process they used to select the k.

There were some general heuristics all participants seemed to use: they first, tried to avoid overlapping topics (if they existed, they cut down the number of topics) and second, tried to avoid topics that seem to include multiple themes (and increased the number of topics in such cases). Most importantly, all the five participants selected a different k with a large variance.

Hence, results show a sort of method opportunism in selecting the k of topics: depending on what people want to find from the data they perceive it differently. Matti’s suggestion is, that computational methods should be used to select the k.

*

dccs2810-tuukka.gifNext, Tuukka Lehtiniemi discussed the troublemakers of data economy based on a manuscript he’s preparing. As troublemakers he refers to players who disrupt the market and gain ground by acting against the normal way of doing things. In normal business markets such actors would be Spotify, Uber, Igglo, or Onnibus – or national broadcasting companies such as YLE for commercial media.

But what is the conventional mode or the market in data economy? The market is to a large extent defined by the large players known as “le GAFA”: Google, Amazon Facebook and Apple. Their business is mostly based on datafication, which means turning social behaviour into quantifiable data (see e.g., Mayer-Schönberger & Cukier, 2013). Such data is born online within these services based on the activities of the users. The markets that exist upon this data are largely base on selling audience data to advertisers and various third party data services. Tuukka, following Shoshana Zuboff’s thoughts, calls this surveillance capitalism.

In his paper, Tuukka examines three potential alternatives to the surveillance model: two commercial startup initiatives (Meeco and Cozy Cloud) and a research-originated one (OpenPDS developed at MIT). These cases are explored to identify overarching features they strive to achieve in relation the above questions. The identified new roles for users are data collector, intermediary of data between services, controller of data analysis, and source of subjective data.

A version of the related paper is available on the Oxford Internet Institute IPP conference site.

*

dccs2810-markus.gifIn the third presentation Markus Koskela from CSC presented some recent advances in automated image analysis tools – or as he neatly put it, analyzing the dark matter of the internet.

Automated image analysis is commonly done nowadays using machine learning and deep neural networks. A big leap forward has been taken around 201,2 made possible by first, the availability of open visual data, second availability computational resources, and third, some methodological advances. From a machine learning perspective there is nothing completely new but a few simple tricks to improve visual analysis.

Nowadays lots of open source tools are available for visual analysis: codes available in GitHub, pre-trained networks are openly available, several annotated datasets to use in the analysis (e.g. Imagenet, Google Open Images). Markus recommends Keras (keras.io) as his favorite choice, and mentioned TensorFlow and Theano as other usable tools.

As a final note of caution Markus reminded that researchers still haven’t solved what vision actually is about. It’s always that particular data set or a particular task, where a computer vision solution works, but generalization is very difficult. For example he presented some funny results of image recognition algorithms’ work in the sample images from Google Research’s automated caption generator: algorithm can’t tell the difference between a traffic sign with stickers and an open refrigerator, if the light sheds over the sign in a particular way (same pics available in this Techcrunch article)

*

Next DCCS meetup will be held in Tampere on November 25th in connection with the Social Psychology Days – stay tuned!

DCCS syyskuussa: aihemallinnusta sekä algoritmejä

Syyskuun viimeisenä perjantaina, tieteiden yön iltapäivällä, Digital Citizens, Communities, and Society kokoontui pohtimaan yhteiskuntatieteen ja tieto- ja viestintäteknologian rajamaastoa. Meillä oli kaksi vuorovaikutteista johdantoa, joita pyrin hiukan tiivistämään blogin muotoon.

Uusia menetelmämahdollisuuksia

Tuukka Ylä-Anttila puhuiaihemallinnuksesta (topic modeling) sosiologin työvälineenä, esitellen kolmea projektia: kehysanalyysiä ilmastopoliittisesta keskustelusta, poliittisten keskustelujen hakemista Suomi24-keskustelualueelta sekä MV-lehden sisällön luokittelua

Lyhyesti, aihemallinnuksessa algoritmi luokittelee sanoja sekä “dokumentteja” esiintymisien mukaan ryhmiin ohjaamattomasti. Yhteiskuntatieteilijä voi käyttää mallia keskustelunaiheiden luokitteluun, mutta suuri kysymys on, onnistuuko keskustelun tapojen kuten kehysten tai diskurssien luokittelu.

Käytimme varsin paljon aikaa pohtimalla miten aihemallinnukset tulisi validoida ja –  ainakin itse – valitin kunnon ohjekirjan puuttumista tälle osa-alueelle. Ylä-Anttila kolleegoineen ovat dokumentoineet prosessin, jossa ensin arvioidaan aihemallinnuksen sanapilviä, minkä jälkeen arvioidaan aiheissa olevien dokumenttien sisältöjä ja tarkennetaan aihetulkintaan jos se on tarpeen. Lähestymistapa kuulosti varsin toimivalta, jäänkin kuuntelemaan mitä mieltä vertaisarvioitsijat ovat siitä.

Toisaalta, myös aiheiden tulkinta herätti huolta: voivatko kyseessä olla framet, diskurssit tai mitkään muut yleisesti käyttämät teoretisoinnit sisällöstä. Tätä ei myöskään helpota, kuten Tuukka muistutti, että framestakin on useampia erilaisia merkityksiä ja tulkintoja yhteiskuntatieteessä. Itse pohdiskelin ääneen, että miksi aiheita pitäisi sanoa joksikin muuksi kuin aiheiksi, mutta Tuukka nopeasti vastasi, että tuo pohdinta liittyy siihen, mihin aiempaan tutkimustraditioon sitten itse sijoittuu. Teoreettisilla käsitteillä on pitkät juuret, jotka vaikuttavat niiden tulkintaan.

Tämä lieneekin valtavirtaistuksen suurin ongelma, jollain tavalla laskennalliset menetelmät ja niiden tulokset pitäisi saada puhumaan traditionaalisten yhteiskunnallisten menetelmien kanssa. Tällöin yhteinen terminologia esimerkiksi auttaa jo varsin paljon, helpoittaa valtavirta-yhteiskuntatieteilijän pohdintaa tulosten järkevyydestä ja merkittävyydestä.

Aiheesta lisää sekä muutama uudehko opinnnäytetyö

Algoritmit sosiaalisessa vuorovaikutuksessa

Jesse Haapoja kertoi juuri jättämästään Helsingin yliopiston jatko-opintosuunnitelmasta, algoritmeistä sosiaalipsykologian kannalta. Hänen keskeinen argumenttinsa on (tai, ehkä paremminkin, minun tulkinta hänen ajatuksestaan), että teknisillä järjestelmillä on toimijuutta mikrotasolla vuorovaikutukstilanteilla – näkökulma joka vielä toistaiseksi puuttuu isoista algoritmien vallankäytön keskustelusta. Algoritmit ja tekniset järjestelmät mahdollistavat ja rajoittavat ihmisten välistä vuorovaikutusta, Tinderin deittaussovelluksesta Pokémon Go:n algoritmin päättämiin vuorovaikutuspaikkoihin.

Jessen tavoite tutkimuksessaan on havainnoida kuinka algoritmit tulevat esille mikrotasolla ihmisten välisessä vuorovaikutuksessa sekä ajatella, miten ihmiset reagoivat algoritmien toimintaan. Eräs esimerkki on vaalikoneet, joiden algoritmit eivät vain neuvo meitä äänestämään vaan myös rakentavat poliittista identiteettiä.

Mikä on oikein ja mikä väärin?

Viimeisenä aiheena eräs pro gradu-työn tekijä Matti Autio esitteli pohdintaansa Facebookin kaupunginosa-ryhmien toiminnasta ja siellä esiintyvästä rajoittavasta sekä yhdentävästä viestittelystä. Hänen suurin kysymys oli tutkimuseettinen: saako tätä tutkimusta oikeastaan tehdä ja voiko gradussa olla lainauksia näistä ryhmistä ja saako ryhmiä edes tutkia.

Tämä herätti laajaa keskustelua DCCS-ryhmässä, tutkimuseettinen pohdinta on vielä kesken. Johtopäätöksemme taisi olla, ettei isojen ryhmien tutkimisessa ollut isompia ongelmia, mutta lainaukset olisi hyvä tarkistaa jokaiselta osallistujalta erikseen. Vaikka verkon tutkimusta onkin tehty jo useampi vuosikymmen, samat eettiset kysymykset ovat edelleen avoinna. Lopuksi päädyimme suosittelemaan vielä opiskelijaa tarkastaman Internet-tutkijoiden AOIRn eettisen toimikunnan ohjeita aiheesta.

 

Miksi DCCS on olemassa?

Eilen oli ensimmäinen Digital Citizens, Communities and Society-meetup Koneen Säätiön tiloissa. Pyrin purkamaan jotain ajatuksiani meetupin jälkeen.

Mitä on digitalisaatio?

Suomessa digitalisaatio on varmaan vuoden 2016 buzzword. Kaikki puhuvat digitalisaatiosta, mutten ole ihan varma mitä sillä julkisessa keskustelussa tarkoitetaan. Kun tästä puhuttiin, niin Jesse tai Tuukka huomautti, että digitalisaation möhmöisyys sallii jokaisen käyttää termiä ja silti olla osa hypeä. Tuntea olevansa osa suurta kertomusta, jossa digitaalisuus muuttaa kaiken. Tämä on ehkä paras kuulemani selitys siitä, digitalisaatiosta – se on tunnussana ollakseen trendikäs tällä kertaa. Katsotaan, mitä tarvitaan ensi vuonna trendikkyyteen.

2016-08-26 14.45.51
Ensimmäisen DCCS tapaamisen osallistujat

Ehkäpä digitalisatio terminä on kaikenkattava, kuin myös DCCS otsakkeena yhteisölle. Puhuimme kahdesta eri perspektiivistä, ‘digitaalisesta’ tutkimuskohteena. Toisaalta on kentttä, joka jossain välissä sanottiin internet tutkimukseksi, mutta nykyisin on melkein valtavirtaa (mutta, vain melkein) perinteisen tutkimuksen skenessä. Samaan aikaan teknologia muuttaa myös tutkimusmenetelmiä. Taikatermi voisi olla datatiede (data science), mutta uskon myös uusien sensoreiden ja välineiden käyttö voi muokata perinteistä tutkimusskeneä.

Uskon kuitenkin, ettei Suomessa ole tarpeen olla turhan tarkka siitä, kumpi on se pääperspektiivi. Osa ongelmista ovat samanlaisia riippumatta perspektiivistä, ja niistä avautuminen muiden ihmisten kanssa on voisi auttaa. Lisäksi, jako eri perspektiiveihin ei ota huomioon ihmisten siirtymistä perspektiivien välillä, hyppiä näkökulmasta tietotekniikkasta tutkimuskohteena tietotekniikkaan menetelmänä.

Puuttuvat käytännön ongelmana

Eräs ongelma erilaisilla digihörhöillä yhteiskuntatieteissä on lähes kokonaan puuttuva ohjauspohja. Jokainen tutkijanalku – oli se sitten kandiin, graduun tai väitöskirjaan – joutuu ponnistamaan tyhjästä. Oma kokemukseni on, että se on samaan aikaan varsin tylsä, turhauttava ja mielenkiintoinen prosessi. Kukapa ei haluaisi viettää useampaa vuotta löytäen keskeistä kirjallisuutta ja yllättyä kolme vuotta homman aloittamisen jälkeen, että tälläistäkin kirjallisuutta on olemassa. Toisaalta, joskus peruskäsitteetkin ovat hiukan hukassa. Useilla ‘perinteisemmillä’ aiheilla on tukevia rakenteita, kuten seminaarit tai opintojaksot, vakiinnuttamassa tätä perustietämystä ja kertomassa, mikä on mahdollista. Ainakin minun aikaan valtiotieteissä ei tälläistä ollut. Tosin, merkittävänä parannuksena aiempaan verrattuna on mielestäni muuttunut ilmapiiri. Nykyisin digitaalisuus on ollut niin läpitunkevaa, että sen huomioiminen tutkimusaiheena on jo hyväksyttyä. Tämä oli tietenkin valtiotieteelllsen tiedekunnan koulutuksen läpikäyneenä iso tilitys siitä, että olipas elämä nyt vaikeaa. Toisaalta, muiden tieteenalojen kohdalla saattoi hyvin törmätä samaan problematiikkaan, vaikka tietojenkäsittelytiede on digitouhun keskiössä, ei sielläkään aina ole osaamista ihmisläheisten aiheiden suhteen.

Puuttuvat käytännöt näkyvät myös tutkimuksen tekemisen haasteina. Menetelmävalinnat sekä aineiston keräys eivät välttämättä sovitu digitaalisuuden tutkimukseen niin hyvin. Esimerkiksi puhuimme sosiaalisen median aineiston keräämisestä: ostaakko aineistoja vaiko käyttää omia resursseja keräämiseen. Sinäänsä kysymys on avoinna myös isommissa piireissä, menetelmärutiinit ovat vielä vakiintumassa.

Samoin digitaalisen tutkimuksen eettiset käytännöt ovat edelleen harmaata aluetta. Facebookin tunnekokeiden jälkeen Yhdysvalloissa on käynnistynyt varsin kiivas keskustelu niin yliopistoissa kuin yrityksissä, esimerkiksi danah boydin ja kumppaneiden työryhmä pohtii näitä asioita . Toki, kansainvälisiä keskustelufoorumeita, kuten AoIR-listaa, seuraamalla huomaa ettei tämä harmaus ole vain Suomen ongelma. Meiltä puuttuu selkeät eettiset ohjeet, joihin tutkija tai tutkimuksen eettinen arvioitsija voisi palata pohdinnoissaan.

Mitä seuraavaksi?

Miten nämä käytännön ongelmat voidaan korjata? Yksi ratkaisu on community of practicen muodostaminen digitaalisuuden tutkimuksen ympärille. Community of practice koostuu kokeneemmista ja noviiseista, ja kokeneemmat ohjaavat noviiseja taitoon ja noviisit muuttuvat kokeneiksi. Tämä siis tarkoittaa, että tarvitsemme touhuumme mukaan enemmän opiskelijoita, jotka ovat eivät vain hyödy meidän ohjauksesta, vaan jatkavat yhteisön ylläpitoa kun kokeneemmat poistuvat muuhun toimiin. Lisäksi toivon, että tyhjiötä digitaalisuudesta voidaan täyttää pala kerrallaan.

Toisaalta, myös me kokeneemmat voimme oppia toisiltamme. Yksinkertainen muoto siihen on erilaiset esitykset ihmisten omasta tutkimuksesta, sen mahdollisuuksista ja haasteista. Käyttäisin tässä kohtaa termiä cutting edge. Jokaisen tutkijan täytyy löytää alansa terävin kärki voidakseen rakentaa sen päälle. Ja sen sijaan, että harhailemme sinne itse, niin voimme kysyä muilta harhailevilta apua.

DCCS jatkuu nyt ainakin syksyn ajan kuukausittain viimeisenä perjantaina. Rakennamme ohjelmaa tarkemmaksi, esimerkiksi suunnittelemme esitelmiä osaksi tapaamiasimme vapaamuotoisen jutustelun lisäksi. Myös opiskelijoiden mukaanotto on tärkeää ja vaatii panostusta meiltä kaikilta. Katsotaan sitten marraskuussa, että jatkammeko tätä kevätkaudelle.

Digital Citizens, Communities, and Society

Yhteiskuntatietelijät ovat viimeaikoina keskittyneet tietoteknologian mahdollisuuksien, haasteiden ja vaikutusten tutkimiseen tai soveltaneet laskennallisia työvälineitä tutkimuksessaan. Kuitenkin Suomessa tuntuu puuttuvan yhteiskuntatieteellinen yhteisö tälle tutkimukselle.

Rajapinnassa päätimme toimia ja järjestämme syksyn aikana kuukausittaisen tapaamisen tutkimuksesta kiinnostuneille perus- ja jatko-opiskelijoille sekä muulle väelle.

Tapaamisissa voimme pohtia tutkimuksen aiheita sekä menetelmävalintoja, sekä kommentoida toistemme töitä. Mielenkiinnon mukaan järjestämme myös vierailuluennoitsijoita tai muuta toimintaa.

Tapaamiset ovat syksyllä kuun viimeisenä perjantaina.

  • 26.8. Koneen säätiön Kamarissa
  • 30.9. Koneen säätiön Kamarissa
  • 28.10.
  • 25.11.

Lisää aiheesta meetup-sivulla.