How to study Big Data epistemology in the social sciences?

In the recent years there has been discussion about whether the rise of Big Data—understood as a collection of methods and practices involved in the analysis of voluminous and rapidly accumulating data with varying structure—calls for a new kind of epistemological understanding of science (e.g. Kitchin 2014; Frické 2015; Floridi 2012; Hey et al. 2009). For instance, Rob Kitchin proclaims that

There is little doubt that the development of Big Data and new data analytics offers the possibility of reframing the epistemology of science, social science and humanities, and such a reframing is already actively taking place across disciplines. (Kitchin 2014, 10.)

This epistemological reframing is due to the idea that Big Data enable a novel form of inquiry called data-driven science, which seeks to generate scientific hypotheses by discovering patterns in vast amounts of data (Kelling et al. 2009, 613-614; Kitchin 2014, 6-7). Data-driven science contrasts with the more traditional ‘knowledge-driven science’, where the hypotheses to be examined are derived from theory rather than data (Kelling et al. 2009, 613). Thus, the argument is that Big Data can reorient the roles that data and theory play in research, and that therefore we should rethink our conception of how scientific knowledge production works.

How, then, should one go about studying Big Data epistemology? How to assess the claim that Big Data enable a novel form of scientific inquiry, which cannot be analysed using traditional epistemological concepts?

In the context of biology, Sabina Leonelli has argued convincingly that in order to critically evaluate the epistemological novelty of Big Data, ‘one needs to analyse the ways in which data are actually disseminated and used to generate knowledge’ (Leonelli 2014, 2). This is quite plausibly so in the context of the social sciences, too. As Kitchin and McArdle (2016) argue, there is no single notion of ‘Big Data’ that would apply across all contexts, and accordingly the ways in which knowledge is generated are likely to vary as well.

Thus it seems sensible that a study of Big Data epistemology in the social sciences should begin with an analysis of the different ways in which Big Data are used in different social scientific contexts. With this purpose in mind, I have collected a number of special issues, sections, and symposia on Big Data that have been published in social scientific journals in the past few years (2013-2016). A review of the different conceptions and uses of Big Data in this collection should give some basis for an assessment of the extent to which the epistemology of the social sciences needs to be reframed.

Below is a list of the collected issues along with short descriptions of their contents.

Special issues, sections, and symposia on Big Data

Political Behavior and Big Data
International Journal of Sociology 46(1), 2016.

The articles in this special issue come from political sociology, cross-national methodology, and computer science. The purpose of the issue is to identify and discuss a set of pressing methodological problems pertaining to the use of Big Data methods in these fields, including the following:

  1. Can Big Data tools be used to describe and explain political behaviour?
  2. How to create a large numerical data set from textual data?
  3. How to deal with the problem of selection in constructing event data with Big Data methods?
  4. How to harmonize large volumes of survey data from distinct sources into one integrated data set?

Big Data in Psychology
Psychological Methods 21(4), 2016.

This special issue provides 10 articles that discuss the benefits of engaging psychological research with Big Data and give instructions for the use of various common research tools. The first four articles offer guides to using Big Data methods and tools in psychological research, giving advice on the use of various APIs and web scraping tools to collect data, as well as on managing and analysing large datasets. The remaining six articles then demonstrate the use of Big Data in psychology, examining the spread of negative emotion on college campuses, models of human declarative memory, methods of theory-guided exploration of empirical data, the uses of statistical learning theory in psychology, and methods for detecting the genetic contributions to cognitive and behavioural phenomena.

Big Data and Media Management
International Journal on Media Management 18(1), 2016.

The stated goal of this special issue is to showcase media management research that employs Big Data, or analyses its use in media management (see the issue introduction, 1-2). The issue includes four research articles, which use Big Data to derive metrics for audience ratings, identify influential factors in terms of news sharing, discuss television use measurement, and examine consumers’ willingness to share personal data.

Special Issue on Big Data
Journal of Business & Economic Statistics 34(4), 2016.

This special issue includes six articles on Big Data finance and seven articles on macroeconomics, high-dimensional econometrics, high-dimensional time series and spatial data. The articles discuss a variety of issues in these fields, developing theory and methods for addressing them as well as investigating applications. (See the issue introduction, 2-3.)

Transformational Issues of Big Data and Analytics in Networked Business
MIS Quarterly 40(4), 2016.

This special issue consists of eleven research articles, which develop a variety of Big Data analysis methods relevant for information systems and business. Included are a data-driven tree based method for assessing interventions in the presence of selection bias; network methods combining sentiment and textual analysis for developing brand advertising; methods for using fine-grained payment data to improve targeted marketing; a study of the causal effectiveness of display advertising; a model to improve resource allocation decisions; a crowd-based method for selecting parts of data as model input; methods for dealing with the scalability and privacy of data sharing; a utility-theory based structural model for mobile app analytics; a predictive modeling method for business process event data; a topic modelling method for measuring the business proximity between firms; and a method to address various wicked problems of societal scale in information systems. (See the issue introduction, 815-817.)

Toward Computational Social Science: Big Data in Digital Environments
The ANNALS of the American Academy of Political and Social Science 659(1), 2015.

The articles in this special issue on Big Data and computational social science come from diverse disciplines, including psychology, epidemiology, political science, and communication studies. The twenty research articles included in the issue are divided into five subsections, titled ‘Perspectives on Computational Social Science’, ‘Computer Coding of Content and Sentiment’, ‘Mapping Online Clusters and Networks’, ‘Examining Social Media Influence’, and ‘Innovations in Computational Social Science’. Each of these sections contains four articles with discussions of the section theme or empirical studies using Big Data.

Big Data, Causal Inference, and Formal Theory: Contradictory Trends in Political Science?
Symposium in Political Science & Politics 48(1), 2015.

The purpose of this symposium is to discuss whether formal theorising, causal inference-making such as experimentation, and the use of Big Data hinder or benefit from each other in political science. The seven articles included in the symposium agree that while there are limits to the extent to which Big Data can help solve problems in theoretical development of causal inference, the three should not be seen as contradictory to each other. In many cases Big Data can supplement the other two.

Section on Big Data
Sociological Methodology 45(1), 2015.

This section focusing on Big Data includes two articles. The first of these develops methods for analysing large-scale administrative datasets to yield econometric measures for urban studies. The second argues for a supervised learning method for analysing unstructured text content that combines machine-based and human-centric approaches.

Big Data, Big Questions
Special section in International Journal of Communication 8, 2014.

This special section includes eight articles which discuss political, ethical, and epistemological issues pertaining to Big Data. The issues discussed in the articles include power asymmetries related to data access; meanings attached to the term ‘Big Data’ in different discourses; the implications for democratic media of the use of Big Data in market advertising; problems pertaining to simplifications and standardizations in large-scale data sets; transparency in Twitter data collection and production; the uses and limitations of spatial Big Data; understanding the practices of the Quantified Self Movement; and the relationship between theory and Big Data.

Big Data in Communication Research
Journal of Communication 64(2), 2014.

This special issue includes eight research articles that use Big Data to address various questions in communication research. The questions addressed include agenda formation in politics; organizational forms of peer production projects; temporal dynamics and content of Twitter messages during elections; the relationship between television broadcasts and online discussion and participation; the acceptance of anti-smoking advertisements; the measurement of political homophily on Twitter; and cross-cultural variation in the use of emoticons.

Symposium on Big Data
Journal of Economic Perspectives 28(2), 2014.

This symposium contains four articles that focus on discussing problems of Big Data analysis in economics and introducing machine learning techniques suitable for addressing them, applications of data mining to analysing high-dimensional data, the uses of data gathered in political campaigns, and privacy issues pertaining to the use of Big Data in economics.

Policy by Numbers: How Big Data is Transforming Security, Governance, and Development
SAIS Review of International Affairs 34(1), 2014.

This issue features essays characterising the role of data in international affairs. The themes discussed range from the effects of selection bias in data collection on policymaking and the potential to use Big Data to estimate slavery, to issues pertaining to the openness of data and data custodianship.

Big Data/Ethnography or Big Data Ethnography
Session in Ethnographic Praxis in Industry Conference 2013.

The EPIC 2013 session on Big Data examines the relationship between Big Data and ethnographic research. The five articles in this session discuss the value of ‘small’ personal data in business, develop tools for analysing qualitative Big Data, argue that Big Data and ethnography should both be viewed as interpretative approaches to analysing human behaviour, examine the discourses and practices surrounding data among technology designers and the health and wellness community, and investigate the use of mobile money using mixed ethnographic methods.

Big Data in Political Science
Political Analysis virtual issue 5, 2013.

This virtual issue is a collection of articles published in Political Analysis between 2005-2013 that showcase the uses of Big Data and methods for analysing it in political science. The uses demonstrated by the articles include the validation of survey reports of voting, validation of online experiments, development of techniques for identifying word usage differences between groups of people, spatial sampling methods based on GPS data, and the measurement of legal significance and doctrinal development in judicial politics. The methods introduced include various Bayesian approaches to Big Data analysis and a general method for statistical inference with network data.

References

Floridi, L. (2012): Big Data and Their Epistemological Challenge. Philosophy & Technology 25(4).

Frické, M. (2015): Big Data and its epistemology. Journal of the Association for Information Science and Technology 66(4).

Hey, T., Tansley, S., and Tolle, K. (Eds.) (2009): The fourth paradigm: Data-intensive scientific discovery. Redmond,WA: Microsoft Research.

Kelling, S., Hochachka, W., Fink, D., Riedewald, M., Caruana, R., Ballard, G., and Hooker, G. (2009): Data-intensive Science: A New Paradigm for Biodiversity Studies. BioScience 59(7).

Kitchin, R. (2014): Big Data, new epistemologies and paradigm shifts. Big Data & Society 1(1).

Kitchin, R. and McArdle, G. (2016): What makes Big Data, Big Data? Exploring the ontological characteristics of 26 datasets. Big Data & Society 3(1).

Leonelli, S. (2014): What difference does quantity make? On the epistemology of Big Data in biology. Big Data & Society 1(1).

Digivaalit 2015 Studia Generaliassa

Syksyn 2016 Studia Generalia eli Helsingin yliopiston perinteikäs yleisöluentosarja starttasi 6. lokakuuta teemalla “Mikä Big Data?”. Puhumassa olivat digitaalisten aineistojen tutkimuksen professori Timo Honkela sekä minä, verkkoviestinnän tutkija Salla-Maaria Laaksonen otsikolla “Digivaalit 2015: Mitä isot digitaaliset aineistot kertovat yhteiskunnasta ja vaikuttamisesta?“.

Illan teemana oli siis erityisesti pohdinta siitä, miten isot digitaaliset aineistot muuttavat humanistisia ja yhteiskuntatieteitä. Omassa esityksessäni kerroin siitä, miten verkkoviestintä jättää erilaisia digitaalisia jälkiä ihmistoiminnasta, ja nämä jäljet antavat uudenlaisia tutkimusmahdollisuuksia myös yhteiskuntatieteiden näkökulmasta. Samalla uudet aineistot vaativat menetelmätaituruutta: tyypillisesti laskennallisen yhteiskuntatieteen asetelmissa tavalla tai toisella isot tekstiaineistot kääntyvät numeroiksi, joita sitten konteksti mielessä pitäen pyritään tulkitsemaan. Samaan aikaan small data on kuitenkin myös merkityksellistä: ilmiöiden syvällinen ymmärtäminen melkeinpä vaatii, että ainakin pieniä osia aineistosta tutkitaan myös perinteisin laadullisin menetelmin. Ihan vielä ihmisten tuottaman teksin äärellä ei uskalla luottaa pelkkään tietokoneeseen.

Ensi viikolla SG:ssä teemana muuten konepuheen matematiikka ja vuorovaikutus!

screen-shot-2016-10-14-at-11-47-48

Vaalit2015: Muutama sana #olohuonetentistä ja Twitteristä

Helsingin yliopiston ja Aalto-yliopiston yhteisessä Digivaalit 2015 –hankkeessa tutkimme sitä, miten eduskuntavaalien aikana eri mediat ovat vuorovaikutuksessa keskenään ja kuka verkkojulkisuuden keskustelua hallitsee. Kuten jo aiemmin tässä blogissa julkaistusta alustavasta analyysistä käy ilmi, eduskuntavaalit 2015 näyttäytyivät sosiaalisessa mediassa todellisina hashtag- eli aihetunnistevaaleina. Kevään aikana valtava määrä toimijoita markkinoi omia ideoitaan hashtagien avulla, minkä lisäksi näkyvyyttä saavuttivat erilaiset aihetunnisteiden avulla levinneet ilmiöt.

Yksi tämänkaltaisista hashtageistä oli #olohuonetentti, joka nousi myös yhdeksi vaalien puhuttaneimmista some-ilmiöistä. Viestinnän ammattilaisten verkosto ProComin vaikuttajaviestintäjaos järjesti keskiviikkona 20.5 Vaikuttamisen ja vakuuttamisen uudet ilmiöt –tilaisuuden, jossa pureuduttiin tähän sosiaalisessa mediassa levinneeseen kansalaisaktiivisuuden uuteen muotoon.

Ystäväporukan aloitteesta liikkeelle lähteneen olohuonetentin ideana on, että mikä tahansa kaveriporukka voi kutsua olohuoneeseen tulevien vaalien ehdokkaita ja järjestää pienimuotoisen poliittisen tentin. Ilmiön taustavaikuttaja, kansalaisaktiivi Riina Malhotra päätti vuoden alussa levittää ideaa suuremman yleisön tietoon. Hän avasi olohuonetentille nettisivut sekä Facebook ja Twitter-tilin. Kampanjan some-strategia oli yksinkertainen: kaverit ja tutut värvättiin levittämään ideaa sosiaalisessa mediassa ja Twitter-tilillä alettiin seurata nuoria, aktiivisia ja innokkaita toimittajia. Kampanjan kokonaisbudjetti oli 32 euroa.

Strategia toimi: sometus käynnistyi. Pian Helsingin Sanomista soitettiin, muut Suomen mediat seurasivat perässä ja ilmiö sai myös kansainvälistä näkyvyyttä. Kevään aikana olohuonetenttejä järjestettiin yhteensä ainakin 60 olohuoneessa ja niihin osallistui 1000 kansalaista ja 150 ehdokasta. Twiittejä aihetunnisteella julkaistiin yli 3500 kappaletta.

Katsotaanpas seuraavaksi hieman tarkemmin sitä, miten kampanja oikeastaan levisi sosiaalisessa mediassa. Alustavien analyysien mukaan #olohuonetentti –hashtagin Twitter-pöhinä näyttää tältä:

olohuonetentti-timeline

Kuva1: #olohuonetentti-aihetunnisteella merkittyjen viestien määrä Twitterissä.

Twiittailu olohuonetentti –aihetunnisteella alkoi tammikuun lopulla heti Twitter-tilin avaamisen jälkeen. Twitter-aktiivisuus olohuonetentin ympärillä lisääntyi huomattavasti vaalipäivän lähestyessä.

verkostoanalyysi_olohuonetentti

Kuva2: Verkostoanalyysi #olohuonetentti-aihetunnisteella merkityistä viesteistä Twitterissä.

Twitterissä olohuonetentti-keskusteluun osallistui kirjava joukko yksittäisiä käyttäjiä – niin ehdokkaita, toimittajia kuin kansalaisiakin. Kun kuvan verkostoa verrataan #vaalit2015-twiiteistä tehtyyn verkostoanalyysiin, nähdään selvästi kuinka olohuonetentin ympärillä puolueet eivät erotu omina siiloinaan, vaan Twitter-pöhinää käytiin laajasti ylitse puoluerajojen. Voidaankin sanoa, että olohuonetentti onnistui sekoittamaan perinteisiä Twitter-kuplia.

Twitter-pöhinää siis ilmeni ja ilmiö tavoitti sosiaalisessa mediasa suuren määrän erilaisia käyttäjiä. Mutta syntyikö kaiken tämän twiittaamisen keskellä ollenkaan todellista vuorovaikutusta? Olohuonetentin Twitter-tilin sekä hashtagin havainnointi osoittaa, että twiittaaminen vaikutti toteuttavan Twitterissä yleistä jakaumaa: lähetettyjä twiittejä on paljon, mutta aiheesta syntyneitä keskusteluita vähemmän. Sen sijaan hashtagin ympärillä ilmeni paljon ”kevyttä vuorovaikutusta”, kuten tykkäyksiä ja uudelleentwiittauksia. Syntyneet keskusteluketjut sisältivät pitkälti kiittelyä, tenttien mainostamista tai konseptista keskustelemista. Twitterille tyypilliseen tapaan keskustelut olivat hyvin lyhyitä ja ytimekkäitä.

Keskustelun vähäisestä määrästä huolimatta olohuonetentti saavutti merkittävää näkyvyyttä Twitterissä. Palvelussa korostuvat reaaliaikainen viestintä ja välittömyys, minkä lisäksi se tarjoaa sopivaa matalan kynnyksen helppoa somettamista. Malhotra arveleekin, että kampanjan saaman Twitter-huomion taustalla vaikuttivat muun muassa sen helppous, rentous ja epäformaalius. Lisäksi ilmiö on voittoa tavoittelematon, puolueesta riippumaton ja sen taustalla oli yhteiseen hyvään nojaava ajatus – tarkoitus vahvistaa demokratiaa.

Olohuonetentti vaikuttaakin olevan yksi niistä ilmiöstä, jotka nousivat vaalien aikana niin sosiaalisen median kuin perinteisenkin median agendalle – pelkästään kansalaisten aloitteesta.

#vaalit2015: alustavia analyyseja eduskuntavaalipöhinästä sosiaalisessa mediassa

Helsingin yliopiston ja Aalto-yliopiston yhteinen Digivaalit 2015 -tutkimushanke, jonka takana ovat Matti, Salla ja Arto tämän blogin kirjoittajista, tutkii verkossa muodostuvaa julkisuutta eduskuntavaalien ympärillä. Aineiston keruu jatkuu vaalipäivään asti, mutta alustavia analyyseja tehtiin jo vaaliviikolla.

Lähes kahdensadantuhannen vaalitwiitin analyysi osoittaa, että hashtageista on tullut keskeinen kampanjointimuoto myös politiikassa. Puolueiden lisäksi vaalikeskusteluun verkossa osallistuvat aktiivisesti erilaiset kansalais- ja etujärjestöt. Keskustelu on kuitenkin keskittynyttä ja jakautunutta: äänekkäimmät ehdokkaat löytyvät Helsingin ja Uudenmaan vaalipiireistä ja poliittiset ryhmittyvät viestivät enimmäkseen keskenään.

Tutkijat havaitsivat, että Twitter-tili löytyi kaikkiaan 938 kansanedustajaehdokkaalta kaikista 2146:sta, eli kaikkiaan 44 prosenttia ehdokkaista on läsnä Twitterissä. Lienee siis liioittelua väittää näitäkään vaaleja ainakaan Twitter-vaaleiksi, vaikkakin Twitterissä läsnä oli kaksi kertaa enemmän ehdokkaita kuin edellisissä eduskuntavaaleissa.

Hashtag- eli aihetunnistevaaleiksi niitä sen sijaan voisi kutsua. Puolueiden lisäksi monet erityyppiset toimijat kansalaisjärjestöistä mediaan ovat rakentaneet omia kampanjoitaan erilaisten hashtagien ympärille. Formaattiin liittyy kiinteästi myös äänestyslupausten kerääminen kansalaisilta sekä ehdokkaiden rekrytointi kampanjan arvojen taakse.

Tällaisia kampanjoita olivat muun muassa Suomen ylioppilaskuntien liiton #koulutuslupaus, eri lasten- ja nuortenjärjestöjen yhteinen #huoneentaulu-kampanja sekä ympäristöjärjestöjen ja yritysten yhdessä tekemä #energiaremontti2015-kampanja. Lisäksi lähes jokaiselta puolueelta löytyi oma kampanjahashtag – samoin kuin lukuisilta yksittäisiltä ehdokkailta. Osa näistä kampanjoista on mobilisoinut paljonkin Twitterin käyttäjiä, sillä ne näkyvät koko aineiston suosituimpien hashtagien listalla.

Eniten äänessä vihreät ja kokoomus Uudenmaan ja Helsingin vaalipiireistä

Vaaliaiheinen twiittailu aktivoitui helmikuun alussa, ensimmäisen kerran yli 2 000 twiittiä päivässä naputeltiin 9.2. ja 18.3. valittuja aihetunnisteita käyttäen twiitattiin jo 8 355 kertaa.

yleinen_vaalikeskustelu

Vaikuttaa myös siltä, että politiikkaa on arkista toimintaa, sillä twiittailu on aktiivisinta viikolla ja hiljenee viikonlopuiksi. Tarkasteltujen asiasanoiden osalta noin 16 000 twiittiä kirjoittivat ehdokkaat, kun taas suurimman osan – 91% kaikista viesteistä – kirjoittivat muut toimijat; äänestäjät, etujärjestöt sekä median edustajat.

Twiittien jakaumaa tarkastellessa selviää myös, että Twitterin käyttö on paitsi puolueittain myös alueellisesti jakautunut — eniten twiittejä lokakuusta vaaliviikon torstaihin mennessä lähettivät vihreiden ja kokoomuksen ehdokkaat Helsingin ja Uudenmaan vaalipiireistä (ks. Taulukko 1, Kuva 1).

dv2015_twiititpuolueittain

Kuva 1. Ehdokkaiden twiittien määrä yhteensä

Hashtagien eli aihetunnisteiden avulla voidaan yleisellä tasolla tarkastella keskustelun aihepiirejä vaalikeskustelussa (ks. Kuva 2, Kuva 3). Yleisten #vaalit2015 ja #politiikka -tunnisteiden yhteydessä käytettiin eniten puolueisiin viittaavia aihetunnisteita. Niiden jälkeen yleisiksi puheenaiheiksi nousivat myös #talous, #työ, turvallisuuspolitiikka eli #turpo, #vaalikoneet sekä #sote. Myöhemmin hankkeessa tutkijat selvittävät teemojen liikkumista verkon julkisuudessa kaikkien tekstisisältöjen tasolla laskennallisen analyysin keinoin.

dv2015_hashtagitpuolueittain

Kuva 2. Hashtagien käytön jakautuminen eri puolueiden ehdokkaiden kesken.

dv2015_yleisimmathastagit

Kuva 3. Suosituimmat hashtagit aineistossa. Yleiset vaali-, politiikka- tai eduskunta-sanat on poistettu.

Kuplia ja valtarakenteita

Sosiaalisen median ja politiikan tutkimuksessa on jo pitkään analysoitu oikean maailman ja digitaalisen maailman välistä yhteyttä. Tutkimusten perusteella vaikuttaa siltä, että yleensä esillä ovat samat henkilöt ja teemat, jotka ovat näkyvillä muuallakin. Tämä on herättänyt keskustelua siitä, kuinka edustava sosiaalinen media lopulta on.

Digivaalit 2015 -hankkeen tekemä verkostoanalyysi (ks. Kuva 4)  tunnisteella #vaalit2015-merkityistä twiiteistä ja Instagram-viesteistä paljastaa, että ainakin näissä palveluissa vaaliviestintä pysyy puoluepoteroissaan. Verkostokuvaajassa yhdessä esiintyneet hashtagit ja käyttäjät asettuvat lähelle toisiaan, ja suosituimmat hashtagit ja käyttäjät näkyvät suurempana.

Screen Shot 2015-04-19 at 20.06.48

Kuva 4. Verkostoanalyysi #vaalit2015-aihetunnisteella merkityistä viesteistä Twitterissä ja Instagramissa. (ks. isompi pdf-versio tästä)

Pääministeripuolue Kokoomus ja ennakkosuosikki Keskusta erottuvat omana ryhmänään sekä aihepiireinä että keskenään viestivinä toimijoina. Vastaavasti Vihreät erottuvat omana keskustelukuplanaan: he ovat aktiivisia, mutta enimmäkseen keskenään. Kolmas selkeä ryhmittymä on puolueista irrallaan: lasten ja nuorten järjestöt ja heidän kampanjahastaginsa herättävät paljon keskustelua, jossa muutamia kansanedustajaehdokkaitakin on mukana. Voisi ajatella, että tämän aiheen nouseminen näin selkeästi esille kertoo siitä, että nuoremmat ikäpolvet järjestöineen ovat verrattain aktiivisia Twitterin ja Instagramin käyttäjiä.

Vaaliaineistojen analyysi jatkuu

Digivaalit 2015 -tutkimushanke on yhdessä Kansalliskirjaston kanssa kerännyt alkuvuoden ajan eri sosiaalisen median palveluista vaaleihin liittyviä sisältöjä. Hankkeen päätavoitteena on selvittää, miten eri mediat vaikuttavat vuorovaikutuksessa keskenään ja kuka verkkojulkisuuden keskustelua hallitsee.

Tässä julkaistuja analyyseja varten tutkijat analysoivat yli 175 000 kappaletta 13.11.2014 – 16.4.2015 lähetettyjä twiittejä, jotka oli merkitty asiasanoilla #valet2015, #vaalit2015, #vaalit, #politiikka tai sisälsivät sanat vaalit, poliitikko, politiikka tai poliitikot. Verkostoanalyysissa on mukana myös Instagram. Aineiston keruu on tehty yhteistyössä Sometrik Oy:n kanssa. Ehdokkaiden tiedot ja käyttäjänimet saatiin avoimesti julkaistuista Helsingin Sanomien ja Yleisradion vaalikonedatoista.

Digivaalit 2015-hankkeessa ovat mukana Helsingin yliopiston ja Aalto-yliopiston yhteinen Tietotekniikan tutkimuslaitos HIIT sekä Helsingin yliopiston Viestinnän tutkimuskeskus CRC. Projektin rahoittaa Helsingin Sanomain Säätiö. Tutkimus jatkuu vaalien jälkeen tarkemmalla analyysillä vaalikeskustelusta sekä sosiaalisen median ja perinteisen median vuoropuhelusta. Kansalliskirjaston keräämät verkkoaineistot  ovat asiakkaiden käytössä Kansalliskirjastossa ja muissa vapaakappalekirjastoissa, Eduskunnan kirjastossa sekä Kansallisessa audiovisuaalisessa arkistossa.

Lisätietoa Digivaalit 2015-hankkeesta:
https://www.hiit.fi/digivaalit-2015

digivaalit2015@hiit.fi
Tutkija Matti Nelimarkka / 050 52 75 920
Tutkija Salla-Maaria Laaksonen / 050 415 6576
Tutkimusavustajat Arto Kekkonen, Mari Marttila ja Mari Tuokko.

Digivaalit 2015 -tutkimusryhmä päivystää 17.4. – 25.4.; pyydämme ottamaan yhteyttä sähköpostitse digivaalit2015@hiit.fi . Vastaamme mielellämme kysymyksiin jotka liittyvät sosiaalisen median käyttöön vaaleissa sekä selvitämme mahdollisuuksien mukaan vastauksia myös tarkempiin kysymyksiin toimittajien pyynnöstä. Huomioithan kuitenkin, että joidenkin analyysien tekeminen näin isolla aineistolla saattaa viedä aikaa.