Voisiko koneoppimismalli tukea laajojen verkkokeskustelujen analyysiä?

Sosiaalisen median keskustelut ovat arkipäivää: erityisesti kriisitilanteissa ihmiset jakavat tietoa ja luovat käsityksiä tilanteesta sosiaalisen median keskusteluissa. Keskusteluissa pyritään myös vaikuttamaan yleisöihin ja trollaamaan. Kriisitilanteet kehittyvät usein salamannopeasti ja informaatio verkossa leviää samalla tavoin valtavan nopeasti laajoille yleisöille [9]. Näistä syistä kriisikeskustelujen laajamittainen analyysi on kiinnostavaa, mutta käytännön haasteena on usein aineistojen laajuus.

Uudessa Northern European Journal of Language Technology -lehdessä julkaistussa tutkimuksessamme kehitimme menetelmiä suomenkielisten kriisikeskustelujen sisältämien sosiaalisten toimintojen koneoppimisavusteiseen analyysiin. Mallien tarkoituksena on tukea laajojen keskusteluaineistojen analyysiä ja auttaa ymmärtämään, miten kommentoijat positioituvat suhteessa kriisitilanteeseen ja miten he pyrkivät vaikuttamaan muihin verkkokeskusteluissa sosiaalisten toimintojen kautta (esim. kysymys, pyyntö). Tällaiset sosiaaliset toiminnot ovat tapa, jolla ihmiset koordinoivat toimintaa, ja ne myös auttavat pitämään yllä koherenttia keskustelua ja luomaan jaettua käsitystä keskustelun aiheista.

Tutkimuksemme keskiössä on asynkroninen keskustelu, jossa osallistujat voivat jättää kommentteja ilman reaaliaikaista vuorovaikutusta. Mielenkiintomme kohteena olivat erityisesti kasvoja uhkaavat toiminnot, kuten syytökset ja haasteet, sillä ne ovat keskeisiä trollaamisessa ja disinformaation levittämisessä sekä trollaamisen tunnistamisessa [2, 7]. Nämä ovat usein kriisikeskusteluihin kohdistettuja vaikuttamisen tapoja. Esimerkiksi COVID-19-pandemiaan tai Ukrainan sotaan liittyvä harhaanjohtavan informaation leviäminen ja manipulatiivinen viestintä verkossa on herättänyt paljon keskustelua siitä, miten nettivaikuttaminen voi vaikuttaa tiedonvälitykseen ja demokraattisten yhteiskuntien toimintaan [esim. 1, 3].

Aiemmat toimintojen automaattista mallintamista kehittäneet tutkimukset ovat keskittyneet pääasiassa synkronisiin eli reaaliaikaisiin keskusteluihin, kun taas asynkroniset vuorovaikutustilanteet ovat jääneet vähemmälle huomiolle. Kehittämämme annotointikehys tarjoaa uudenlaisen lähestymistavan, joka mahdollistaa niin sanottujen kasvoja uhkaavien (esim. syytös, haaste) ja parillisten (esim. kysymys-vastaus) toimintojen automaattisen tunnistamisen. Kasvoja uhkaavia toimintoja ei ole juurikaan sisällytetty aiempiin sosiaalisia toimintoja luokitteleviin malleihin. Lähestymistapamme ammentaa keskusteluanalyysistä, luonnollisen kielen käsittelystä (NLP) ja koneoppimisesta.

Koneoppimismallien käyttö toimintojen analyysissä on kuitenkin herättänyt ristiriitaisia mielipiteitä. Tutkijat ovat erimielisiä esimerkiksi mallien yleistettävyydestä ja toimintojen tarkastelun vaatimasta analyyttisestä syvyydestä [5]. Toiset näkevät keskustelunanalyysin suotuisana maaperänä laskennalliselle mallintamiselle, koska sen alalla on kiinnitetty huomiota vuorovaikutuksen yleistettäviin piirteisiin ja niiden jakaumiin [8]. Sosiaalisiin toimintoihin liittyy kuitenkin usein monitulkintaisuutta, mikä on haaste koneoppimismalleille [6]. Tämän vuoksi halusimme tarkastella, kuinka mallit voisivat paremmin tavoittaa toiminnoille tyypillistä monitulkintaisuutta.

Kriisiuutisiin liittyvät foorumikeskustelut voivat sisältää usein hyvinkin monimutkaisia ja monitulkintaisia viestejä. Siksi hyödynsimme ihmisannotaattoreiden erimielisyyksiä mallien kehityksessä. Näin mallit voivat paremmin heijastella sitä monitulkintaisuutta, jota ihmisannotoijat näkevät kommenteissa: ne ennustavat useita mahdollisia tulkintoja kunkin kommentin sisältämästä toiminnosta. Havaintomme mukaan kasvoja uhkaavat toiminnot voivat erityisen usein ilmetä epäsuorasti tai monitulkintaisesti, mikä on linjassa klassisen kohteliaisuusteoreettisen tutkimuksen kanssa [4].

Kommentit sisältävät myös usein useampia toimintoja. Havaintojemme mukaan paras tapa ennustaa useampia toimintoja ja useita mahdollisia tulkintoja on hyödyntää useamman luokittelijan joukkoa, joista kukin perustuu eri annotaattorin annotaatioihin. Mallit pärjäävät tehtävässä suhteellisen hyvin. Joidenkin toimintojen osalta ne ovat hyvinkin tarkkoja (esim. kysymys), kun taas toiset ovat vaikeampia tunnistaa (esim. kielto).

Verkkokeskustelut ovat täynnä monimutkaisia vuorovaikutustilanteita, joiden rakenteen analyysi toimintojen kautta voi auttaa erittelemään keskustelun kehittymistä ja miten ihmiset pyrkivät vaikuttamaan muiden mielipiteisiin. Kehittämämme mallit voivat toivottavasti avata uusia mahdollisuuksia verkkokeskustelujen tietokoneavusteiselle analyysille, erityisesti laajojen verkkoaineistojen tarkastelussa. Mahdollisia sovelluskohteita voisivat ovat esimerkiksi keskustelujen toiminnollisen rakenteen analyysi: miten tiettyihin toimintoihin vastataan yleensä kriisikeskusteluissa, tai ovatko jotkin toiminnot yleisempiä tietyssä vaiheessa keskustelua? Toimintomallien tukemana voisi myös tarkastella, mitä keskustelijat tekevät eri tyyppisissä kriisikeskusteluissa – esimerkiksi ovatko viranomaisiin, poliitikkoihin tai muihin keskustelijoihin kohdistuvat syytökset joissakin keskusteluissa yleisempiä kuin toisissa.

Blogikirjoitus perustuu tähän artikkeliin:

Paakki, H., Toivanen, P., & Kajava K. (2025). Implicit and Indirect: Detecting Face-threatening and Paired Actions in Asynchronous Online Conversations. Northern European Journal of Language Technology (NEJLT), 11(1), pp. 58–83. https://doi.org/10.3384/nejlt.2000-1533.2025.5980

Lähteet
[1] Badawy, Adam, Emilio Ferrara ja Kristina Lerman. 2018. ”Analyzing the Digital Traces of Political Manipulation: The 2016 Russian Interference Twitter Campaign.” International Conference on Advances in Social Networks Analysis and Mining (ASONAM), 258–265. IEEE/ACM.
[2] Bellutta, Daniele, Catherine King ja Kathleen M. Carley. 2021. “Deceptive accusations and concealed identities as misinformation campaign strategies.” Computational and Mathematical Organization Theory, 27:302–323.
[3] Bjola, Corneliu ja Krysianna Papadakis. 2020. ”Digital Propaganda, Counterpublics and the Disruption of the Public Sphere: The Finnish Approach to Building Digital Resilience.” Cambridge Review of International Affairs 33 (5): 638–666.
[4] Brown, Penelope ja Stephen C. Levinson. 1987. “Politeness: Some Universals in Language Usage”, volume 4. Cambridge University Press.
[5] Hirst, Graeme. 1991. Does conversation analysis have a role in computational linguistics? Computational Linguistics 17, 2, 211–227.
[6] Jiang, Nan-Jiang and Marie-Catherine de Marneffe. 2022. Investigating reasons for disagreement in Natural Language Inference. Transactions of the Association for Computational Linguistics, 10: 1357–1374.
[7] Paakki, Henna, Heidi Vepsäläinen, Antti Salovaara ja Bushra Zafar. 2024. “Detecting covert disruptive behavior in online interaction by analyzing conversational features and norm violations”. ACM Transactions on Computer-Human Interaction, 31(2):1–43.
[8] Tanya Stivers. 2015. Coding social interaction: A heretical approach in conversation analysis? Research on Language and Social Interaction 48, 1, 1–19. https://doi.org/10.1080/08351813.2015.993837
[9] Vosoughi, Soroush, Deb Roy ja Sinan Aral. 2018. ”The spread of true and false news online.” Science 359 (6380): 1146–1151. https://doi.org/10.1126/science.aap9559

Share this:

Leave a comment Cancel reply