Tämän vuoden alku on ollut tulvillaan tekoälypuhetta ja suurten kielimallien ihmettelyä. Sosiaalisen median virrat ovat täyttyneet ChatGPT:tä pohtivista päivityksistä ja esimerkkikuvista, jossa ihmiset kokeilevat chatbottia. Jakoon päätyvät erityisesti dialogit, joissa keskusteleva tekoäly tuottaa jotakin vaikuttavaa tai jotakin virheellistä. Samaan aikaan mediassa pohditaan tekstiä tuottavan tekoälyn tuomaa muutosta työelämään. Opettajat ja yliopistoväki ovat puolestaan huolissaan siitä, alkavatko opiskelijat tuottaa kaikki kirjalliset työnsä helposti saatavissa olevalla tekoälyllä. Teknologiaentusiastit pohtivat, miten keskusteleva tekoäly voi parantaa tuottavuutta tai kenties pilata maailman.
ChatGPT pohjautuu Open AI:n kehittämälle GPT-mallille, joka on niin sanottu suuri kielimalli (large language model LLM). Se tarkoittaa sanojen ja sanajonojen esiintymistodennäköisyyksille perustuvaa mallia, joka osaa ennustaa annetulle tekstipätkälle jatkoa tai tuottaa kuvauksen mukaista tekstiä. Mallit opetetaan käyttämällä opetusaineistoja, joissa tyypillisesti on valtavia tekstikokoelmia. Modernit suuret kielimallit pohjaavat neuroverkoille, joita myös hyödynnetään niiden kouluttamisessa – käytännössä tekoäly kouluttaa toista tekoälyä. Keskustelutaitoinen ChatGPT on myös esimerkki viestivästä tekoälystä, eli luonnollisella kielellä käytävään keskusteluun kykenevästä algoritmista.
Kokeilin helmikuussa organisaatioviestinnän kurssiani varten miten GPT-3 (sekä ChatGPT että Open AI:n pelkkä GPT3-malli) selviytyy organisaatioviestinnän perustekstien tuottamisesta. Pyysin tekoälyä kirjoittamaan esimerkiksi tiedotteen teknologiayrityksen ympäristöaloitteista, yrityksen moniarvoisuutta kehuvia twiittejä, toimitusjohtajan puheen pikkujouluihin ja Elon Muskin yt-viestin (selaa kuvia nuolien avulla):
Kuten kuvista näkyy, tekstit ovat lähes täydellisiä genrejensä edustajia: ne noudattavat tekstilajilleen tyypillistä rakennetta ja kielenkäyttöä aihetunnisteita myöten, ja toistavat jopa tilanteeseen sopivia tunnetyylejä. Mutta ne ovat myös kovin bulkkeja. Sieluttomia, kuten eräs opiskelija luennolla totesi. Rakenne ja tyylilaji GPT-mallilla on selvästi hallussa.
Mihin GPT-malli taipuu?
Ihmismäistä puhetta tuottava tekoäly on hirvittävän houkutteleva. Se herättää ajatuksia teknologisesta ylivoimaisuudesta ja mielikuvan koneen kyvystä ymmärtää kuten ihminen. Mutta GPT on lopulta vain hyvin toimiva ennustava tekstinsyöttöjärjestelmä, joka osaa toistaa ja yhdistellä aiemmin luotua tekstiä. Sille on syötetty opetusaineistoksi hieman epämääräiseksi jäävä kokoelma erilaista avoimesti saatavilla olevaa tekstimassaa, esimerkiksi Wikipedian sisältöjä ja Reddit-keskusteluja, ja sen keskustelukykyä on koulutettu ihmisluokittelijoiden ja toisen tekoälymallin avulla.
GPT-mallin tiedot perustuvat sen opetusaineistolle, jota se toki pystyy käsittelemään nopeasti ja yhdistelemällä. Aineistojen sisältämän tiedon todenperäisyydestä sillä ei kuitenkaan ainakaan toistaiseksi vaikuta olevan käsitystä. Julkisuudessa on keskusteltu esimerkiksi siitä, miten ChatGPT esittää totena mediassa esitettyjä vääriä väitteitä tai keksii ihmisiä ja julkaisuja, joita ei ole olemassa.
GPT-malli ei siis varsinaisesti ymmärrä sillä tavalla kuin ymmärryksen tyypillisesti käsitämme ihmisen kognitiivisena kyvykkyytenä. Mutta kielimalli osaa tuottaa hyvältä näyttävää ja rakenteeltaan oikeaa tekstiä, varsinkin sellaisista ihmisviestinnän muodoista, jotka ovat erityisen toisteisia. Kuten yllä olevat korporaatiotekstit näyttävät, tähän kategoriaan menevät juuri esimerkiksi monet yritysviestinnän tuotokset tai mikä tahansa rutiininomainen viestintä juhlapuheista osanottoviesteihin.
ChatGPT osoittaakin varsin alleviivaavasti sen, miten toisteista osa tekstintuotannostamme on. Rutiininomaisilla viesteillä on paljon merkitystä sosiaalisessa toiminnassa ja yhteisön rakentumisessa – alkaen juuri vaikkapa tervehdyksistä ja toivotuksista. Mutta iso kysymys on, mitä puuttuu maailmasta, jossa suuri kielimalli kirjoittaa viestejä promptien perusteella ja ehkä toinen kielimalli lukee ja tiivistää viestit vastaanottajalle? Rakentaako tällainen tekoälyn viestintä myös yhteisöä?
Yhden vastauksen kysymykseen tarjoaa tuore tapaus, jossa Yhdysvalloissa yliopisto käytti ChatGPT:tä kirjoittaakseen lohduttavan kirjeen opiskelijoille kampuksella tapahtuneen ampumavälikohtauksen jälkeen. Opiskelijat eivät tekoa arvostaneet.
Itselleni avautuu GPT:n tuotosten äärellä myös epämääräinen ajatus tulevaisuudesta, jossa kaikki on yhä toisteisempaa ja rakentuu yhä sumenevalle kuvalle menneistä teksteistä ja tiedoista. Miten tällaisessa maailmassa rakennetaan mitään uutta? Miten tällaisessa maailmassa ajatellaan, kun ajattelu tapahtuu koko ajan myös kirjoittamalla?
Miksi juuri ChatGPT herättää keskustelun tekoälystä?
Isoja kielimalleja on käytetty jo pitkään erilaisten teknologioiden taustalla, esimerkiksi hakukoneissa, puheentunnistuksessa tai kielten automaattikäännöksissä. Miksi juuri ChatGPT herättää näin paljon keskustelua sekä visioita ja kauhukuvia tulevaisuudesta, vaikka tekoälyn kehitys on mullistanut tekstinluokittelun ja automaattisen tekstinkäsittelyn jo vuosia sitten? Erilaiset reittioppaat ovat mainioita esimerkkejä tekoälystä, jota käytämme arkisesti, mutta jonka on niin kotoistunut, ettemme enää näe sen ihmeellisyyttä. Toisaalta ymmärrämme sen tekevän jotakin sellaista, mikä ihmiselle olisi vaikeaa.
GPT-mallit ovat monipuolisimpia kohtaamiamme tekoälyjä. Mutta viestinnän tutkijana arvelisin yhden syyn niiden herättämään mielenkiintoon olevan siinä, että varsinkin ChatGPT tarjoaa viestinnällisen elämyksen, jonka kautta käyttäjälle muodostuu yhteys koneen kanssa. Kyky verbaaliseen ilmaisuun tekee ChatGPT:stä ymmärrettävän, lähestyttävän ja inhimillisemmän tekoälyn. Sen kanssa tekoälyn kehittymisen voi konkreettisesti kokea.
ChatGPT:n avulla meitä myös koulutetaan ja totutetaan käyttämään luonnollisen kielen käyttöliittymiä tietokoneisiin ja monimutkaisiin analyyseihin. Juuri tämä uusi avautunut saavutettavuus tekee niistä houkuttelevaa. Arkeemme on yhtäkkiä avautunut näkymä scifielokuvien tulevaisuuteen, jossa jutellaan HAL-robotin kanssa niitä näitä. Kenties kohta sujuvasti jutteleva tekstinkäsittelyohjelman apulaisbotti on niin arkipäiväinen asia, että emme pärjää ilman sitä – vähän kuten Google Mapsille on käynyt.
– –
Tämän tekstin tuottamisessa ei ole käytetty kielimallia. Apuna ja esilukijoina on kuitenkin ollut monta skarppia kollegaa Rajapinta-tutkijayhteisöstä: kiitos Jesse Haapoja, Arto Kekkonen, Tuukka Lehtiniemi, Juho Pääkkönen ja Pihla Toivanen!