Perinteinen tykkäyksiä ja näyttökertoja laskeva somenalytiikka alkaa olla kaikille viestinnän ja markkinoinnin parissa työskenteleville tuttua. Sosiaalisesta mediasta saatavaa dataa voidaan analysoida numeroiden lisäksi myös tekstinlouhinnan keinoin. 5.2.2020 järjestetyssä webinaarimuotoisessa HY+digiaamussa Helsingin yliopiston Kuluttajatutkimuskeskuksen tutkijatohtori Salla-Maaria Laaksonen kertoi, mitä kaikkea tietoa somesisällöistä voidaan saada irti laskennallisilla menetelmillä.
Laskennallinen tekstianalytiikka tarkoittaa Laaksosen mukaan erilaisten piirteiden tunnistamista tekstisisällöistä. Analytiikassa tarkastellaan sitä, miten eri piirteitä esiintyy teksteissä ja mitkä niiden keskinäiset suhteet ovat. Yksikertaisimmillaan voidaan esimerkiksi tutkia tiettyjä avainsanoja ja sitä, kuka on vaikkapa twiitannut aiheesta eniten, tai tarkastella aikaleimojen avulla, mistä tietyillä ajanjaksoilla somessa puhutaan.
Kiinnostavaa somessa on Laaksosen sanoin se, että se näyttäytyy ikään kuin ihmistoiminnan digitaalisena jalanjälkenä: mistä puhutaan, miten käyttäydytään, minkälaisten ilmiöiden perässä liikutaan. Tämä data on kiinnostavaa sekä tutkijoille että yrityksille.
Laaksonen kehottaa suhtautumaan analytiikkapalveluihin varauksella. Tässä blogiartikkelissa on avattu, miksi näin on ja mistä sosiaalisen median analytiikassa on Laaksosen mukaan oikeastaan kyse.
Millaista dataa somesta saadaan ja kuinka sitä analysoidaan?
Someanalytiikan menetelmäkehitys ja laskentateho ovat kasvaneet paljon viime vuosina. Sosiaalisen median lisääntynyt käyttö tarkoittaa myös sitä, että julkista aineistoa on enemmän saatavilla.
Millaisia aineistoja sosiaalisesta mediasta saadaan? Laaksonen puhuu isoista julkisista viesteistä saatavista datamassoista, joita voidaan koneellisesti ladata palveluiden rajapintojen kautta.
Tyypillisiä tekstianalytiikan muotoja ovat esimerkiksi sentimenttianalyysi tai ohjaamaton aihemallinnus. Sentimenttianalyysissä on kyse lauseen sävyn analysoimisesta. Siinä tyypillisesti lasketaan yhteen sanojen tunnettua positiivisuutta ja negatiivisuutta sana sanalta, ja yhteenlaskun tuloksena arvioidaan koko viestin sävyä. Aihemallinnus puolestaan tunnistaa aineistoista aiheita eri teemoja ryhmittelemällä sanoja sanaryppäiksi, ja antaa siten yleiskuvan siitä, mistä teksteissä keskustellaan.
Vaikka tällainen analytiikka on periaatteesta automaattista, Laaksonen muistuttaa, että myös ”tekoälyn” aikakaudella analytiikka vaati usein edelleen ihmistä lukemaan aineistoa ja tarkistamaan analyysin tuloksia. Esimerkiksi aihemallinnus ei itsestään nimeä aiheita, vaan ihminen päättelee mistä aiheita kuvaavissa sanaryhmissä on kyse. Samoin sentimenttianalyysi harvoin tunnistaa ironiaa tai kielikuvia oikein, vaikka ihminen pystyisi ne nopeasti tulkitsemaan.
Myös sosiaalisen median alustojen kehittyminen luo haasteita analytiikalle. Kuten Laaksonen tuo esiin, somesisällöt ovat nykyään pitkälti tavalla tai toisella kuvallisia. Kuluttaja saattaa ilmaista tyytyväisyyttä tai tyytymättömyyttä kuvalla, jota on hankalampi analysoida kuin tekstiä. Kuvistakin voidaan kuitenkin päätellä jotain.
Tyypillinen kuvia tunnistava koneoppimisjärjestelmä etsii kuvista esimerkiksi ihmisiä tiettyjen piirteiden perusteella. Tekoäly tekee kuitenkin aika paljon vääriä tulkintoja, sillä tietynlaisia asioita on kuvista vielä hankala tunnistaa. Automaattisella analyysilla ei päästä myöskään kiinni yksityiskohtiin tai kuvan sisältämään huumoriin.
Ylipäätään someanalytiikassa on olemassa helpompia piirteitä, kuten viestin lähettäjä, lähetysajankohta, mainintojen määrä tai viestin pituus, joita voidaan analysoida. Vaikeammiksi piirteiksi Laaksonen listaa esimerkiksi viestin lähettäjän sijainnin, keskustelun jakautumisen eri ryhmiin, viestin sävyn sekä poliittiset näkemykset ja mielipiteet, joita on jo varsin vaikea tunnistaa. Mitä moninaisempia keskustelut ovat, sitä hankalampi niistä on tunnistaa esimerkiksi erilaisia argumentteja.
Miten someanalytiikalla tuetaan liiketoimintaa?
Miten sosiaalisen median analytiikkaa ja aineistoja on mahdollista käyttää liiketoiminnan tukemisessa? Tutkitusti ainakin kuluttajatottumuksista voidaan tehdä päätelmiä someanalytiikan avulla, ja somesta saatu data voi heijastella yhteiskunnallista keskustelua ja kuluttajien liikkuvia intressejä.
Yksittäisten tuotteiden kohdalla voidaan osoittaa yhteyksiä. Laaksonen käyttää esimerkkinä Twitteriä, joka voi ennustaa tietyn elokuvan lipputulojen suuruutta suhteessa siitä tehtyihin mainintoihin Twitterissä. Myös tietyn brändin mainintoja voidaan hakea somesta ja tarkastella esimerkiksi sitä, ovatko tuotteet yhteydessä johonkin tiettyyn ilmiöön.
Laaksosen koordinoimassa Smarter Social Media Analytics -hankkeessa tutkittiin ruokatrendejä pidemmällä aikavälillä, sillä ruokaan liittyviä kulutustottumuksia muutetaan yleensä pikkuhiljaa. Tutkimuksessa perehdyttiin kasvimaitojen myyntiin suhteessa kasvissyönnistä ja sen lieveilmiöistä kirjoitettuihin someviesteihin eri foorumeissa vuosina 2012–2016.
Tutkimuksessa todettiin, että veganismikeskustelun nousu ja kasvimaitojen myynti olivat yhteydessä toisiinsa. Näin ollen sosiaalisen median voidaan havaita toimivan indikaattorina kuluttajien kiinnostuksen kohteista.
Tutkimus kuitenkin osoitti, että somemuuttujia paremmin kuluttajakäyttäytymistä ennustavat yhä kaupan omat myyntitilastot ja menekki, Laaksonen korostaa.
Mitä someanalytiikan hyödyntämisessä kannattaa ottaa huomioon?
Analytiikan mahdollisuudet kehittyvät ja tarjonta lisääntyy, mutta ongelmana on usein se, että yritykset eivät tiedä, mitä haluavat somedatalla tehdä ja kuinka sitä hyödynnetään organisaation prosesseissa. Analytiikan ympärillä pyörii paljon hypeä, mutta analytiikkapalveluja harkitessa pitäisi Laaksosen mukaan olla kriittisempi.
Mittaamisvimmassa on hyvä miettiä tarkemmin, mitkä ovat niitä asioita, jotka ovat omalle organisaatiolle olennaisia. Voisiko tekstilouhinnalla päästä paremmin kiinni haluttuun aiheeseen kuin esimerkiksi seuraamalla tykkäyksiä?
Yksi pohdinnan aihe on myös se, kuinka paljon dataa tarvitaan, jotta analytiikka olisi luotettavaa. Somesta saatu data ei koskaan ole edustava otos esimerkiksi koko Suomen kansasta, vaan se kertoo vain tietyn sosiaalisen median kanavan aktiivisista käyttäjistä, vaikka iso osa ihmisistä somea käyttääkin.
Lopuksi Laaksosen kolme väitettä fiksumpaan sosiaalisen median datan hyödyntämiseen:
- Fiksumpi someanalytiikka on aina ihmisen ja koneen yhteistyötä. Ihminen tarvitaan tulkitsemaan tai siivoamaan dataa sekä tekemään päätöksiä vaikkapa hakusanoista. Ihminen tekee myös päätökset organisaatiossa siitä, miten tietoa hyödynnetään.
- Analytiikka tarvitsee analysoijan ymmärrystä somen kulttuureista, ilmiöistä ja trendeistä. Koneen ymmärrys kulttuureista ja laadullisista sisällöistä on rajallinen. Esimerkiksi pelkän aihetunnisteen käyttöön ei välttämättä kannata keskittyä, koska kaikki eivät käytä niitä. Kannattaa selvittää oman toimialan kannalta oleellisimmat areenat ja käyttää aikaa keskusteluun tutustumiseen.
- Ei kannata ostaa ”mustia laatikoita”. Analytiikkamenetelmiä on lukuisia erilaisia, ja monet niistä on koulutettu hyvin rajatuilla tai vinoutuneilla aineistoilla. On siis syytä kysyä analytiikkapalvelun tarjoajalta, mitä heidän käyttämänsä menetelmät tekevät, ja kannattaa kysyä niin monta kertaa, että varmasti ymmärtää.
Kirjoittaja: Saara Kankainen
Voit ladata ja katsoa HY+digiaamun tallenteen tämän linkin kautta.
Salla-Maaria Laaksonen kouluttaa HY+:n uudessa DigiViestijä – digitaalisen viestinnän koulutusohjelmassa. Tule mukaan kehittämään omaa digiosaamistasi!