maanantaina 05. maaliskuuta 2018

Työelämätiedon kansallinen kokonaiskuva rakentuu uusista ja vanhoista mittareista

Jos dataa kerätään vain keräämisen ilosta ja analyysissa keskitytään helppojen voittojen saamiseen, mennään metsään. Paras lopputulos saavutetaan, kun mittareiden laatu ja luotettavuus pohjautuvat läpinäkyvyyteen ja laajaan yhteistyöhön.

Yksityisten ja julkisten palveluiden siirtyminen tietoverkkoon on lisännyt aineistojen määrää ja kokoa. Palveluiden käyttämisestä kertyy merkittäviä suuraineistoja elämän eri osa-alueilta: ostokäyttäytymisestä, liikkumisesta, lääketieteellisestä hoidosta, sosiaalisista suhteista ja kommunikaatioverkostoista.

Muutos on kattava ja vaikuttaa työterveyteen ja työhyvinvointiin ja sen tutkimiseen merkittävästi. Suuraineistot mahdollistavat uudenlaiset tutkimusavaukset ja täydentävät vakiintuneita ja koeteltuja tilastollisia aineistoja.

Kuten kaikilla uusilla ja innostavilla teknologisilla muutoksilla, myös siirtyminen suuraineistoihin aiheuttaa vauhtisokeutta. Suuraineistojen tapauksessa analytiikka tarvitsee tuekseen hyvää tilastollista ymmärrystä. Lisäksi suuraineistojen mielekäs analysointi ja sen tärkein osa, tulosten tulkinta, perustuu vahvaan sisällön osaamiseen.

Pahiten mennään metsään silloin, kun dataa kerätään vain keräämisen ilosta ja analyysissa keskitytään helppojen voittojen saamiseen. Paras lopputulos saavutetaan, kun datahallinnan, tilastollisen mallintamisen ja substanssin asiantuntijat toimivat samoissa tiimeissä.

Käytetäänhän tietojani oikein?

Suuraineistojen analysointi pakottaa tiimit tehostamaan sekä tiedon että datan sisäistä jakamista. Tällöin myös tietoturva ja tietosuoja korostuvat. Työelämän suuraineistot sisältävät usein dataa työntekijöistä eli luonnollisista henkilöistä.

Suomalaisten luottamus tieteeseen ja tutkimukseen on maailmanlaajuisesti huippuluokkaa, ja tutkimuksiin osallistutaan innokkaasti. Luottamus rakentuu kahdesta tekijästä: teknisestä tietoturvasta ja oikeudenmukaisuuden tunteesta.

Painopiste keskusteluissa on edelleen teknisessä tietoturvassa: ovathan tietoni turvassa? Suuraineistojen käyttäminen palvelutuotannossa ja tutkimuksessa – erityisesti työn kaltaisella läpileikkaavalla aihepiirillä – tulee siirtämään luottamuksen rakentamisen painopistettä kohti oikeudenmukaisuutta: käytetäänhän tietojani oikein?

Tiimin monitieteisyys parantaa laatua

Soveltavassa tutkimuksessa tehdyt havainnot ja menetelmät otetaan käyttöön palvelutuotannossa ja siirron tahtia halutaan nopeuttaa kansallisesti. Algoritmit ja koneoppimisen järjestelmät mahdollistavat henkilöiden luokittelun näennäisen objektiivisesti datan perusteella. Läpinäkyvyys algoritmien rakentamisessa ja käytössä mahdollistaa virheiden varhaisen tunnistamisen ja kasvattaa luottamusta. Monitieteiset asiantuntijaryhmät lisäävät ratkaisujen laatua.

Yksi kuuluisimmista big datalla tehdyistä ennustemalleista on Googlen yritys ennustaa kausi-influenssan ilmenevyyttä Google-hakujen perusteella. Suomessa ETLA käytti Google-hakuja parantamaan asuntojen hintakehitysten ennustemalliaan, joka sisältää muita, vakaampia muuttujia hakujen lisäksi.

Me Työterveyslaitoksella vertasimme Google-hakujen yleisyyden muutoksia SAK:n YT-neuvotteluiden avoimeen dataan. Havaitsimme, että hakujen rakenne muuttui ilmoitusten myötä, mutta hakutrendeillä ei pystynyt ennustamaan ilmoitusten ajankohtaa.

Nämä kolme esimerkkiä vihjaavat, että uusilla aineistolähteillä on mahdollista täydentää perinteisiä aineistoja. Uusien aineistolähteiden käyttöönotto vaatii monitieteisiä panostuksia, jotta ratkaisuista tulee kypsiä laajaan käyttöön.

Työelämätietoa luotettavasti ja kattavasti

Parhaimmillaan tällaiset uudet datalähteet parantavat ja monipuolistavat kuvaa tarkasteltavasta ilmiöstä. Työterveyslaitos valmistelee uutta kansallista palvelua, työelämätiedon koontipalvelua. Palvelu koostaa nykyisin hajanaista työelämätietoa yhteen paikkaan.

Palvelun yksi päämääristä on tarjota työelämän asiantuntijoille ajantasaisia mittareita työelämän tilanteen seurantaan. Suunnittelemme ja valikoimme mittareita palveluun yhdessä sidosryhmien kanssa. Rakennamme mittaristoa vaiheittain ja sisällytämme siihen myös aidosti uudenlaisia, suuraineistoista kumpuavia mittareita.

Luotettavuus on yksi keskeisiä lupauksia koontipalvelussa. Tämän takia läpinäkyvyys mittareiden valinnassa on tärkeää. Uuden mittarin tasapainoisuus, luotettavuus ja kansallinen merkittävyys vaikuttavat sen mahdollisuuksiin päästä osaksi työelämätiedon alustaa.

Olemme rakentamisen alkuvaiheessa, eikä ensimmäisiä mittareita ole vielä valittu. Palvelun avauduttua siirrymme jatkuvan kehityksen sykliin, jossa uusia ja palvelussa jo olevia mittareita arvioidaan, parannetaan ja päivitetään jatkuvasti. Tavoitteena on rakentaa palvelu, joka kattavasti kuvailee Suomen työterveyden ja työhyvinvoinnin tilaa pohjautuen sekä perinteisiin että täysin uusiin tietolähteisiin.

5.3.2018