keskiviikkona 11. huhtikuuta 2018

Työdatan hiljaiset signaalit: Mahdollisuuksien meri

Tämä kirjoitus aloittaa blogien sarjan, jossa pohdimme, miten hyödynnämme työdataa työolojen kehittämisessä. Työdatalla tarkoitamme tapahtumatietoja, joita jatkuvasti ja tulevaisuudessa enenevässä määrin kertyy käyttämiimme digitaalisiin järjestelmiin.

Yksi tunnetuimmista malleista työolojen ja hyvinvoinnin tutkimisessa ja kehittämisessä on ollut Työn vaatimukset – työn hallinta -malli (Karasek 1979). Karasek tuskin osasi aikanaan kuvitella nykyaikaa, jolloin työdataa on saatavilla erilaisista tietolähteistä käsittämättömät määrät. Vuosikymmeniä on kerätty tietoa erilaisilla kyselylomakkeilla ja niiden tulosten perusteella sekä työoloja että työtä on kehitetty. Kyselymenetelmien käyttö on tarkoittanut kymmeniä, ellei satoja uusia ja modifioituja kyselyasteikkoja ja niiden ympärille kehittynyttä tiedon muodostamisen ja tulkinnan perinnettä.

Työdata kerääntyy järjestelmiin ilman meidän tutkijoiden ohjausta ja malleja. Millaista tuo tieto sitten on ja miten se eroaa kyselytiedosta? Voidaanko tutkimuksessa soveltaa vanhoja työolojen tutkimusmalleja, miten työdataa analysoidaan ja millaista hyötyä siitä saadaan? Maailmalla tutkijat pohtivat vastauksia mainittuihin kysymyksiin.

Työelämä on muutoksessa, eikä dynaamisesta ilmiöstä voi saada luotettavaa tietoa staattisin esim. kerran vuodessa tehtävin kyselyin, joissa tieto rakentuu koettuun itsearviointiin työstä. Tietoa tulisi saada riittävän tiheästi ja riittävän pitkään. Kun työn tekemisestä jää digitaalisia jälkiä moniin järjestelmiin, tieto on tapahtumatietoa eli tapahtumalla on aika, paikka, tekijä, välineet, tapahtumien verkosto, johon se liittyy ja muita tapahtumaan vaikuttavia seikkoja. Saatu tapahtumatieto, työdata, työstä on laadullista, tilannekohtaista ja prosessimaista eikä niinkään määrällistä tietoa. Työdatan analysointi tarvitsee uusia keinoja, joita datatieteilijät ovat kehittäneet.

Mutta palataan vielä Karasekin Työn vaatimukset – työn hallinta -malliin. Jos Karasek seuraisi työdatan tapahtumia, hän havaitsisi organisaation sykkeen: Työ ei etene samanlaisena tilanteesta toiseen. Välillä lyhyessä ajassa tapahtuu paljon ja toisinaan on hiljaisempia jaksoja. Työdatasta voidaan tunnistaa työntekijäryhmiä, joilla on kuormitushuippuja toisensa perään ja toisia ryhmiä, joilla puolestaan on jatkuvasti muuttuvia tilanteita.

Suuri työn määrä ja aikapaine olivat jo 1970-luvulla keskeinen työhyvinvointiin vaikuttava työn vaatimus, jota säädeltiin työn hallinnan avulla – ja hallintaa kehitettiin. Ehditäänkö nykyisessä muutoksessa saada aikaiseksi hallinnan elementtejä? Toisaalta työntekijä voi jäädä yksin hallinnan kanssa, kun työssä on sidokset muihin toimijoihin ja heidän aikatauluihinsa. Tulisiko huomio kohdistaa suoraan vaatimuksiin? Työn intensiteettiä on ehdotettu uudeksi käsitteeksi kuvaamaan työn vaatimusta. Intensiteetin voisikin tunnistaa tapahtumien ketjussa työdatassa: Työdatassa on paljon tai erilaisia ja vaihtuvia tapahtumia jossain aikaikkunassa. On mm. toistuvia jaksoja ja poikkeamia.

Toisaalta ilman tutkijan tiedonhankintamenetelmää kertyvä työdata tarjoaa huikean mahdollisuuden tehdä aineistolähtöistä analyysiä eli analyysiä ilman tarkkoja ennakko-oletuksia. Monipuoliseen dataan tarvitaan käsitteitä datan hallintaa varten kuten piirteiden valinta (feature selection) ja hahmontunnistus (pattern recognition). Ensiksi mainittu tarkoittaa raakadatan esikäsittelyä siten, että tuloksena on tutkittavaa aihetta hyvin kuvaava joukko piirteitä, eräänlaisia mittareita. Piirteiden pohjalta tunnistetaan hahmoja (pattern) erilaisin koneoppimisen ja tekoälyn keinoin. Hahmot voivat esimerkiksi olla erilaisia työkäytäntöprofiileja, joista osa voi yhdistyä vaikkapa poissaoloihin.

Mistä on kyse?

Olemme aloittaneet Työsuojelurahaston tuella hankkeen ”Työdatan hiljaiset signaalit: Menetelmä työkäytäntö- ja poissaoloprofiilien tunnistamiseen ja näiden yhteyksien tutkimiseen” (2018–2019). Hankkeen suunnitteluun ovat osallistuneet datatieteilijät Andreas Henelius (Aalto yliopisto) ja Antti Ukkonen (Helsingin yliopisto). Toteuttajina Työterveyslaitoksella ovat hankkeen vastuullinen johtaja, työ- ja organisaatiopsykologi, Tiina Kalliomäki-Levanto ja datatieteilijä Jussi Korpela. Osallistuva organisaatio on ammattikorkeakoulu, joka on vuosia kehittänyt tietovarantoaan HR:n ja ICTasiantuntijoiden yhteistyönä.

Tulevissa tämän sarjan blogikirjoituksissa käsittelemme mm. tutkimustietovarantoa; tieto kertoo työpaikan yhteisestä toiminnasta eikä yksilöstä; mitä tarkoittaa, kun aika (minuutti, tunti, päivä, viikko) tulee mukaan työstä kertovaan aineistoon; esimerkkejä piirteiden valinnasta ja hahmon tunnistuksesta; miten data-driven työskentely eroaa malli-vetoisesta; työprofiilien hyödyllisyyttä toiminnan kehittämisessä ja tutkimuksen virhelähteitä.

11.4.2018