maanantaina 26. marraskuuta 2018

Mitä on datalähtöinen työn ja käytäntöjen tutkimus?

Työelämätutkimuksessa saadaan yhä enemmän rikasta dataa, jota kertyy järjestelmiin ilman erillistä tietojen keräystyötä. Tässä TYHIS-blogisarjan osassa kuvataan, miten dataa lähetytään tutkimuksessa. Miten siitä saadaan digitaalisia jalanjälkiä sekä massadataa?

Mitä enemmän työtä tehdään järjestelmien ja alustojen avulla, sitä enemmän työstä ja sen hyvinvointivaikutuksista on saatavissa tietoa järjestelmiin jäävän digitaalisen jalanjäljen avulla.

Tekoälyn, kuten koneoppimisen, menetelmät tarvitsevat paljon rikasta dataa, jota nyt on mahdollisuus saada myös työelämätutkimuksen saralla. Taustalla on olettamus, että työn tekeminen ei ole satunnaista jolloin työelämätiedon löytyminen digitaalisesta jalanjäljestä erilaisin tekoälyn keinoin on mahdollista.

Aineisto kertyy automaattisesti järjestelmiin ilman erillistä tietojen keruuta. Jalanjäljellä on aikaleima, ja jalanjälkeen taltioituu kompleksisuuden ja jatkuvan muutoksen ilmiöitä työstä. Uusista aineistolähteistä voidaan tunnistaa työn dynaamisuutta, jotta ei ole aiemmin tutkittu ja jota on nyt mahdollisuus mallintaa tekoälyn avulla datalähtöisesti.

Olen vastuullisena tutkijana TYHIS – Työdatan hiljaiset signaalit -hankkeessa. Hankkeen aineistolähteenä on yhden ammattikorkeakoulun Moodle oppimisalustalta sekä suunnittelu- ja hr-järjestelmistä saatu digitaalinen jalanjälkiaineisto.

400 opettajan dataa 63 viikolta

Saamamme ammattikorkeakoulu-aineisto sisältää 400 opettajan dataa 63 viikolta (2017-2018). Aineisto on luovutettu meille anonymisoituna, ja henkilö on aineistossa koodina. Koodin avulla yhdistetään tietoa eri aineiston osista. Tutkimusaineistossa ei siis ole henkilötunnisteisia tietoja.

Aluksi lähestymme aineistoa työn tekemisen tasolla. Eli hahmotellaan, millainen on opettajan näkökulma:

Viikolla 41 on paljon opiskelijoille pidettäviä opetustapahtumia, joita suunnitellaan ja toteutetaan yhteistyössä toisen open kanssa. Itse asiassa opetustunteja on yhteensä 35. Tämä viikko 41 on erilainen kuin edellinen, jolloin oli myös muuta opetukseen liittyvää kuin kontaktiopetusta. Seuraavalla viikolla on vähemmän opetusta mutta enemmän aikaa tulee varata tehtävien arviointiin ja opiskelijoiden kanssa kommunikointiin. Kurssien päivitystäkin on mahdollisesti tulossa. Lisäksi joitain epäselviä tilanteita on ilmaantunut, joihin tulisi nopeasti tarttua. Muilla opettajilla on vastaavia vaihtelevia tilanteita ja samakin viikko voi eri opettajilla olla erilainen.”

Jos haastattelisin opettajia heidän muuttuvasta työstään, voisin saada tällaista työn tekemisen tietoa. Tutkimushankkeessa pystyisin kuitenkin haastattelemaan vain osaa henkilöstöstä, esimerkiksi 30 opettajaa.

Digitaalisen jalanjäljen avulla minulle välittyy tietoa kaikista toimijoista.

Digitaalisen jalanjäljen taso

Mitä sitten tapahtuu digitaalisen jalanjälkidatan tasolla? Ensimmäinen tehtävä on tunnistaa ja määritellä datasta opetustyön elementtejä kuten opetustapahtumia, yhteistyötä, arviointia, kurssisuunnittelua ja kommunikointia kuvaavia piirteitä (features).

Arkisessa työssä kaikki työn tekemisen elementit ja niistä kertovat työn piirteet ovat läsnä erilaisina määrinä eri viikkoina eri työntekijöillä.

Huomioita piirteistä:

  • Piirteet ovat riippuvaisia toisistaan ja muodostavat piirreyhdistelmiä.
  • Piirreyhdistelmät heijastavat käytäntöjä, joilla työn tavoitteita saavutetaan ja työhyvinvointi kehittyy.
  • Yksittäistä piirrettä ei voi ottaa erikseen ja tutkia irrallaan muista.
  • Toisaalta yksi piirre voi dominoida käytäntöä tilannekohtaisesti (esim. jonain viikkoina arviointiin liittyvät piirteet korostuvat).

Massadata muodostuu

Seuraavaksi datasta lasketaan jokaiselle opettajalle viikoittaisia työn piirteitä, ja niitä voidaan tunnistaa ja määritellä useita. Jokaiselta viikolta ja jokaiselta opettajalta saadaan kaikille piirteille jokin arvo. Näin saadaan opetustyön viikkotasoista vaihtelua ja muutosta kuvaava aineisto ”massadata”.

Seuraavaksi TYHIS-hankkeessa analysoidaan opettajien omien uniikkien viikkopiirteiden muodostamaa ”massadataa” tavoitteena tunnistaa yleiset yhteiset viikkokäytännöt (pattern recognition).

Mallinnamme siis työtä emmekä ihmistä, ja saamme tietoa työn ja käytäntöjen kehittämistä varten, vaikka emme tiedä työntekijöistä henkilöinä mitään. Tutkijana olen aiemmin tehnyt haastattelututkimuksia ja aineistölähtöistä analyysiä, nyt huomaan algoritmin huikeat edut suhteessa ihmisen tekemään analyysiin.

Algoritmi on väsymätön ja tehokas piirreyhdistelmien vertailija. Toisaalta ihmisellä on intuitio, joka voi ylittää monia toistoja ja oivaltaa yhteydet ja yhteiset yleiset käytännöt.

Kun ihminen ja tekoäly tekevät analyysiä yhdessä, saadaan säilytettyä todellisuudesta kertovan ilmiön kompleksisuus juuri sopivasti, kun tehdään ilmiöstä yleistyksiä.

TYHIS-hankkeessa yhteistyö jatkuu: olemme juuri saaneet tunnistettua Moodle-datasta 25 piirrettä, jotka edelleen voidaan ryhmitellä 12 yleisiksi yhteisiksi viikkokäytännöiksi. Nämä esittelemme seuraavassa blogissa.

Kirjoitus on osa työdata-aiheista blogisarjaa. Aiemmin ilmestyneet:

Työdatan hiljaiset signaalit: mahdollisuuksien meri

 

26.11.2018