”Laskennallinen tutkimus perustuu isolta osin simulointiin, ja simulaattorien parametrien sovittaminen dataan on keskeisen tärkeää, jotta simulaattori saadaan kuvaamaan todellisuutta mahdollisimman hyvin", kuvailee Aalto-yliopiston tietotekniikan laitoksen professori, COIN-huippuyksikön johtaja Samuel Kaski.
"Kehittämämme ELFI-päättelyohjelmisto tekee tämän aiemmin erittäin vaikean tehtävän mahdollisimman helpoksi: menetelmänkehittäjät saavat pienellä vaivalla uudet päättelymenetelmänsä laajaan käyttöön, ja muiden alojen tutkijat pääsevät hyödyntämään uusimpia ja tehokkaimpia menetelmiä. Avoimet ohjelmistot edistävät toistettavuutta ja avointa tiedettä.”
Avoimesti kaikkien saatavilla olevan ohjelmiston taustalla on bayesilainen päättely ilman uskottavuusfunktiota, jota pidetään yhtenä tilastotieteen tärkeimmistä innovaatioista viime vuosikymmenten aikana. Siinä simulaattorin ulostuloja verrataan todellisiin havaintoihin, ja satunnaisuuden vuoksi simulaatioajot joudutaan tekemään useampaan kertaan. Päättelyohjelmisto tehostaa tuntemattomien parametrien estimointia muun muassa bayesilaisella optimoinnilla, joka vähentää tarvittavien simulaatioajojen määrää useilla kertaluokilla.
Sovelluksia lääketieteessä ja ympäristötieteissä
Päättelykoneen käyttäjiksi kaavaillaan sellaisen alojen tutkijoita, joille perinteisesti käytetyt tilastolliset menetelmät eivät sovellu.
”Simulaattoreita voidaan soveltaa monella alalla. Esimerkiksi taudin simuloimisessa voidaan huomioida, miten tauti tarttuu ihmisestä toiseen, missä ajassa ihminen paranee tai ei parane, miten virus voi mutatoitua tai montako erilaista uniikkia virusmutaatiota on olemassa. Joukko simulaattoriajoja tuottaa siten todellista tilannetta kuvaavan jakauman”, kertoo professori Aki Vehtari.
ELFI-päättelykone on helppokäyttöinen ja skaalautuva, ja itse päättelyongelma voidaan määritellä helposti graafisen mallin avulla.
"Ympäristötieteissä ja sovelletussa ekologiassa käytetään simulaattoreita, tutkimaan ihmistoiminnan vaikutuksia ympäristöön. Esimerkiksi Suomen ympäristökeskuksessa (SYKE) on kehitteillä ekosysteemimalli, jolla tutkitaan ravinteiden kiertoa Saaristomerellä ja esimerkiksi maatalouden tai kalankasvatuksen kuormitusten vaikutusta leväkukintoihin. Näiden mallien parametrisointi ja niiden ennusteisiin liittyvä epävarmuuden arviointi on laskennallisesti haastavaa. Tulemme testaamaan ELFI-päättelykonetta näissä analyyseissa. Toivomme, että mallien parametrisointia pystytään päättelykoneen avulla nopeuttamaan ja parantamaan, jolloin johtopäätökset ovat paremmin perusteltavissa", kertoo apulaisprofessori Jarno Vanhatalo Helsingin yliopiston ympäristötilastotieteen tutkimuksesta.
Päättelykoneen kehittivät yhteistyössä Aalto-yliopiston tutkijat Antti Kangasrääsiö, Jarno Lintusaari, Kusti Skytén, Marko Järvenpää, Henri Vuollekoski, Aki Vehtari ja Samuel Kaski, edustaen sekä Aalto-yliopiston ja Helsingin yliopiston yhteistä tietotekniikan tutkimuslaitosta (HIIT) että laskennallisen päättelyn huippuyksikköä (COIN), Michael Gutmann Edinburghin yliopistolta sekä Jukka Corander, joka edustaa sekä Helsingin yliopiston matematiikan ja tilastotieteen laitosta että Oslon yliopistoa. Suomen Akatemia rahoittaa tutkimushanketta.
Päättelykone löytyy verkosta osoitteesta http://elfi.readthedocs.io.