Samuel Kaski opettaa koneita oppimaan (video)

Otaniemessä, Aalto-yliopiston Tietotekniikan laitoksen ala-aulassa on akateemikko Teuvo Kohosen muotokuva. Eikä syyttä: hän on kouluttanut useammankin sukupolven tekoälytutkijoita aikana, jolloin Suomessa ei vielä paljoa puhuttu tekoälystä tai koneoppimisesta. Hän oli edellä aikaansa itseorganisoituvine karttoineen.

 

30.10.2018

Eräs Kohosen oppilaista on akatemiaprofessori Samuel Kaski, joka vetää Suomen tekoälykeskus -nimistä aloitetta.

"Olin opiskellut tietotekniikkaa pari vuotta ja lukenut myös neurotieteitä, kun pääsin kesätyöhön Teuvo Kohosen tutkimusryhmään", selittää Kaski.

"En ollut tiennyt, että Suomessa oli mitään niin kiinnostavaa asiaa. Vaikka opinnoissa olin pärjännyt erittäin hyvin, olin hämmästynyt, että pääsin mukaan. Näin jälkikäteen katsottuna oli todella tärkeää päästä mukaan korkeatasoiseen tutkimukseen noin aikaisin. Moni asia kiinnosti, mutta kun ymmärsin, että tällaista voi tehdä tosissaan ja se voi olla oikeasti työ, niin tutkimus vei minut mukanaan.”

Kaski toteaa, että hänkin ottaa lupaavimpia opiskelijoita projekteihinsa mahdollisimman varhain. "Se on huippututkimuksen erittäin hyvä kansainvälinen käytäntö. Vaikka pian väittelyn jälkeen suuntauduin ihan toisiin asioihin, kerron tätä tarinaa silloin tällöin siltä varalta, että nuoria fiksuja opiskelijoita olisi kuuntelemassa. Ehkä joku heistä tulee ajatelleeksi, että tutkimusta voisi kokeilla.”

Tekoälyllä syövän kimppuun

Kaski on kiinnostunut siitä, miten malleja maailmasta voi oppia automaattisesti ja miten näin voidaan ymmärtää tapahtumia sekä soveltaa malleja teknisesti muihin tarkoituksiin."Malli voi olla hyvin datalähtöinen tai sellainen, missä on jo tietoa siitä, miten asiat toimivat. Yleensä se on joku yhdistelmä näistä. Ja sitten tarvitaan aineistoa, joista voidaan oppia ne asiat, joita ei tiedetä valmiiksi. Sitten tarvitaan algoritmi, joka pystyy sovittamaan mallin saatavilla olevaan dataan."

Konkretiaa tälle saadaan esimerkiksi siitä, mitä Kaski on tehnyt viime aikoina: hän on käyttänyt koneoppimista lääketieteellisiin sovelluksiin.

"Genomiikassa iso kysymys on se, miten löydetään geenidatasta ne tärkeät tiedot, jotka voisivat auttaa sairauksien mallinnuksessa ja ennustamaan nykyistä paremmin, mikä hoito tehoaa. Aineistossa on tietoja geenien toiminnoista, metaboliikasta ja muita mittauksia soluista. Esimerkiksi syöpänäytteiden tapauksessa pystyimme määrittelemään, mikä aineistossa on relevanttia ja millaisia ovat riippuvuudet eri tietojen välillä. Tämä on auttanut parantamaan ennusteita siitä, millainen hoito tehoaa tietynlaisen kudosnäytteen perusteella kullekin potilaalle."

Vaikeaa on erityisesti harvinaisten tautien tutkimus. Kun uudesta potilaasta ei ole tarpeeksi tietoja eikä muistakaan potilaista, joilla on sama sairaus, ole paljoa tietoja, on Kasken kehittämin menetelmin saatu ongittua esiin olennaisia kohtia.

"Vaikein ongelma tässä on se, että vaikka olennaisia tietoja on vähän, niin mittaustietoja on aivan tolkuton määrä. Kun puhutaan genomiikasta, niin potentiaalisesti hyödyllisiä muuttujia on miljoonittain. Niistä pitää pystyä valitsemaan aineiston perusteella ne, jotka tulisi ottaa huomioon. Olemme siksi yhdistelleet aineistoja ja keskittyneet eri muuttujien välisiin suhteisiin yksittäisten tietojen sijaan."

Samankaltainen ongelma on lääkkeiden kehittämisessä. Lääkkeet toimivat periaatteessa siten, että niiden vaikuttavat aineet kohdistuvat tiettyihin proteiineihin soluissa. Samalla aineet vaikuttavat myös toisiin proteiineihin ja joskus niistä voi olla myös haittaa.

"Meillä on siis valtava matriisi, jossa on proteiinit vastaan lääkkeet. Tekoälyn avulla voimme ennustaa paremmin, mitä tästä matriisista puuttuu – erityisesti niistä kohdista, joista voisi olla hyötyä erityisesti silloin, kun lääkekehitystä viedään eteenpäin."

Jo nyt suuri osa lääketiedettä on muuttunut hyvin datalähtöiseksi. Kun tietoa on ja sitä voidaan saada yhä helpommin, voidaan asioita kysyä aivan uusilla tavoilla."Lääkkeiden kehittäminen perinteisillä menetelmillä on kovin kallista ja kestää kauan. Samalla esimerkiksi antibioottiresistanssi yleistyy ja monet lääkkeet menettävät tehoaan, joten uusien lääkkeiden kehittämisen pitäisi olla entistä tehokkaampaa, jotta ihminen voisi voittaa kilpajuoksun patogeenejä vastaan."

Ihminen ja kone yhdessä

Kaski painottaa usein, että koneoppiminen, tekoäly ja tekoälyn eri sovellukset ovat parhaimmillaan silloin, kun niitä käytetään ihmisen tukena. Tässäkin konkreettinen esimerkki tulee lääketieteestä: lääkärin vastaanotto.

"Kun lääkäri päättää siitä, millaisia mittauksia potilaalle tehdään, ja kun hän tekee mittausten perusteella diagnoosin ja määrää hoitoa, niin koneesta voi olla paljon apua. Lääkärillä on hyvä koulutus, mutta tekoälyn avulla voidaan saada paljon lisätietoa niistä miljoonista mittauksista, joita genomitieto tuottaa."

Näin päästään täsmälääketieteeseen. Siinä kaikkea saatavissa olevaa solutasonkin tietoa käytetään, kun tehdään kullekin potilaalle yksilöllisesti toimiva hoitosuunnitelma.

"Mutta siis edelleen tarvitaan lääkäri ja ennen kaikkea potilas itse sanomaan, mikä hoito valitaan. Kaikissa hoidoissa kun on sekä sivuvaikutuksia että hyötyjä."

Terminaattoriskenaario

Tekoäly ja sitä käyttävät sovellukset ovat työkaluja, joita voidaan käyttää niin hyvään kuin pahaankin. Kaski painottaa, että suurin riski niiden suhteen onkin sama kuin muun tekniikan kanssa, eli ihmiset käyttävät tekoälyä samalla tavalla toisiaan vastaan kuin kaikkea muutakin nykyistä tekniikkaa.

"Tekoälystä voi olla todella paljon hyötyä ja haittaa, ja siksi eettisiä kysymyksiä pitää pohtia yhdessä demokraattisen yhteiskunnan kehittymisen mukana. Pitää olla tutkijoita, jotka pohtivat kauhukuvia, jotta niiden riski saadaan minimoitua. Mutta silti mielestäni keskitymme liikaa näihin terminaattoriskenaarioihin, joissa tekoälyrobotit ottavat vallan. Se riski on periaatteessa olemassa, mutta mielestäni paljon pienempi kuin moni muu yhteiskunnallinen riski. Siksi voisimme keskustella enemmän siitä, miten tekoälyn avulla voitaisiin tehdä töitä ja ratkoa polttavia ongelmia tehokkaammin ja paremmin."

Tämä on myös yhteiskunnallinen asia, sillä edessä on joka tapauksessa suuria muutoksia, kun monet perinteiset työtehtävät eivät ole enää tarpeellisia. Kasken mukaan varsin harvat ammatit ovat vaarassa kadota kokonaan, mutta suurimmassa osassa ammateista työtehtävät muuttuvat.

"Näin on käynyt aikaisemminkin! Kun kirjoitustaito keksittiin, niin käytännössä kaikki silloiset työtehtävät joutuivat ottamaan huomioon sen, että nyt asioita voidaan kirjoittaa muistiin ja tietoja voidaan jakaa muille. Tekoälyn vaikutukset ovat vain nopeampia. Niiden myötä yhteiskunnasta voi tulla tasa-arvoisempi tai epätasa-arvoisempi. Näistä pitää sitten poliittisesti valita."

Ideoita ei saa vain suihkussa

Kaski on ollut – ja varmasti edelleenkin on – kiinnostunut monista hyvinkin eri asioista, mutta hän kehottaa kaikkia keskittymään olennaiseen.

"Minun alani on menetelmien kehitys, ja sen siunaus ja kirous on se, että hyvä menetelmä on sovellettavissa moneen eri tehtävään. Se tarkoittaa sitä, että pitää kehittää sekä teoriaa että tehdä käytännön sovelluksia, joille on tarvetta erittäin monilla aloilla."

Hän kertoo valinneensa sovellusalueita sen mukaan, missä on ollut kiinnostavia yhteistyökuvioita. Viime aikoina näitä on ollut varsin paljon lääketieteessä, missä esimerkiksi genomiikka tarjoaa nyt paljon uutta tietoa tekoälyn purtavaksi ja tuottaa uusia, jänniä sovelluksia.

"On todella tärkeää, että meillä on tiedeyhteisö, missä on mahdollista törmätä kollegoihin, joilla on ihan uudenlaisia ajatuksia, jotka ovat yhteensopivia oman tutkimuksesi kanssa. Näistä syntyvät uudet innovaatiot. Uudet ideat saattavat tulla noin vain suihkussa ollessa, mutta yleensä sitä on edeltänyt se, että on puhunut oikeista asioista sopivaan aikaan juuri sopivien ihmisten kanssa."

*

Juttu ja video on julkaistu myös Suomen akatemian sivuilla. Ne on tehnyt Tiedetuubin Jari Mäkinen.