Mitä kuvassa näkyy? Matematiikka kertoo ja sinä nautit tuloksista.

Pe, 12/11/2015 - 11:25 By Jari Mäkinen

Astun ulos hissistä Tampereen teknillisessä yliopistossa ja edessäni on tyypillinen tutkimuslaitoksen käytävä: se on pitkä ja sen kummallakin puolella on ovia, joiden vieressä on nimikylttejä sekä erilaisia papereita seinälle kiinnitettyinä. On ilmoitustaulu, ikkuna käytävän päässä, porraskuilu vieressä sekä muutamia ihmisiä.

Pystyn hahmottamaan nopeasti ympärilläni olevat kohteet ja erottamaan niistä aiemmin näkemäni kuvan perusteella akatemiaprofessori Moncef Gabbouj’n, mutta kameran kautta maailmaa kuvaava tietokone olisi hyvin hämillään. Konenäöllä olisi vaikeuksia erottaa toimistojen ovia muista neliskanttisista kohteista ja ihmisiä toisistaan – saati  yhdistää näkemänsä kuva muistissaan olevaan kuvaan tietystä henkilöstä.

Tämän vuoden lopussa akatemiaprofessorikautensa päättävä Gabbouj on erikoistunut epälineaarisiin digitaalisiin suotimiin, erityisesti haluttujen kohteiden löytämiseen videokuvasta sekä älykkäisiin hakupalveluihin.

Jo nyt kameroissa käytetään kasvontunnistusta ja hakukoneet voivat etsiä tietynlaisia kuvia, mutta Gabbouj haluaa tehdä tästä tarkempaa, nopeampaa ja arkisempaa, minkä lisäksi hän laajentaa hahmontunnistusta kaikkialle tiedonlouhintaan. Siihen tarvitaan matematiikkaa, joka yleistäen on sitä monimutkaisempaa, mitä helpommalta työn halutaan vaikuttavan.

Parvella tiedon kimppuun

“Kyse on yksinkertaisesti signaalinkäsittelystä ja algoritmeista, joilla tätä käsittelyä tehdään”, aloittaa Gabbouj työnsä selittämisen.

“Kehitimme aluksi tällä alalla erilaisia tekniikoita hahmontunnistukseen ja koneoppimiseen, joita olemme soveltaneet nyttemmin laajoihin tietomääriin ja niin sanottuun big dataan.”

Tällaisia tietokantoja ovat yhtäältä esimerkiksi kuva-arkistot kuten netissä olevat kuvat, toisaalta vaikkapa lääketieteelliset kuvat tai tutkahavainnot. Usein näissä on yksittäisiä tietoja, kuvia ja havaintoja niin paljon, että niiden valikoiminen yksittäin tietyn hakukriteerin mukaan ei ole käytännössä mahdollista. Äreimmätkään tietokoneet eivät onnistu siinä.

Siksi tietojen hakua voi auttaa älykkäillä algoritmeilla, jotka seulovat tietoja ja muodostavat löytämistään tiedoista kolmiulotteisen mallin, mistä matemaattisesti voidaan löytää kaikkein osuvimmat vaihtoehdot.

Siinä missä aiemmin hakua tehtiin avainsanojen avulla, pystyy tamperelaisten niin sanottu parvioptimointialgoritmi hahmottamaan tietoa ja löytämään siitä erilaisia määreitä. Näin esimerkiksi kuvahakua Pisan kaltevasta tornista tehtäessä tuloksena ei ole kaikenlaista kaltevaa, vaan vaikuttava määrä erilaisia kuvia juuri Pisan tornista.

Samaa menetelmää voi käyttää esimerkiksi syöpäkasvaimien tai pinnanmuotojen tunnistamiseen. Tuoreimmassa tutkimusohjelmassa menetelmää käytetään taloustietojen tunnistamiseen ja louhimiseen.

“Siinä missä aiemmin puhuimme vain kuvista, on nyt kaikki tieto kiinnostavaa. Pystymme käsittelemään raakadataa, kuvia, videota ja ääntä, joista oppiva algoritmimme pystyy etsimään haluttuja asioita. Lopulta voimme jopa ennustaa tietojen perusteella tulevaisuuteen.”

Tällainen ennustava systeemi on esimerkiksi sydänkäyrää tutkiva algoritmi, joka kykenee havaitsemaan sydänkohtauksesta varoittavat merkit jo ennalta, jolloin esimerkiksi älykelloon asennettuna se voi antaa hälytyksen ja pyytää kantajaansa lepäämään. Näin kohtaus ei tulekaan tai apu voi olla matkalla jo itse kohtauksen alkaessa.

Gabbouj’n tutkimusryhmä on kehittänyt myös oppivia algoritmeja, jotka esimerkiksi sydänkäyrän tapauksessa pystyvät sopeutumaan käyttäjän omaan sydämen lyöntityyliin – jokaisella se on omanlaisensa.

Lisää sovelluksia tällaisilla älykkäillä signaalikäsittelyä, hahmontunnistusta ja koneoppimista käyttävillä systeemeillä on vaikka kuinka:  autonomisesti liikkuvien autojen ohjauslaitteiden kameroiden reaaliajassa ottamista kuvista pitää löytää nopeasti ja luotettavasti näkökentässä olevat kohteet ja valokuvia nettiin lataavia auttaisi huomattavasti älykäs ohjelmisto, joka löytäisi automaattisesti kuvassa olevat avainsanat.

Puolustus- ja turvallisuusviranomaiset ovat luonnollisesti myös hyvin kiinnostuneita järjestelmistä, jotka pystyvät seulomaan tehokkaasti suuria tietomääriä ja löytämään niistä haluttuja asioita.

Ei ihme, että tutkimusta tällä alalla tehdään nykyisin muuallakin kuin vain Tampereella.

Apua hiukkasfysiikasta

Gabbouj kertoo, että aluksi hänen ryhmänsä lähinnä sovelsi muiden tekemiä algoritmeja ja kehitti niitä eteenpäin, kunnes ryhmä halusi ottaa hyppäyksen eteenpäin ja tehdä jotain aivan uutta.

Niinpä ryhmäläiset alkoivat katsoa rohkeasti muilla aloilla olevia matemaattisia sovelluksia. Erityisen kiinnostavaksi paljastui hiukkasfysiikka, ja etenkin Schrödingerin yhtälö. Se on kvanttimekaniikassa käytetty aaltoyhtälö, joka kuvaa hiukkasta ja sen olotilaa niin sanotun aaltofunktion avulla. Samaa menetelmää voi käyttää yksittäisten tietojen ja sen ominaisuuksien kuvaamiseen. Myös silloin, kun ei tiedetä ihan täsmälleen mitä ollaan etsimässä.

Myös fysiikassa käytetty menetelmä ison ongelman ratkaisemisesta osissa oli toimiva: tuloksena oli skaalattava algoritmi, joka luokittelee tietoa semanttisiin luokkiin.

Tamperelaisten keinoin onnistuttiin ratkaisemaan myös eräs neuroverkkojen – hermosolujen toimintatapaan perustuvien keinoälysysteemien – kompastuskivi: kahden spiraalin ongelma. Siinä on sisäkkäin kaksi pisteinä piirrettyä spiraalia, ja hahmontunnistuksen pitäisi erottaa ne toisistaan. Tehtävä ei ole helppo.

Sisäkkäisten spiraalien kanssa painiminen on tyypillinen tapaus ongelmasta, joka äkkiseltään kuulostaa kaiken maailman dosenttien harrastamalta teoreettiselta pohdiskelulta, mutta jolla onkin hyvin konkreettisia ja merkittäviä sovelluksia.

“Sovelluksia ei ole ilman perustutkimusta”, toteaakin Gabbouj ja jatkaa: “Perustutkimus on kuin uutta verta, mitä ilman emme voi tulla toimeen. Voimme kehittää sovelluksia ja parantaa menetelmiämme jonkin aikaa aiemman tiedon perusteella, mutta todella uusien asioiden löytäminen ja harppausten ottaminen eteenpäin tarvitsevat perustutkimusta. Sen merkitystä ei voi aliarvioida.”

Moncef Gabbouj (keskellä) perjantai-iltana paikalla olleita tutkimusryhmän jäseniä.

Kuva: Moncef Gabbouj (keskellä) perjantai-iltana paikalla olleita tutkimusryhmän jäseniä.

 

Haasteita pitää olla!

Kun juttelemme Gabbouj’n kanssa, paiskoo ikkunan takana räntää marraskuiselta taivaalta. On jo pimennyt perjantaisen iltapäivän loppu.

Siitä huolimatta Signaalinkäsittelyn laitoksen huoneissa on vielä väkeä. Kun muualta tutkijat ja opiskelijat vetäytyvät viikonlopun viettoon, on Gabbouj’n ryhmästä vielä moni paikalla. Syynä ei ole suinkaan se, että professori olisi orjapiiskuri, vaan se, että ratkottavana on niin kiinnostavia ongelmia.

“Tämä ryhmä on eräs yliopiston kansainvälisimmistä, sillä meillä on 14:stä eri kansallisuudesta”, selittää itse Yhdysvalloista Tampereelle jo 25 vuotta sitten tullut Gabbouj.

“Professorina tuolloin ollut Yrjö Neuvo halusi kansainvälistää yliopistoa, ja palkkasi minut tänne perustamaan ohjelmaa ulkomaisia opiskelijoita varten. Sen jälkeen aloitimme koulutuksen englanniksi ensin peruskursseilla ja nykyisin kaikki opinnot voi suorittaa englanniksi.”

Nyt ryhmässä olevat eivät kuitenkaan ole tulleet Hervantaan vain englanninkielisen opetuksen vuoksi, vaan siksi, että signaalinkäsittelyssä se on eräs huipuista maailmassa.

“Tutkijat tulevat tänne etsimään haasteita ja tekemään tiedettä, ja annammekin heille mahdollisuuden rakentaa aivan uudenlaista tekniikkaa. He ovat motivoituneita ja tekevät kaikki työtä yhdessä erilaisista taustoista ja kulttuureista huolimatta.”

“Mutta aina välillä kyllä täytyy mennä ulos”, toteaa akatemiaprofessori ja katsoo kohti ikkunaa ja tämän talvikauden ensimmäistä räntää.

Kenties yksi syy työintoon on myös se, että sisällä labrassa on mukavaa, valoisaa ja lämmintä.

Juttu on julkaistu myös Suomen akatemian nettisivuilla.