Astun ulos hissistä Tampereen teknillisessä yliopistossa ja edessäni on tyypillinen tutkimuslaitoksen käytävä: se on pitkä ja sen kummallakin puolella on ovia, joiden vieressä on nimikylttejä sekä erilaisia papereita seinälle kiinnitettyinä. On ilmoitustaulu, ikkuna käytävän päässä, porraskuilu vieressä sekä muutamia ihmisiä.
Pystyn hahmottamaan nopeasti ympärilläni olevat kohteet ja erottamaan niistä aiemmin näkemäni kuvan perusteella akatemiaprofessori Moncef Gabbouj’n, mutta kameran kautta maailmaa kuvaava tietokone olisi hyvin hämillään. Konenäöllä olisi vaikeuksia erottaa toimistojen ovia muista neliskanttisista kohteista ja ihmisiä toisistaan – saati yhdistää näkemänsä kuva muistissaan olevaan kuvaan tietystä henkilöstä.
Tämän vuoden lopussa akatemiaprofessorikautensa päättävä Gabbouj on erikoistunut epälineaarisiin digitaalisiin suotimiin, erityisesti haluttujen kohteiden löytämiseen videokuvasta sekä älykkäisiin hakupalveluihin.
Jo nyt kameroissa käytetään kasvontunnistusta ja hakukoneet voivat etsiä tietynlaisia kuvia, mutta Gabbouj haluaa tehdä tästä tarkempaa, nopeampaa ja arkisempaa, minkä lisäksi hän laajentaa hahmontunnistusta kaikkialle tiedonlouhintaan. Siihen tarvitaan matematiikkaa, joka yleistäen on sitä monimutkaisempaa, mitä helpommalta työn halutaan vaikuttavan.
Parvella tiedon kimppuun
“Kyse on yksinkertaisesti signaalinkäsittelystä ja algoritmeista, joilla tätä käsittelyä tehdään”, aloittaa Gabbouj työnsä selittämisen.
“Kehitimme aluksi tällä alalla erilaisia tekniikoita hahmontunnistukseen ja koneoppimiseen, joita olemme soveltaneet nyttemmin laajoihin tietomääriin ja niin sanottuun big dataan.”
Tällaisia tietokantoja ovat yhtäältä esimerkiksi kuva-arkistot kuten netissä olevat kuvat, toisaalta vaikkapa lääketieteelliset kuvat tai tutkahavainnot. Usein näissä on yksittäisiä tietoja, kuvia ja havaintoja niin paljon, että niiden valikoiminen yksittäin tietyn hakukriteerin mukaan ei ole käytännössä mahdollista. Äreimmätkään tietokoneet eivät onnistu siinä.
Siksi tietojen hakua voi auttaa älykkäillä algoritmeilla, jotka seulovat tietoja ja muodostavat löytämistään tiedoista kolmiulotteisen mallin, mistä matemaattisesti voidaan löytää kaikkein osuvimmat vaihtoehdot.
Siinä missä aiemmin hakua tehtiin avainsanojen avulla, pystyy tamperelaisten niin sanottu parvioptimointialgoritmi hahmottamaan tietoa ja löytämään siitä erilaisia määreitä. Näin esimerkiksi kuvahakua Pisan kaltevasta tornista tehtäessä tuloksena ei ole kaikenlaista kaltevaa, vaan vaikuttava määrä erilaisia kuvia juuri Pisan tornista.
Samaa menetelmää voi käyttää esimerkiksi syöpäkasvaimien tai pinnanmuotojen tunnistamiseen. Tuoreimmassa tutkimusohjelmassa menetelmää käytetään taloustietojen tunnistamiseen ja louhimiseen.