Tietokone opetti itsensä pelaamaan huippushakkia

Mitä eroa oli Deep Blue -supertietokoneella ja Garri Kasparovilla? Noin 199 999 995 siirtoa sekunnissa.

20.03.2016

Parikymmentä vuotta sitten tietokone päihitti ensimmäistä kertaa ihmisen huipputurnauksen sääntöjen puitteissa. Silloinen hallitseva maailmanmestari Garri Kasparov joutui tunnustamaan Deep Bluen paremmaksi ruutulaudan ääressä.

Siinä missä supertietokone pystyi käymään läpi 200 miljoonaa mahdollista siirtoa sekunnissa, Kasparov kykeni korkeintaan viiteen siirtoon sekunnissa. Mutta silti ottelusarja oli varsin tiukka.  

Sen jälkeen tietokoneet ovat kehittyneet entistä nopeammiksi, mutta niiden shakkistrategia on pysynyt samana: voittoon on tähdätty raa’alla laskentavoimalla. Siksi Deep Bluen ylivoimainen kapasiteetti ei tehnyt siitä totaalisen ylivoimaista, sillä ihminen kykenee tekemään arvioita ja rajaamaan mahdollisista vaihtoehdoista järkevimmät.

Lontoon Imperial Collegen tutkija Matthew Lai on kehittänyt tekoälyn, joka pelaa shakkia samalla periaatteella. Giraffe-niminen tietokone toimii samaan tapaan kuin ihmisaivot, mikä tekee siitä täysin toisenlaisen verrattuna aikaisempiin ”shakkirobotteihin”.

Giraggen keskeinen ominaisuus on, että se opettaa itse itseään. Sen toiminta perustuu neuroverkkoon, jonka toiminta muuttuu oppimisprosessin aikana. Tällaisten verkkojen teho on kasvanut huimasti viime vuosina, sillä samalla kun tietokoneet ovat käyneet yhä nopeammiksi, käytettävissä on yhä suurempia tietokantoja, joiden avulla oppiminen tapahtuu. 

Lain kehittämä tekoäly tarkastelee shakkilaudan kulloistakin tilannetta neljällä eri tasolla kolmella eri tavalla: pelin kokonaistilannetta eli kummankin puolen pelinappuloiden määrää ja ominaisuuksia, kunkin nappulan sijaintia pelilaudalla ja kunkin nappulan mahdollisia hyökkäys- ja puolustusvaihtoehtoja.

Giraffen opettamiseen käytettiin tietoja todellisista shakkiotteluista, sillä vain reaalisista tilanteista saadaan järkevää oppimateriaalia. Muuten tietokone alkaa jauhaa vaihtoehtoja, joita ei käytännössä koskaan tule vastaan. 

Lai kokosi tietokannan, jossa on viisi miljoonaa satunnaista pelitilannetta. Sitten hän lisäsi tiedot sääntöjen mukaisista siirroista, jolloin vaihtoehtojen kokonaismäärä kasvoi 175 miljoonaan.

Yleensä shakkitietokoneita opetetaan käymällä vaihtoehdot läpi yksi kerrallaan ja kertomalla, mitkä niistä ovat suositeltavia ja mitkä eivät. 175 miljoonan vaihtoehdon läpikäynti olisi valtava urakka. 

Siksi Lai laittoi Giraffen pelaamaan itseään vastaan siten, että se tarkasteli jatkuvasti, miten hyvin se pystyi arvioimaan tekemiensä siirtojen seuraukset. Lai kokeili tekoälynsä toimivuutta testitietokannalla, jossa on 1 500 eri pelitilannetta. 

Testin paras pistemäärä on 15 000. Kun Giraffe alkoi opetella shakin hienouksia, se pääsi pian 6 000 pisteeseen ja kolmen vuorokauden kuluttua tulos oli jo 9 700. Se vastaa maailman parhaiden shakkitietokoneiden tasoa.

"Tulos on merkittävä, sillä niiden arviointifunktiot ovat satojen parametrien muodostamia jättiläisiä, jotka on vuosien varrella hienosäädetty sekä käsin että automaattisesti, ja monia niistä ovat työstäneet suurmestarit", Lai toteaa.

Vastaavanlaisen koneoppimisen avulla määrittyy todennäköisyys, jolla tiettyyn siirtoon kannattaa tähdätä. Näin Giraffe sai karsittua suuren määrän eri vaihtoehtojen turhia tarkasteluja, mikä paransi suuresti laskentatehoa.

Tällä tavalla Giraffe kykenee määrittämään parhaan mahdollisen siirron 46 prosentin todennäköisyydellä ja onnistuu sijoittamaan sen kolmen parhaan joukkoon 70-prosenttisesti. Silloin koneen ei tarvitse piitata muista mahdollisista siirroista.

Uudessa lähestymistavassa on myös haittapuolensa. Neuroverkko toimii selkeästi hitaammin kuin perinteinen tietojenkäsittely. Giraffelta vie kymmenen kertaa kauemmin käydä läpi sama määrä mahdollisia vaihtoehtoja kuin tavalliselta shakkitietokoneelta. Silti Giraffe on merkittävä edistysaskel.

"Toisin kuin useimpien nykyisten shakkitietokoneiden, Giraffen teho ei perustu siihen, että se pystyy tekemään pitkälle meneviä arvioita, vaan siihen, että se kykenee punnitsemaan hankalia tilanteita tarkasti ja ymmärtämään mutkikkaita vaihtoehtoja, mikä ihmiselle on intuitiivista, mutta on tähän saakka ollut shakkitietokoneiden saavuttamattomissa", Lai kehuu.

Giraffe-tekoälystä kerrottiin MIT:n teknologiakatsauksessa.

Kuva: CC BY-SA 3.0