Ihmisen genomin kielioppi on monimutkainen
11.11.2015

Tuore ruotsalais-suomalainen tutkimus kertoo, että ihmisen geneettisen koodin ‘kielioppi’ on monimutkaisempi kuin minkään puhutun kielen.

Nyt 9. marraskuuta Nature-tiedelehdessä julkaistut tulokset selittävät, miksi ihmisen genomin tulkitseminen on niin vaikeaa.

Ihmisen genomin muodostavien kirjainten A, C, G ja T järjestys paljastui vuonna 2000, kun genomin sekvensointi valmistui. Kirjainten järjestyksen tietäminen ei kuitenkaan riittänyt siihen, että genomitietoa olisi voitu hyödyntää saman tien lääketieteessä. Kuten ihmiskielissä, on geenikielessäkin myös ymmärrettävä, mitä kirjainjonot tarkoittavat. Genomin kielessäkin on ’sanat’ ja ’kielioppi’ – tästä on väläys alla olevassa kuvassa.

Proteiinit kielioppina

Kaikissa ihmiskehon soluissa on lähes identtinen genomi, mutta erityyppiset solut ilmentävät eri geenejä. Kullakin geenillä on kontrollialue, joka sisältää ohjeet siitä, milloin ja missä geeniä ilmennetään. 

Tätä säätelykoodia lukevat transkriptiotekijöiksi kutsutut proteiinit, jotka sitoutuvat tiettyihin ’DNA-sanoihin’ ja joko nostavat tai laskevat kohdegeenin ilmentymistä.

Professori Jussi Taipaleen (otsikkokuvassa toinen oikealta) Karoliinisessa instituutissa Ruotsissa vetämä tutkijatyhmä on tunnistanut jo aikaisemmin useimmat yksittäisten transkriptiotekijöiden tunnistamat DNA-sanat. Puhuttujen kielten tapaan DNA-sanojakin voidaan liittää yhdyssanoiksi, joiden lukemiseen tarvitaan useita transkriptiotekijöitä. 

Lukemiseen käytettävää mekanismia ei kuitenkaan ole aikaisemmin tutkittu. Niinpä Taipaleen ryhmä kartoitti nyt systemaattisesti transkriptiotekijöiden parien sitoutumista DNA-yhdyssanoihin.

Kartoitus paljastaa, että geneettinen koodi on paljon monimutkaisempi kuin mikään ihmisen käyttämä kieli. Kahta sanaa ei yhdistetä vain poistamalla välilyönti, vaan yhdyssanaan liitetyt sanat muuttuvat muodostaen suuren joukon täysin uusia sanoja. 

"Tutkimuksemme tunnisti monia tällaisia sanoja, ja lisää ymmärrystä siitä kuinka geenejä säädellään normaalissa yksilönkehityksessä ja syövässä", sanoo ryhmässä mukana oleva tohtoriopiskelija Arttu Jolma (kuvassa toinen vasemmalta).

Mukana tutkimuksessa tiiviisti olleen Helsingin yliopistossa toimivan Suomen Akatemian Syöpägenetiikan huippuyksikön (missä Taipale on myös mukana) tutkijat osallistuivat tutkimuksen laskennalliseen osaan, jossa vertailtiin uusien DNA-yhdyssanojen esiintymistä ihmisen ja muiden lajien genomeissa. Tavoitteena on hyödyntää tietoa ihmisten geneettisen syöpäalttiuden ymmärtämisessä, koska mutaatio tärkeässä DNA-sanassa voi aktivoida syövälle hyödyllisen tai hiljentää syövältä suojaavan geenin. 

Huippuyksikön tutkijat ovat jo aikaisemmin selittäneet, kuinka yhden kirjaimen ero yli kolmen sadan tuhannen merkin päässä syövälle tärkeästä MYC-geenistä sijaitsevassa DNA-sanassa vaikuttaa paksusuolisyövän riskiin. Yhdyssanojen ymmärtäminen mahdollistaa entistä useampien erojen tulkintaa.

Otsikkokuvassa on Jussi Taipaleen tutkimusryhmä Karoliinisessa instituutissa. Kuvassa ovat Taipaleen (toinen oikealta) ja Arttu Jolman (toinen vasemmalta) lisäksi vasemmalla Jekaterina Morgunova ja oikealla Yimeng Yin, Kuva: Ulf Sirborn / Karolinska Institutet

Julkaisu: DNA-dependent formation of transcription factor pairs alters their binding specificity. Jolma A, Yin Y, Nitta KR, Dave K, Popov A, Taipale M, Enge M, Kivioja T, Morgunova E and Taipale J., Nature 9 November 2015, dos: 10.1038/nature15518.

Teksti perustuu Helsingin yliopiston ja Karoliinisen instituutin tiedotteisiin.