Kerroin aiemmassa Tutkijat maailmalle -blogitekstissäni tekoälyä, kuva-analyysia ja lääketiedettä yhdistävästä tutkimustyöstäni (https://tutkijatmaailmalle.fi/tekoalya-lansinaapurissa/). Tukholmaan Karoliiniseen instituuttiin suuntautuneen vaihtojaksoni kautta pääsin työskentelemään ainutlaatuisen digitoiduista eturauhasen koepaloista koostuvan ruotsalaisen aineiston kimpussa. Tavoitteemme laajaa aineistoa hyödyntäen oli selvittää, onko patologin työskentelyä eturauhassyövän diagnosoinnissa mahdollista imitoida tarkasti tekoälyn avulla.
Lyhyt vastaus kysymykseemme on: kyllä – tekoäly kykenee diagnosoimaan eturauhassyöpää koepaloista kokeneen asiantuntijan tapaan. Uusi vuosikymmen alkoi iloisesti, kun tuloksemme julkaistiin The Lancet Oncology -tiedelehdessä (kts. linkki Tampereen yliopiston ja Karoliinisen instituutin tiedotteisiin sekä itse artikkeliin tekstin lopussa). Edellä mainittuun ruotsalaiseen potilasaineistoon tukeutuen suunnittelimme ja ”koulutimme” tässä tutkimuksessa tekoälyjärjestelmän, joka kykenee analysoimaan koepaloista skannattuja kuvia. Testasimme niin sanotuista syvistä neuroverkoista rakennettua laskennallista järjestelmäämme liki kahdella tuhannella kokeneiden patologien arvioimalla koepalalla.
Hetki, jolloin päätimme, että tekoäly on nyt valmis testattavaksi, jäi mieleen. Hyvään tieteelliseen käytäntöön koneoppimistutkimuksessa nimittäin kuuluu, että tarkkuus testiaineistolla mitataan vain kerran eikä järjestelmää tämän jälkeen parannella ennen tulosten julkaisua. Tällöin saadaan mahdollisimman realistinen käsitys siitä, kuinka järjestelmä tulisi toimimaan jollakin uudella aineistolla tutkimuksen ulkopuolella – niin sanotusti ”oikeassa elämässä”. Jos tulokset osoittautuvat kehnoiksi, mahdolliset parannukset jäävät sitten tehtäväksi seuraavassa tutkimusprojektissa ja arvioitaviksi uudella testiaineistolla. Tähän ensimmäiseen ja samalla viimeiseen testiajoon sisältyy siis tietynlaista pelonsekaista jännitystä. Voisi sanoa, että kyseessä on eräänlainen köyhän miehen versio siitä, kun avaruustutkijat laukaisevat kymmenen vuotta valmistellun rakettinsa. Tutkimusryhmän keräännyttyä yhteen yksi meistä painoi napista ja lukemat ilmeistyivät hetken päästä ruudulle – seurauksena ei onneksi ollut pettymys, vaan helpotus ja epäusko. Järjestelmän erottelukyky hyvänlaatuisten ja pahanlaatuisten koepalojen välillä oli niin lähellä täydellistä, että epäilimme ensin laskuvirhettä. Suorituskyky osoittautui erinomaiseksi myös kussakin koepalassa olevan syöpäkudoksen määrän ja syövän vakavuutta mittaavan Gleason-pisteytyksen määrittämisessä.
Tähän mennessä olen kirjoittanut paljon laadukkaan datan merkityksestä yleisesti ja suuren ruotsalaisen potilasaineiston ratkaisevasta roolista tutkimuksessamme. Aiemmassa blogitekstissäni vihjasin, että se toinen olennainen raaka-aine löytyi Pohjanlahden itäpuolelta. Kyseessä on moderni laskentakapasiteetti ja kyky hyödyntää sitä. Kuvia tunnistavan syvän neuroverkon ”kouluttaminen” tarkoittaa, että järjestelmälle syötetään esimerkkikuvia uudestaan ja uudestaan. Samalla järjestelmä mukautuu automaattisesti niin, että se pyrkii joka kierroksella tekemään vähemmän ja vähemmän virheitä esimerkkikuvien luokittelussa. Jokaisen esimerkin käsittely vaatii huomattavasti laskentaa ja aineistossamme näitä yksittäisiä esimerkkejä on miljoonia.
Laskennan mittakaavaa voi havainnollistaa seuraavilla luvuilla. Patologitekoälymme kouluttaminen tavanomaisella kuluttajatietokoneella veisi vuosia. Lisäksi tutkimuksen kannalta ei riitä, että tekoäly koulutetaan kerran. Suunnittelu- ja kehitysvaiheessa on pystyttävä kokeilemaan erilaisia ratkaisuja ja asetuksia, ja voitava joka kerta kouluttaa tekoäly uudestaan, jotta näiden muutosten vaikutuksia suorituskykyyn voidaan arvioida (tähän tarkoitukseen on muuten luonnollisestikin varattava erillinen testiaineisto). Varovaisestikin arvioiden voisi siis todeta, että tutkimuksemme toteutus tavallisella tietokoneella olisi vienyt ainakin vuosikymmenen. Viimeisin tekoälymme koulutusrupeama ei kuitenkaan vienyt vuosia – vaan kolme päivää! Kiitos tästä kuuluu Tieteen tietotekniikan keskus CSC:n upouudelle Puhti-supertietokoneelle, jonka käyttöönottopilotoinnissa sain kunnian olla mukana joitakin kuukausia sitten. Myös Tampereen tieteellisen laskennan keskuksen grafiikkaprosessorit olivat kovassa käytössä koko tutkimuksemme ajan. Lisää järeää rautaa on odotettavissa jälleen vuonna 2021, kun Lumi, tuolloin yksi maailman nopeimmista tietokoneista, käynnistyy Kajaanissa. Vastaavaa laskentakapasiteettia ei muun muassa Ruotsissa tutkijoiden käytettävissä tällä hetkellä ole. Itse laitteiden lisäksi tarvitaan toki myös tietotaitoa digitaalipatologisen kuvadatan käsittelystä, jotta aineisto saadaan prosessoitua mahdollisimman tehokkaasti. Tällä saralla otimmekin tutkimustyön aikana aimo harppauksia eteenpäin.
Kuten todettua, lyhyt vastaus alun kysymykseemme on: kyllä, tekoälyn suorituskyky vastaa patologia. Pidempi vastaus on, että suorituskyky vaikuttaa erinomaiselta, mutta emme vielä tiedä, voiko tekoälyyn luottaa kaikissa tilanteissa. Kuten tieteessä usein, pitkä vastaus sisältää uusia jatkokysymyksiä. Toimiiko tekoäly yhtä hyvin, jos analysoitavana on eri valmistajan skannerilla digitoituja koepaloja? Entäs jos koepalat on valmisteltu eri laboratoriossa? Tai eri maassa? Mitä tapahtuu, jos tekoäly kohtaa sellaisen ulkonäöltään hyvin harvinaisen syöpätapauksen, jota opetusaineistomme ei sisältänyt, ja johon patologi tyypillisesti törmää urallaan vain muutamia kertoja? Näiden kysymysten ratkaisu on kriittisen tärkeää, jotta tekoälyn lupaava suorituskyky voidaan ottaa hyötykäyttöön arkipäivän terveydenhuollossa. Käytännön hyödyn lisäksi nämä kysymykset ja virhelähteet ovat kiinnostavia myös siitä näkökulmasta, että niiden kautta voimme kenties saada paremman käsityksen siitä, kuinka tekoälyjärjestelmä ”ajattelee” ja miten tämä eroaa ihmisen tavasta työskennellä. Tutkijavaihtojaksoni myötä käynnistyneen yhteistyön puitteissa keskitymme seuraavaksi näihin aiheisiin.
Tampereen yliopiston tiedote:
https://www.tuni.fi/fi/ajankohtaista/tekoaly-tunnistaa-eturauhassyovan
Karoliinisen instituutin tiedote:
https://news.ki.se/ai-can-be-used-to-detect-and-grade-prostate-cancer
Tutkimusartikkeli (maksullinen):
https://www.thelancet.com/journals/lanonc/article/PIIS1470-2045(19)30738-7/fulltext