Tekoäly on viime aikoina herättänyt hämmästyttävän paljon huomiota tieteellisten piirien lisäksi valtamediassa ja laajemminkin läpi yhteiskunnan. Huomattavassa osassa keskustelua tekoäly esitetään taikuutta lähentelevänä tekniikkana, joka ratkaisee ongelman kuin ongelman. Toisaalta tekoälyn pelätään vievän työpaikat – ja synkimmissä dystopioissa kenties hengenkin. Olen saanut etuoikeuden seurata tätä keskustelua aitiopaikalta, sillä oma tutkimukseni käsittelee tekoälyn soveltamista lääketieteessä, erityisesti digitaalisessa patologiassa.
Patologia ei ehkä välittömästi kuulosta ilmeisimmältä tekoälyn soveltamiskohteelta. Jos ongelma rajataan sopivasti, kyseessä on kuitenkin malliesimerkki tehtävästä, johon tekoäly soveltuu hyvin. Perinteisesti esimerkiksi epäillyistä kasvaimista otetaan koepaloja, jotka patologi tutkii mikroskoopilla. Arviointi perustuu yksinkertaistettuna erilaisten kudoksessa esiintyvien ulkonäöltään poikkeavien rakenteiden löytämiseen ja tunnistamiseen. Tämän perusteella voidaan päätellä, sisältääkö koepala syöpää, ja arvioida muun muassa mahdollisen syövän agressiivisuutta ja siten potilaan tarvitsemaa jatkohoitoa. Usein huomattava osa kiireisen asiantuntijan työajasta kuluu kuitenkin ”neulan etsimiseen heinäsuovasta” eli lukuisten normaalien näytteiden läpikäymiseen. Väsymätön tekoäly on parhaimmillaan tällaisissa tehtävissä, joissa kyse on tietyn kuvion tunnistamisesta suuresta määrästä visuaalista dataa.
Digitaalipatologiassa koepalat skannataan erityisellä mikroskooppiskannerilla tarkoiksi digitaalisiksi kuviksi. Yksi tällainen kuva sisältää yleensä suurin piirtein saman verran kuvapikseleitä kuin noin 2000 tavallisella älypuhelimella otettua kuvaa. Kun koepalat on digitoitu, patologi voi tarkastella niitä tietokoneella mikroskoopin sijaan ja pyytää esimerkiksi konsultaatiota toisesta sairaalasta aiempaa helpommin. Mahdollisesti vielä suurempi etu kuitenkin on, että digitaalisia kuvia voidaan analysoida tekoälyllä ja siten automatisoida tai helpottaa osaa patologin tehtävistä. Kuten arvata saattaa, tekoäly ei kuitenkaan toiveikkaista lehtikirjoituksista huolimatta ole taikatemppu, vaan ainoastaan käyttökelpoinen laskennallinen tekniikka. Tekoälysoppaan tarvitaan teknisen osaamisen lisäksi kaksi pääraaka-ainetta: paljon hyvälaatuista dataa sekä riittävästi laskentatehoa. Tieteellisen laskentakapasiteetin osalta tilanne Suomessa on tällä hetkellä mainio, mistä lisää tuonnempana. Datan osalta tutkimukseni on sen sijaan hyötynyt ratkaisevasti ”rapakon taakse” Tukholmaan suuntautuneesta tutkijavaihtojaksosta.
Tukholmassa työskentelen Karoliinisen instituutin Epidemiologian ja biostatistiikan laitoksella. Käytettävissä on osana aiempaa kliinistä tutkimusta kerätty, kansainvälisestikin huomattava yli 80 000 eturauhaskoepalan aineisto, josta suuri osa on jo digitoitu. Itse kuvien lisäksi saatavilla on kokeneen patologin poikkeuksellisen kattava arvio kustakin koepalasta. Toimivan tekoälyratkaisun kehittämisen kannalta tällainen aineisto on kultakimpale – kyseessähän on koneoppimistehtävä, jossa tekoälyalgoritmi ”opetetaan” tunnistamaan syöpäkudosta esittämällä suuri määrä esimerkkejä normaalista ja syöpäisestä kudoksesta. Jos näitä esimerkkejä ei ole tarpeeksi, ne eivät edusta tutkittavaa ongelmaa aiotulla tavalla tai patologin esimerkkejä koskevat arviot eivät ole luotettavia, tekoälyllä ei ole juuri toivoa ”oppia” ratkaisemaan ongelmaa.
Lääketieteellisissä ongelmissa datan arvo korostuu, koska sitä ei tyypillisesti ole laajasti saatavilla sekä potilaiden tietosuojan että datankeruun kustannusten vuoksi, ja arvioiden suorittaminen edellyttää tyypillisesti erityisosaamista. Tilanne on toinen, jos tarkoitus on esimerkiksi kouluttaa tekoäly ennakoimaan, minkälaisista elokuvista katsojat pitävät Netflixissä. Esimerkkejä suosituista ja epäsuosituista elokuvista voidaan tällöin kerätä automaattisesti valtavia määriä perustuen ainoastaan järjestelmän omaan tilastointiin. Lääketieteellisten ongelmien erityispiirteitä ovat myös, että tekoälyn tarkkuutta on kyettävä arvioimaan luotettavasti ja vaatimustaso tarkkuudelle on korkea. Kehnokin elokuvia suositteleva algoritmi tuottaa korkeintaan vähäistä mielipahaa kun taas syöpädiagnoosiin osallistuva kelvoton tekoäly on lähtökohtaisesti hengenvaarallinen. Käytössämme oleva data mahdollistaa onneksi myös tekoälyn suorituskyvyn arvioinnin tilastollisesti riittävän suuressa mittakaavassa.
Yhteistyö ruotsalaisten kanssa on osoittautunut hedelmälliseksi ja eturauhassyöpää tunnistavan tekoälyratkaisun kehitys on jo varsin pitkällä. Suomessa yleinen stereotypia päättymättömistä ruotsalaisista kokouksista ja ”diskuteerauksesta” kahvikupin ääressä tunnistetaan täälläkin, mutta omassa tutkimusarjessani en ole vitkutteluun törmännyt. Ylipäätään suuria kulttuurieroja Suomeen verrattuna on vaikea löytää, mutta toki Karoliininen instituutti perinteikkäänä lääketieteellisenä yliopistona on jossain määrin eksoottinen tutkimusympäristö tamperelaiselle teknillisen yliopiston kasvatille. Tekoälyn lupausten lunastaminen todellisissa potilassovelluksissa edellyttää kuitenkin väistämättä monitieteistä lähestymistapaa. Tutkijavaihto tällaisessa ympäristössä ja sen myötä pohjoismainen yhteistyö onkin antanut merkittävää lisäpotkua väitöskirjatyöhöni.