Johdanto
Diagnostiikan ja hoidon ohella prognoosi eli ennuste on keskeinen elementti lääketieteessä. Ennustaminen (eng. prediction) eli ennustetutkimus tai prediktiivinen tutkimus on siksi yleistä lääketieteessä. Varsinkin monimuuttujamallien hyödyntäminen on keskeistä ennustetutkimuksessa. Prediktiivisen tutkimuksen yhtenä tarkoituksena on luoda kliinisen työn tueksi kliinisiä ennustemalleja ja -sääntöjä (eng. clinical prediction rule). Hyvä esimerkki on FINRISKI-laskuri (https://thl.fi/fi/web/kansantaudit/sydan-ja-verisuonitaudit/finriski-laskuri). Vastaavasti esimerkiksi eri syöpätaudeissa voidaan määrittää ja ennustaa monimuuttujamallin avulla yksittäisen potilaan odotettavissa olevaa elinikää.
Ennustaminen ei välttämättä tarkoita aina vain taudin prognoosia tai päätetapahtuman riskiä. Ennustaminen on tärkeää myös taudin diagnostiikan osalta. Diagnostiikassa olemme tottuneet käyttämään herkkyyttä ja tarkkuutta arvioitaessa eri diagnostiikkamenetelmien hyötyjä. Herkkyys ja tarkkuus ovat kuitenkin ns. käänteisiä todennäköisyyksiä eivätkä ole käytännän työn kannalta kovin käytännöllisiä. Ennustetutkimus tai ennustemalli sen sijaan antaa taudin todennäköisyyden tietyillä lähtömuuttujien arvoilla perustuen monimuuttujamalliin, kuten esimerkiksi logistiseen regressioon. Tämä lähestyminen on oleellisesti käytännöllisempi kliiniseltä näkökannalta.
Käytännöllisyydestään huolimatta ennustaminen on yleisesti ottaen äärimmäisen vaikeaa. Mikäli ennustamiselle annetaan hieman virhemarginaalia ja tilaa epävarmuudelle, ennustaminen muuttuu jo hieman helpommaksi.
Huomattavan suuri ongelma lääketieteessä on se, että usein tutkimuksessa ei selkeästi oteta kantaa onko kyseessä selittävä vai ennustava lähestyminen aiheeseen. Hyvin usein monimuuttujamalleja käytettäessä keskeisin tutkimustulos perustuu riskitekijöiden raportoimiseen vailla pohdintaa niiden selitys- tai ennustekyvystä. Riskitekijöistä on kirjoitettu erillinen artikkeli.
Mitä on ennustaminen?
Ennustaminen perustuu tilastollisen mallin kykyyn ennustaa uusia havaintopisteitä. Yleensä näillä tarkoitetaan jotain tiettyä päätemuuttujaa. Alla on kuvattuna kuvitteellisen potilasaineiston muuttujia. Ikä, sukupuoli, BMI ja systolinen verenpaine ovat käytettävissä olevia lähtömuuttujia. Muuttujat y1
ja y2
ovat päätemuuttujia. y1
on binaarinen eli kaksiluokkainen muuttuja, kuten esimerkiksi onko potilaalla diabetes tai onko potilas saanut sydäninfarktin. y2
on kuvitteellinen jatkuva muuttuja asteikolla 0-100.
ikä sukupuoli bmi s_rr | y1 y2
76 M 37 154 1 86
59 N 43 164 1 92
71 M 29 123 0 53
49 M 31 147 0 41
65 N 25 166 0 21
29 N 19 109 1 34
. . . . . .
. . . . . .
. . . . . .
Ylläolevalla aineistolla voidaan pyrkiä ennustamaan kumpaakin päätemuuttujaa. Toisin sanoen aineiston pohjalta voidaan kehittää kliininen ennustemalli molemmille päätemuuttujille. Muuttujan y2
osalta voidaan asettaa lineaarimalli, joka olisi muotoa:
y2_i=\beta_0+\beta_{ikä}x_{i1}+\beta_{sukupuoli}x_{i2}+\beta_{bmi}x_{i3}+\beta_{s\_rr}x_{i4}
Lineaarinen regressiomalli sovitetaan aineistoon ja näin saadaan määritettyä regressiokertoimien arvot. Kun kertoimet on määritetty, voidaan jokaiselle potilaalle määrittää mallin ennustama (eng. predicted) päätemuuttujan arvo ŷ2
. Tämä on siis eri kuin aineistossa havaittu (eng. observed). Mitä lähempänä arvot ovat toisiaan, sitä parempi malli on kyseessä. Muuttujan y1
osalta voidaan asettaa logistinen malli:
log(\frac{p_i}{1-p_i})=\beta_0+\beta_{ikä}x_{i1}+\beta_{sukupuoli}x_{i2}+\beta_{bmi}x_{i3}+\beta_{s\_rr}x_{i4}
Nyt regressiokertoimet määritetään asettamalla logistinen regressiomalli aineistoon. Kun kertoimet on määritetty, voidaan jokaiselle potilaalle määrittää mallin ennustama todennäköisyys päätetapahtumalle.
\hat{p} = \frac{e^{\beta_0+\beta_{ikä}x_{i1}+\beta_{sukupuoli}x_{i2}+\beta_{bmi}x_{i3}+\beta_{s\_rr}x_{i4}}}{1+e^{\beta_0+\beta_{ikä}x_{i1}+\beta_{sukupuoli}x_{i2}+\beta_{bmi}x_{i3}+\beta_{s\_rr}x_{i4}}}
Malli ei siis ennusta arvoja 0 ja 1 vaan antaa todennäköisyyden väliltä [0,1]. Mallin hyvyys arvioidaan vertaamalla ennustettuja todennäköisyyksiä havaittuihin päätetapahtumiin.
Ennustamassa vai selittämässä?
Jos tutkimuksen tarkoitus on selittää miten altiste vaikuttaa päätemuuttujaan, on kaikista keskeisintä pohtia sekoittavien tekijöiden, välitysmuuttujien sekä ns. collider-muuttujien osuutta selityssuhteisiin. Näitä on kuvattu tarkemmin artikkeleissa, jotka löytyvät Selittäminen -hakusanan alta.
Kun tutkimuksen tarkoitus on ennustaa, edellä mainituilla käsitteillä ja niiden osuudella ei ole merkitystä. Ennustetutkimuksessa tulkinta nojaa ainoastaan kykyyn ennustaa uusien havaintopisteiden tai aineiston päätemuuttujien arvoja. Ennustetutkimuksessa voi olla esimerkiksi kolme lähtömuuttujaa, A, B ja C. Ennustetutkimuksessa tarkoitus on ainoastaan tutkia näiden muuttujien ennustekykyä päätemuuttujan X osalta. Syy-seuraussuhteiden eli kausaalimallin pohjalta voi olla hyvinkin mahdollista, että muuttuja B välittää muuttujan A vaikutusta päätemuuttujaan X.
Ennustetutkimuksessa selityssuhteilla ei ole kuitenkaan merkitystä. Tämä perustuu erityisesti siihen, että A:n ja B:n regressiokertoimia ei edes tarvitse tulkita, kun tarkoituksena on ennustaa. Jos tarkoitus on selittää, miten A vaikuttaa muuttujaan X, keskeistä on tulkita A:n regressiokerrointa. Ennustamisessa lähtömuuttujan ja päätemuuttujan välisen tilastollisen yhteyden (regressiokertoimet) suuruudella ei ole oleellista merkitystä. Keskeisin tulos on se, miten hyvin nämä kolme lähtömuuttujaa ennustavat päätemuuttujaa X tietyillä lähtömuuttujien arvoilla. Päätemuuttuja X voi olla esimerkiksi kaksiluokkainen, kuten onko potilaalla sairaus vai ei. Tällöin tutkimuksen tarkoitus on arvioida ja määrittää ennustemallin kykyä ennustaa päätemuuttujan todennäköisyyttä tai sen luokkaa. Ensin mainittu voi pohjautua esimerkiksi logistiseen regressioon. Jälkimmäinen on yleensä keskeistä koneoppimisessa. Jos päätemuuttuja on jatkuva, ennustemallin hyvyys perustuu kykyyn arvioida suoraan jatkuvan muuttujan arvoja.
Ennustetutkimuksen periaatteita
Ennustaminen ja ennustetutkimus on erittäin keskeistä potilaan tai sairauden prognoosin eli ennusteen tutkimisessa. Selittävässä tutkimuksessa meitä kiinnostaa muuttujien välinen syy-seuraus- eli kausaalisuhde: miten muuttuja A vaikuttaa muuttujaan X? Ennustetutkimuksessa meitä taas kiinnostaa esimerkiksi mikä on potilaan kuoleman riski 5 vuoden aikana tai mikä on potilaan toimenpiteen jälkeinen toimintakyky asteikolla 0-100 tietyillä lähtömuuttujien arvoilla. Lähtömuuttujien kausaalisuhteilla päätemuuttujiin ei ole merkitystä, jos kyseessä on vain ennusteen arviointi. Ennustetekijöihin vaikuttaminen ennusteen muuttamisen toivossa on eri asia ja vaatii silloin selityssuhteiden pohtimista huolellisesti. Tätä on käyty läpi tarkemmin artikkelissa Pohdintaa riskitekijöistä.
Monimuuttujamallin ja lähtömuuttujien ennustekykyä voidaan arvioida monilla eri tavoilla. Kun ennustetaan jatkuvaa muuttujaa, hyvin perinteinen mittari ennustekyvylle on R2, joka kuvaa selitetyn vaihtelun osuutta (eng. variance explained). R2-arvo 1 tarkoittaa, että lähtömuuttujat selittävät kaiken vaihtelun päätemuuttujassa. Se tarkoittaa myös periaatteessa täydellistä ennustamista. Tämä ei ole koskaan mahdollista ainakaan lääketieteellisessä tutkimuksessa. R2-arvo 0 tarkoittaa taas, että lähtömuuttujat eivät selitä yhtään päätemuuttujan vaihtelua. Tämäkään ei toisaalta ole kovin realistinen, koska yleensä kaikilla muuttujilla biolääketieteessä on jokin yhteys keskenään ja hyvin pieniä määriä vaihtelua kyetään selittämään millä tahansa. Toki tämän erottaminen ns. taustakohinasta on hankalaa.
Jatkuvan muuttujan ennustekykyä voidaan arvioida erilaisilla virhearvoilla. Näitä ovat esimerkiksi keskimääräinen absoluuttinen virhe (eng. mean absolute error, MAE), keskineliövirhe (eng. mean squared error, MSE) sekä keskineliövirheen neliöjuuri (eng. root mean squared error, RMSE). Jokainen lasketaan hieman eri tavalla, joten esimerkiksi poikkeavat havainnot vaikuttavat niihin eri tavalla. Sopivan menetelmän käyttö riippuu tutkittavasta ilmiöstä ja aineistosta sekä poikkeavien arvojen painoarvosta.
Todennäköisyyksien ennustamisen onnistumista voidaan arvioida Brierin luvulla esimerkiksi logistisessa regressiossa. Se on käytännössä vastaava kuin MSE jatkuville muuttujille.
Kaksiluokkaista muuttujaa ennustettaessa esimerkiksi logistisella regressiolla voidaan myös määrittää R2, mutta sen määritys ja tulkinta ei ole aivan yksiselitteistä, kuten lineaarisesti regressiossa. Keskeistä on sen sijaan tutkia ennustemallin diskriminaatio- eli erottelukykyä. Se tarkoittaa mallin kykyä luokitella aineiston havainnot päätemuuttujan suhteet. Hyvä erottelukyky tarkoittaa, että malli ennustaa oikein havainnot, joilla on todettu päätetapahtuma ja joilla ei ole todettu päätetapahtumaa. Yleinen erottelukykymittari on c-indeksi (eng. concordance). Sen tulkinta on sama kuin AUC eli area under curve, joka lasketaan ROC eli receiver operating characteristics -analyysillä. c-arvo 0.5 tarkoittaa, että mallin erottelukyky on kolikonheiton tasoa ja 1 vastaa täydellistä erottelua. Jälleen kerran tämä ei ole koskaan saavutettavissa biolääketieteellisessä tutkimuksessa.
Toinen tärkeä ennustekyvyn mittari on kalibraatio. Se kuvastaa miten hyvin malli osaa ennustaa oikein erilaisia päätemuuttujan arvoja. Ennustekyky ei välttämättä ole yhtä hyvä kaikille arvoille. Malli voi esimerkiksi arvioida oikein matalan riskin, mutta yli- tai aliarvioida suuren riskin. Tällä tiedolla on merkitystä on mietitään ennustemallin käytännö sovelluksia.
Lopuksi
Ennustetutkimukseen liittyy lukuisia muita huomioitavia seikkoja kuten sisäinen ja ulkoinen validiteetti, yli- ja alisovittaminen, mallin optimismi, ns. kutistustekijän huomiointi sekä harhan ja varianssi suhteen ymmärtäminen. Ennustetutkimuskirjallisuus on erittäin massiivista ja sen teoreettinen tietosisältö on erittäin laaja. Koneoppimisen tuomat uudet menetelmät ovat laajentanee tätä teoriapohjaa valtavasti. Kliinisen tutkijan on kuitenkin hyvä ymmärtää perusperiaatteita ennustetutkimuksesta ja siihen liittyvästä metodologiasta, koska tämä alue antaa erinomaisia keinoja ja sovellusmahdollisuuksia laadukkaaseen diagnostiikan, hoidon ja prognoosin tutkimukseen.
Hyvä kirjoitus! Oliko johonkin merkittynä lähteet/lisämateriaali?