Erilaisten tutkimusasetelmien perusteiden ymmärtäminen on tärkeää niin tutkimuksen tekemisen kuin tutkimusten lukemisen osalta. Tässä artikkelissa käydään läpi erilaisia tutkimusasetelmia sekä metodologisia periaatteita siitä näkökulmasta, mikä on varsinainen tutkimuskysymys.
Onko hoito A tehokkaampi kuin hoito B? Onko hoitojen A ja B välillä eroa tehokkuudessa? Onko hoidosta A hyötyä verrattuna lumehoitoon?
Tämä on yksi keskeisimpiä tutkimuskysymyksiä lääketieteessä. Tämän tyyppisissä tutkimuskysymyksissä tulisi aina pyrkiä tekemään satunnaistettu vertailututkimus eli RCT. Se on tehokkain tapa tutkia hoidon tai intervention kausaliteettia eli syy-seuraussuhdetta. RCT:n tarkoitus on, että mahdolliset ryhmien väliset erot, jotka voisivat aiheuttaa harhaa ryhmien välillä tulosmuuttujan osalta, olisivat sattuman aiheuttamia, ei systemaattisia.
Erittäin tavallinen tapa tutkia eri hoitomenetelmien tehoja on takautuva asiakirjatutkimus eli retrospektiivinen tutkimus. Yleensä tällaisessa tutkimusaineistossa on potilaita, jotka ovat saaneet joko hoitoa A tai B. Takautuvassa tutkimuksessa hoitojen antamista ei ole satunnaistettu, vaan hoitopäätökset perustuvat hoitavan lääkärin harkintaan. Tämä tarkoittaa sitä, että jokin tekijä, kuten potilaan tai sairauden ominaisuus, hoitojen saatavuus, hoitavan lääkärin mieltymykset, sairaalan yleiset linjaukset tai muut tekijät ovat vaikuttaneet siihen, miksi joku potilas on saanut hoidon A ja toinen hoidon B. Lisäksi usein hoitojen saaminen ei perustu selkeään yksittäiseen tekijään vaan useiden tekijöiden summaan. Koska takautuvan tutkimuksen aineisto on muodostunut normaalin potilashoidon aikana, eikä hoitoon liity minkäänlaista koeasetelmaa, tällaista tutkimusta kutsutaan myös havainnoivaksi.
Takautuvassa, havainnoivassa tutkimuksessa voidaan myös pyrkiä selvittämään mahdollista eroa hoitojen tehossa. Tällöin on keskeistä selittää, miten altiste eli hoito A tai B vaikuttaa haluttuun päätemuuttujaan. Tärkeää on siis miettiä taustalla vaikuttavaa kausaali- ja selityssuhdemallia. Hyvin usein tämän tyyppisessä tutkimuksessa erotellaan hoitoa A tai B saaneet potilaat ja tehdään ryhmien välinen “vakiointi” tärkeiksi ajateltujen muuttujien suhteen. Kausaalimallia rakentaessa on tärkeä ymmärtää tutkittavaan ilmiöön liittyvät kausaalisuhteet, jotta malliin valikoituu oikeat muuttujat eikä väärien muuttujien sisällyttämisestä koidu harhaa tuloksiin (Katso hakusana Selittäminen).
Riippumatta tutkimusasetelmasta, vakioinnin määrästä tai käytetyistä muuttujista, tutkimuksen aineistoon liittyy aina jonkin verran jäännösharhaa tai jäännössekoitetta. Tämä tarkoittaa, että kattavastakin vakioinnista huolimatta jokin tunnettu tai tuntematon kolmas muuttuja voi selittää ryhmien A ja B välistä eroa hoidon tehossa. Käytännössä kaikkien mahdollisten sekoittavien tekijöiden huomiointi ei ole koskaan mahdollista. Tässä nimenomaan piilee satunnaistamisen merkittävin etu: kun havainnoivassa tutkimuksessa vakioimattomien muuttujien vaikutus saattaa olla systemaattista, satunnaistetussa tutkimuksessa niiden vaikutus on ei-systemaattista eli satunnaista potilaiden välillä.
Ennustaako muuttuja A päätemuuttujaa X? Altistaako muuttuja A päätemuuttujalle X?
Otsikon kaltaiset tutkimuskysymykset liittyvät ensisijaisesti ennustamiseen eli ennustetutkimukseen. Hyvin usein tutkimusasetelmissa on yksi mielenkiinnon kohteena oleva lähtömuuttuja, jonka yhteyttä päätemuuttujaan halutaan selvittää. Tällöin tutkimuskysymys muotoillaan usein otsikon kysymysten kaltaisiksi. Tällaiset tutkimuskysymykset ovat lähtökohtaisesti kuitenkin ongelmallisia. Kärjistäen voidaan sanoa, että biolääketieteessä kaikki vaikuttaa kaikkeen, ja siten muuttuja A ennustaa aina muuttujaa X. Kyse on vain siitä miten paljon A ennustaa vastemuuttujaa X.
Näin ollen onkin mielekkäämpää kysyä, miten paljon A kykenee ennustamaan muuttujaa X. Tällaiseen tutkimuskysymykseen tulisi vastausta etsiä tilastollisen mallin selitysasteesta. Selitysaste kuvaa miten hyvin lähtömuuttujat pystyvät ennustamaan uusia havaintopisteitä. Tästä on kerrottu tarkemmin artikkelista Ennustaminen lääketieteellisessä tutkimuksessa. Erityisesti yhden muuttujan tapauksessa voi myös tutkia miten uuden muuttujan lisääminen parantaa lähtömuuttujien ennustekykyä eli selitysastetta päätemuuttujan suhteen. Huomattavaa on, että ennustavassa tutkimuksessa yksittäisillä regressiokertoimilla ei ole juurikaan merkitystä, koska ne kuvaavat vain muuttujien välistä tilastollista yhteyttä. Erittäin yleinen virhe on analysoida yhden monimuuttujamalliin regressiokertoimia ja tulkita tilastollisesti merkitsevät kertoimet “ennustetekijöiksi”. Tällaisessa menetelmässä piilee kuitenkin sudenkuoppia, jotka mahdollisesti johtavat virheellisiin tulkintoihin. Tilastollisesti merkitsevät muuttujat voivat olla riskitekijöitä, mutta niiden ennustekyky pitää tutkia muulla tavalla.
Vaihtoehtoinen tutkimuskysymys on miettiä, vaikuttaako muuttuja A muuttujaan X. Tässä ei ole kyse ennustamisesta vaan kysymys on kausaalinen ja perustuu syy-seuraussuhteiden pohdintaan. Tällöin pitää siis pohtia kausaalimallin näkökulmasta miten lähtömuuttuja vaikuttaa päätemuuttujaan X. Aiheesta löytyy tarkemmin hakusanan Selittäminen alta.
Mitkä tekijät ennustavat päätemuuttujaa X?
Tämä kysymys on lähes vastaava kuin edellä oleva. Kuten sanottua, kärjistäen voidaan sanoa, että biolääketieteessä kaikki vaikuttaa kaikkeen. Tämän pohjalta ei ole siis mielekästi kysyä mikä tai mitkä tekijät muuttujista A, B, C tai D ennustavat päätemuuttujaa X. Yleensä kyse on vain siitä, onko otoskoko riittävä havaitsemaan mahdollisen tilastollisen yhteyden. Oleellisempaa on kysyä, mikä muuttujista on tärkein päätemuuttujan ennustamisen kannalta. Tämä nojaa jälleen selitysasteen tutkimiseen ja muuttujien tärkeyden arviointiin tilastollisesti.
Oleellista on siis miettiä miten A, B, C ja D yhdessä ennustavat mielenkiinnon kohteen olevaa muuttujaa. Tällöin tilastollinen analyysi perustuu ennustetutkimukselle oleellisten tulosmuuttujien raportointiin ja regressiokertoimet eivät ole tärkein osa niissä. Kliiniseltä kannalta mielenkiinnon kohteena on siis tiettyjen riskitekijöiden muodostama absoluuttisen riskin suuruus eikä yksittäisten tekijöiden suhteellinen vaikutus riskiin. Edeltävä on kaikista keskeisin kliinisen päätökstenteon kannalta. Tarkemmin aiheesta löytyy hakusanan Ennustaminen alta.
Onko muuttuja A päätemuuttujan X itsenäinen riskitekijä? Mitkä ovat päätemuuttujan X itsenäisiä riskitekijöitä?
Yleinen menetelmä “riskitekijä”-tutkimuksessa on rakentaa monimuuttujamalli ja tulkita tilastollisesti merkitsevien muuttujien regressiokertoimet “riskitekijöinä” päätetapahtumalle X. Tämän analyysin tulkinta edellyttää tarkkaa pohdintaa riskitekijöiden merkityksestä. Viime kädessä kyse on vain tilastollisesta yhteydestä eikä välttämättä varsinaisesta syy-seurausyhteydestä. On virheellista todeta, että tekijä A aiheuttaa päätetapahtuman X ilman kausaalimalliin perustuvaa pohdintaa. Riskitekijä tarkoittaa viime kädessä vain tilastollista yhteyttä lähtömuuttujan ja päätemuuttujan välillä. Lisää aiheesta löytyy artikkelista Pohdintaa riskitekijöistä.
Monesti puhutaan myös muokattavista riskitekijöistä (eng. modifiable risk factor). Tässä ajatuksena on, että riskitekijään vaikuttamalla vaikutetaan myös päätetapahtuman riskiin. Jälleen kerran tätä päätelmää ei voida tehdä ilman, että taustalla on pohdittu kausaalimallia ja syy-seuraussuhteita altisteen ja päätemuuttujan välillä. Viime kädessä tällaisia päätelmiä riskitekijän muokattavuudesta voidaan tehdä ainoastaan satunnaistetulla vertailututkimuksella, jossa ehdotettua riskitekijää todella muokataan tai siihen kohdistetaan interventio. Riskitekijöiden tuntemista voidaan hyödyntää tunnistamaan yksilö, jolla on mahdollisesti kohonnut riski päätetapahtumalle. Potentiaalinen interventio vaikuttaa kyseisen yksilön riskiin, mikä ei välttämättä tarkoita riskitekijään vaikuttamista.
Mikä on testin X herkkyys ja tarkkuus? Mikä on testin X hyöty?
Yksittäisen diagnostisen testin hyöty ja merkitys on erittäin yleinen kliinisen tutkimuksen kohde. Klassinen lähestyminen aiheeseen on määrittää tietyn testin herkkyys (sensitiviteetti) ja tarkkuus (spesifiteetti) mielenkiinnon kohteena olevan taudin tai päätetapahtuman suhteen.
Huolimatta menetelmän yleisyydestä, herkkyyden ja tarkkuuden määritys ei ole kliinisesti hyödyllistä eivätkä ne ole käytännöllisiä mittareita. Molemmat mittarit ovat käänteisiä todennäköisyyksiä. Herkkyys kertoo, kuinka monella tutkituista oli sairaus, joilla testitulos oli positiivinen. Tarkkuus kertoo, kuinka monella tutkituista ei ollut sairautta, joilla testitulos oli negatiivinen.
Käänteinen todennäköisyys tarkoittaa, että sairauden todennäköisyys lasketaan, kun testitulos on jo tiedossa. Käytännön työssä tämä tarkoittaisi sitä, että lääkäri ottaa potilaalta verikokeen ja tulkitsee tuloksen vasta, kun potilaan diagnoosi on muuta kautta selvitetty. Näin ollen tämä lähestymistapa ei ole kovin hyödyllinen käytännön työssä.
Herkkyyden ja tarkkuuden määrittäminen perustuu yleensä receiver operating characteristic (ROC) -analyysiin. Sen lisäksi, että menetelmä perustuu käänteisiin todennäköisyyksiin, analyysi perustuu jatkuvan muuttujan muuttamiseen kaksiluokkaiseksi, mikä ei ole koskaan suotavaa.
Jos tutkimuksessa pyritään selvittämään testin X käytännöllisyyttä ja merkitystä, kannattaa tutkia testin hyötyä prediktiivisestä eli ennusteellisesta näkökulmasta. Olennaista olisi selvittää, mikä on sairauden todennäköisyys, kun testitulos on tiedossa. Edelliseen esimerkkiin viitaten tämä vastaisi tilannetta, jossa lääkäri pyrkii määrittämään potilaan diagnoosin laboratoriokokeen tuloksen perusteella. Herkkyys ja tarkkuus eivät anna tähän suoraan vastausta. Esimerkiksi logistisella regressiolla voidaan graafisesti kuvata, miten diagnostisen testin X arvot vaikuttavat päätetapahtuman todennäköisyyteen. Lisäksi viime kädessä diagnostisen testin hyöty tulisi arvioida vertaamalla ennustemallia, jossa ei ole mukana tutkittavaa testiä X sellaiseen ennustemalliin, jossa on mukana testi X. Jos testin X sisältävä ennustemalli ei paranna lainkaan taudin tai sairauden ennustekykyä, testi X ei ole kovin hyödyllinen.
Lopuksi
Edellä käytiin läpi yleisimpiä lääketieteellisiä tutkimuskysymyksiä ja -asetelmia. Erilaisia tutkimusasetelmia on luonnollisesti lähes rajattomasti ja varsinkin uusien menetelmien kuten koneoppimisen, tekoälyn ja genetiikan myötä syntyy myös uusia tutkimusasetelmia ja ne muuttuvat myös monimutkaisemmiksi. Liiaksi ei voi kuitenkaan korostaa sitä, että ennenkuin opettelemme näiden uusien menetelmien käytön, on erittäin tärkeää osata klassisen tilastotieteen käyttö ja metodologia ns. perinteisissä tutkimusasetelmissa.
Kirjoittanut Aleksi Reito, vertaisarvioinut Ville Ponkilainen, Lauri Raittio ja Mikko Uimonen.