Hypoteesia luomassa, vahvistamassa vai jälkikäteen keksimässä?

Tieteen filosofia Ei kommentteja

Johdanto

Hypoteesi on keskeinen käsite lääketieteellisessä tutkimuksessa kuten tieteessä ylipäätänsä. Hypoteesi tarkoittaa ehdotettua selitystä ilmiölle tai havainnolle. Tieteellisen hypoteesin määritelmänä on, että ehdotettua hypoteesia voidaan testata kokeellisesti. Tieteellisessä tutkimuksessa siis asetetaan hypoteeseja, joita testataan kokeellisella asetelmalla. Tämä tarkoittaa myös, että hypoteesin pohjalta yritetään ennustaa kokeellisen tutkimuksen havaintoja.

Hypoteesi on eri asia kuin teoria. Teoria on selitysmalli, jota tarkastellaan kun tutkimusaineisto on kerätty. Teorialla pyritään selittämään havaittua aineistoa ja siinä havaittuja säännönmukaisuuksia. Teorian pohjalta voidaan laatia hypoteeseja uusia tutkimuksia varten.

Hypotetiko-deduktiivinen prosessi

Ei ole olemassa yhtä oikeaa tieteenkäsitystä tai -menetelmää eli tapaa tehdä tiedettä. Tärkeintä on, että tieteellisessä diskurssissa kerrotaan mahdollisimman avoimesti käytettyyn menetelmään liittyvät oletukset ja teoriat. Yksi lääketieteeseen soveltuva tieteenmenetelmä on hypotetiko-deduktiivinen lähestyminen.

Yksinkertaisimmillaan hypotetiko-deduktiivisessa (HD) -asetelmassa asetetaan yksi hypoteesi, joka on laadittu aiemman kirjallisuuden tai kokemusperäisen tiedon pohjalta. Hypoteesi voi esimerkiksi olettaa, että fysioterapeutin ohjaus vähentää potilaan kokemaa kroonista selkäkipua 3 kuukauden seurannassa verrattuna pelkkään suulliseen ohjeistukseen. Hypoteesin asettamisen jälkeen kerätään aineisto, jonka perusteella testataan hypoteesia. Ideaalitilanteessa aineisto kerätään tätä varten laaditulla kokeellisella asetelmalla, kuten satunnaistetulla vertailututkimuksella. Siinä potilaat satunnaistetaan saamaan joko fysioterapeutin ohjausta tai kotihoito-ohjeita. Aineiston keräämisen jälkeen tehdään tilastollinen analyysi. Lopuksi tehdään tilastolliset päätelmät analyysien pohjalta.

Filosofisemmalta kannalta HD-asetelmassa voidaan joko saada tukea tai vahvistusta (konfirmaatio) hypoteesille tai hylätä hypoteesi. Käytännön kannalta loppupäätelmä voi olla esimerkiksi, että fysioterapeutin ohjaus vähentää kipua tietyn määrän tietyssä ajassa tai että fysioterapeutin ohjauksella ei ollut osoitettavaa, kliinisesti merkitsevää vaikutusta selkäkipuun. Toisaalta voidaan myös päätellä, että tutkimuksen perusteella ei voida päätellä mitään tulosten perusteella, jos niihin sisältyy huomattava epätarkkuus.

Hypotetiko-deduktiivista tieteenmenetelmää hyödyntävää tutkimusta kutsutaan joskus myös hypoteesin vahvistavaksi eli konfirmatoriseksi tutkimukseksi (eng. hypothesis driven, confirmatory). Keskeistä on se, että tutkimuksen hypoteesi on selkeästi dokumentoitu ennen tutkimuksen aloittamista tai aikaisemmassa kirjallisuudessa on selkeästi kuvattu tutkimushypoteesin olemassa olo, jota on sittemmin lähdetty testaamaan.

Hypoteesin tuottava tutkimus

Jos tutkimuksessa ei ole selkeää hypoteesia, vaan tutkimus on havainnoiva tai kokeileva (≠kokeellinen), kyseessä on ns. hypoteesin tuottava tutkimus (eng. hypothesis generating, exploratory). Suurin osa lääketieteellisestä tutkimuksesta on hypoteesin tuottavaa tutkimusta.

Hypoteesin tuottavassa tutkimuksessa saattaa olla testattavana useita, jopa kymmeniä hypoteeseja samanaikaisesti. Tällainen on esimerkiksi tutkimus, jossa käytetään kymmeniä tai satoja muuttujia sisältävää sairausrekisteriaineistoa. Yksi muuttujista saattaa olla kliinisesti selkeä päätulosmuuttuja, kuten kuolleisuus. Muut muuttujat voivat olla esimerkiksi erilaisia lähtötietoja kuten ikä, sukupuoli ja muut sairaudet. Jokaisen muuttujan yhteys päätemuuttujaan voidaan testata tilastollisesti ns. yksimuuttuja-analyysissä. Jokaisella testillä on tällöin oma hypoteesinsa. Toisaalta analyysiin voidaan ottaa erilaisia ryhmiä lähtömuuttujia ja jälleen jokainen monimuuttuja-analyysi muodostaa oman hypoteesin, miten lähtömuuttujat vaikuttavat päätemuuttujaan.

Vaikka yksittäinen lähtömuuttuja olisikin selvästi yhteydessä kuoleman riskiin, päättelyssä pitää aina ottaa huomioon tutkimuksen kokeileva ja havainnoiva lähestyminen. Keskeinen ongelma kokeellisessa tai hypoteesin tuottavassa tutkimuksessa ovat satunnaisvaihtelun aikaansaamat “positiiviset” löydökset, jos analyysi perustuu p-arvojen ja luottamusvälien määritykseen.

Otetaan esimerkkinä tutkimus, jossa on 20 muuttujaa, joilla ei ole minkäänlaista osoitettavaa yhteyttä päätulosmuuttujaan: tällöin satunnaisvaihtelu saa aikaan, että ainakin yksi näistä muuttujista on tilastollisesti merkitsevä 64 %:n todennäköisyydellä, kun merkitsevyystasona pidetään p-arvoa 0,05.

Kokeilevassa tai selkeästi hypoteesia tuottavassa tutkimusasetelmassa on kyseenalaista tehdä yksiselitteisiä päätelmiä tutkimustuloksista. Tutkimuksessa on voinut ollut esimerkiksi 10 lähtömuuttujaa, joista yhden kohdalla on voitu osoittaa tilastollinen yhteys päätemuuttujaan. Kyseenalainen käytäntö on nostaa juuri tämä yksittäinen löydös merkittävimmäksi havainnoksi ja rakentaa tutkimus tämän havainnon ympärille.

Parempi tapa on raportoida avoimesti kaikki testatut muuttujat, pohtia monitestauksen ongelmaa sekä todeta, että kyseessä oli kokeellinen lähestyminen esimerkiksi kuoleman tai muun päätetapahtuman riskitekijöihin. “Monitestauksen ongelma” (eng. multiple testing problem) on perinteinen tilastotieteellinen haaste, johon esitetty lukuisia ratkaisuehdotuksia historian saatossa.

HARKing

Erityinen ongelma tutkimuksessa muodostuu sellaisessa tilanteessa, jossa ei ole läpinäkyvästi kerrottu aineiston ja tutkimuksen luonteesta, vaan esitetään vain merkitykselliset tulokset. Kaikkein huonoin ja eniten väärä tapa on esittää tutkimuksessa ns. a priori (lat. ennen tutkimusta) -hypoteesi, joka on todellisuudessa laadittu vasta analyysien jälkeen. Tällöin puhutaan HARKing -ilmiöstä (eng. hypothetising after results are known, hypoteesin asettaminen tulosten analysoinnin jälkeen). Termin kuvasi psykologi Norbert Kerr vuonna 1998. On varsin oletettavaa, että HARKing on erittäin yleistä lääketieteellisessä tutkimuksessa. Sitä tapahtuu sekä tiedostamatta että tiedostetusti. Alla olevassa taulukossa on kuvattu Kerrin (1998) alkuperäisessä työssä kuvatut tieteenfilosofiset ongelmat, jotka ovat seurausta HARKingista.

HARKing aiheuttaa tyypin 1 virheen vaihtumisen teoriaksi
Tyypin 1 virhe tarkoittaa, että nollahypoteesi on hylätty virheellisesti eli nollahypoteesi pitää oikeasti paikkansa. Tämä tarkoittaa esimerkiksi, että ryhmien välillä on päätelty olevan ero keskiarvoissa vaikka näin ei ole todellisuudessa ole. Yksittäisen tutkimuksen jälkeen tyypin 1 virhettä ei kuitenkaan voida koskaan arvioida. Koska satunnaisvaihtelu saa aikaan sen, että osa tuloksista on aina tilastollisesti merkitseviä, HARKing johtaa siihen, että todellisuudessa satunnaisvaihtelun aikaan saama löydös esitetään ikäänkuin tutkimusta edeltävänä hypoteesina, joka on vahvistettu ja jälkikäteen tulkittu havainnon selittäväksi teoriaksi.
HARKing ei noudata perinteistä hypoteesin falsifikaatiota
Karl Popper, yksi kuuluisimmasta tieteen filosofeista totesi, että oikea tieteellinen hypoteesi on sellainen, joka on mahdollista kokeellisesti osoittaa vääräksi. HARKingin seurauksena hypoteesi asetetaan tutkimuksen jälkeen, mikä tarkoittaa, että sitä ei ole koskaan yritettykään osoittaa vääräksi.
HARKing suhteessa hypoteesin akkommodaatioon ja ennusteellisuuteen
Selitys tai hypoteesi, joka on laadittu vasta tutkimuksen jälkeen on todennäköisesti useammin väärä kuin hypoteesi, jonka pohjalta tulokset ennustettiin oikein. Tutkimuksen ja tulosten analysoinnin jälkeen laadittu hypoteesi selittääkin vain kyseiset tulokset, kun hypoteesin pohjalta tehty ennustus toistunee uusissakin tutkimuksissa.
HARKing seurauksena tärkeää tietoa alkuperäisestä hypoteesista menetetään
Tutkimuksessa on saattanut olla hyvin perusteltu, kirjallisuuteen pohjaava hypoteesi. Jos tutkija kuitenkin syyllistyy HARKingiin ja ei esitäkään tätä alkuperäistä hypoteesia, menetetään arvokasta tietoa ja muita tutkijoita hyödyttävää pohdintaa liittyen alkuperäiseen hypoteesiin.
HARKing johtaa vääristyneeseen tapaan tehdä tiedettä
Jos HARKing on yleistä ja hyväksyttävää, se ei edistää oikeaa ja hyvää tapaa tehdä tieteellisiä havaintoja ja tutkimuksia.
HARKing voi edistää tilastollista väärinkäytöstä
Tilastollisella väärinkäytöksellä ja eri tilastomenetelmien kokeilulla voidaan valikoida sopivin hypoteesi ja esittää post hoc -hypoteesi ikään kuin se olisi ollut alunperin a priori asetettu hypoteesi.
HARKing voi edistää "kyynisyyttä" ja kyseenalaisia menetelmiä
Tiedemaailman käytännöt, kuten lehtien vaatimukset ja yleinen "julkaise tai katoa" -asenne, voi edellyttää erilaisen sanoman ja viestin kertomista kuin mitä todellisuudessa havaittiin tai oli suunniteltu
HARKing voi vaikeuttaa uusien havaintojen tekemistä
Jos tutkijalla on vahvoja näkemyksiä ja asenteita, joita hän ei muuta tai joista hän ei jousta, HARKing voi vaikeuttaa uusien havaintojen ja löydösten raportointia.
HARKing voi luoda kapea-alaisia hypoteeseja.
Hypoteesin on tarkoitus olla universaali ja aiempaa tietoa integroiva. HARKing voi johtaa hypoteesiin, joka ei ole kumpaakaan, koska se pohjataan vain käsillä olevaan aineistoon tai havaittuun ilmiöön.
HARKing luo väljiä ja heikkoja hypoteeseja.
Jos tutkimustulos on yllättävä, voi HARKing johtaa hypoteesiin, jota ei voida testata kunnolla tai hyödyntää uusien teoreettisten ennustusten pohjana.
HARKing voi estää vaihtoehtoisten hypoteesien kehittämisen
Hyvä käytäntö on pohtia vaihtoehtoisia hypoteeseja, jos kyseessä oli puhtaasti kokeileva tai havainnoiva tutkimus. HARKing kuitenkin johtaa tilanteeseen, jossa vain yksi hypoteesi nostetaan esille eikä tuoda esille tai pohdita muita mahdollisia vaihtoehtoja.

Hollenbeck ja Wright (2017) ehdottivat kahta eri alatyyppiä HARKingille. Heidän mukaan kyseeseen voi olla Sharking (eng. Secretly HARKing in the Introduction section) tai Tharking (eng. Transparently HARKing in the Discussion section). Termit ovat melko selkeitä. Sharking tarkoittaa räikeää HARKingia, jossa tutkija on ensin analysoinut aineistoaan ja tehnyt sitten tutkimuslöydöksen, jota varten aineistoa ei kuitenkaan alun perin kerätty. Tämän jälkeen tutkija esittää tutkimuksensa alussa laajalti ja näennäisesti perustellun hypoteesin ikään kuin se olisi ollut alun perin aineiston keräämisen tarkoitus.

Tharking tarkoittaa tilannetta, jossa tutkija on tehnyt vastaavassa tilanteessa vastaavan löydöksen, mutta tutkija lopuksi täysin avoimesti kertoo, että hypoteesi laadittiin vasta, kun tulokset olivat selvillä ja pohtii tämän merkitystä kokonaisuuden kannalta. Keskeistä on siis, että tutkija on täysin avoin menetelmistään vaikka olisi toiminut HARKingin tavoin.

Ennakkorekisteröinti ennen kaikkea

Hypoteesin vahvistava tutkimus on useimmiten sokkoutettu ja satunnaistettu vertaileva tutkimus. Tällainen tutkimus pohjaa yleensä johonkin hypoteesiin lääkkeen tai hoitomenetelmän tehosta tai sen puutteesta. Nykyään tällaiset tutkimukset pitää olla lähes poikkeuksetta ennakkorekisteröity, ja keskeistä on nimenomaan päätulosmuuttujan määrittäminen. Keskeisin tavoite ennakkorekisteröinnillä on todentaa, että kyseessä on todella hypoteesin vahvistava tutkimus, ja hypoteesia testataan ennakkoon kerrotuilla menetelmillä.

Ennakkorekisteröinti on suositeltavaa myös muun tyyppisille tutkimuksille, kuten prospektiivisille seurantatutkimuksille. Tämä vähentää tutkijan vapausasteita liittyen tulosten analyysiin ja tulkintaan sekä ns. ”kalastelua”. Näillä tarkoitetaan erilaisia tapoja käsitellä aineistoa sekä tehdä tilastollisia testejä, joilla saattaa olla päinvastaisia vaikutuksia lopulliseen tutkimustulokseen.

Kun menetelmät ja päätulosmuuttujat on ennakkorekisteröity ja tutkimus on rakentunut ennen tutkimusta laaditun hypoteesin pohjalle, tulos on paljon luotettavampi kuin hypoteesin tuottavassa tutkimuksessa. Konfirmatoriset tutkimukset ovatkin keskeisiä tieteen kehityksessä. Hypoteesin tuottava tutkimus on luonnollisesti myös tärkeää kehityksen kannalta, mutta se edellyttää tutkijoilta rehellisyyttä ja läpinäkyvyyttä.

Lopuksi

Jokaisella tieteellisellä tutkimuksella pitää olla jokin hypoteesi tai tutkimuskysymys. Tutkimusaineiston avulla pyritään saamaan tukea hypoteesille tai saamaan vastaus tutkimuskysymykseen. Keskeistä on, että hypoteesi tai tutkimuskysymys on laadittu ennen aineiston keräämistä. Toisinaan selkeää hypoteesia tai tutkimuskysymystä ei ole tai niitä on hyvin paljon. Tällöin aineistosta voidaan tehdä useita erilaisia analyysejä. Tässä ei ole periaatteellisesti mitään väärää, kunhan tutkija on täysin avoin ja läpinäkyvästi raportoi monitestausasetelman. Myös päätelmien suhteen pitää tällöin olla erittäin varovainen. HARKing on yksi suurimpia syitä tieteellisen tutkimukseen huonoon laatuun sekä toistettavuusongelmiin.

Kirjoittanut Aleksi Reito.

Mitä mieltä olit artikkelin sisällöstä?

Klikkaa tähteä arvostellaksi artikkelin!

Keskiarvo 4.3 / 5. Arvostelujen lukumäärä: 6

Kukaan ei ole vielä äänestänyt, ole ensimmäinen

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *