Johdanto Lääketieteelliseen tutkimukseen liittyvä tilastollinen päättely on perinteisesti nojannut hypoteesin testaukseen perustuviin menetelmiin. Tätä ei yleensä suoraan korosteta tilastotieteen opetuksessa tai tieteellisissä tutkimuksissa, vaan hypoteesin testaus on usein tietynlainen perusoletus käytettyjen menetelmien pohjana. Hypoteesin testaukseen liittyy kuitenkin tiettyjä ongelmia, jotka liittyvät myös olennaisesti ns. tutkimushukkaan. Hypoteesin testaus ei kuitenkaan ole ainoa mahdollinen lähestymistapa aineiston tilastolliseen ..
Yleistä Kuten aikaisemmin mainittu, logistinen regressio on erittäin suosittu tilastotieteellinen menetelmä. Varsinkin ns. riskitekijätutkimuksessa logistinen regressio on lähes kultainen standardi, jos kyseessä ei ole elinaika- eli survival-analyysi. Elinaika-analyysissä on tärkeää päätetapahtuman lisäksi huomioida aika, joka kuluu päätetapahtuman ilmaantumiseen. Logistista regressiota käytettäessä on keskeistä miettiä, mihin koko tutkimuksella ja tutkimuskysymyksillä pyritään. Kuten minkä tahansa monimuuttujamallin kohdalla, ..
Logistinen regressio on erittäin suosittu menetelmä lääketieteellisessä tutkimuksessa. Logistinen regressio ei ole oma, erillinen menetelmänsä vaan se on lineaarisen regressiomallin erityistapaus. Logistisessa regressiossa päätemuuttujana eli mallinnettavana muuttujana on jokin binaarinen eli dikotominen muuttuja, kuten kuolema tai leikkauskomplikaatio. Se siis tarkoittaa, että muuttuja voi saada vain arvon 0 tai 1, ‘kyllä’ tai ‘ei’. Lähtömuuttujat voivat olla ..
Funktionaalinen ohjelmointi (eng. functional programming) on R:n taustalla oleva ohjelmointiparadigma. Lyhyesti sanottuna kieli perustuu pääasiassa matemaattisten funktioiden käyttöön, ja tämä ominaisuus on yksi syy R:n suosion taustalla. R sisältää suuren määrän valmiita funktioita [kuten mean(), sd()], mutta lisäksi sillä on helppo luoda omia funktioita, sekä soveltaa purrr -paketin funktionaaliseen ohjelmointiin luotuja funktioita, joita voi käyttää ..
Erilaiset monimuuttujamallit ovat lääketieteellisen tutkimuksen yleisimpiä tilastollisia menetelmiä. Yleinen asetelma on se, että tutkimusaineistossa on useita muuttujia, joiden keskinäisiä vaikutuksia tiettyyn päätemuuttujaan halutaan selvittää. Oikein käytettynä monimuuttujamallit tarjoavat tähän erinomaisen työkalun. Monimuuttujamallien käyttöön liittyy kuitenkin runsaasti erilaisia virheellisiä toimintatapoja sekä sudenkuoppia. Tässä artikkelissa käydään läpi erilaisia käytännön näkökulmia monimuuttujamallien käyttöön ja tulkintaan. Oletuksena on, että ..
Keskeinen soveltavan tilastotieteen menetelmä lääketieteellisessä tutkimuksessa on ennustemallin laatiminen ja kehittäminen. Tavoite on tällöin arvioida, miten hyvin annetuilla lähtömuuttujilla voidaan ennustaa päätemuuttujaa ja miten hyvin lähtömuuttujat selittävät päätemuuttujan vaihtelua tai todennäköisyyttä. Myös lähtömuuttujien keskinäistä tärkeyttä kokonaisuuden kannalta voidaan arvioida ennustemallin näkökulmasta. Kokonaisselitysasteen R2 tutkiminen antaa tietoa, siitä miten hyvin lähtömuuttujilla voidaan selittää päätemuuttujan vaihtelua. Jos ..
Johdanto Hypoteesi on keskeinen käsite lääketieteellisessä tutkimuksessa kuten tieteessä ylipäätänsä. Hypoteesi tarkoittaa ehdotettua selitystä ilmiölle tai havainnolle. Tieteellisen hypoteesin määritelmänä on, että ehdotettua hypoteesia voidaan testata kokeellisesti. Tieteellisessä tutkimuksessa siis asetetaan hypoteeseja, joita testataan kokeellisella asetelmalla. Tämä tarkoittaa myös, että hypoteesin pohjalta yritetään ennustaa kokeellisen tutkimuksen havaintoja. Hypoteesi on eri asia kuin teoria. Teoria on ..
Erilaisten tutkimusasetelmien perusteiden ymmärtäminen on tärkeää niin tutkimuksen tekemisen kuin tutkimusten lukemisen osalta. Tässä artikkelissa käydään läpi erilaisia tutkimusasetelmia sekä metodologisia periaatteita siitä näkökulmasta, mikä on varsinainen tutkimuskysymys. Onko hoito A tehokkaampi kuin hoito B? Onko hoitojen A ja B välillä eroa tehokkuudessa? Onko hoidosta A hyötyä verrattuna lumehoitoon? Tämä on yksi keskeisimpiä tutkimuskysymyksiä lääketieteessä. ..
R SPSS Tulosten raportointi Tässä tapausesimerkissä pyrimme selvittämään, miten hyvin syöpäkuolleisuutta voidaan selittää väestön keskimääräisellä tulotasolla. Käytämme esimerkissä ilmaiseksi saatavilla olevaa aineistoa, jossa kuvataan syöpäkuolleisuutta sekä keskeisiä väestöllisiä muuttujia piirikunnittain Yhdysvalloissa. Aineisto on saatavilla osoitteesta: https://data.world/nrippner/ols-regression-challenge (vaatii kirjautumisen esimerkiksi Googlen, Twitterin, GitHubin tai Facebookin tunnuksilla). Aineisto sisältää 34 erilaista muuttujaa, joiden kuvaus löytyy ylläolevalta nettisivulta. ..
Tässä tapausesimerkissä pyrimme selvittämään, miten hyvin syöpäkuolleisuutta voidaan ennustaa saatavilla olevista väestötason muuttujista. Käytämme esimerkissä ilmaiseksi saatavilla olevaa aineistoa, jossa kuvataan syöpäkuolleisuutta sekä keskeisiä väestöllisiä muuttujia piirikunnittain Yhdysvalloissa. Aineisto on saatavilla osoitteesta: https://data.world/nrippner/ols-regression-challenge (vaatii kirjautumisen esimerkiksi Googlen, Twitterin, GitHubin tai Facebookin tunnuksilla). R – Siirry SPSS -esimerkkiin Aluksi lataamme aineiston R-ympäristöön komennolla read.csv(): Aineisto sisältää ..