Funktionaalinen ohjelmointi (eng. functional programming) on R:n taustalla oleva ohjelmointiparadigma. Lyhyesti sanottuna kieli perustuu pääasiassa matemaattisten funktioiden käyttöön, ja tämä ominaisuus on yksi syy R:n suosion taustalla. R sisältää suuren määrän valmiita funktioita [kuten mean(), sd()], mutta lisäksi sillä on helppo luoda omia funktioita, sekä soveltaa purrr -paketin funktionaaliseen ohjelmointiin luotuja funktioita, joita voi käyttää ..

Read more

Erilaiset monimuuttujamallit ovat lääketieteellisen tutkimuksen yleisimpiä tilastollisia menetelmiä. Yleinen asetelma on se, että tutkimusaineistossa on useita muuttujia, joiden keskinäisiä vaikutuksia tiettyyn päätemuuttujaan halutaan selvittää. Oikein käytettynä monimuuttujamallit tarjoavat tähän erinomaisen työkalun. Monimuuttujamallien käyttöön liittyy kuitenkin runsaasti erilaisia virheellisiä toimintatapoja sekä sudenkuoppia. Tässä artikkelissa käydään läpi erilaisia käytännön näkökulmia monimuuttujamallien käyttöön ja tulkintaan. Oletuksena on, että ..

Read more

Keskeinen soveltavan tilastotieteen menetelmä lääketieteellisessä tutkimuksessa on ennustemallin laatiminen ja kehittäminen. Tavoite on tällöin arvioida, miten hyvin annetuilla lähtömuuttujilla voidaan ennustaa päätemuuttujaa ja miten hyvin lähtömuuttujat selittävät päätemuuttujan vaihtelua tai todennäköisyyttä. Myös lähtömuuttujien keskinäistä tärkeyttä kokonaisuuden kannalta voidaan arvioida ennustemallin näkökulmasta. Kokonaisselitysasteen R2 tutkiminen antaa tietoa, siitä miten hyvin lähtömuuttujilla voidaan selittää päätemuuttujan vaihtelua. Jos ..

Read more

Johdanto Hypoteesi on keskeinen käsite lääketieteellisessä tutkimuksessa kuten tieteessä ylipäätänsä. Hypoteesi tarkoittaa ehdotettua selitystä ilmiölle tai havainnolle. Tieteellisen hypoteesin määritelmänä on, että ehdotettua hypoteesia voidaan testata kokeellisesti. Tieteellisessä tutkimuksessa siis asetetaan hypoteeseja, joita testataan kokeellisella asetelmalla. Tämä tarkoittaa myös, että hypoteesin pohjalta yritetään ennustaa kokeellisen tutkimuksen havaintoja. Hypoteesi on eri asia kuin teoria. Teoria on ..

Read more

Erilaisten tutkimusasetelmien perusteiden ymmärtäminen on tärkeää niin tutkimuksen tekemisen kuin tutkimusten lukemisen osalta. Tässä artikkelissa käydään läpi erilaisia tutkimusasetelmia sekä metodologisia periaatteita siitä näkökulmasta, mikä on varsinainen tutkimuskysymys. Onko hoito A tehokkaampi kuin hoito B? Onko hoitojen A ja B välillä eroa tehokkuudessa? Onko hoidosta A hyötyä verrattuna lumehoitoon? Tämä on yksi keskeisimpiä tutkimuskysymyksiä lääketieteessä. ..

Read more

R SPSS Tulosten raportointi Tässä tapausesimerkissä pyrimme selvittämään, miten hyvin syöpäkuolleisuutta voidaan selittää väestön keskimääräisellä tulotasolla. Käytämme esimerkissä ilmaiseksi saatavilla olevaa aineistoa, jossa kuvataan syöpäkuolleisuutta sekä keskeisiä väestöllisiä muuttujia piirikunnittain Yhdysvalloissa. Aineisto on saatavilla osoitteesta: https://data.world/nrippner/ols-regression-challenge (vaatii kirjautumisen esimerkiksi Googlen, Twitterin, GitHubin tai Facebookin tunnuksilla). Aineisto sisältää 34 erilaista muuttujaa, joiden kuvaus löytyy ylläolevalta nettisivulta. ..

Read more

Tässä tapausesimerkissä pyrimme selvittämään, miten hyvin syöpäkuolleisuutta voidaan ennustaa saatavilla olevista väestötason muuttujista. Käytämme esimerkissä ilmaiseksi saatavilla olevaa aineistoa, jossa kuvataan syöpäkuolleisuutta sekä keskeisiä väestöllisiä muuttujia piirikunnittain Yhdysvalloissa. Aineisto on saatavilla osoitteesta: https://data.world/nrippner/ols-regression-challenge (vaatii kirjautumisen esimerkiksi Googlen, Twitterin, GitHubin tai Facebookin tunnuksilla). R – Siirry SPSS -esimerkkiin Aluksi lataamme aineiston R-ympäristöön komennolla read.csv(): Aineisto sisältää ..

Read more

Regressiokertoimien määrittäminen Regressiomallin kokonaisarviointi ja selitysaste Mallin virhe Regressiokertoimet Regressiodiagnostiikka Johdanto Lineaarinen regressio on kaikista selkein regressiomenetelmä. Se toimii eräänlaisena runkona monimutkaisemmille regressiomenetelmille, kuten yleiselle lineaariselle mallille. Jo tässä tässä vaiheessa lukijan on hyvä tiedostaa, että toinen erittäin yleinen regressiomenetelmä, logistinen regressio, on yleisen lineaarisen mallin erityistapaus eikä suinkaan oma erillinen menetelmänsä. Lineaarisen mallin pohjana ..

Read more

Sisältö ggplot2 Käyttö Pisteparvikuva (geom_point) Pylväsdiagrammi (geom_histogram() / geom_col() / geom_bar()) Viivakuvaaja (geom_line) Skaalat Fasetointi Teemat Kuvan tallentaminen Yhteenveto R-ohjelmointikielen suosiota selittää sen laajat mahdollisuudet aineiston eli datan visualisointiin ja jopa animointiin useilla helppokäyttöisillä paketeilla. R:n peruspaketissa (base) on luonnollisesti mahdollisuus tehdä helposti kuvioita. Lisäksi on kuitenkin suosittuja paketteja kuten ggplot2 ja lattice, joiden avulla ..

Read more

Johdanto Diagnostiikan ja hoidon ohella prognoosi eli ennuste on keskeinen elementti lääketieteessä. Ennustaminen (eng. prediction) eli ennustetutkimus tai prediktiivinen tutkimus on siksi yleistä lääketieteessä. Varsinkin monimuuttujamallien hyödyntäminen on keskeistä ennustetutkimuksessa. Prediktiivisen tutkimuksen yhtenä tarkoituksena on luoda kliinisen työn tueksi kliinisiä ennustemalleja ja -sääntöjä (eng. clinical prediction rule). Hyvä esimerkki on FINRISKI-laskuri (https://thl.fi/fi/web/kansantaudit/sydan-ja-verisuonitaudit/finriski-laskuri). Vastaavasti esimerkiksi eri ..

Read more