Regressiokertoimien määrittäminen Regressiomallin kokonaisarviointi ja selitysaste Mallin virhe Regressiokertoimet Regressiodiagnostiikka Johdanto Lineaarinen regressio on kaikista selkein regressiomenetelmä. Se toimii eräänlaisena runkona monimutkaisemmille regressiomenetelmille, kuten yleiselle lineaariselle mallille. Jo tässä tässä vaiheessa lukijan on hyvä tiedostaa, että toinen erittäin yleinen regressiomenetelmä, logistinen regressio, on yleisen lineaarisen mallin erityistapaus eikä suinkaan oma erillinen menetelmänsä. Lineaarisen mallin pohjana ..
Sisältö ggplot2 Käyttö Pisteparvikuva (geom_point) Pylväsdiagrammi (geom_histogram() / geom_col() / geom_bar()) Viivakuvaaja (geom_line) Skaalat Fasetointi Teemat Kuvan tallentaminen Yhteenveto R-ohjelmointikielen suosiota selittää sen laajat mahdollisuudet aineiston eli datan visualisointiin ja jopa animointiin useilla helppokäyttöisillä paketeilla. R:n peruspaketissa (base) on luonnollisesti mahdollisuus tehdä helposti kuvioita. Lisäksi on kuitenkin suosittuja paketteja kuten ggplot2 ja lattice, joiden avulla ..
Johdanto Diagnostiikan ja hoidon ohella prognoosi eli ennuste on keskeinen elementti lääketieteessä. Ennustaminen (eng. prediction) eli ennustetutkimus tai prediktiivinen tutkimus on siksi yleistä lääketieteessä. Varsinkin monimuuttujamallien hyödyntäminen on keskeistä ennustetutkimuksessa. Prediktiivisen tutkimuksen yhtenä tarkoituksena on luoda kliinisen työn tueksi kliinisiä ennustemalleja ja -sääntöjä (eng. clinical prediction rule). Hyvä esimerkki on FINRISKI-laskuri (https://thl.fi/fi/web/kansantaudit/sydan-ja-verisuonitaudit/finriski-laskuri). Vastaavasti esimerkiksi eri ..
Tämä on päivittyvä artikkeli – edellinen päivitys 10.6.2021 Valtakunnalliset valmistuvan lääkärin osaamistavoitteet löytyvät osoitteesta: https://www.helsinki.fi/fi/laaketieteellinen-tiedekunta/valmistuvan-laakarin-osaamistavoitteet. Otsikon Kliininen tutkimus ja tieteellisyys alta löytyy tavoitekohta 24, jossa todetaan “Lääkäri osaa käyttää tieteellistä ajattelua ja tutkimusmenetelmiä sekä soveltaa niitä erilaisista lähteistä saatuun tietoon tehdessään hoitopäätöksiä“. Tämän alta löytyy edelleen seuraavat 9 kohtaa: 24.1 selittää näytönasteet ja niiden merkityksen ..
Johdanto Riskitekijä on jokaiselle lääkärille ja lääketieteen tutkijalle erittäin tuttu termi. Riskitekijöitä pyritään tunnistamaan ja niitä pyritään hoitamaan. Tutkimuksen näkökulmasta riskitekijä liittyy suoraan monimuuttumalleihin. Riskitekijöitä tutkitaan hyvin usein monimuuttujamalleilla. Monimuuttujamallissa on yksi tai useampi päätemuuttuja eli selitettävä (eng. dependent) muuttuja sekä yksi tai useampi lähtömuuttuja (eng. independent) eli selittävä muuttuja. Yleensä lähtömuuttujat rinnastetaan tutkittaviin riskitekijöihin. ..
DAGitty -sovellus löytyy osoitteesta dagitty.net. Valitse vasemmasta reunasta “Launch DAGitty online in your browser.” Tämän jälkeen selaimeen aukeaa oheinen vakionäkymä, jossa on piirrettynä muutamia muuttujia valmiiksi. Ennen oman kausaalimallin piirtämistä voit poistaa kaikki muuttujat, jotka ovat valmiina oletusarvoisesti. Ennen tätä klikkaa vasemmasta yläreunasta Variable -valikon kohdalta oikealle osoittavaa nuolta, jotta saat auki kyseisen valikon. Muuttujan ..
Artikkelissa hyödynnetään DAGitty -sovellusta. Pika-ohje sen käyttöön löytyy täältä. Johdanto Edellisessä artikkelissa kuvattiin selittämiseen liittyviä keskeisiä huomioita sekä teoreettista pohjaa selityssuhteille havainnoivassa tutkimuksessa. Tässä artikkelissa käydään läpi käytännön esimerkkejä siitä, miten selitysmalleja ja kausaalisuhteita voidaan hyödyntää harhan minimoimiseksi havainnoivassa tutkimuksessa. Aikaisemmassa artikkelissa kuvattiin miten sekoittava tekijä, mediaattori eli välitysmuuttuja ja collider-muuttuja tulisi huomioida selityssuhteiden osalta. ..
Taustaa Havainnoivassa tutkimuksessa keskeisintä on erottaa selittäminen ja ennustaminen. Selittäminen yhdistetään usein syy-seuraus-päättelyyn eli kausaalisuuteen. Tämän ympärille on syntynyt oma tilastotieteen osa-alue, ns. kausaali-inferenssi (eng. causal inference). Siinä keskitytään asioiden ja ilmiöiden selittämiseen eikä vain muuttujien väliseen korrelaatioon tai assosiaatioon. Yksinkertaistettuna selittäminen tarkoittaa kahden muuttujan välisen yhteyden tutkimista. Perinteisiä esimerkkejä ovat esimerkiksi äidin tupakoinnin vaikutus ..
Monimuuttujamallit ovat yleisesti käytettyjä tilastollisia menetelmiä lääketieteellisessä tutkimuksessa. Kuten nimikin kertoo, monimuuttujamallissa on mukana useita eri muuttujia. Monimuuttujamallien avulla pystytään tutkimaan useiden muuttujien välisiä vaikutussuhteita, mikä tekee malleista hyvin joustavia palvelemaan useita erilaisia tavoitteita. Muuttujien valintamenetelmät ja mallin antamien tulosten tulkinta riippuvatkin puhtaasti siitä, mikä on tutkimuksen tavoite ja miten malli on rakennettu. Yleensä monimuuttujamalleja ..
Tidy Data (suom. siisti, puhdas) on aineiston muoto, jonka tilastotieteilijä Hadley Wickham on tehnyt tunnetuksi. Tidy -muotoa kannattaa useimmiten pitää ensimmäisenä tavoitteena aineiston puhdistuksessa. Kun aineisto on siistissä muodossa, on sitä helpompi lukea, muokata sekä analysoida. Tidy Data pohjautuu kolmeen periaatteeseen: Jokainen muuttuja on omassa sarakkeessaan Jokainen havainto on omalla rivillään Jokainen arvo on omassa ..