Author : Ville

Funktionaalinen ohjelmointi (eng. functional programming) on R:n taustalla oleva ohjelmointiparadigma. Lyhyesti sanottuna kieli perustuu pääasiassa matemaattisten funktioiden käyttöön, ja tämä ominaisuus on yksi syy R:n suosion taustalla. R sisältää suuren määrän valmiita funktioita [kuten mean(), sd()], mutta lisäksi sillä on helppo luoda omia funktioita, sekä soveltaa purrr -paketin funktionaaliseen ohjelmointiin luotuja funktioita, joita voi käyttää ..

Read more

Sisältö ggplot2 Käyttö Pisteparvikuva (geom_point) Pylväsdiagrammi (geom_histogram() / geom_col() / geom_bar()) Viivakuvaaja (geom_line) Skaalat Fasetointi Teemat Kuvan tallentaminen Yhteenveto R-ohjelmointikielen suosiota selittää sen laajat mahdollisuudet aineiston eli datan visualisointiin ja jopa animointiin useilla helppokäyttöisillä paketeilla. R:n peruspaketissa (base) on luonnollisesti mahdollisuus tehdä helposti kuvioita. Lisäksi on kuitenkin suosittuja paketteja kuten ggplot2 ja lattice, joiden avulla ..

Read more

Tidy Data (suom. siisti, puhdas) on aineiston muoto, jonka tilastotieteilijä Hadley Wickham on tehnyt tunnetuksi. Tidy -muotoa kannattaa useimmiten pitää ensimmäisenä tavoitteena aineiston puhdistuksessa. Kun aineisto on siistissä muodossa, on sitä helpompi lukea, muokata sekä analysoida. Tidy Data pohjautuu kolmeen periaatteeseen: Jokainen muuttuja on omassa sarakkeessaan Jokainen havainto on omalla rivillään Jokainen arvo on omassa ..

Read more

Kun aineisto on saatu ajettua R-ympäristöön, on seuraavaksi syytä tutustua siihen tarkemmin ja tarkistaa että muuttujat ovat oikeassa muodossa, jotta ne käyttäytyvät analyyseissä halutulla tavalla. Varsinkin alkuvaiheessa välttyy useilta turhauttavilta erroreilta jos muuttujat ovat halutussa muodossa. Kaikki R-kielessä käytetyilä muuttujilla on oma luokka (class), joka vaikuttaa muuttujan käyttömahdollisuuksiin. Datan käsittelyssä yleisimpiä luokkia ovat: character eli ..

Read more

R on ilmainen ohjelmointikieli, jonka vahvuutena ovat datan muokkaamiseen sekä analysointiin keskittyvät avoimesti saatavilla olevat paketit (package). R on suosittu ohjelmointikieli data-analytiikassa, ja se on erityisesti tunnettu huipputason graafisista kuvaajista, joita ohjelmistolla on helppo luoda. R:llä pystyy tekemään kaiken tarvittavan datan putsaamisesta ja perusanalyyseistä aina koneoppimiseen ja tekoälyyn saakka. R:llä on myös mahdollista tehdä jopa ..

Read more