skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

R programmeren | aan de slag met R programming op zateRdag

De 3-daagse zateRdag cursus programmeren in R vormt een inleiding in de populaire statistische softwarepakketten R en RStudio. Na deze cursus kan de cursist zelfstandig statistische analyses uitvoeren, visualiseren, resultaten beoordelen, en rapporteren met R en RStudio. R programming is één van de meest geavanceerde en flexibele statistiekprogramma’s en is bovendien open source (gratis). Het is in overleg mogelijk dat de cursisten voorbeelden aandragen uit hun eigen praktijk.

De zatRdag cursus programmeren in R wordt gegeven door docenten die zelf R-packages hebben ontwikkeld, boeken over R hebben gepubliceerd en dagelijks R gebruiken in hun werk als senior onderzoeker, universitair docent of hoogleraar.

De cursus R programming start iedere tweede zateRdag van de maand en duurt drie zateRdagen achter elkaar. We starten op de eerste dag van iedere cursus met een mini-brunch.

Inhoud van de winteR couRse programmeren in R

Tridata hecht er waarde aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen, dus om meteen toe te passen in de praktijk op basis van gedegen theorie. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten. In de cursus R programmeren ligt de focus op basisvaardigheden voor R, datamanagement en -bewerking, datavisualisatie en (geautomatiseerde) rapportage. De docenten werken zo veel mogelijk met Tidyverse en Tidyverse vriendelijke packages.

Dag 1: Introductie & Data Transformaties

  • Introductie in R & R Studio
    • Basis R : wat is een object; basis verschillende soorten objecten zoals een variabele met 1 waarde
    • Wat noemen we een vector (kolom)
    • Welke typen kolommen kunnen er zijn in een tabel (integer, double, string, logical, tekst, etc. )
  • Bewerkingen op tabellen
    • filteren van rijen, selecteren van kolommen, aanpassen van kolommen, toevoegen van kolommen, kolomnamen veranderen, geaggregeerde statistieken uitrekenen
  • Ketenen van opdrachten aan elkaar
  • Overzicht van verschillende typen plots (wanneer welke te gebruiken?)
    • Inleiding ggplot2

Dag 2: Datamanagement

  • Geavanceerde eigenschappen van kolommen
    • Werken met datums in tabellen
    • Categoriale variabelen (factoren) in tabellen
    • Werken met tekst
      • Basisbeginselen van Regular Expressions
      • Zoeken en vervangen van tekst
  • Data bestanden beheren
    • Inlezen van tabellen uit verschillende soorten bestanden
    • Exporteren van tabellen
    • Koppelen van tabellen
    • Herschikken van data (lange & brede tabellen)

Dag 3: Data Presentaties & Rapportage

  • Grafieken
    • Grafieken en exploratieve data-analyse (combinaties van typen variabelen in verschillende plots – wat maak je nu inzichtelijk met welk type plot)
    • Additionele mogelijkheden met grafieken (facetwraps & facet grids)
    • Aanpassen titels, vormen, kleuren & labellen punten
  • Maken van rapporten – R Markdown
    • Genereren van PDF, HTML of Word documenten
    • Dynamisch genereren van rapporten
    • Creëren van interactieve rapporten

Doelgroep

De cursus programmeren in R is bedoeld voor mensen met basiskennis van statistiek en statistische software, die bovendien ervaring willen opdoen met dit populaire statistische pakket.

Vereiste voorkennis

Om de deel te kunnen nemen aan de cursus programmeren in R wordt van de deelnemer een bepaald kennisniveau verwacht.
– Minimaal afgeronde HBO
– Basiskennis van ICT-systemen
– Basiskennis van basisstatistiek is een pré maar niet noodzakelijk

Tools

In de cursus wordt gewerkt met de meest recente versie van R en RStudio.

Het hebben van een eigen laptop is noodzakelijk. Het voordeel van een eigen laptop is dat je dan de software en opgaven in je eigen omgeving hebt, zodat je eenvoudig thuis aan de cursus kunt werken.

Cursusdata (Utrecht)
7, 14, 21 november 2020
28 november, 12, 19 december 2020

Een cursusdag duurt van 10:00 tot 16.00 uur. Op de eerste dag van elke cursus, beginnen wij met een mini-brunch om 9:30 uur. De minibrunch duurt 30 minuten.

De zateRdag R couRse wordt op drie opeenvolgende zateRdagen gegeven. Wil je liever de cursus doordeweekse volgen, check dan de reguliere Tridata R cursus.

Kosten en inschrijving van de zateRdag R course

De kosten van de 3-daagse zateRdag R course bedragen € 1375. De cursusprijs is vrijgesteld van BTW en is inclusief cursusmateriaal, het R for Data Science boek van Hadley Wickham Garrett Grolemund, deelnamecertificaat, koffie/thee en lunches.

Cursuslocatie

Europalaan 400, 5e verdieping | 3526 KS Utrecht

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– De R-cursus van Tridata is een multidisciplinaire cursus die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modelling en machine learning, statistical software development, tekstanalyse, text mining, datavisualisatie en -management.
– Tridata heeft in 2006 samen met de faculteit economie/econometrie van de Erasmus Universiteit R geïntroduceerd in Nederland.

De Docenten

Dr. Mark van der Loo studeerde Cum Laude af in de informatische chemie (een combinatie van scheikunde, wiskunde, en informatica) aan de Katholieke Universiteit Nijmegen. Na zijn promotie op een onderwerp uit de quantumfysica is hij werkzaam als statistisch onderzoeker bij het CBS met als specialiteit statistical computing and modelling, data cleaning en text processing. Over deze onderwerpen publiceert hij regelmatig op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, Python, en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipediapagina’s. Mark werkt sinds 2012 bij Tridata als consultant en docent.

Drs. Edwin de Jonge studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren te hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS met als specialiteit statistical computing and modelling, datamanagement en -visualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert in verschillende programmeertalen zoals C++, Javascript, Python en R. In die laatste taal ontwikkelde hij een package wat inmiddels meer dan 120 duizend keer per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.

Edwin en Mark zijn auteur van het boek ‘Learning R Statistical Computing with Rstudio‘ (Packt publishing, 2012) en werken momenteel, aan een boek over ‘Statistical Data Cleaning with Applications in R‘ (te verschijnen bij Wiley). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) genaamd “An introduction to data cleaning with R”

Back To Top