Cursus programmeren in R: Statistical Programming with R
De cursus programmeren in R vormt een eerste inleiding op de zeer populaire statistische softwarepakketten R Statistical Programming en RStudio. Hierdoor kan de cursist na de cursus zelfstandig statistische analyses uitvoeren, resultaten beoordelen, visualiseren, en rapporteren met R Statistical Programming en RStudio. Aangezien R Statistical Programming op dit moment één van de meest geavanceerde en flexibele statistische programma’s is en de leidende programmeertaal in Data Science, statistiek, data-analyse en datavisualisaties, is het een waardevolle vaardigheid om te leren. Bovendien is R Statistical Programming open source (gratis).
Ervaren docenten
U krijgt les van docenten die zelf R-packages hebben geschreven, R-boeken hebben gepubliceerd en dagelijks R Statistical Programming gebruiken in hun werk als senior onderzoeker, universitair docent of hoogleraar. Daarnaast is het in overleg mogelijk dat de cursisten voorbeelden aandragen uit hun eigen praktijk.
Onderaan deze pagina vindt u een link naar de pagina: R en R Studio installeren en testen.
Duur van de cursus: 3 dagen of 5 dagen
De cursist heeft de mogelijkheid om slechts 3 dagen te volgen. Tijdens dag 1 t/m dag 3 ligt de focus op het aanleren van R-(RStudio)vaardigheden, datamanagement, databewerking, datavisualisatie en (geautomatiseerde) rapportage. In dag 4 en dag 5 wordt aandacht besteed aan een aantal statistische modellen, toetsen en functioneel programmeren (looping, cycling, iterating). De docenten werken zo veel mogelijk met Tidyverse packages.
Inhoud van de cursus programmeren in R
Tridata hecht er waarde aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen, zodat er op basis van gedegen theorie meteen wordt toegepast in de praktijk. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten.
Dag 1: Introductie en Data Transformaties
- Introductie in R programmeren en RStudio
- Basis R programmeren: wat is een object; basis verschillende soorten objecten, zoals een variabele met 1 waarde
- Wat noemen we een vector (kolom)
- Welke typen kolommen kunnen er zijn in een tabel (integer, double, string, logical, tekst, etc.)
- Bewerkingen op tabellen
- Filteren van rijen, selecteren van kolommen, aanpassen van kolommen, toevoegen van kolommen, kolomnamen veranderen, geaggregeerde statistieken uitrekenen
- Ketenen van opdrachten aan elkaar
- Overzicht van verschillende typen plots (wanneer welke te gebruiken?)
- Inleiding ggplot2
Dag 2: Datamanagement
- Geavanceerde eigenschappen van kolommen
- Werken met datums in tabellen
- Categoriale variabelen (factoren) in tabellen
- Werken met tekst
- Basisbeginselen van Regular Expressions
- Zoeken en vervangen van tekst
- Databestanden beheren
- Inlezen van tabellen uit verschillende soorten bestanden
- Exporteren van tabellen
- Koppelen van tabellen
- Herschikken van data (lange & brede tabellen)
Dag 3: Datapresentaties & Rapportage
- Grafieken
- Grafieken en exploratieve data-analyse (combinaties van typen variabelen in verschillende plots – wat maak je nu inzichtelijk met welk type plot)
- Additionele mogelijkheden met grafieken (facetwraps & facet grids)
- Aanpassen titels, vormen, kleuren & labelen punten
- Maken van rapporten – R Markdown
- Genereren van PDF, HTML of Worddocumenten
- Dynamisch genereren van rapporten
- Creëren van interactieve rapporten
Dag 4: Modellen en Functies
- Modelleren in R
- Lineaire modellen en residuen – beschrijving, toepassingen & selectie van variabelen
- Logistische modellen
Dag 5: Statistiek & Geavanceerde Analyses
- Statistiek in R
- Kruistabellen
- Statistische toetsen (t-toets, chi-kwadraattoets)
- Verschillende klassen/type objecten in R (vectoren, lijsten)
- Verandering van type object
- Functioneel programmeren: itereren van bewerkingen aan tabellen over meerdere argumenten tegelijkertijd (m.b.v. purrr)
Doelgroep
Deze cursus programmeren in R is bedoeld voor personen met enige kennis van statistiek en statistische software, die ervaring willen opdoen met dit zeer populaire, en bovendien gratis, statistische pakket.
Vereiste voorkennis
Enige bekendheid met basisstatistiek wordt voorondersteld.
Tools
In de R cursus wordt werkt met de meest recente versie van R en RStudio.
Cursusdata
11 december, 18 december 2024, 8 januari, 15 januari, 22 januari 2025
30 januari, 6 februari, 13 februari, 6 maart, 13 maart 2025
20 maart, 27 maart, 3 april, 10 april, 17 april 2025
23 april, 30 april, 7 mei, 14 mei, 21 mei 2025
27 mei, 3 juni, 10 juni, 17 juni, 24 juni 2025
Studiebelasting
De R cursus duurt 5 dagen (één dag per week). Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.
Lestijden
De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.
Kosten en inschrijving:
De kosten van de 5-daagse cursus programmeren in R bedragen €2275 i.p.v. € 2750** . Als je ervoor kiest om slechts 3-daagse te volgen dan bedragen de kosten €1475 i.p.v. €1650**. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie/thee en lunches. Het naslagwerk “R for Data Science,” behorend bij de R cursus, is niet inbegrepen in de cursusprijs, maar de pdf-versie is online ( op de site van de auteurs) vrij verkrijgbaar.
** Deze actie is geldig van vrijdag 8 november tot vrijdag 6 december 2024.
In-company en maatwerk
De cursus programmeren in R kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die binnen jouw organisatie plaatsvindt. Hebben meerdere collega’s in jouw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s. Voor meer informatie kunt u contact met ons opnemen.
Cursuslocatie
Europalaan 400 | 3526 KS Utrecht
Waarom de cursus volgen bij Tridata?
– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– De R cursus van Tridata wordt gegeven door docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, tekstmining, datavisualisatie en datamanagement.
– Tridata heeft samen met de Faculteit Economie/Econometrie van de Erasmus Universiteit, R geïntroduceerd in Nederland.
De docenten
Dr. Mark van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Sinds zijn promotie op een onderwerp uit de quantumfysica is hij werkzaam als statistisch onderzoeker bij het CBS, met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, Python, en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipedia pagina’s. Mark werkt sinds 2012 als consultant en docent voor Tridata.
J. (Jolien) Oomens, MSc. is cum laude afgestudeerd in de wiskunde aan de universiteit van Amsterdam, waar ze vanaf haar negentiende heeft lesgegeven. Op 21-jarige leeftijd werd ze docent computeralgebra en daarmee was ze de jongste docent aan de UvA. Zij schreef mee aan lesmaterialen voor verschillende opleidingen van de UvA. Jolien verzorgt data science en data engineering opleidingen in R en Python bij Tridata. Jolien heeft gewerkt als data scientist en onderzoeker bij het Centraal Bureau voor de Statistiek en is momenteel verbonden aan het Erasmus MC als research software engineer.
Drs. Edwin de Jonge studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren te hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS, met als specialiteit statistical computing and modeling, datamanagement en datavisualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert op het gebied van verschillende programmeertalen waaronder C++, Javascript, Python en R. In die laatste taal ontwikkelde hij een package dat inmiddels meer dan 120.000 maal per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.
Mark van der Loo en Edwin de Jonge zijn auteurs van de boeken “Learning RStudio for R Statistical Computing” (Packt Publishing, 2012) en “Statistical Data Cleaning with Applications in R” (Wiley, 2018). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) getiteld “An introduction to data cleaning with R”. Zij waren ook keynote speakers op useR conferenties in Boekarest, Los Angeles, Toulouse, Marrakesh, Madrid, etc.
Dr. K. (Karin) Groothuis-Oudshoorn, PhD, is an Assistant Professor and Biostatistician at University of Twente, the Netherlands. Dr. Groothuis-Oudshoorn completed her PhD at the University of Utrecht, specializing in mathematical statistics. After that she worked at several applied research institutes as a (bio)statistician. In 2009, she joined the department of Health Technology and Services Research at the University of Twente where her research focus is on survival regression models, statistical learning and design and statistical analysis of preferences. She teaches courses on data science, statistical learning and medical statistics for several educational programs at the University of Twente. Next to that, she has been working as a statistical consultant and teacher for Tridata since 2011.
R for Data Science: het boek behorend bij de R cursus
R en R Studio installeren en testen
- Wat is R Studio?
- Hoe installeer ik R en R studio?
- De installatie van R en R studio testen
- Voorbeeld van een R script