skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Cursus gevorderd statistical programming met R (1 dag)

Doel

Tijdens de cursus gevorderd statistical programming met R leert de beginnende R-programmeur zijn analyses te automatiseren, zodat ze eenvoudiger kunnen worden ingebouwd in een geautomatiseerde omgeving, zoals een Analytics Dashboard. Daarnaast leert de cursist profiteren van een aantal typische, geavanceerde R-eigenschappen, zoals methoden om op zeer compacte wijze berekeningen over complexe datasets de definiëren. R is op dit moment één van de meest geavanceerde en flexibele statistische programma’s en is bovendien open source (gratis).

Inhoud

Tridata hecht er waarde aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen, dus wordt er op basis van gedegen theorie meteen toegepast in de praktijk. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten.

Ochtend: Imperatief en functioneel programmeren in R
•    Loops, branching, functions
•    Lists en aggregeren met de *apply-familie van functies
•    Standard en non-standardevaluatie: with, within, eval

Middag: Automatiseren en objectgeoriënteerd programmeren
•    Inleiding objectgeoriënteerd programmeren in R: S3 en S4
•    Organisatie van R-code in meerdere scripts; source
•    R-scripts uitvoeren vanaf de commandline; het docopt package
•    Interactie met databases; R-code laten uitvoeren op een database

Doelgroep

•    BI en data-analysespecialisten die regelmatig met R werken en hun productiviteit willen verhogen
•    Teammanagers van BI en data-analisten
•    Jonge academici die een carrière ambiëren als data scientist.
•    Specialisten die hun R-kennis willen verdiepen en hun productiviteit willen verhogen

Vereiste voorkennis

We verwachten enige bekendheid met R, en enige algemene bekendheid met algemene programmeerconcepten zoals loops en if-else statements.

Tools

Tijdens de cursus wordt gewerkt met de meest recente versie van R en RStudio, plus een aantal R-packages voor automatisering.

Cursusdata

Vrijdag 20 mei 2022
Vrijdag 18 november 2022

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

Kosten en inschrijving:

De kosten van de 1-daagse cursus bedragen €1150. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie/thee en lunches.

In-company training

De cursus gevorderd statistical programming met R kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die binnen jouw organisatie plaatsvindt. Hebben meerdere collega’s in uw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s. Neemt u voor een maatwerkofferte contact op met Tridata.

Plaats

Europalaan 400 3526 KS Utrecht

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– De R cursus van Tridata is een multidisciplinaire cursus die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, tekstmining, datavisualisatie en datamanagement.
– Tridata heeft in 2006 samen met de Faculteit Economie/Econometrie van de Erasmus Universiteit, R geïntroduceerd in Nederland.

De docenten

Dr. Mark van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Sinds zijn promotie op een onderwerp uit de quantumfysica is hij werkzaam als statistisch onderzoeker bij het CBS, met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, Python,  en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipedia pagina’s. Mark werkt sinds 2012 als consultant en docent voor Tridata.

Drs. Edwin de Jonge studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren te hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS, met als specialiteit statistical computing and modeling, datamanagement en datavisualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert op het gebied van verschillende programmeertalen waaronder C++, Javascript, Python en R. In die laatste taal ontwikkelde hij een package dat inmiddels meer dan 120.000 maal per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.

Mark van der Loo en Edwin de Jonge zijn auteurs van de boeken “Learning RStudio for R Statistical Computing” (Packt Publishing, 2012) en “Statistical Data Cleaning with Applications in R” (Wiley, 2018). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) getiteld “An introduction to data cleaning with R”. Zij waren ook keynote speakers op useR conferenties in Boekarest, Los Angeles, Toulouse, Marrakesh, Madrid, etc.

Dr. ir. J.(Jan) van der Laan studeerde af op het gebied van signaalverwerking bij de de faculteit technische natuurkunde aan de Technische Universiteit Delft. Na zijn promotie op het gebied van medical physics is hij als statistisch onderzoeker werkzaam bij het CBS. Op het CBS houdt hij zich onder andere bezig met statistische analyse en regressietechnieken, datavisualisatie en het verwerken en koppelen van grote bestanden. Over deze onderwerpen publiceert hij op conferenties en peer reviewed journals. Jan is expert op het gebied van  meerdere programmeertalen waaronder C++, Javascript, D3.js en R. Hij heeft bijdragen geleverd aan meerdere R packages op CRAN. Jan werkt sinds 2015 als consultant en docent bij Tridata.

Gerelateerde cursussen

•    Statistical programming met R
•    R package in één dag: schrijf je eigen R package.
•    Text processing en text mining met R
•    Inleiding netwerkanalyse met R en Gephi

Back To Top