skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Cursus statistiek en data-analyse met R

Inleiding

Tridata, instituut voor statistiek en data-analyse met R, biedt een zesdaagse cursus statistiek en data-analyse met R aan, waarin een uitgebreid palet aan statistische kennis en onderzoeksvaardigheden aan bod komt. De praktische toepasbaarheid van de statistiek staat centraal. Voor zowel cursisten met basiskennis als ook meer ervaren cursisten biedt de cursus toegepaste statistiek en data-analyse de unieke mogelijkheid om binnen een zeer korte periode fundamentele en zeer waardevolle onderzoeksvaardigheden eigen te maken. Daarbij leert de cursist om deze vaardigheden toe te passen in de statistische software R Statistical programming.

Over R Statistical Programming

R Statistical Programming is een softwarepakket en programmeertaal ontwikkeld voor statistiek en data-analysedoeleinden. Op dit moment is R Programming één van de meest geavanceerde en flexibele statistische programma’s en de leidende programmeertaal in Data Science, statistiek, data-analyse, datavisualisaties en interactieve (data)rapporten. Bovendien is R Statistical Programming open source (gratis).

Inhoud cursus statistiek met R

In de cursus statistiek en data-analyse met R wordt ingegaan op het onderzoeksproces dat een cursist doorloopt. De cursist krijgt bruikbare handvaten aangereikt, waardoor hij/zij na deze cursus gefundeerde uitspraken kan doen. Er wordt stilgestaan bij het verschil tussen beschrijvende en verklarende statistiek en er wordt aandacht besteed aan het correct formuleren en het operationaliseren van een onderzoeksvraag. De cursist krijgt daarnaast inzicht in de wijze waarop de vertaling van de onderzoeksvraag naar analyses kan worden gemaakt. Tijdens de cursus leert de cursist zich in rap tempo het vrij beschikbare open source programma R eigen te maken. Naast de flexibiliteit die R biedt, is er in toenemende mate vraag naar onderzoekers die deze software beheersen.

Eindtermen

Na afronding van de cursus statistiek en data-analyse met R:

  • Kan de cursist het hele onderzoeksproces doorlopen, van onderzoeksvraag naar analyses tot conclusies;
  • Heeft de cursist inzicht in statistische methoden, alsmede basale en geavanceerde analyses;
  • Beheerst de cursist vaardigheden om verworven data te prepareren voor analyse;
  • Is de cursist in staat de keuze voor een specifieke analyse adequaat te kunnen verantwoorden;
  • Is de cursist in staat analyses verantwoord toe te passen op concrete onderzoeksvragen;
  • Weet de cursist de resultaten van statistische analyses zelfstandig en adequaat te interpreteren;
  • Kan de cursist kritisch reflecteren op onderzoeksvragen, analyses en conclusies;
  • Heeft de cursist concrete methoden in handen voor het eigen onderzoek;
  • Heeft de cursist voldoende kennis van R om zijn of haar data te verwerken en analyseren.

Cursusinhoud statistiek en data analyse met R

In de statistiek cursus wordt gewerkt met korte, interactieve informatieblokken, afgewisseld met praktijkopdrachten.

Dag 1 – basisbegrippen en onderzoeksvragen

Wat is statistiek, wanneer en hoe kan het worden gebruikt? Daar starten we mee. Op dag 1 wordt er een start gemaakt met het onderzoeksproces en de onderzoeksvraag. We gaan op deze dag vanaf de eerste stap bekijken hoe we van een algemene vraag of interesse komen tot een onderzoeksvraag en een plan om een onderzoek op te zetten waarmee we de vraag kunnen beantwoorden. Op deze dag leren we over variabelen en meetniveaus, verschillende onderzoeksdesigns en maken we kennis met R.

Dag 2 – beschrijvende statistiek en hypothesen

Op dag twee gaan we verder met de basis van de statistiek en een uitbreiding op het onderzoeksproces. We gaan verder in op descriptieve maten zoals centrum- en spreidingmaten. De verdeling van je data, normaalverdelingen en de Z-verdeling. De verworven kennis passen we direct toe in R. Vervolgens pakken we door met het verschil tussen populaties en steekproeven, betrouwbaarheidsintervallen en meetfouten. Tevens gaan we in op meetkwaliteit (validiteit en betrouwbaarheid).

Op dag 1 hebben we een onderzoeksvraag opgesteld. Aan de hand van de op dag 2 geleerde statistische kennis gaan we deze onderzoeksvraag omzetten tot een hypothese. Aan de hand van deze hypothese kunnen we deze gaan toetsen. Hiervoor leer je hypothesetoetsing en p-waardes.

Dag 3 – dataverwerking, manipulatie en startanalyses

Op dag 3 gaan we verder in R. Hoe voer je data in? Tevens nemen we wat basis datamanipulatie door. Op overzichtelijke wijze leert de cursist welk statistische analyses er bestaan en welke wanneer van toepassing is. In het bijzonder zullen we de correlatie en de Chi-kwadraat toets doornemen.

Dag 4 – groepsgemiddeldes vergelijken

Vandaag staat het parametrisch en non-parametrisch toetsen van gemiddelden centraal. Het volgende zal worden besproken:

  • Onderzoeksvraag bij t-test
  • Verschillende soorten t-test toegelicht
  •  One-sample t-test
  • Dependent sample t-test
  • Independent sample t-test
  • Toepassen in R
  • Interpretatie t-test

Dag 5 – variantieanalyses

Op dag 5 gaan we van de t-test naar variantieanalyse. Diverse analyses uit het general linear model komen aan bod:

  • Onderzoeksvraag bij univariate variantieanalyse (ANOVA)
  • Univariate variantieanalyse (ANOVA) toegelicht
  • Factorial ANOVA
  • ANCOVA
  • MANOVA
  •  Post-hoc analyse
  • Analyse ANOVA in R
  •  Intepretatie ANOVA

Dag 6 – regressieanalyses

Op de laatste dag zullen we regressieanalyses doornemen.

  • Analyse toegelicht (Correlatie en regressieanalyse)
  • Het verband tussen variabelen
  • Het bereik van correlatie
  •  Verschillende soorten correlaties
  • Causaliteit en correlatie
  • Analyses waarmee voorspellingen gedaan kunnen worden
  • Regressieanalyse
  • Het regressiemodel
  • R square
  • Interpretatie regressie
  • Toepassen van kennis en vaardigheden in R
  • Interpretatie resultaten
  • Rapporteren van onderzoeksresultaten

We sluiten de cursus met een overzicht van de analyses en hoe ze tot elkaar verhouden.

Doelgroep

De cursus toegepaste statistiek en data-analyse met R wordt afgestemd met informatieanalisten, data-analisten, businessanalisten, adviseurs en andere professionals die zich bezighouden met het vastleggen en het analyseren van informatiebehoeften binnen een organisatie.

Cursusdata

3 oktober, 10 oktober, 31 oktober, 7 november, 14 november, 21 november 2024
7 november, 14 november, 21 november, 28 november, 12 december, 19 december 2024

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

De cursus statistiek en data analyse met R duurt 6 dagen. Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

Kosten en inschrijving

De kosten van de 6-daagse cursus statistiek en data analyse met R bedragen € 3250. Deze prijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie/thee, lunches en boek. Tijdens de cursus wordt o.a. gebruikgemaakt van het boek Discovering Statistics Using R van Andy Field. Het boek van Andy Field is inbegrepen in de prijs.

– De opleidingskosten van Tridata zijn BTW-vrij (BTW 0%) en dat scheelt u 21% aan kosten.

In-company training

De cursus statistiek en data-analyse in R kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die binnen jouw organisatie plaatsvindt. Hebben meerdere collega’s in uw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s.  Neemt u voor een maatwerkofferte contact op met Tridata.

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– Tridata werkt uitsluitend met hoogleraren en gepromoveerde wetenschappers. De docenten hebben diverse wetenschappelijke artikelen gepubliceerd in boeken en tijdschriften en beschikken over bewezen didactische (onderwijskundige) vaardigheden.

Cursuslocatie

Europalaan 400 | 3526 KS Utrecht

Docenten

Dr. S.C. (Susanna) Gerritse studeerde psychometrie aan de Universiteit van Amsterdam. Daarna was zij werkzaam als promovenda bij de Universiteit Utrecht op een statistisch-methodologisch project in samenwerking met het Centraal Bureau voor de Statistiek. Haar proefschrift behandelde het schatten van populatiegrootte, toegepast op officiële statistieken. Tevens was Dr. Gerritse verbonden aan de VU als Universitair Docent, waar zij statistiekcolleges verzorgde. Tegenwoordig werkt Dr. Gerritse als Data Scientist bij Inpaqt en is sinds 2018 verbonden aan Tridata als statistiekdocente.

Dr. A. (Anouck) Kluytmans studeerde methoden en statistiek aan de Universiteit Utrecht. Gedurende haar studies deed ze ruime ervaring op met onderwijs in onderzoeksmethoden en data-analyse op bachelor-, master- en postgraduate niveau. Ook werkte ze als statistisch en toegepast onderzoeker. In haar proefschrift gebruikte ze statistische modellen, aangevuld door kwalitatieve dataverzameling, om al in een vroeg stadium in te schatten wat de potentiële meerwaarde van medisch-technologische innovaties is. Vanuit dit onderzoek adviseerde ze bovendien publiek-private samenwerkingen hoe zij deze methoden konden toepassen om investeringsbeslissingen te verantwoorden. Tijdens dit promotieonderzoek aan het Radboud UMC bleef Anouck actief als docent onderzoeksmethoden en statistiek. Zij zet nu haar expertise op het gebied van onderzoek en data-analyse in om universitair onderwijs te verbeteren. Met haar aansluiting bij Tridata wil Anouck cursisten uit diverse contexten laten ervaren hoe zij zich de rol van onderzoeker en data-analist in korte tijd kunnen aanmeten en hen tools meegeven om praktische vraagstukken zelfstandig te beantwoorden.

Vervolgcursussen

De docenten maken o.a. gebruik van het boek Discovering Statistics Using R van Andy Field

Back To Top