skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Cursus data analyse met R | afsluiting met praktijkopdracht

 Inleiding cursus data analyse met R

Tridata, Instituut voor toegepaste statistiek en data-analyse, biedt een zesdaagse cursus data-analyse met R aan, waarin een breed overzicht wordt gegeven van statistische theorie en van de mogelijkheden om deze statistische theorie te vertalen naar statistische vaardigheden. Het moge duidelijk zijn de toepassing van statistische analysetechnieken staat centraal. Voor zowel cursisten met basale statistische kennis als voor cursisten met meer ervaring op het terrein van de statistiek zal deze cursus een geweldige mogelijkheid bieden om in een korte tijdspanne (nog meer) gedegen kennis en vaardigheid op te doen betreffende het opzetten, uitvoeren en interpreteren van statistische analyses.

Inhoud cursus data analyse met R

In de cursus data analyse met R wordt ingegaan op het onderzoekstraject, dat een cursist doorloopt. De cursist krijgt een bruikbaar kader aangereikt, waardoor zij/hij na deze cursus in staat zal zijn zelfstandig statistische analyses te verrichten inclusief een verantwoorde interpretatie van de onderzoeksresultaten. Er wordt aandacht besteed aan de verschillen tussen beschrijvende, toetsende en verklarende statistiek en er wordt tevens aandacht besteed aan het correct opstellen en het zo zorgvuldig mogelijk operationaliseren van een onderzoeksvraag. De cursist raakt vertrouwd met de manier waarop een onderzoeksvraag kan worden vertaald naar de uit te voeren statistische analyses. Gedurende de eerste cursusdag leert de student omgaan met het computerprogramma R, dat zij/hij nodig heeft tijdens de daarop volgende dagen, die gevuld zullen zijn met een scala aan statistische analysetechnieken.

Eindtermen cursus data analyse met R

Na de afronding van deze cursus:

  • Heeft de cursist kennis en inzicht in het verloop van een onderzoekstraject;
  • Heeft de cursist inzicht in en kennis van statistische analysetechnieken, zowel op basisniveau als op geavanceerd niveau;
  • Is de cursist in staat de keuze voor een specifieke statistische analyse te verantwoorden;
  • Heeft de cursist een degelijke kennis van de achtergrond van de behandelde statistische analyses;
  • Is de cursist in staat om statistische analyses adequaat toe te passen op concrete onderzoeksvragen en is zij/hij tevens in staat om de geproduceerde resultaten van deze analyses te interpreteren;
  • Is de cursist in staat om de statistische analyses van het eigen onderzoek zelfstandig uit te voeren.

Cursusinhoud cursus data analyse met R

Dag 1

Introductie computerprogramma R

  • Inleiding R; hulp krijgen; de R community; packages.
  • Werken met de commandline en RStudio.
  • Rekenen met vectoren (kolommen) en data.frames (tabeldata)
  • Lezen en schrijven van tekstbestanden
  • Nieuwe variabelen maken
  • Eenvoudige plots: boxplot, cirkeldiagram, histogra
  • Selecteren van rijen en kolommen
  • Hercoderen en hernoemen van variabelen
  • Koppelen en sorteren
  • Data groeperen en aggregeren
  • Random sampling van records (selecteren van ‘cases’ uit een gegevensbestand)

Dag 2

Wat is statistiek, wanneer en hoe kan statistiek worden gebruikt (Basisbegrippen statistiek + toepassing in R)

  • Plaats van statistiek in het onderzoeksproces
  • Basisbegrippen beschrijvende statistiek (meetniveaus variabelen, absolute en cumulatieve frequenties, centrum- / spreidingsmaten en grafische weergave)
  • Basisbegrippen toetsende/verklarende statistiek (hypothese toetsen, statische significantie, statistische power, populatieverdeling, soorten steekproeven, steekproefgrootte, steekproevenverdeling, betrouwbaarheidsintervallen, z-scores, t-scores)
  • Grafieken (staafdiagram, histogram, boxplots, scatterplot)
  • Ontbrekende waarden (missing values) en extreme waarden (outliers)
  • Statistische basisbegrippen voor meetkwaliteit (betrouwbaarheid, validiteit, representativiteit)

Dag 3

Toetsen van hypothesen I + toepassingen in R

T-toetsen en Variantie-analyse (maken van een verantwoorde keuze gebaseerd op onderzoeksvragen)

  • Vergelijken van twee populatiegemiddelden middels twee onafhankelijke steekproeven en twee afhankelijke steekproeven (of variabelen) (twee typen t-test )
  • Vergelijken van twee populatieproporties middels twee onafhankelijke steekproeven (z-test)
  • Vergelijken van meer dan twee populatiegemiddelden (ANOVA, GLM)
  • Vergelijken van meer dan twee populatiegemiddelden met controle(interval)variabele (ANCOVA)

Dag 4

Toetsen van hypothesen II + toepassingen in R

Correlatie- en regressieanalyse (maken van een verantwoorde keuze gebaseerd op onderzoeksvragen, causaliteit)

  • Correlatie-analyse (bivariaat)
  • Lineaire Regressie-analyse (voorspellingsmodellen)
  • Categorische variabelen

Dag 5

Toetsen van hypothesen III + toepassingen in R

Regressieanalyse met afhankelijke variabelen van nominaal meetniveau zowel dichotoom als polytoom (maken van een verantwoorde keuze gebaseerd op onderzoeksvragen, causaliteit).

  • Logistische Regressie-analyse (bivariaat en multivariaat)
  • Log-likelihood ratio
  • Wald test
  • Odds-ratio

Non-parametrische toetsen (verdelingsvrije toetsen). Waarom verdelingsvrij verkiezen boven niet-verdelingsvrije (parametrische) tegenhangers en wat is het verschil tussen deze twee soorten toetsen?

  • Wilcoxon rank-sum test voor twee onafhankelijke steekproeven
  • Wilcoxon matched pairs signed-rank test voor twee afhankelijke steekproeven of twee afhankelijke variabelen
  • Kruskal-Wallis test voor meer dan twee onafhankelijke steekproeven
  • Friedman test voor meer dan twee afhankelijke steekproeven of meer dan twee afhankelijke variabelen

Dag 6

Meetmodellen + toepassing in R + eindopdracht

Reduceren van het aantal variabelen met nagenoeg dezelfde inhoud en met hetzelfde aantal antwoordmogelijkheden (met dezelfde inhoud) tot onderliggende begrippen.

  • Basisbegrippen latente data-analyse
  • Klassieke schaaltechnieken (m.n.Likert)
  • Variabelenreductie tot één dimensie of begrip (Cronbach’s Alpha, Split-half)
  • Variabelenreductie tot meerdere dimensies of begrippen middels Factoranalyse (Principale Component Analyse, Principale Factor Analyse)

Eindopdracht: De laatste lesmiddag staat in het teken van een eindopdracht, waarbij zelfstandig of in groepjes een onderzoek moet worden uitgevoerd en klassikaal besproken wordt. Het geleerde in de praktijk brengen is het doel van de eindopdracht.

Doelgroep

De cursus is bestemd voor personen, die in de toekomst onderzoek willen gaan doen of al onderzoek doen of willen leren uitkomsten van onderzoek van anderen te begrijpen en kritisch te beschouwen.

Vereiste Voorkennis

Men dient bekend te zijn met statistische basisbegrippen als steekproeftrekking, variabelen en onderzoekseenheden, meetniveaus en kansverdelingen. Ook wordt verondersteld dat men bekend is met de beschrijvende statistiek, en dus met de meest voorkomende centrum- en spreidingsmaten zoals het gemiddelde, de mediaan, variantie en standaarddeviatie en met frequentieverdelingen.

Cursusdata

16-mrt, 23-mrt, 30-mrt, 6-apr, 13-apr, 20-apr 2021
18-mei, 25-mei, 1-jun, 8-jun, 15-jun, 22-jun 2021
28-sep, 5-okt, 12-okt, 19-okt, 26-okt, 2-nov 2021
16-nov, 23-nov, 30-nov, 7-dec, 14-dec, 21-dec 2021

Kosten en inschrijving

De kosten van de 6-daagse cursus data analyse met R bedragen € 3350. Deze prijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie/thee, lunches en boek. Tijdens de cursus wordt o.a. gebruikgemaakt van het boek Discovering Statistics Using R van Andy Field. Het boek van Andy Field is inbegrepen in de prijs.

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– Tridata werkt uitsluitend met hoogleraren en gepromoveerde wetenschappers. De docenten hebben diverse wetenschappelijke artikelen gepubliceerd in boeken en tijdschriften en beschikken over bewezen didactische (onderwijskundige) vaardigheden.

Cursuslocatie

Europalaan 400, 5e verdieping | 3526 KS Utrecht

Docenten

Dr. S.C. (Susanna) Gerritse studeerde psychometrie aan de Universiteit van Amsterdam. Daarna was zij werkzaam als promovenda bij de Universiteit Utrecht op een statistisch-methodologisch project in samenwerking met het Centraal Bureau voor de Statistiek. Haar proefschrift behandelde het schatten van populatiegrootte, toegepast op officiële statistieken. Tevens was Dr. Gerritse verbonden aan de VU als Universitair Docent, waar zij statistiekcolleges verzorgde. Tegenwoordig werkt Dr. Gerritse als Data Scientist bij Inpaqt en is sinds 2018 verbonden aan Tridata als statistiekdocente.

Dr. A. (Anouck) Kluytmans studeerde methoden en statistiek aan de Universiteit Utrecht. Gedurende haar studies deed ze ruime ervaring op met onderwijs in onderzoeksmethoden en data-analyse op bachelor-, master- en postgraduate niveau. Ook werkte ze als statistisch en toegepast onderzoeker. In haar proefschrift gebruikte ze statistische modellen, aangevuld door kwalitatieve dataverzameling, om al in een vroeg stadium in te schatten wat de potentiële meerwaarde van medisch-technologische innovaties is. Vanuit dit onderzoek adviseerde ze bovendien publiek-private samenwerkingen hoe zij deze methoden konden toepassen om investeringsbeslissingen te verantwoorden. Tijdens dit promotieonderzoek aan het Radboud umc bleef Anouck actief als docent onderzoeksmethoden en statistiek. Zij zet nu haar expertise op het gebied van onderzoek en data-analyse in om universitair onderwijs te verbeteren. Met haar aansluiting bij Tridata wil Anouck cursisten uit diverse contexten laten ervaren hoe zij zich de rol van onderzoeker en data-analist in korte tijd kunnen aanmeten en hen tools meegeven om praktische vraagstukken zelfstandig te beantwoorden.

 

Bekijk ook de volgende cursussen

Cursus statistiek en data analyse met R
Opleiding data analist bij het instituut voor de statistiek

Back To Top