Cursus Multivariate data-analyse met R

Cursus Multivariate data- analyse met R ( 6 dagen, incl. introductie R: Statistical programming with R)

 Inleiding

Tridata, Instituut voor toegepaste statistiek en data-analyse, biedt een zesdaagse cursus Multivariate data-analyse met R/ Rstudio aan, waarin een breed overzicht wordt gegeven van statistische theorie en van de mogelijkheden om deze statistische theorie te vertalen naar statistische vaardigheden. Het moge duidelijk zijn de toepassing van statistische analysetechnieken staat centraal. Voor zowel cursisten met basale statistische kennis als voor cursisten met meer ervaring op het terrein van de statistiek zal deze cursus een geweldige mogelijkheid bieden om in een korte tijdspanne (nog meer) gedegen kennis en vaardigheid op te doen betreffende het opzetten, uitvoeren en interpreteren van statistische analyses.

Inhoud

In deze cursus wordt ingegaan op het onderzoekstraject, dat een cursist doorloopt. De cursist krijgt een bruikbaar kader aangereikt, waardoor zij/hij na deze cursus in staat zal zijn zelfstandig statistische analyses te verrichten inclusief een verantwoorde interpretatie van de onderzoeksresultaten. Er wordt aandacht besteed aan de verschillen tussen beschrijvende, toetsende en verklarende statistiek en er wordt tevens aandacht besteed aan het correct opstellen en het zo zorgvuldig mogelijk operationaliseren van een onderzoeksvraag. De cursist raakt vertrouwd met de manier waarop een onderzoeksvraag kan worden vertaald naar de uit te voeren statistische analyses. Gedurende de eerste cursusdag leert de student omgaan met het computerprogramma R, dat zij/hij nodig heeft tijdens de daarop volgende dagen, die gevuld zullen zijn met een scala aan statistische analysetechnieken.

Eindtermen

Na de afronding van deze cursus:

  • Heeft de cursist kennis en inzicht in het verloop van een onderzoekstraject;
  • Heeft de cursist inzicht in en kennis van statistische analysetechnieken, zowel op basisniveau als op geavanceerd niveau;
  • Is de cursist in staat de keuze voor een specifieke statistische analyse te verantwoorden;
  • Heeft de cursist een degelijke kennis van de achtergrond van de behandelde statistische analyses;
  • Is de cursist in staat om statistische analyses adequaat toe te passen op concrete onderzoeksvragen en is zij/hij tevens in staat om de geproduceerde resultaten van deze analyses te interpreteren;
  • Is de cursist in staat om de statistische analyses van het eigen onderzoek zelfstandig uit te voeren.

Cursusinhoud

Dag 1

Introductie computerprogramma R

  • Inleiding R; hulp krijgen; de R community; packages.
  • Werken met de commandline en RStudio.
  • Rekenen met vectoren (kolommen) en data.frames (tabeldata)
  • Lezen en schrijven van tekstbestanden
  • Nieuwe variabelen maken
  • Eenvoudige plots: boxplot, cirkeldiagram, histogra
  • Selecteren van rijen en kolommen
  • Hercoderen en hernoemen van variabelen
  • Koppelen en sorteren
  • Data groeperen en aggregeren
  • Random sampling van records (selecteren van ‘cases’ uit een gegevensbestand)

Dag 2

Wat is statistiek, wanneer en hoe kan statistiek worden gebruikt (Basisbegrippen statistiek + toepassing in R)

  • Plaats van statistiek in het onderzoeksproces
  • Basisbegrippen beschrijvende statistiek (meetniveaus variabelen, absolute en cumulatieve frequenties, centrum- / spreidingsmaten en grafische weergave)
  • Basisbegrippen toetsende/verklarende statistiek (hypothese toetsen, statische significantie, statistische power, populatieverdeling, soorten steekproeven, steekproefgrootte, steekproevenverdeling, betrouwbaarheidsintervallen, z-scores, t-scores)
  • Grafieken (staafdiagram, histogram, boxplots, scatterplot)
  • Ontbrekende waarden (missing values) en extreme waarden (outliers)
  • Statistische basisbegrippen voor meetkwaliteit (betrouwbaarheid, validiteit, representativiteit)

Dag 3

Toetsen van hypothesen I + toepassingen in R

T-toetsen en Variantie-analyse (maken van een verantwoorde keuze gebaseerd op onderzoeksvragen)

  • Vergelijken van twee populatiegemiddelden middels twee onafhankelijke steekproeven en twee afhankelijke steekproeven (of variabelen) (twee typen t-test )
  • Vergelijken van twee populatieproporties middels twee onafhankelijke steekproeven (z-test)
  • Vergelijken van meer dan twee populatiegemiddelden (ANOVA, GLM)
  • Vergelijken van meer dan twee populatiegemiddelden met controle(interval)variabele (ANCOVA)

Dag 4

Toetsen van hypothesen II + toepassingen in R

Correlatie- en regressieanalyse (maken van een verantwoorde keuze gebaseerd op onderzoeksvragen, causaliteit)

  • Correlatie-analyse (bivariaat)
    • Verschillende statistische samenhangsmaten plus bijbehorende toetsen (zoals Pearson, Spearman, Kendall, Cramer’s V)
  • Lineaire Regressie-analyse (voorspellingsmodellen)
    • Simple Linear Regression (bivariaat)
    • Multiple Linear Regression (multivariaat)
    • Interactie, Multicollineariteit, Dummyvariabelen, Residu-analyse
  • Categorische variabelen
    • Kruistabellen met Chi-square en assumpties

Dag 5

Toetsen van hypothesen III + toepassingen in R

Regressieanalyse met afhankelijke variabelen van nominaal meetniveau zowel dichotoom als polytoom (maken van een verantwoorde keuze gebaseerd op onderzoeksvragen, causaliteit).

  • Logistische Regressie-analyse (bivariaat en multivariaat)
  • Log-likelihood ratio
  • Wald test
  • Odds-ratio

 Non-parametrische toetsen (verdelingsvrije toetsen). Waarom verdelingsvrij verkiezen boven niet-verdelingsvrije (parametrische) tegenhangers en wat is het verschil tussen deze twee soorten toetsen?

  • Wilcoxon rank-sum test voor twee onafhankelijke steekproeven
  • Wilcoxon matched pairs signed-rank test voor twee afhankelijke steekproeven of twee afhankelijke variabelen
  • Kruskal-Wallis test voor meer dan twee onafhankelijke steekproeven
  • Friedman test voor meer dan twee afhankelijke steekproeven of meer dan twee afhankelijke variabelen

Dag 6

Meetmodellen + toepassing in R

Reduceren van het aantal variabelen met nagenoeg dezelfde inhoud en met hetzelfde aantal antwoordmogelijkheden (met dezelfde inhoud) tot onderliggende begrippen.

  • Basisbegrippen latente data-analyse
  • Klassieke schaaltechnieken (m.n.Likert)
  • Variabelenreductie tot één dimensie of begrip (Cronbach’s Alpha, Split-half)
  • Variabelenreductie tot meerdere dimensies of begrippen middels Factoranalyse (Principale Component Analyse, Principale Factor Analyse)

Doelgroep

De cursus is bestemd voor personen, die in de toekomst onderzoek willen gaan doen of al onderzoek doen of willen leren uitkomsten van onderzoek van anderen te begrijpen en kritisch te beschouwen

Vereiste Voorkennis

Men dient bekend te zijn met statistische basisbegrippen als steekproeftrekking, variabelen en onderzoekseenheden, meetniveaus en kansverdelingen. Ook wordt verondersteld dat men bekend is met de beschrijvende statistiek, en dus met de meest voorkomende centrum- en spreidingsmaten zoals het gemiddelde, de mediaan, variantie en standaarddeviatie en met frequentieverdelingen. Verder dienen cursisten enige (maar niet heel veel) ervaring te hebben met het gebruik van R omdat hier tijdens de computerpractica mee wordt gewerkt.

Het handboek ‘Basis Statistics: an Introduction with R’ van Tenko Raykov en George A. Marcoulides zal bij aanvang van de cursus beschikbaar zijn.

Cursusdata

24-okt, 31-okt, 7-nov, 14-nov, 21-nov,  28-nov 2018 (Utrecht)
14-nov, 21-nov, 28-nov, 5-dec, 12-dec,19-dec 2018 (Utrecht)

Kosten en inschrijving

De kosten van de 6-daagse cursus bedragen € 3350. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie / thee en lunches.
Werkzoekenden betalen slechts € 2475.

In-company training

Deze training kan in huis (bij uw organisatie) worden gegeven. In overleg past tridata de cursus  aan de  wensen van de cursisten. Voor meer informatie kunt u contact met ons opnemen.

Plaats

Vondellaan 202,  Utrecht

Waarom de cursus volgen bij Tridata?.
- Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
- De cursus data-analyse wordt gegeven door twee docenten met ruime ervaring op het gebied van R en auteurs van verschillende boeken en artikelen op het gebied van statistiek en data-analyse.