Cursus toegepaste statistiek en data-analyse met R (6 dagen)

Cursus toegepaste statistiek en data-analyse met R (6 dagen)

Inleiding

Tridata, Instituut voor toegepaste statistiek en data-analyse, biedt een zesdaagse cursus toegepaste statistiek en data-analyse aan, waarin een uitgebreid palet aan statistische kennis en onderzoeksvaardigheden aan bod komt. De toepasbaarheid van deze kennis en vaardigheden staat hierbij centraal. Voor zowel cursisten met basiskennis als ook meer ervaren cursisten biedt de cursus toegepaste statistiek en data-analyse de unieke mogelijkheid om binnen een zeer korte periode fundamentele en zeer waardevolle onderzoeksvaardigheden eigen te maken. Daarbij leert de cursist om deze vaardigheden toe te passen in de statistische software R. Dit programma is open source en biedt vele mogelijkheden tot dataverwerking, datavisualisatie en statistische analyses.

Inhoud

In de cursus toegepaste statistiek en data-analyse wordt ingegaan op het onderzoeksproces dat een cursist doorloopt. De cursist krijgt bruikbare handvatten aangereikt, waardoor hij/zij na deze cursus gefundeerde uitspraken kan doen. Er wordt stilgestaan bij het verschil tussen beschrijvende en verklarende statistiek en er wordt aandacht besteed aan het correct formuleren en het operationaliseren van een onderzoeksvraag. De cursist krijgt daarnaast inzicht in de wijze waarop de vertaling van de onderzoeksvraag naar analyses kan worden gemaakt. Tijdens de cursus leert de cursist zich in rap tempo het vrij beschikbare open source programma R eigen te maken, Naast de flexibiliteit die R biedt, is er in toenemende mate vraag naar onderzoekers die deze software beheersen.

Eindtermen

Na afronding van deze cursus:

  • Kan de cursist het hele onderzoeksproces doorlopen, van onderzoeksvraag naar analyses tot conclusies;
  • Heeft de cursist inzicht in statistische methoden, alsmede basale en geavanceerde analyses;
  • Beheerst de cursist vaardigheden om verworven data te prepareren voor analyse;
  • Is de cursist in staat de keuze voor een specifieke analyse adequaat te kunnen verantwoorden;
  • Is de cursist in staat analyses verantwoord toe te passen op concrete onderzoeksvragen;
  • Weet de cursist de resultaten van statistische analyses zelfstandig en adequaat te interpreteren;
  • Kan de cursist kritisch reflecteren op onderzoeksvragen, analyses en conclusies;
  • Heeft de cursist concrete methoden in handen voor het eigen onderzoek;
  • Heeft de cursist voldoende kennis van R om zijn of haar data te verwerken en analyseren.

Cursusinhoud

In deze cursus wordt gewerkt met korte, interactieve informatieblokken, afgewisseld met praktijkopdrachten.

Dag 1 - basisbegrippen en onderzoeksvragen :

Wat is statistiek, wanneer en hoe kan het worden gebruikt? Daar starten we mee. Op dag 1 wordt er een start gemaakt met het onderzoeksproces en de onderzoeksvraag. We gaan op deze dag vanaf de eerste stap bekijken hoe we van een algemene vraag of interesse komt tot een onderzoeksvraag en een plan om een onderzoek op te zetten waarmee we de vraag kunnen beantwoorden. Op deze dag leren we over variabelen en meetniveaus, verschillende onderzoeksdesigns en maken we kennis met R.

Dag 2 - beschrijvende statistiek en hypothesen:

Op dag twee gaan we verder met de basis van de statistiek en een uitbreiding op het onderzoeksproces. We gaan verder in op descriptieve maten zoals centrum- en spreidingmaten. De verdeling van je data, normaal verdelingen en de Z verdeling. De verworven kennis passen we direct toe in R. Vervolgens pakken we door met het verschil tussen populaties en steekproeven, betrouwbaarheidsintervallen en meetfouten. Tevens gaan we in op meetkwaliteit (validiteit en betrouwbaarheid).

Op dag 1 hebben we een onderzoeksvraag opgesteld. Aan de hand van de op dag 2 geleerde statistische kennis gaan we deze onderzoeksvraag omzetten tot een hypothese. Aan de hand van deze hypothese kunnen we deze gaan toetsen. Hiervoor leer je hypothesetoetsing en p-waardes.

Dag 3 – data verwerking, manipulatie en start analyses:

Op dag 3 gaan we verder in R. Hoe voer je data in? Tevens nemen we wat basis datamanipulatie door. Op overzichtelijke wijze leert de cursist welk statistische analyses er bestaan en welke wanneer van toepassing is. In het bijzonder zullen we de correlatie en de Chi-kwadraat toets doornemen.

Dag 4 – Groepsgemiddeldes vergelijken:

Vandaag staat het parametrisch en non-parametrisch toetsen van gemiddelden centraal. Het volgende zal worden besproken:

  • Onderzoeksvraag bij t-test
  • Verschillende soorten t-test toegelicht
  •  One-sample t-test
  • Dependent sample t-test
  • Independent sample t-test
  • Toepassen in R
  • Interpretatie t-test

Dag 5 – Variantie analyses:

Op dag 5 gaan we van de t-test naar variantieanalyse. Diverse analyses uit het general linear model komen aan bod:

  • Onderzoeksvraag bij univariate variantie-analyse (ANOVA)
  • Univariate variantie-analyse (ANOVA) toegelicht
  • Factorial ANOVA
  • ANCOVA
  • MANOVA
  •  Post-hoc analyse
  • Analyse ANOVA in R
  •  Intepretatie ANOVA

Dag 6:

Op de laatste dag zullen we regressieanalyses doornemen.

  • Analyse toegelicht (Correlatie en regressie-analyse)
  • Het verband tussen variabelen
  • Het bereik van correlatie
  •  Verschillende soorten correlaties
  • Causaliteit en correlatie
  • Analyses waarmee voorspellingen gedaan kunnen worden 
  • Regressieanalyse
  • Het regressiemodel
  • R square
  • Interpretatie regressie 

We sluiten de cursus met een overzicht van de analyses en hoe ze tot elkaar verhouden.

Doelgroep

De cursus toegepaste statistiek en data-analyse wordt afgestemd met informatieanalisten, data-analisten, business analisten, adviseurs en andere professionals die zich bezighouden met het vastleggen en het analyseren van informatiebehoeften binnen een organisatie.

Docent

Dr. S.C. (Susanna) Gerritse studeerde psychometrie aan de Universiteit van Amsterdam. Daarna was zij werkzaam als promovenda bij de Universiteit Utrecht op een statistisch-methodologisch project in samenwerking met het Centraal Bureau voor de Statistiek. Haar proefschrift behandelde het schatten van populatiegrootte, toegepast op officiële statistieken. Tevens was Dr. Gerritse verbonden aan de VU als Universitair Docent, waar zij statistiekcolleges verzorgde. Tegenwoordig werkt Dr. Gerritse als Data Scientist bij Inpaqt en is sinds 2018 verbonden aan Tridata als statistiekdocente.

Cursusdata

12, 19, december 2018, 9, 16, 23, 30 januari 2019 (Utrecht)
13, 20, 27 februari, 13, 20 maart 2019 (Utrecht)

In-company training

De statistiekcursus kan tevens als in-company training (op een locatie van uw keuze) worden gegeven. In overleg wordt het aantal deelnemers van uw organisatie bepaalt en past Tridata de cursus aan naar uw specifieke wensen. Neemt u voor een maatwerkofferte contact op met Tridata.

Kosten en inschrijving

De kosten van de 6-daagse cursus bedragen € 2995. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie / thee, luxe lunches en inclusief boek.