skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Opleiding data-analist bij het instituut voor de statistiek

Opleiding Data-Analist – Inleiding

Tridata, instituut voor toegepaste statistiek en data-analyse, biedt een intensieve tiendaagse Opleiding Data Analist aan, waarin een uitgebreid palet aan statistische kennis en vaardigheden aan bod komen. De toepasbaarheid van deze kennis en vaardigheden staat hierbij centraal. Voor zowel onderzoekers met basiskennis als ook meer ervaren onderzoekers biedt deze cursus dan ook de unieke mogelijkheid om binnen een zeer korte periode fundamentele en zeer waardevolle onderzoeksvaardigheden eigen te maken. Zie ook de erkende 2-jarige opleiding data-analist.

Opleiding Data-Analist – Leervormen

In de 10-daagse Opleiding Data Analist wordt ingegaan op het onderzoeksproces dat een onderzoeker doorloopt. De onderzoeker wordt bewust van valkuilen en krijgt bruikbare handvatten aangereikt, waardoor hij/zij na deze opleiding gefundeerde uitspraken kan doen. Er wordt stilgestaan bij het verschil tussen beschrijvende en toetsende statistiek en er wordt aandacht besteed aan het correct formuleren en het operationaliseren van een onderzoeksvraag. De onderzoeker krijgt inzicht in de wijze waarop de vertaling van de onderzoeksvraag naar analyses kan worden gemaakt. In rap tempo wordt kennisgemaakt met het computerprogramma R, waarbij in de daaropvolgende dagen veelvuldig zal worden geoefend met data. Binnen het programma R (Statistical Programming with R) zal actief worden geoefend met het opschonen en prepareren van data, het onderzoeken van de aannames van de gekozen analyse en raakt de onderzoeker bekend met het toepassen van basale en meer geavanceerde analyses. Ook krijgt men alternatieven aangereikt in het geval dat de data niet aan de aannames van de gekozen statistische toets voldoet.

Opleiding Data Analist: Eindtermen

Na afronding van deze Opleiding Data-Analist:
–    heeft de cursist kennis en inzicht in het verloop van het onderzoeksproces;
–    is de cursist in staat data op verantwoorde wijze te bewerken in R (Statistical Programming with R);
–    heeft de cursist inzicht in statistische methoden en basis en geavanceerde technieken;
–    is de cursist in staat de keuze voor een specifieke analyse adequaat te kunnen verantwoorden;
–    heeft de cursist grondige kennis van de achtergrond van de behandelde statistische analyses;
–    is de cursist in staat analyses verantwoord toe te passen op concrete onderzoeksvragen, alsmede de  hieruit voortkomende resultaten zelfstandig te kunnen interpreteren;
–    heeft de cursist concrete methoden in handen voor het eigen onderzoek.

Opleiding Data-Analist – Inhoud

Onderstaande inhoud geeft een beeld van de Opleiding Data-Analist per trainingsdag. De trainingsdagen bestaan uit toelichting gemixt met practica in R programming. Er wordt gestreefd naar een prettige balans tussen het opdoen en toepassen van nieuwe kennis. Het tempo wordt door de groep als geheel bepaald, waarbij er vanzelfsprekend ruimte is voor vragen en aanpassingen. Iedere week zullen er bovendien huiswerkopdrachten zijn om nader met de stof te oefenen.

Dag 1: kennismaking met onderzoek, statistiek en R
–    Waarom doen we onderzoek?
–    Hoe steekt de onderzoekscyclus in elkaar?
–    Variabelen en onderzoeksdesigns
–    Waarom doen we statistische analyses?
–    Steekproef versus populatie
–    Valkuilen van de onderzoeker
–    R: simpele operaties met variabelen en dataframes in R

Dag 2: beschrijvende statistiek en datavisualisatie
–    Nut van beschrijvende statistiek
–    Datavisualisatie: welke plotjes zijn er, welk plotje gebruik je wanneer?
–    Datavisualisatie in R (ggplot)
–    Beschrijvende statistiek: centrummaten, spreidingsmaten en missings
–    Beschrijvende statistiek in R

Dag 3: relatie tussen twee variabelen (correlatie, t-toets en chi-kwadraat)
–    Uitleg over toetsende statistiek (basis)
–    Correlatie: wat is het, wanneer gebruik je het, hoe interpreteer je het?
–    T-toets: wat is het, wanneer gebruik je het, hoe interpreteer je het?
–    Chi-kwadraattoets: wat is het, wanneer gebruik je het, hoe interpreteer je het?
–    Correlatie, t-toets en chi-kwadraattoets in R
–    Assumpties bij de behandelde methoden

Dag 4: verdieping toetsende statistiek en lineare regressie
–    Uitleg over toetsende statistiek (verdieping) – power, type I- en II fout, betrouwbaarheidsintervallen, p-waarde in detail, etcetera
–    Poweranalyse in R (hoe groot moet mijn steekproef zijn?)
–    Lineare regressie: wat is het, wanneer gebruik je het, hoe interpreteer je het?
–    Lineare regressie in R
–    Assumpties checken en interpretatie

Dag 5: een-weg en twee-weg ANOVA
–    Wanneer/waarom ANOVA
–    Omnibus toets en follow-up analyses: planned contrasts versus post hoc
–    Interactie tussen onafhankelijke variabelen
–    Eén en twee-weg ANOVA’s in R
–    Assumpties checken en interpretatie

Dag 6: ANCOVA en multiple regressie
–    Uitleg ANCOVA en multiple regressie
–    Centreren/standaardiseren
–    Verklaarde variantie
–    Part en partial correlaties
–    ANCOVA en multiple regressie in R
–    Assumpties checken en interpretatie

Dag 7: within-subjects data
–    Between versus within-subjects data
–    Eigenschappen en voor- en nadelen van within-subjects data
–    Afhankelijke data analyseren in R
–    Mixed designs analyseren in R
–    Assumpties en interpretatie

Dag 8: categorische data-analyse
–    Vormen van categorische data
–    Kansen
–    Nominale en ordinale data
–    Count data
–    Diverse categorische datavormen in R
–    Verdieping chi-kwadraatanalyse in R
–    Logistische regressie in R

Dag 9: non-parametrische data-analyse
–    Wat is parametrisch eigenlijk?
–    Belang van aannames uit de afgelopen weken
–    Wat als assumpties geschonden zijn?
–    Datatransformatie
–    Non-parametrische alternatieven
–    Wilcoxon rank sum test en Kruskall Wallis test
–    Wilcoxon signed rank test, McNemar test en Friedman ANOVA
–    Alternatieven voor correlatie
–    Verdieping assumpties in R
–    Nonparametrische alternatieven in R

Dag 10: onderwerpen naar keuze
Gedurende de cursus wordt bijgehouden met welke onderwerpen de cursisten graag nader willen oefenen. Het kan hierbij zowel gaan om verdieping als verbreding van de geleerde statistische- en onderzoeksvaardigheden.
Voorbeelden van mogelijkheden voor deze trainingsdag:
–    Nader oefenen met het importeren en opschonen van data
–    Oefenen met een type data dat men verwacht vaak tegen te komen
–    Meer over vragenlijsten en validatie
–    Meer over tijdsafhankelijke data (bijv. tijdreeksen)
–    Ontwikkelingen in onderzoek en data-analyse
–    Omgaan met missing data
–    Nader oefenen met de interpretatie en rapportage van resultaten
–    Herhaling, samenvatting en afsluiting

Praktische informatie

De Opleiding Data-Analist bestaat uit tien opleidingsdagen en vindt plaats op de cursuslocatie van Tridata in Utrecht. De opleiding kent een ochtend- en middagprogramma. Het ochtendprogramma zal plaatsvinden van 9.15 tot 12.30u. Het middagprogramma zal plaatsvinden van 13.30 tot 16.15u.

De deelnemers hebben toegang tot een digitale omgeving waarin docenten hun colleges, datasets, opdrachten en overig cursusmateriaal zullen plaatsen. Er zijn geen examens of testen, en cursisten zullen na voltooiing van de cursus een certificaat van deelname ontvangen.

Opleiding Data-Analist – Doelgroep

De Opleiding Data-Analist is geschikt voor mensen uit de dienstensector, de overheid en het bedrijfsleven die door hun functie geregeld in aanraking komen met kwantitatieve data en de analyse daarvan. Mensen die inzicht willen verwerven in statistische methoden en data-analyse. De vereiste vooropleiding is minimaal HAVO met wiskunde.

Cursusdata

3 oktober, 10 oktober, 31 oktober, 7 november, 14 november, 21 november, 28 november, 5 december, 12 december, 19 december 2024

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

De cursus statistiek en data analyse met R duurt 10 dagen. Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

Kosten en inschrijving

De kosten van de 10-daagse cursus statistiek en data analyse met R bedragen € 5500. Deze prijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief cursusmateriaal, deelnamecertificaat, koffie/thee, lunches en boek. Tijdens de cursus wordt o.a. gebruikgemaakt van het boek Discovering Statistics Using R van Andy Field. Het boek van Andy Field is inbegrepen in de prijs.

– De opleidingskosten van Tridata zijn BTW-vrij (BTW 0%) en dat scheelt u 21% aan kosten.

In-company training

De cursus statistiek en data-analyse in R kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die binnen jouw organisatie plaatsvindt. Hebben meerdere collega’s in uw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s.  Neemt u voor een maatwerkofferte contact op met Tridata.

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– Tridata werkt uitsluitend met hoogleraren en gepromoveerde wetenschappers. De docenten hebben diverse wetenschappelijke artikelen gepubliceerd in boeken en tijdschriften en beschikken over bewezen didactische (onderwijskundige) vaardigheden.

Cursuslocatie

Europalaan 400 | 3526 KS Utrecht

Docenten

Dr. S.C. (Susanna) Gerritse studeerde psychometrie aan de Universiteit van Amsterdam. Daarna was zij werkzaam als promovenda bij de Universiteit Utrecht op een statistisch-methodologisch project in samenwerking met het Centraal Bureau voor de Statistiek. Haar proefschrift behandelde het schatten van populatiegrootte, toegepast op officiële statistieken. Tevens was Dr. Gerritse verbonden aan de VU als Universitair Docent, waar zij statistiekcolleges verzorgde. Tegenwoordig werkt Dr. Gerritse als Data Scientist bij Inpaqt en is sinds 2018 verbonden aan Tridata als statistiekdocente.

Dr. A. (Anouck) Kluytmans studeerde methoden en statistiek aan de Universiteit Utrecht. Gedurende haar studies deed ze ruime ervaring op met onderwijs in onderzoeksmethoden en data-analyse op bachelor-, master- en postgraduate niveau. Ook werkte ze als statistisch en toegepast onderzoeker. In haar proefschrift gebruikte ze statistische modellen, aangevuld door kwalitatieve dataverzameling, om al in een vroeg stadium in te schatten wat de potentiële meerwaarde van medisch-technologische innovaties is. Vanuit dit onderzoek adviseerde ze bovendien publiek-private samenwerkingen hoe zij deze methoden konden toepassen om investeringsbeslissingen te verantwoorden. Tijdens dit promotieonderzoek aan het Radboud UMC bleef Anouck actief als docent onderzoeksmethoden en statistiek. Zij zet nu haar expertise op het gebied van onderzoek en data-analyse in om universitair onderwijs te verbeteren. Met haar aansluiting bij Tridata wil Anouck cursisten uit diverse contexten laten ervaren hoe zij zich de rol van onderzoeker en data-analist in korte tijd kunnen aanmeten en hen tools meegeven om praktische vraagstukken zelfstandig te beantwoorden.

De docenten maken o.a. gebruik van het boek Discovering Statistics Using R van Andy Field

Back To Top