skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Cursus Data Science met Python

Data Science is een multidisciplinaire benadering om bruikbare inzichten te extraheren uit de grote en steeds groter wordende hoeveelheden gestructureerde en ongestructureerde gegevens, die worden verzameld en gecreëerd door hedendaagse organisaties. Tridata biedt dé cursus Data Science, gericht op het voorbereiden van gegevens voor analyse en verwerking, het uitvoeren van geavanceerde gegevensanalyses en het presenteren van de resultaten om patronen op een slimme manier te onthullen. De cursus Data Science biedt een gestructureerde aanpak om problemen op te lossen met goed gedefinieerde stappen.

In de cursus Data Science met Python besteden we aandacht aan de verschillende stappen van de data science-levenscyclus. De levenscyclus bevat de belangrijkste fasen die projecten meestal doorlopen, vaak iteratief:

1: Probleemidentificatie
2: Begrip van de bedrijfscontext
3: Gegevens verzamelen
4: Gegevensvoorbewerking
5: Gegevens analyseren
6: Gegevensmodellering
7: Modelevaluatie
8: Modelimplementatie
9: Inzichten genereren en BI-rapporten maken
10: Besluitvorming op basis van inzichten

Data Science

Data Science Cycle

Data Science tool

Tijdens de cursus Data Science wordt gewerkt met de programmeertaal Python, wereldwijd een van de meest gebruikte programmeertalen. Ontwikkelaars gebruiken Python voor data-analyse, development, DevOps, data-analyse en machine learning. Vooral die laatste twee winnen aan populariteit.
Wil je liever aan de slag met R, meld je dan aan voor de 5-daage cursus met R

Doelgroep

De cursus Data Science met Python is ontwikkeld voor Big Data projectmanagers, Business Intelligence managers en -consultants, IT managers, business development managers, data-analisten, businessanalisten, datawarehouse-analisten, informatiearchitecten, marketing(technology)managers, marketing (intelligence) managers, innovatiemanagers en Big data-analisten die hun kennis willen opfrissen en uitbreiden.

Vereiste vooropleiding en vaardigheden

Om de cursus Data Science succesvol af te sluiten wordt van de deelnemer een bepaald kennisniveau verwacht:
– Minimaal afgeronde HBO
– Basiskennis van ICT-systemen
– Basiskennis van één of meerdere programmeertalen is een pré, maar niet noodzakelijk.

Na afronding van de cursus Data Science:

  • Beschikt u over allround kennis die u nodig heeft om een realistische inschatting te maken van de impact en mogelijkheden van Big Data in uw organisatie.
  • Heeft u kennis gemaakt met verschillende toepassingen en tools voor het verzamelen, opslaan, analyseren en visualiseren van grote en (on) gestructureerde databestanden.
  • Beschikt u over de juiste handvaten om als projectmanager Big Data uw eigen Big Data-projecten te ontwerpen en te leiden.
  • Kent u de meest recente ontwikkelingen op het gebied van business intelligence en Big Data.
  • Kunt u vaststellen hoe Big Data kan worden omgezet in nieuwe kansen, diensten en verdienmodellen.
  • Bent u in staat om te bepalen welke interne en externe databronnen nodig zijn om de gevraagde informatie te kunnen vervaardigen.
  • Heeft u inzicht in methoden voor het analyseren van Big Data.
  • Bent u in staat om een datascienceproject in logische, onafhankelijke stappen op te delen.
  • Bent u in staat om gegevens op te schonen, en om te gaan met missende gegevens.

Moduleopbouw cursus  Data Science 

De wekelijkse opbouw van het programma stelt u in staat om deze cursus eenvoudig te combineren met uw dagelijkse werkzaamheden. Daarbij creëert deze opbouw voor u de ruimte om vragen te stellen die tussentijds op de werkvloer naar boven zijn gekomen.

Inhoud Data Science cursus

Dag 1: Inleiding tot Data Science en Tools

  • Introductie tot Data Science en Machine Learning
  • Installatie en configuratie van tools zoals Python, Jupyter Notebook, en populaire bibliotheken zoals NumPy, Pandas, en Scikit-learn
  • Basisprincipes van data-analyse en visualisatie met behulp van Pandas en Matplotlib

Dag 2: Data Preprocessing en Feature Engineering

  • Data cleaning en preprocessing: behandeling van ontbrekende waarden, uitschieters, en dubbele gegevens
  • Feature engineering: creatie van nieuwe kenmerken en transformaties van bestaande kenmerken om de voorspellende kracht van het model te verbeteren
  • Hands-on oefeningen met echte datasets om data preprocessing en feature engineering technieken toe te passen

Dag 3: Supervised Learning Technieken

  • Inleiding tot supervised learning en de meest gebruikte algoritmen: lineaire regressie, logistische regressie, k-nearest neighbors (KNN), decision trees, random forests en boosting
  • Model evaluatie en validatie: kruisvalidatie, evaluatiemetrics zoals precisie, recall en F1-score
  • Hands-on oefeningen met het bouwen en evalueren van supervised learning modellen op echte datasets

Dag 4: Introductie tot Deep Learning

  • Basisprincipes van Deep Learning: neurale netwerken, activatiefuncties, feedforward propagation
  • Introductie tot populaire Deep Learning-frameworks zoals TensorFlow
  • Hands-on oefeningen met het bouwen en trainen van eenvoudige neurale netwerkmodellen voor classificatie en regressie taken

Dag 5: Interpreteerbare AI en Model Interpretatie

  • Belang van interpreteerbare AI en model interpretatie in data science en machine learning
  • Technieken voor model interpretatie: SHAP (SHapley Additive exPlanations), LIME (Local Interpretable Model-agnostic Explanations), en Partial Dependence Plots (PDP)
  • Hands-on oefeningen met het interpreteren en verklaren van modellen om inzicht te krijgen in de voorspellingen en besluitvorming van het model

Cursusdata

1 april, 8 april, 15 april, 22 april, 29 april 2025
27 mei, 3 juni, 10 juni, 17 juni, 24 juni 2025

Herfstvakantie
Om tegemoet te komen aan afwezigheid tijdens de herfstvakantie, kan in overleg met de docent en de andere cursisten de lesplanning worden aangepast.

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

De cursus Data science met Python duurt 5 dagen. Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

Kosten en inschrijving

De kosten van de 5-daagse cursus Data Science met Python bedragen € 3350. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken, cursusmateriaal en toegang tot het e-learning platform van Tridata.

In-company en maatwerk

De cursus Data Science met Python kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die op maat voor jouw organisatie wordt gemaakt. Hebben meerdere collega’s in jouw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s. Voor meer informatie kunt u contact met ons opnemen.

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende cursus statistiek aanbiedt.
– De  cursus Data Science van Tridata is een multidisciplinaire opleiding die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, big data, tekstmining, datavisualisatie en datamanagement & cloud computing. De docenten hebben diverse wetenschappelijke artikelen en boeken geschreven.

Dr. M. (Mark) van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Na zijn promotie op een onderwerp uit de quantumfysica werd hij werkzaam als statistisch onderzoeker bij het CBS met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, python,  en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipedia paginas. Mark werkt sinds 2012 als consultant en docent voor Tridata.

Drs. E. (Edwin) de Jonge studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren the hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS met als specialiteit statistical computing and modeling, data management en data visualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert op het gebied van verschillende programmeertalen waaronder C++, javascript, python en R. In die laatste taal ontwikkelde hij een package wat inmiddels meer dan 120.000 maal per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.

Mark van der Loo en Edwin de Jonge zijn auteurs van de boeken “Learning RStudio for R Statistical Computing” (Packt Publishing, 2012) en “Statistical Data Cleaning with Applications in R” (Wiley, 2018). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) getiteld “An introduction to data cleaning with R”. Zij waren ook keynote speakers op useR conferenties in Boekarest, Los Angeles, Toulouse, Marrakesh, Madrid, etc.

Dr. J.(Joris) de Wind promoveerde in 2014 aan de Universiteit van Amsterdam (Cum Laude). In zijn proefschrift heeft hij verschillende nieuwe econometrische technieken ontwikkeld en toegepast op macro-economische vraagstukken. Joris heeft in de periode 2008-2017 verschillende economische modellen ontwikkeld voor beleidsanalyses en voor het maken van (kortetermijn)voorspellingen, eerst bij De Nederlandsche Bank en later bij het Centraal Planbureau. In 2017 heeft Joris de overstap gemaakt naar de datasciencediscipline en is momenteel als data scientist werkzaam bij ING Nederland. Sinds medio 2018 geeft Joris diverse cursussen over data science namens Tridata, zowel in R en ook met Python.

Vervolgcursus: Opleidng Data Science (12 dagen)

Back To Top