skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Cursus Machine Learning (5 dagen)

‘Machine learning is the science of getting computers to act without being explicitly programmed’

Machine learning is een toepassing van kunstmatige intelligentie (AI) die systemen de mogelijkheid biedt om automatisch te leren en te verbeteren zonder expliciet te worden geprogrammeerd. Machine learning is gericht op de ontwikkeling van algoritmes en technieken waarmee computers kunnen leren gegevens te analyseren en interpreteren.

Doel

Het doel van de Cursus Machine Learning is het verkrijgen van een gedegen technische kennis en businesstoepassingen op het gebied van Machine Learning. Na deze cursus heeft de cursist een duidelijk beeld over de verschillende typen Machine Learning-algoritmes, de correcte toepassing ervan, en de uitrol in de organisatie (deployment).

Doelgroep

De cursus Machine Learning bestaat uit twee delen. Het eerste deel is bedoeld voor iedereen die geïnteresseerd is in leren wat Machine Learning is en de toepassing van machinelearningtechnieken voor data-analyse en predictie. Dit deel is geschikt voor mensen die een carrière als data scientist ambiëren of teammanagers die de communicatie met hun teamleden willen verbeteren. Het tweede deel (3 dagen: dag 3 t/m 5) is bedoeld voor iedereen die al beschikt over enige basiskennis en wil leren hoe Machine Learning gebruikt kan worden om problemen uit de praktijk op te lossen.

Moduleopbouw

Tridata hecht er waarde aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen, dus wordt er op basis van gedegen theorie meteen toegepast in de praktijk. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten. Tijdens de oefeningen zal gewerkt worden met R and Rstudio. Hierbij wordt zowel aandacht besteed aan de datasciencemethoden, alsook de engineering best practices. Naast de verschillende classificatie-, regressie- en clusteringmethoden, wordt dus ook uitgebreid gekeken naar de mogelijkheden om R effectief te kunnen gebruiken, incl. verschillende datamanipulatiemodules, pipelines, debugging van code, etc. Ook versiebeheer met Git en Markdown komen aan bod. De cursisten gaan dit zowel lokaal doen, als op één cloud platform, w.o.Amazon AWS.

Inhoud (5 dagen)

Introductie Machine Learning

Dag 1. Introductie, zowel qua datasciencemethoden als een introductie tot R en RStudio, incl. best practices voor het opzetten van projecten in RStudio met versiebeheer en een aantal datamanipulatiemodules. Eerste toy model wordt gebouwd.

Dag 2. Datasciencedag met verschillende classificatiemethoden, waarbij we een professionele pipeline bouwen met best practices. Ook feature engineering-technieken komen aan bod, waardoor na deze dag een echt model gebouwd kan worden.

Dag 3. Engineeringdag. We gaan wat we tot dusver hebben geleerd implementeren op een cloudplatform. Versiebeheer met Git komt deze dag ook wat uitgebreider aan bod en ook de command line wordt behandeld. Afhankelijk van de tijd kunnen we nog gaan kijken naar clusteringtechnieken.

Dag 4. Op deze dag gaan we alles aanscherpen, zowel qua data science als qua engineering. We gaan nu kijken naar verschillende regressiemethoden en een volledige pipeline implementeren, zowel lokaal als in de cloud. Op verschillende onderdelen zullen we nog wat dieper ingaan.

Dag 5. Afsluitende dag waarbij we gaan kijken naar clusteringtechnieken, en ook zullen zorgen voor het overzicht met een samenvatting van alles wat we geleerd hebben. We nemen een volledig geïmplementeerde pipeline mee naar huis van zowel een classificatie- als een regressieprobleem. We gaan vandaag ook nog kijken naar clusteringtechnieken (tenzij al op dag 3 behandeld). Tot slot doen we een introductie in Spark met behulp van het SparklyR pakket. Ook wordt er een overzicht gegeven van Big Data-technieken, hoe ze met elkaar samenhangen (wanneer heb je wat nodig), etc.

Kosten en inschrijving

De kosten van de 5-daagse cursus Machine Learning bedragen €3550. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken en cursusmateriaal, deelnamecertificaat, koffie/thee en luxe lunches.

Tridata heeft eigen cursuslocaties met pc’s waarop kan worden gewerkt. Cursisten die daar de voorkeur aan geven kunnen ook een eigen laptop meebrengen. Voordeel is dat alle software, opgaven en scripts dan op de eigen omgeving staan.

Cursusdata (Utrecht)

3 juni, 10 juni, 17 juni, 24 juni, 1 juli 2022
11 november, 18 november, 25 november, 2 december, 9 december 2022

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

In-company training

De cursus Machine Learning kan ook in-company worden gegeven. Een in-company training, ook wel in-house training of bedrijfstraining, is een training die binnen jouw organisatie plaatsvindt. Hebben meerdere collega’s in uw organisatie dezelfde leervraag? Dan is een in-company training zeer geschikt. Onze trainingsprogramma’s stemmen we af op leerwensen en –doelen van jou en je collega’s. Neemt u voor een maatwerkofferte contact op met Tridata.

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– De Opleiding Data Science van Tridata is een multidisciplinaire opleiding die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, big data, tekstmining, datavisualisatie en datamanagement & cloud computing. De docenten hebben diverse wetenschappelijke artikelen en boeken geschreven.

Docent

Dr. J. (Joris) de Wind promoveerde in 2014 aan de Universiteit van Amsterdam (Cum Laude). In zijn proefschrift heeft hij verschillende nieuwe econometrische technieken ontwikkeld en toegepast op macro-economische vraagstukken. Joris heeft in de periode 2008-2017 verschillende economische modellen ontwikkeld voor beleidsanalyses en voor het maken van (kortetermijn)voorspellingen, eerst bij De Nederlandsche Bank en later bij het Centraal Planbureau. In 2017 heeft Joris de overstap gemaakt naar de datasciencediscipline en is momenteel als data scientist werkzaam bij ING Nederland. Sinds medio 2018 geeft Joris diverse cursussen over data science namens Tridata, zowel in R en ook met Python.

Back To Top