Cursus Machine Learning (5 dagen)

Machine learning is the science of getting computers to act without being explicitly programmed

Doel

Het verkrijgen van een gedegen technische kennis en business toepassingen op het gebied van Machine Learning. Na deze cursus heeft de cursist een duidelijk beeld over de verschillende type Machine Learning algoritmes, de correcte toepassing ervan, en de uitrol in de organisatie (deployment).

Doelgroep

De cursus bestaat uit twee delen. Het eerste deel is  bedoeld voor iedereen die geïnteresseerd is in het leren wat Machine Learning is en het toepassen van Machine Learning technieken voor data-analyse en predictie. Dit deel is geschikt voor mensen die een carrière als data scientist of teammanagers die de communicatie met hun teamleden willen verbeteren. Het tweede deel (3 dagen: dag 3 t/m 5) is bedoeld voor iedereen die al beschikt over  enige basiskennis Machine Learning en wil leren hoe Machine Learning  gebruikt kan worden om problemen uit de praktijk op te lossen.

Module opbouw
Tridata hecht er aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen. Dus op basis van gedegen theorie meteen toepassen in de praktijk. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten. Tijdens de oefeningen zal gewerkt worden met R and Rstudio. Hierbij wordt zowel aandacht besteed aan de data science methoden alsook de engineering best practices. Dus naast de verschillende classificatie, regressie en clustering methoden, wordt ook uitgebreid gekeken naar de mogelijkheden om R effectief te kunnen gebruiken incl. verschillende data manipulatie modules, pipelines, debugging van code, etc. Ook versiebeheer met Git en Markdown komen aan bod. De cursisten gaan dit zowel lokaal doen alsook op één cloud platform, w.o.Amazon AWS.

Inhoud (5 dagen)

Introductie Machine Learning

Dag 1. Introductie, zowel qua data science methoden alsook een introductie tot R en RStudio, incl. best practices voor het opzetten van projecten in RStudio met versiebeheer en een aantal data manipulatie modules. Eerste toy model wordt gebouwd.

Dag 2. Data science dag met verschillende classificatie methoden, waarbij we een professionele pipeline bouwen met best practices. Ook feature engineering technieken komen aan bod, waardoor na deze dag een echt model gebouwd kan worden.

Dag 3. Engineering dag. We gaan wat we tot dusver hebben geleerd implementeren op een cloud platform. Versiebeheer met Git komt deze dag ook wat uitgebreider aan bod en ook de command line wordt behandeld. Afhankelijk van de tijd kunnen we nog gaan kijken naar clustering technieken.
Dag 4. Op deze dag gaan we alles aanscherpen zowel qua data science en engineering. We gaan nu kijken naar verschillende regressie methoden en een volledige pipeline implementeren, zowel lokaal als op in de cloud. Op verschillende onderdelen zullen we nog wat dieper ingaan.

Dag 5. Afsluitende dag waarbij we gaan kijken naar clustering technieken en ook zorgen voor het overzicht en samenvatting van alles wat we geleerd hebben. We nemen een volledig geïmplementeerde pipeline mee naar huis van zowel een classificatie als een regressie probleem. We gaan vandaag ook nog kijken naar clustering technieken (tenzij al op dag 3 behandeld). Tot slot doen we een introductie in Spark met behulp van het SparklyR pakket. Ook wordt er een overzicht gegeven van Big Data technieken, hoe ze met elkaar samenhangen (wanneer heb je wat nodig), etc.

Kosten en inschrijving

De kosten van de 5-daagse cursus bedragen € 3550. Indien u ervoor kiest om slechts één module te volgen dan betaalt u €750/dag. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken en cursusmateriaal, deelnamecertificaat, koffie / thee en luxe lunches.

Tridata heeft eigen cursuslocaties met pc’s waarop kan worden gewerkt. Cursisten die daar de voorkeur aan geven kunnen ook een eigen laptop meebrengen. Voordeel is dat alle software, opgaven en scripts dan op de eigen omgeving staan.

Cursusdata (Utrecht)

Planning

Dag 1: 29 mei 2019
Dag 2 en 3: 14 en 17 juni 2019
(Pauze: experimenteren met ML technieken )
Dag 4 en 5: 6 en 9 september 2019

De deelnemers hebben tijd nodig om te experimenteren terwijl ze ook de focus nodig hebben, vandaar de blokken.

Dag 1: vrijdag 18 oktober
Dag 2 en dag 3:  vrijdag 1 november en maandag 4 november 2019
Dag 4 en dag 5: vrijdag 22 november en maandag 25 november 2019

In-company training

Deze opleiding kan ook in-company worden gegeven. In overleg past tridata de inhoud aan uw wensen. Voor meer informatie kunt u contact met ons opnemen.

Waarom de cursus volgen bij Tridata?.

- Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
- De data science opleiding van tridata is een multidisciplinaire opleiding die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, big data, Tekstmining, datavisualisatie en datamanagement & cloud computing. De docenten hebben diverse wetenschappelijke artikelen en boeken geschreven.

Docent

Dr. J. (Joris) de Wind
Dr. J. de Wind promoveerde in 2014 aan de Universiteit van Amsterdam (Cum Laude). In zijn proefschrift heeft hij verschillende nieuwe econometrische technieken ontwikkeld en toegepast op macroeconomische vraagstukken. Joris heeft in de periode 2008-2017 verschillende economische modellen ontwikkeld voor zowel beleidsanalyses en het maken van (korte-termijn) voorspellingen, eerst bij De Nederlandsche Bank en later bij het Centraal Planbureau. In 2017 heeft Joris de overstap gemaakt naar de data science discipline en is momenteel als data scientist werkzaam bij ING Nederland. Sinds medio 2018 geeft Joris diverse data science cursussen namens Tridata, zowel in R en ook met Python.