Cursus Machine Learning (5 dagen)

Machine learning is the science of getting computers to act without being explicitly programmed

Doel

Het verkrijgen van een gedegen technische kennis en business toepassingen op het gebied van Machine Learning. Na deze cursus heeft de cursist een duidelijk beeld over de verschillende type Machine Learning algoritmes, de correcte toepassing ervan, en de uitrol in de organisatie (deployment).

Doelgroep

De cursus bestaat uit twee delen. Het eerste deel is  bedoeld voor iedereen die geïnteresseerd is in het leren wat Machine Learning is en het toepassen van Machine Learning technieken voor data-analyse en predictie. Dit deel is geschikt voor mensen die een carrière als data scientist of teammanagers die de communicatie met hun teamleden willen verbeteren. Het tweede deel (3 dagen: dag 3 t/m 5) is bedoeld voor iedereen die al beschikt over  enige basiskennis Machine Learning en wil leren hoe Machine Learning  gebruikt kan worden om problemen uit de praktijk op te lossen.

Module opbouw
Tridata hecht er aan om cursisten tijdens de cursussen hands-on ervaring op te laten doen. Dus op basis van gedegen theorie meteen toepassen in de praktijk. Elke dag bestaat daarom voor ongeveer de helft uit oefeningen onder begeleiding van onze ervaren docenten. Tijdens de oefeningen zal gewerkt worden met R and Rstudio. Er is ook een algemene introductie tot Amazon Web services, Microsoft Azure,  IPython server, Spark and Scala in het programma
De cursus Machine Learning bestaat uit twee delen die ook apart gevolgd kunnen worden.

Inhoud (5 dagen)

De cursus bestaat uit  twee delen die ook apart gevolgd kunnen worden:
Introductie Machine Learning
Dag 1.
Hoe Machine Learning werkt

  • Welk type problemen Machine Learning oplost? 
  • Supervised Learning inleiding
  • Unsupervised Learning inleiding

Het opzetten van een ML platform

  • Opzetten van AWS en inleiding tot verschillende AWS services
  • Opzetten van R; Rstudio Server en ML packages in een AWS- EC2 instance
  • Opzetten van iPython Notebook Server en ML packages in een AWS - EC2 instance
  • Lezen en schrijven vanuit AWS-S3 de bestanden die wij in de cursus zullen gebruiken, en eerste beschrijvende analyse.

Dag 2
Algoritmen voor de  vraag: hoeveel? b.v. hoeveel clicks verwacht ik, wat  voor kijkcijfer verwacht ik?      

  • Enkelvoudige  Lineaire regressie
  • Multipele lineaire regressie
  • Gegeneraliseerde  lineaire modellen
  • Hands-on Lab

Algoritmen  voor de vraag: tot welke categorie behoort x of y? b.v. Blijft  klant  x bij ons of gaat hij naar de concurrent?

  • Logistische regressie
  • Beslisbomen
  • Het AdaBoost algoritme
    Hands-on Lab

Dag 3
Algoritmen voor de vraag welke groepen zijn er? b.v. Welke producten in de supermarkt horen bij elkaar omdat ze vaak samen worden verkocht?   

  • Apriori
    k-means
    DBSCAN
    Hands-on Lab

Algoritmen voor de vraag : is er iets aan de hand? b.v. Is dit een normale banktransactie? Is dit een verdacht bericht?

  • Seasonal-Trend decomposition using Loess (STL)
  • Seasonal Hybrid ESD (S-H-ESD): twitter algoritme
    Hands-on

Dag 4.
Inleiding tot Azure Machine Learning diensten
Inleiding tot AWS Machine Learning diensten  
Het verder uitbreiden van het Machine Learning platform

  • Eerste data import en analyse
  • opzetten van Sparklyr en SparkR
  • opzetten van scala and spark

Dag 5
Inleiding tot predicative analytics  en classificatie
Data geschikt maken voor ML technieken: feature selectie en evaluatie.

Ensemble methoden

  • Random Forests
  • xgboost
  • Hand-on Lab Evaluatie van de performance van  predicatieve modellen
    ROC curve, AUC, Sensitivity (True Positive Rate), Specificity (False Positive Rate), etc.
    Hands-on Lab

Van ruwe data naar een data product: bouwen van een recommender system

  • Content-based en Collaborative Recomendations
  • Bouw een offline recommender system 
  • Hoe zet je een ML model in productie/online
  • Deploy een reeds gebouwd recommender system to Azure/AWS.

Kosten en inschrijving

De kosten van de 5-daagse cursus bedragen € 3550. Indien u ervoor kiest om slechts één module te volgen dan betaalt u €750/dag. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken en cursusmateriaal, deelnamecertificaat, koffie / thee en luxe lunches.

Tridata heeft eigen cursuslocaties met pc’s waarop kan worden gewerkt. Cursisten die daar de voorkeur aan geven kunnen ook een eigen laptop meebrengen. Voordeel is dat alle software, opgaven en scripts dan op de eigen omgeving staan.

Cursusdata (Utrecht)
9-nov, 16-nov, 23-nov, 30-nov, 7-dec 2018 (Utrecht)

In-company training

Deze opleiding kan ook in-company worden gegeven. In overleg past tridata de inhoud aan uw wensen. Voor meer informatie kunt u contact met ons opnemen.

Waarom de cursus volgen bij Tridata?.

- Tridata is het enige instituut wat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
- De data science opleiding van tridata is een multidisciplinaire opleiding die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, big data, Tekstmining, datavisualisatie en datamanagement & cloud computing. De docenten hebben diverse wetenschappelijke artikelen en boeken geschreven.

Dr. H (Hicham) Zmarrou studeerde in 2003 af in de richting Financiële Wiskunde en Stochastische Differentiaalvergelijkingen aan de Universiteit van Amsterdam. Hij is gepromoveerd in 2008 aan dezelfde universiteit op het onderwerp 'Stochastische systemen'. Na zijn promotie heeft de heer Zmarrou diverse R&D functies bekleed. De heer Zmarrou is verbonden aan Tridata als docent van o.a. R Statistical Programming, Machine Learning, Bayesian analysis en adviseert hierin.