skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Tridata Summer Course Big Data en Business Analytics (5 dagen)

Waardecreatie met Big Data Analytics

Doel

De hoeveelheid gegenereerde gegevens neemt dagelijks explosief toe. Niet langer komt data alleen maar voort uit de informatiesystemen van een organisatie, haar partners en klanten, er is tegenwoordig een enorme hoeveelheid bronnen die (on)gestructureerde data leveren. Data is echter nog geen informatie. In deze cursus wordt ingegaan op hoe deze data op een slimme manier gebruikt kunnen worden. We besteden aandacht aan het concept van big data en de mogelijkheden voor organisaties. Tevens worden de verschillen tussen huidige databasetechnieken en nieuwe tools en technologieën zoals Hadoop en Spark behandeld. Cursisten krijgen een breed overzicht van moderne methoden en oefenen zelf met enkele van de belangrijkste tools en methoden.

Doelgroep

De doelgroep van deze cursus zijn analisten, marketeers, onderzoekers, en managers die hun kennis en vaardigheden over het huidige werkveld en de datarevolutie willen opfrissen. De Big Data cursus is ontwikkeld voor Big Data projectmanagers, Business Intelligence managers en -consultants, IT managers, business development managers, data-analisten, business-analisten, datawarehouse-analisten, informatiearchitecten, marketing(technology)managers, marketing(intelligence)managers en innovatiemanagers.

Na afronding van de cursus

  • Beschikt u over allround kennis die u nodig heeft om een realistische inschatting te maken van de impact en mogelijkheden van Big Data in uw organisatie.
  • Heeft u kennis gemaakt met verschillende toepassingen en tools voor het verzamelen, opslaan, analyseren en visualiseren van grote en (on)gestructureerde databestanden.
  • Beschikt u over de juiste handvaten om als projectmanager Big Data uw eigen Big Data projecten te ontwerpen en te leiden.
  • Kent u de meest recente ontwikkelingen op het gebied van business intelligence en Big Data.
  • Kunt u vaststellen hoe Big Data kan worden omgezet in nieuwe kansen, diensten en verdienmodellen.
  • Bent u in staat om te bepalen welke interne en externe databronnen nodig zijn om de gevraagde informatie te kunnen vervaardigen.
  • Heeft u inzicht in methoden voor het analyseren van Big Data.

Moduleopbouw

De wekelijkse opbouw van het programma stelt u in staat om deze opleiding eenvoudig te combineren met uw dagelijkse werkzaamheden. Daarbij creëert deze opbouw voor u de ruimte om vragen te stellen die tussentijds op de werkvloer naar boven zijn gekomen.

Inhoud (5 dagen)

Dag 1: Huidige trends in Big Data en Data Science
Overzicht van de huidige trends in (big data) tools en werkwijzen.
Wat is een data scientist en wanneer is data ‘big’?
Datascienceprojecten en de rollen in een data science team
Inleiding R en RStudio:
Inleiding R; de R community, hulp krijgen en R community
Werken met RStudio; workflow en Rstudio projects
Basis datatypen en datamanipulatie in R

Dag 2: Inleiding Data Science in R en R studio
Meer over data-import en -export
Data summaries en eenvoudige visualisaties
Inleiding statistische modellen met R
Time series Forecasting en trendanalyse

Dag 3: Data management en data cleaning
De datawaardeketen
Datatypen, conversie,
Nette data en datavalidatie
Oefeningen met R

Dag 4: Crash course modern predictive modeling methoden
Overzicht Statistical Learning en modelselectie
Random Forests en Gradient Boosted trees
Modelkeuze en interpretatie.
Oefeningen met R

Dag 5: Communicatie en vertaling naar de praktijk
Datavisualisatie en informatievisualisatie
Automatic reporting
Dashboards
Oefeningen met plotly
Praktijkopdracht uitwerken

Kosten en inschrijving

De kosten van de 5-daagse cursus bedragen €2750. De cursusprijs is vrijgesteld van BTW (BTW-tarief 0%) en is inclusief boeken en cursusmateriaal, deelnamecertificaat, koffie/thee en lunches.

Scholingsvoucher aanvragen bij het UWV
De scholingsvoucher heeft een waarde van maximaal €2.500 inclusief btw. Hiermee kunt u zich laten bij- of omscholen naar een kansberoep. Dit zijn beroepen waar de kans op werk gemiddeld of hoger is.
Een scholingsvoucher is een subsidie om een opleiding te volgen voor een van de kansberoepen uit dit overzicht. U vindt deze beroepen in de bijlage Kansberoepenlijst.

Tridata heeft eigen cursuslocaties met pc’s waarop kan worden gewerkt. Cursisten die daar de voorkeur aan geven kunnen ook een eigen laptop meebrengen. Voordeel is dat alle software, opgaven en scripts dan op de eigen omgeving staan.

Cursusdata (Utrecht)

8 t/m 12 augustus 2022

Lestijden

De lestijden zijn van 9:15 tot 16:00, met uitloop tot uiterlijk 16:15.

Studiebelasting

Per week kun je rekenen op 8 uur studielast, op de cursusdag zelf. Daarnaast ben je in je vrije tijd per week nog 2-4 uur bezig met de voorbereiding en verwerking van de cursusdag. Dit is afhankelijk van de intensiviteit van de lesstof en jouw eigen opleidingsachtergrond.

In-company training

Deze opleiding kan ook in-company worden gegeven. In overleg past Tridata de inhoud aan uw wensen aan. Voor meer informatie kunt u contact met ons opnemen.

Waarom de cursus volgen bij Tridata?

– Tridata is het enige instituut dat een door de Vereniging voor Statistiek & Operationele Research (VVS-OR) erkende opleiding statistiek aanbiedt.
– De data science opleiding van Tridata is een multidisciplinaire opleiding die wordt gegeven door drie verschillende docenten met ruime ervaring op het gebied van R, statistical modeling en machine learning, statistical software development, tekstanalyse, big data, Tekstmining, datavisualisatie en datamanagement & cloud computing. De docenten hebben diverse wetenschappelijke artikelen en boeken geschreven.

Dr. M. (Mark) van der Loo studeerde cum laude af in de informatische chemie aan de Katholieke Universiteit Nijmegen (een combinatie van scheikunde, wiskunde, en informatica). Na zijn promotie op een onderwerp uit de quantumfysica werd hij werkzaam als statistisch onderzoeker bij het CBS met als specialiteit statistical computing and modeling, data cleaning en text processing. Over deze onderwerpen publiceert hij op conferenties en in peer reviewed journals. Mark is expert op het gebied van R, python,  en (multicore) C programming en heeft verschillende R-packages op CRAN gepubliceerd. Een van die packages wordt onder andere door Wikimedia Foundation gebruikt voor tekstanalyse van Wikipedia paginas. Mark werkt sinds 2012 als consultant en docent voor Tridata.

Drs. E. (Edwin) de Jonge studeerde af in de theoretische natuurkunde aan de Katholieke Universiteit Nijmegen. Na zich enkele jaren the hebben gespecialiseerd in softwareontwikkeling is hij als onderzoeker gaan werken bij het CBS met als specialiteit statistical computing and modeling, data management en data visualisatie. Over dit laatste onderwerp publiceerde Edwin onder andere een paper voor de prestigieuze IEEE VisWeek conferentie. Edwin is expert op het gebied van verschillende programmeertalen waaronder C++, javascript, python en R. In die laatste taal ontwikkelde hij een package wat inmiddels meer dan 120.000 maal per maand wordt gedownload van de CRAN servers. Edwin werkt sinds 2012 als consultant en docent voor Tridata.

Mark van der Loo en Edwin de Jonge zijn auteurs van de boeken “Learning RStudio for R Statistical Computing” (Packt Publishing, 2012) en “Statistical Data Cleaning with Applications in R” (Wiley, 2018). In 2013 gaven zij een tutorial op de grootste R conferentie ter wereld (useR!2013) getiteld “An introduction to data cleaning with R”. Zij waren ook keynote speakers op useR conferenties in Boekarest, Los Angeles, Toulouse, Marrakesh, Madrid, etc.

Dr. ir. J. (Jan) van der Laan studeerde af op het gebied van signaalverwerking bij de de faculteit technische natuurkunde aan de Technische Universiteit Delft. Na zijn promotie op het gebied van medical physics is hij als statistisch onderzoeker werkzaam bij het CBS. Op het CBS houdt hij zich onder andere bezig met statistische analyse en regressietechnieken, data visualisatie en het verwerken en koppelen van grote bestanden. Over deze onderwerpen publiceert hij op conferenties en peer reviewed journals. Jan is expert op het gebied van  meerdere programmeertalen waaronder C++, Javascript, D3.js en R. Hij heeft bijdragen geleverd aan meerdere R packages op CRAN. Jan werkt sinds 2015 als consultant en docent bij Tridata.

Vervolgcursus

Opleiding Data Science (10 dagen)

Back To Top