skip to Main Content
Instituut voor toegepaste statistiek en data-analyse Geaccrediteerd door de Vereniging voor Statistiek

Gratis Python cursus | zelf aan de slag

Python Script voor Data Manipulatie en Visualisatie: Een praktijkgericht voorbeeld

Bekijk hier de 3-daagse cursus Python | Python for data science

# Basistypen en variabelen
# In deze code worden verschillende basistypen en variabelen gedemonstreerd.
# De variabele x wordt toegewezen aan de waarde 5, wat een integer is.
# De variabele y wordt toegewezen aan de waarde 3.14, wat een float is.
# De variabele z wordt toegewezen aan de string “Hello, world!”.
x = 5
y = 3.14
z = “Hello, world!”

# Control structuren en functies
# Hier wordt een voorbeeld gegeven van het gebruik van een if-else statement.
# De code controleert of x groter is dan y en geeft een bijbehorende boodschap.
# Daarna wordt een eenvoudige functie greet() gedefinieerd die een begroeting afdrukt met de opgegeven naam.

if x > y:
print(“x is groter dan y”)
else:
print(“x is kleiner dan of gelijk aan y”)

def greet(name):
print(“Hello, ” + name + “!”)

greet(“John”)

# Lists en sets
# Hier worden een lijst (numbers) en een set (names) gedemonstreerd.
# De lijst bevat de getallen 1 tot en met 5, terwijl de set namen bevat zoals “Alice”, “Bob” en “Charlie”.
numbers = [1, 2, 3, 4, 5] names = {“Alice”, “Bob”, “Charlie”}

# Packages

# Importeren van de benodigde packages
# Hier worden de benodigde packages geïmporteerd voor verdere demonstraties.
# De pandas, matplotlib.pyplot en seaborn packages worden geïmporteerd onder de gebruikelijke aliassen pd, plt en sns.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Voorbeeld code met gebruik van de packages
# Inlezen van data met Pandas
# De code pd.read_csv(‘data.csv’) wordt gebruikt om data in te lezen vanuit een CSV-bestand en op te slaan in een DataFrame-object genaamd data.
data = pd.read_csv(‘data.csv’)

# Data manipulatie met Pandas
# Hier wordt een voorbeeld gegeven van data manipulatie met behulp van Pandas.
# De code data[‘column’] > 10 selecteert de rijen waarvan de waarden in de kolom ‘column’ groter zijn dan 10.
# Het resultaat wordt toegewezen aan de variabele filtered_data, die een nieuwe DataFrame bevat met alleen de geselecteerde rijen.
filtered_data = data[data[‘column’] > 10]

# Visualisatie met matplotlib
# Hier wordt een eenvoudige grafiek gemaakt met behulp van matplotlib.
# De code plt.plot(data[‘x’], data[‘y’]) tekent een lijndiagram met de waarden uit de kolommen ‘x’ en ‘y’ van de DataFrame data.
# De xlabel(), ylabel() en title() functies worden gebruikt om de labels van de x-as, y-as en de titel van de grafiek in te stellen.
# Tot slot wordt plt.show() gebruikt om de grafiek weer te geven.
plt.plot(data[‘x’], data[‘y’])
plt.xlabel(‘X-as’)
plt.ylabel(‘Y-as’)
plt.title(‘Data Visualisatie’)
plt.show()

# Geavanceerde visualisatie met seaborn
# Hier wordt een geavanceerdere visualisatie gemaakt met behulp van seaborn.
# De code sns.scatterplot(data=data, x=’x’, y=’y’, hue=’category’) maakt een scatterplot waarbij de waarden uit de kolommen ‘x’ en ‘y’ worden weergegeven.
# De hue parameter zorgt ervoor dat punten in de plot worden ingekleurd op basis van de waarden in de kolom ‘category’.
# Tot slot wordt plt.show() gebruikt om de plot weer te geven.
sns.scatterplot(data=data, x=’x’, y=’y’, hue=’category’)
plt.show()

Introductie data-analyse

# Werken met externe data en databases
# Hier wordt de import van de sqlite3 package gebruikt om te werken met externe databases.
import sqlite3

# Verbinding maken met een database
# De code sqlite3.connect(‘database.db’) maakt verbinding met een SQLite-database met de naam ‘database.db’.
conn = sqlite3.connect(‘database.db’)
# Query uitvoeren op de database
# De code conn.execute(‘SELECT * FROM table’) voert een query uit op de verbonden database.
result = conn.execute(‘SELECT * FROM table’)
# Data opschonen
# De code data.dropna() wordt gebruikt om ontbrekende waarden (NaN-waarden) uit de dataset te verwijderen.
# Het resultaat wordt toegewezen aan de variabele cleaned_data.
cleaned_data = data.dropna()

# Data analyseren met Pandas
# De code cleaned_data.describe() genereert een samenvattende statistiek van de dataset met behulp van de describe()-functie van Pandas.
# Deze functie berekent statistieken zoals het gemiddelde, de standaarddeviatie, de minimale waarde, de maximale waarde en de kwartielen voor elke numerieke kolom in de dataset.
# Het resultaat wordt toegewezen aan de variabele summary.
summary = cleaned_data.describe()

# Probleemoplossing en debugging
# De functie divide() demonstreert het gebruik van exception handling voor probleemoplossing en debugging.
# De code probeert x door y te delen en als er een ZeroDivisionError optreedt, wordt de boodschap “Kan niet delen door nul!” afgedrukt.
def divide(x, y):
try:
result = x / y
return result
except ZeroDivisionError:
print(“Kan niet delen door nul!”)

print(“Kan niet delen door nul!”)

Uitleg Python Script

# Introductie
# In deze eerste module beginnen we met het ontstaan en de ontwikkeling van Python.
# Er wordt uitgelegd hoe je Python installeert en welke verschillende ontwikkelomgevingen er bestaan.
# We gaan specifiek in op Jupyter Notebook, de webapplicatie die we in deze cursus zullen gebruiken.
# Basistypen, tupels en variabelen
# Elke programmeertaal kent bepaalde ingebouwde basistypen.
# We bespreken de eigenschappen van Pythons basistypen.
# Ook gaan we in op de overeenkomsten en verschillen tussen variabelen, constanten en waarden objecten.

# Controlestructuren en functies
# Via controlestructuren beïnvloed je de manier waarop je script wordt uitgevoerd.
# Hierbij kun je bijvoorbeeld denken aan een als-dan-structuur.
# We bespreken de meest voorkomende controlestructuren die ook in andere programmeertalen veel aan bod komen.
# Ook behandelen we functies, samenhangende stukjes code die specifieke taken kunnen uitvoeren.
# We laten zien hoe je zelf een functie kunt schrijven.

# Lists en sets
# We bespreken nog twee ingebouwde datatypen in Python.
# In tegenstelling tot wat we tot dusver hebben gezien, kunnen deze typen veranderd worden (ze zijn ‘mutable’).
# We gaan in op de voor- en nadelen hiervan en waar je op moet letten.

# Modules, data inlezen en visualisaties

# Data inlezen
# Om data te kunnen analyseren, moet deze data natuurlijk eerst te vinden zijn in je Python-omgeving.
# We laten zien hoe je dit doet met databestanden die op je computer staan.

# Modules
# Een van de grote voordelen van Python is dat er ontzettend veel kwalitatief hoogwaardige modules bestaan.
# Een Python-module is een programma dat is bedoeld om gebruikt te worden door andere Python-scripts.
# Je kunt het zien als een soort ‘code-bibliotheek’.
# Dit maakt je leven als programmeur een stuk makkelijker.
# We bespreken de populairste Python-modules.

# Visualisaties
# Om data inzichtelijk te maken zijn goede visualisaties essentieel.
# We bespreken welke visualisatie geschikt is voor welk type data,
# en hoe je deze visualisaties in Python kunt maken met behulp van de matplotlib- en seaborn-modules.

# Stijlgids: do’s and don’ts
# Net zoals gesproken taal kent ook iedere programmeertaal bepaalde regels en conventies.
# We behandelen de belangrijkste do’s en don’ts in Python en bespreken het belang hiervan.

# Dag Introductie data-analyse

# Werken met externe data en databases
# Vaak zul je niet alleen met lokale data werken, maar ook met externe data.
# We laten zien hoe je dit soort data kunt importeren in Python, hoe je het kunt opslaan in databases
# en hoe je er vervolgens mee kunt werken.

# Data opschonen
# Er wordt wel eens gezegd dat datawetenschappers wel 80 procent van hun tijd kwijt zijn aan het opschonen van hun data.
# Dat is wellicht wat overdreven, maar het is een niet te onderschatten onderdeel van het werkproces.
# Daarom oefenen we in dit blok met het opschonen van verschillende datatypen.

# Data analyseren met Pandas
# Pandas is een populaire en krachtige Python-module voor het manipuleren en analyseren van data.
# We laten zien hoe je met behulp van Pandas eenvoudig je data kunt bewerken, samenvatten of samenvoegen.

# Hoe pak ik een programmeerprobleem aan?
# Aan het begin van je programmeercarrière is het vaak lastig in te schatten hoe je een probleem het beste kunt aanpakken.
# We bespreken hoe je een probleem in kleinere stukjes kunt hakken, hoe je het beste kunt debuggen
# en waar je terecht kunt als je vastloopt.
# Zo heb je handvatten om je leerproces voort te zetten.

Back To Top