Apache Spark Hands-On Training

Een praktisch overzicht van Spark, volgens sommigen het Zwitsers zakmes voor bliksemsnelle big data analyse

4 March 2015 (14-18u30)
Locatie: Holiday Inn Airport (Diegem)
Gepresenteerd in het Nederlands door Geert Van Landeghem
Prijs: 420 EUR (excl. 21% BTW)

Registreer NU »

This event is history, please check out the List of Upcoming Seminars, or send us an email

Check out our related in-house workshops:

Google BigQuery in Practice (INHOUSE WORKSHOP - On Request)
Apache Spark Hands-On Training (In-Company) (INHOUSE WORKSHOP - On Request)
Het Logisch Datawarehouse - Architectuur, Ontwerp en Technologie (INHOUSE WORKSHOP - On Request)
Business Intelligence en Datawarehousing Fundamentals (INHOUSE WORKSHOP - On Request)
The Hadoop Ecosystem (INHOUSE WORKSHOP - On Request)
Big Data Oplossingen voor BI (INHOUSE WORKSHOP - On Request)
Lean Business Analyse (INHOUSE WORKSHOP - On Request)
Business Analysis Agility (INHOUSE WORKSHOP - On Request)
Minimum Viable Products (MVPs) Demystified (INHOUSE WORKSHOP - On Request)
Aan de Slag met RPA, UiPath en Blue Prism (INHOUSE WORKSHOP - On Request)
Data Vault in a Day (INHOUSE WORKSHOP - On Request)

Leerdoelen

Waarom dit seminar over Apache Spark ?

Big Data is de hype van het moment in de ICT en marketing wereld. Apache Hadoop werd sinds zijn ontstaan in 2007 beschouwd als de facto standaard voor het opslaan en verwerken van big data volumes in batch.

Maar elke nieuwe technologie kent ook zijn beperkingen, zo ook Hadoop: het is batch-oriented en het MapReduce framework is te beperkend om elk type van data analyse te implementeren binnen dezelfde technologie stack.

Aangezien het volume en de snelheid waarmee data gegenereerd wordt, stijgt de behoefte naar snellere data verwerking en analyse om een stap vooruit te blijven en de verwachtingen van eindgebruikers in te lossen.

Apache Spark komt tegemoet aan deze verwachtingen als een "open source data analytics cluster computing framework". Spark werd ontwikkeld in 2009 aan het AMPLab (Algorithms, Machines, and People Lab) van de University of California in Berkeley, en geschonken aan de open source wereld in 2010. Het is sneller dan Hadoop, in sommige gevallen tot 100x sneller, en voorziet een framework dat meerdere types van data analyse ondersteunt binnen dezelfde technologie stack: snelle interactieve queries, streaming analyse, graph analyse en machine learning. Tijdens dit seminar bespreken we de theorie en praktijk van diverse data analyse toepassingen.

Voor wie is dit seminar bestemd ?

Dit seminar is vooral bedoeld voor developers en data analysten die meer willen weten over Apache Spark. Deze cursus laat hen toe om hands-on de basics van Spark aan te leren. Een basiservaring programmeren is nodig om deze cursus te kunnen volgen.

Om de oefeningen te kunnen maken dient u uw laptop mee te brengen. Basiservaring met programmeren in ofwel Python, Java of Scala is een voordeel.

Volledig Programma

13.30u - 14.00u

Registratie en Ontvangst van de deelnemers met Koffie/Thee en Croissants, en mogelijkheid tot netwerking

14.00u

Wat is Apache Spark ?

Spark versus Hadoop

Spark API

Resilient Distributed Datasets (RDD)
Transformaties
Acties

Performantie

15.45u

Koffie/Thee Pauze met Versnaperingen

16.00u

Advanced Spark

Spark SQL

Streaming

Machine Learning

Graph toepassingen

18.15u

Vragen, samenvatting en besluit

18.30u

Einde van dit seminar

Sprekers

Geert Van Landeghem (DataCrunchers)

Geert Van Landeghem is een Big Data consultant met meer dan 20 jaar ervaring. Hij raakte geinteresseerd in Big Data in 2010 en implementeerde een eerste Big Data project in 2011. Meerdere big data projecten later werkt hij momenteel als Head BI team en Big Data architect voor een online gokbedrijf waar Spark gebruikt wordt. Hij is gedreven om nieuwe big data technologieën te verkennen en te vertalen in nieuwe oplossingen naar business toe. Hij is tevens co-organiser van de bigdata.be meetup groep.

Geert heeft ervaring als instructor voor IBM en met eigen ontwikkelde cursussen bij datacrunchers.eu.

In november 2014 behaalde hij het "Developer Certification for Apache Spark" van Databricks en O'Reilly.

Questions about this ? Interested but you can't attend ? Send us an email !