Apache Spark Hands-On Training

Apache Spark Hands-On Training


Een praktisch overzicht van Spark, volgens sommigen het Zwitsers zakmes voor bliksemsnelle big data analyse

4 March 2015 (14-18u30)
Locatie: Holiday Inn Airport (Diegem)
Gepresenteerd in het Nederlands door Geert Van Landeghem
Prijs: 420 EUR (excl. 21% BTW)
Registreer NU »

This event is history, please check out the List of Upcoming Seminars, or send us an email

Check out our related in-house workshops:

 Leerdoelen

Waarom dit seminar over Apache Spark ?

Big Data is de hype van het moment in de ICT en marketing wereld. Apache Hadoop werd sinds zijn ontstaan in 2007 beschouwd als de facto standaard voor het opslaan en verwerken van big data volumes in batch.

Maar elke nieuwe technologie kent ook zijn beperkingen, zo ook Hadoop: het is batch-oriented en het MapReduce framework is te beperkend om elk type van data analyse te implementeren binnen dezelfde technologie stack.

Aangezien het volume en de snelheid waarmee data gegenereerd wordt, stijgt de behoefte naar snellere data verwerking en analyse om een stap vooruit te blijven en de verwachtingen van eindgebruikers in te lossen.

Apache Spark komt tegemoet aan deze verwachtingen als een "open source data analytics cluster computing framework". Spark werd ontwikkeld in 2009 aan het AMPLab (Algorithms, Machines, and People Lab) van de University of California in Berkeley, en geschonken aan de open source wereld in 2010. Het is sneller dan Hadoop, in sommige gevallen tot 100x sneller, en voorziet een framework dat meerdere types van data analyse ondersteunt binnen dezelfde technologie stack: snelle interactieve queries, streaming analyse, graph analyse en machine learning. Tijdens dit seminar bespreken we de theorie en praktijk van diverse data analyse toepassingen.

Voor wie is dit seminar bestemd ?

Dit seminar is vooral bedoeld voor developers en data analysten die meer willen weten over Apache Spark. Deze cursus laat hen toe om hands-on de basics van Spark aan te leren. Een basiservaring programmeren is nodig om deze cursus te kunnen volgen.

Om de oefeningen te kunnen maken dient u uw laptop mee te brengen. Basiservaring met programmeren in ofwel Python, Java of Scala is een voordeel.

 Volledig Programma

13.30u - 14.00u
Registratie en Ontvangst van de deelnemers met Koffie/Thee en Croissants, en mogelijkheid tot netwerking
14.00u
Wat is Apache Spark ?
 
Spark versus Hadoop
 
Spark API
 
Performantie
15.45u
Koffie/Thee Pauze met Versnaperingen
16.00u
Advanced Spark
  • Spark SQL
  • Streaming
  • Machine Learning
  • Graph toepassingen
  • 18.15u
    Vragen, samenvatting en besluit
    18.30u
    Einde van dit seminar

     Sprekers


    Geert Van Landeghem (DataCrunchers)
    DataCrunchers

    Geert Van Landeghem is een Big Data consultant met meer dan 20 jaar ervaring. Hij raakte geinteresseerd in Big Data in 2010 en implementeerde een eerste Big Data project in 2011. Meerdere big data projecten later werkt hij momenteel als Head BI team en Big Data architect voor een online gokbedrijf waar Spark gebruikt wordt. Hij is gedreven om nieuwe big data technologieën te verkennen en te vertalen in nieuwe oplossingen naar business toe. Hij is tevens co-organiser van de bigdata.be meetup groep.

    Geert heeft ervaring als instructor voor IBM en met eigen ontwikkelde cursussen bij datacrunchers.eu.

    In november 2014 behaalde hij het "Developer Certification for Apache Spark" van Databricks en O'Reilly.

    Questions about this ? Interested but you can't attend ? Send us an email !

    -->