Big Data Technologie voor IoT, Data Lakes, Data Science en BI
Een leveranciersonafhankelijk technologie-overzicht van big data: hoe werken Hadoop, Spark, NoSQL, NewSQL, ... en wat kun je ermee ?
30 March 2017 (14-21u)
Locatie:
Parker Hotel (Diegem)
Gepresenteerd
in het Nederlands
door
Rick van der Lans
Prijs:
720 EUR (excl. 21% BTW)
Registreer NU »
This event is history,
please check out the List of Upcoming Seminars, or send us an email
Check out these related open workshops:
Check out our related in-house workshops:
Leerdoelen
WAT zal u leren op dit seminar over Big Data, Hadoop, Spark en Analytics ?
Wat heeft Big Data en Hadoop te bieden aan bedrijven in retail, utilities, banking, insurance, ..., en de overheid ?
Dit seminar beantwoordt deze en vele andere vragen:
- Wat wordt precies bedoeld met Big Data en NoSQL, en waarom kan dit nuttig zijn voor uw bedrijf ?
- Welke "flavours" van NoSQL bestaan er en wat zijn de bekendste produkten ?
- Welke rol speelt Hadoop ?
- Wat is de relatie tussen big data en IoT (Internet of Things), Data Science, Data Lakes, zware transactionele systemen, datavirtualisatie en uitbreidbare datawarehouses ?
- Wat zijn de belangrijkste eigenschappen, voordelen en nadelen van analytische databaseservers ?
- Hoe ontsluiten we de kracht van big data databases, Hadoop en NoSQL voor rapportering en data/tekst-analyse, en wat wordt bedoeld met de "SQL-ficatie van NoSQL" ?
- Waar gaat dit naar toe, m.a.w. wat mogen we nog verwachten van de Big Data, NoSQL, NewSQL en analytical database revolutie ?
- Wat is NewSQL en waarom/wanneer is dit nuttig voor uw bedrijf ?
- Welke oplossingen bieden de traditionele database leveranciers zoals Oracle, Microsoft, Teradata en SAP ?
WAAROM organizeren wij dit seminar over Big Data Technologie ?
Big Data, Hadoop, NoSQL, analytical SQL databaseservers, NewSQL, MapReduce, appliances zijn de populaire termen van vandaag. Is dit technologie voor alleen de grote, bekende websites, zoals Bol.com, Amazon, LinkedIn, Twitter en Facebook, of heeft deze technologie wel degelijk traditionele organisaties iets te bieden? In dit seminar worden deze nieuwe ontwikkelingen helder toegelicht en wordt duidelijk gemaakt hoe, waar en waarom ze ook zeer relevant kunnen zijn voor meer traditionele organisaties.
Tijdens het seminar zullen voorbeelden van toepassingsgebieden van big data gegeven worden. Een belangrijk toepassingsgebied is uiteraard analytics. Big data applicaties maken vormen van analytics mogelijk waarvan veel organisaties momenteel alleen kunnen dromen. Big data applicaties vereisen de opslag en verwerking van (soms extreem) grote hoeveelheden gegevens.
Maar welke gegevensopslagtechnologie dient ingezet te worden? Bestaande, meer traditionele technologie haalt misschien niet de benodigde schaalbaarheid of alleen voor een onacceptabel hoge prijs. Organisaties kunnen ook kiezen voor één van de volgende oplossingen:
- Hadoop: een platform speciaal ontwikkeld voor big data systemen
- Een NoSQL databaseserver, zoals CouchDB, Cassandra en MongoDB
- Een Analytical SQL databaseserver, zoals Aster Database, Oracle Exalytics, SAP HANA en Teradata
- Een NewSQL databaseserver, zoals Clustrix, NuoDB of VoltDB
- Een best-of-breed combinatie van deze oplossingen
Tijdens dit seminar worden al deze nieuwe technologieën kritisch besproken. Wat is hun geheim ? Hoe kunnen zij opvallend meer verwerken dan de klassieke databaseservers ? Voor- en nadelen worden toegelicht en mogelijkheden en technische eigenschappen worden besproken. Na het seminar heeft u een gedegen en compleet overzicht van deze snel veranderende wereld van gegevensopslagtechnologie om big data systemen te ontwikkelen. U zult deze kennis goed kunnen gebruiken om een keuze voor de toekomst te maken.
De kans is zeer groot dat veel organisaties in de toekomst een hybride architectuur zullen opbouwen, bestaande uit NoSQL en SQL producten. Tijdens dit seminar laat Rick dan ook zien hoe deze twee omgevingen samen kunnen functioneren.
WIE mag dit seminar niet missen ?
Dit seminar is bedoeld voor iedereen die alles wil leren over de nieuwste ontwikkelingen in de databasewereld, o.a.:
- database specialisten,
- database administrators,
- datawarehouse- en database designers,
- database- en business intelligence experten,
- consultants,
- technology planners,
- project managers,
- systeem- en infrastructuur analisten,
- ...
Volledig Programma
13.30u - 14.00u
Registratie en ontvangst van de deelnemers met koffie/thee en croissants
14.00u
Begin van dit Seminar
Big Data: State-of-the-art
- Wat bedoelen we precies met big data ?
- Gaat het over big data of over big analytics ?
- High-level overzicht van de verschillende categorieën technologie voor data-opslag
- Typische toepassingsgebieden van big data
Wat heeft Big Data en Hadoop te bieden aan bedrijven in retail, utilities, banking, insurance, ..., en de overheid ?
Hadoop, Spark en NoSQL Verstaanbaar Uitgelegd
- De Hadoop stack: HDFS, MapReduce, Spark, Hive, HBase, YARN, ZooKeeper, Pig, HCatalog, enzovoorts
- Karakteristieken en gevolgen van HDFS en file-formaten
- Alternatieve implementaties onder andere van MapR, Amazon (Hadoop as a service) en ScaleOut (Hadoop in-memory)
- De rol van Cloudera, HortonWorks en MapR
- Classificatie van NoSQL producten: key-value stores, document stores, column-family stores, en graph data stores
- Het belang van schaalbaarheid en performantie
- Zijn NoSQL producten werkelijk databaseservers?
- Marktoverzicht, inclusief Apache HBase, Cassandra, CouchDB, Cloudera, DataStax, MongoDB, Neo4j en Riak
15.45u - 16.00u
Koffie/thee Break
NewSQL en Analytische SQL Databaseservers voor Big Data Systemen
- Classificatie van analytical SQL databaseservers
- Kunnen zij concurreren met NoSQL producten ?
- Hoe belangrijk is in-database analytics ?
- Is het in-memory laden van databases altijd mogelijk en altijd een oplossing ?
- Marktoverzicht, inclusief Actian Matrix en Vector, EMC/Greenplum, Exasol, HP/Vertica, IBM PureData System for Analytics (powered by Netezza), InfoBright, Kognitio WX2, Microsoft PDW, Oracle Exalytics, SAP HANA en Sybase IQ, Teradata Appliances en Teradata Aster Database
- NewSQL databaservers voor high-performance transactionele systemen
- Simpelere transactie-mechanismen om scale-out te realiseren
- Het voorkomen van multi-table joins die niet geparallelliseerd kunnen worden
- Marktoverzicht inclusief Akiban, CitusDB, Clustrix, MariaDB, NuoDB, Pivotal GemFire en VoltDB
Use Case 1: Uitbreiden van Datawarehouses met Big Data Technologie
- Hadoop gebruiken in datawarehousing omgevingen
- Hadoop als staging area, datawarehouse, data mart en archief voor "koude data"
- Datawarehouses beschikbaar maken voor rapportage en analytics via SQL-on-Hadoop engines
- Overzicht van SQL-on-Hadoop engines: Apache Hive, Apache Drill, Apache Phoenix, Cloudera Impala, HP Vertica, JethroData, Pivotal HDB (Apache Hawq), Spark SQL en Splice Machine
- Datavirtualisatie voor het integreren van data uit Hadoop, NoSQL en SQL systemen, met producten van AtScale, Capsenta, Cisco/Composite, Data Virtuality, Denodo, Informatica, Red Hat en StoneBond
Use Case 2: Bouwen van Data Lakes met Big Data Technologie
- Wat is een data lake ?
- Welke technologieën bestaan er voor het bouwen van data lakes ?
- Is een fysiek data lake bouwen realistisch bij big data toepassingen ?
- Een virtueel data lake "bouwen" met datavirtualisatie servers
- Vergeet de technische en business metadata niet
Use Case 3: Data Science met Big Data Technologie
- Wat is data science en waarom is dit verschillend van analytics?
- Wat hebben MapReduce en Spark data scientists te bieden
- Kunnen we standaard BI tools zoals QlikView en Tableau gebruiken met Spark ?
- Kunnen we Hadoop gebruiken als sandbox voor advanced analytics ?
- Wat betekenen graph databases zoals AllegroGraph, InfiniteGraph en Neo4J voor data science ?
17.45u - 18.45u
Dinner & Networking
Use Case 4: Internet-of-Things (IoT) met Big Data Technologie
- IoT gaat over het snel streamen en analyseren van data
- Typische IoT databronnen: smartphones, smartwatches, RFID sensoren, machines, algemene sensoren, camera's, pacemakers, enz
- De uitdaging van real-time interactie met binnenkomende IoT data
- Het verschil tussen big data en fast big data
- Technologieëen voor het streamen van IoT data: Apache Kafka, Apache ActiveMQ, Amazon Kinesis, Kestrel, RabbitMQ, and ZeroMQ
- Verschillen tussen deze nieuwe technologie en traditionele message queuing producten
- Marktoverzicht van big data streaming tools: Apache Storm en Flink, IBM InfoSphere Streams, Informatica for Streaming Analytics, Software AG Apama, and Spark Streaming
- Hoe IoT data integreren met uw Enterprise Data Warehouse (EDW)
Use Case 5: High-end Transactionele Systemen met Big Data Technologie
- NoSQL producten gebruiken voor real-time verwerking van grote hoeveelheden transacties
- Manipuleren van ongestructureerde en gestructureerde data
- Flexibele datastructuren in NoSQL
- Waarom schema-on-read meer flexibel is dan schema-on-write
- Data-replicatie van NoSQL naar SQL
- Vergelijking tussen NoSQL en NewSQL
Samenvatting en afsluiting
- Wanneer Hadoop gebruiken ?
- Wanneer welke SQL/NoSQL database technologie ?
- Wat brengt de toekomst ?
21.00u
Einde van dit Seminar
Sprekers
Rick van der Lans is onafhankelijk adviseur, docent en auteur op de terreinen datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Als consultant heeft hij door de jaren heen veel grote bedrijven (nationaal en internationaal) geadviseerd bij het ontwerpen van hun datawarehouse-architectuur en bij het maken van een toolkeuze.
Rick heeft als spreker op conferenties een zeer goede naam verworven zowel in binnen- als buitenland. Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische en strategische zaken.
Hij schrijft voor het bekende BeyeNetwork.com. Tevens verschenen van zijn hand diverse artikelen in toonaangevende vakbladen. Verschillende van zijn boeken, waaronder het populaire "SQL Leerboek", zijn in vele talen gepubliceerd. Recent is van zijn hand verschenen Data Virtualization for Business Intelligence Systems", alsook tientallen whitepapers over BI.
Questions about this ? Interested but you can't attend ? Send us an email !