Big Data Oplossingen voor BI
 • (0)9 241.56.13
 • feedback@itworks.be

  Big Data Oplossingen voor BI

  Een overzicht van Hadoop, NoSQL, graph databases, streaming en NewSQL voor BI

   ON REQUEST
   In-company (YOUR COMPANY)
   Prijs: ASK FOR PRICE QUOTE (excl. 21% BTW)

   Gepresenteerd in het Nederlands door Rick van der Lans


  Volledig Programma:
  WELKOM
  Introductie van de spreker, de deelnemers en het seminar
  STANDAARD PROGRAMMA (maar maak het interactief):
  Begin van dit Seminar

  1.De Komst van Big Data en Fast Data

  • Nieuwe BI-vormen, waaronder data science, investigative analytics en streaming analytics
  • Het inzetten van Big Data om een concurrentievoordeel te krijgen
  • Verschillen tussen semi-structured, poly-structured, multi-structured en unstructured data
  • Voorbeelden van Big Data: sensordata, (micro-)eventdata en clickstream data
  • Fast Data = Big Data + fast analytics + fast reactions
  • Het belang van meer schaalbaarheid en query performance

  Wat heeft Big Data en Hadoop te bieden aan bedrijven in retail, utilities, banking, insurance, ..., en de overheid ?

  2. De Wereld van Hadoop, NoSQL en Spark Toegelicht

  • De Hadoop stack: HDFS, MapReduce, Hive, Spark, HBase, YARN, ZooKeeper, Pig, HCatalog, enzovoorts
  • Alternatieve implementaties onder andere van MapR, Amazon (Hadoop as a service) en ScaleOut (Hadoop in-memory)
  • MapReduce of Spark voor analytics en reporting?
  • Classificatie van NoSQL producten: key-value stores, document stores, column-family stores en graph data stores
  • Marktoverzicht, inclusief Apache HBase, Cassandra, CouchDB, Cloudera, DataStax, MongoDB, Neo4j en Riak

  Big SQL oplossingen: SQL-on-Hadoop, NewSQL en analytical SQL databaseservers

  • Hoe volwassen zijn de huidige SQL-on-Hadoop oplossingen?
  • Marktoverzicht van SQL-on-Hadoop engines, inclusief Apache Drill, Apache Hive, Apache Phoenix, Cloudera Impala, HP Vertica, JethroData, Spark SQL en Splice Machine
  • Classificatie van analytical SQL databaseservers
  • De voor- en nadelen van kolomgebaseerde opslagstructuren
  • Wat is in-database analytics en wat is de relatie met Google’s MapReduce?
  • Marktoverzicht, inclusief Apache Greenplum, Exasol, HP Vertica, IBM PureData Systems for Analytics, InfoBright, JustOneDB, Kognitio WX2, Microsoft PDW, Oracle In-Memory, SAP HANA en Sybase IQ, SnowflakeDB, Teradata Appliances en Teradata Aster Database
  • NewSQL betekent high-performance transactie-georiënteerde SQL systemen
  • Simpelere transactiemechanismen om scale-out te realiseren
  • Het voorkomen van multi-table joins die niet geparallelliseerd kunnen worden
  • Marktoverzicht inclusief Akiban, Clustrix, GenieDB, NuoDB en VoltDB

  Technologieën voor Fast Data en Streaming Analytics

  • De grootste toepassing van Fast Data: het Internet of Things (IoT)
  • IoT betekent streaming data en snel analyseren van die data
  • IoT devices: smartphones, smartwatches, RFID sensoren, machines, algemene sensoren, cameras, pacemakers, ...
  • De uitdaging: real-time reacties op streaming data
  • De verschillen tussen Big Data en fast Big Data
  • Technologieën voor streaming data: Apache Kafka, Apache ActiveMQ, Amazon Kinesis, Kestrel, RabbitMQ en ZeroMQ
  • Verschillen tussen de nieuwe technologieën en traditionele message queuing producten
  • Voorbeelden van producten voor Big Data streaming: Apache Storm en Flink, IBM InfoSphere Streams, Informatica for Streaming Analytics, Software AG Apama en Spark Streaming
  • Hoe integreren we Fast Data met het enterprise data warehouse?

  Integreren van Big Data Technologie in Datawarehouse Systemen

  • Gebruiken van Hadoop en Spark in datawarehouse systemen
  • Hadoop als staging area, datawarehouse, data mart of archiveringsgebied
  • Datawarehouse gegevens beschikbaar stellen voor rapportage en analyse met SQL-on-Hadoop engines
  • Gebruik van datavirtualisatie om gegevens te integreren die opgeslagen zijn in Hadoop, NoSQL- en SQL-systemen
  • De mogelijke rol van NoSQL

  Ontwikkelen van data lakes met Big Data technologie

  • Wat is een data lake?
  • Welke technologieën zijn geschikt voor het ontwikkelen van data lakes?
  • Is het realistisch om een fysiek data lake op te bouwen met Big Data?
  • Het ontwikkelen van een virtueel of logisch data lake met datavirtualisatie-servers
  • Let op de technische en business metadata !

  Data Science, Big Data Technologie en het Datawarehouse

  • Wat is data science en waarom is het anders dan analytics?
  • Wat hebben MapReduce en Spark data scientists te bieden?
  • Kunnen we standaard BI tools, zoals QlikView en Tableau, gebruiken in samenwerking met Spark?
  • Hadoop als sandbox voor geavanceerde vormen van analytics
  • De waarde van graph databases voor data science, zoals AllegroGraph, InfiniteGraph en Neo4J

  Samenvatting en afsluiting

  EINDE
  Einde van dit Seminar  • WELKOM
  • BEGIN van dit Seminar
   • De Komst van Big Data en Fast Data
   • De Wereld van Hadoop, NoSQL en Spark Toegelicht
   • Big SQL oplossingen: SQL-on-Hadoop, NewSQL en analytical SQL databaseservers
   • Technologieën voor Fast Data en Streaming Analytics
   • Integreren van Big Data Technologie in Datawarehouse Systemen
   • Ontwikkelen van data lakes met Big Data technologie
   • Data Science, Big Data Technologie en het Datawarehouse
   • Samenvatting en afsluiting
  • EINDE van dit Seminar

  En bekijk wie deze opleiding presenteert ...

  These related seminars and workshops may also be of interest to you:

  Vragen hierover ? Geïnteresseerd maar u kan niet deelnemen ? Stuur ons een email.

  ABOUT I.T. WORKS®

  I.T. Works has been organizing seminars and workshops on technical and business IT topics since 1992. Our high-quality, information-packed, vendor-independent events provide solutions to the problems that many IT and business professionals face today.

  CONTACT US

  I.T. Works
  Technologiepark 82, 9052 Gent
  Email: info@itworks.be
  Phone: +32 (9) 241.56.13
  Fax: +32 (9) 241.56.56
  BTW/VAT/RRRP: BE 0454.842.797

  © I.T. Works - All Rights Reserved