Big Data Oplossingen voor Business Intelligence
Een overzicht van Hadoop, Spark, SQL-on-Hadoop, Fast (IoT) Data, Data Lakes en Data Science voor uw Business Intelligence
29 March 2018 (14-21u)
Locatie:
Parker Hotel (Diegem)
Gepresenteerd
in het Nederlands
door
Rick van der Lans
Prijs:
720 EUR (excl. 21% BTW)
Registreer NU »
This event is history,
please check out the List of Upcoming Seminars, or send us an email
Check out these related open workshops:
Check out our related in-house workshops:
Leerdoelen
WAT zal u leren op dit seminar over Big Data, Hadoop en NoSQL voor Business Intelligence-systemen en Datawarehouses ?
Wat heeft Big Data en Hadoop te bieden aan bedrijven in retail, utilities, banking, insurance, ..., en de overheid ?
Dit intensief ééndaags seminar beantwoordt deze en vele andere vragen:
- Wat behelst Big Data en waarom is dit belangrijk voor elke organisatie?
- Wat is de relatie tussen Fast Data en streaming analytics?
- Wat is Hadoop en welke concrete producten zijn voor mijn organisatie relevant?
- Wanneer dienen welke Hadoop en NoSQL producten ingezet te worden?
- Wat is de toegevoegde waarde van Spark voor high-end processing?
- Wat zijn de belangrijkste toepassingsgebieden?
- Hoe ontsluiten we Big Data voor Data Science?
- Waarom SQL-on-Hadoop engines de toegankelijkheid van Hadoop verhogen
- Welke richting gaan we op met deze nieuwe producten in bestaande BI-omgevingen?
WAAROM organizeren wij deze Powersessie over Big Data Technologie voor Business Intelligence ?
Hadoop, NoSQL, Spark, Kafka, Storm, NewSQL, Streams ...
De wereld van business intelligence en data warehousing wordt de laatste jaren geconfronteerd met een niet aflatende stroom technologieën en daarbij moet een steeds bredere groep gebruikers ondersteund worden. Big Data is de grote aanjager van de meeste van deze veranderingen. Big Data heeft geleid tot de introductie van nieuwe gegevensopslag-technologieën, zoals Hadoop, NoSQL en NewSQL, en tot nieuwe platformen voor gegevensverwerking, zoals Spark en Storm. En voor streaming analytics zijn onder andere Kafka en Streams geïntroduceerd. Maar ook de gegevensconsumptie is niet ongewijzigd gebleven. Naast klassieke en interactieve rapporten moeten BI-omgevingen ook ondersteuning bieden voor self-service BI, investigative analytics en data science. De lat voor BI lijkt elk jaar weer hoger gelegd te worden.
Maar de grote vraag is: hoe moeten deze nieuwe gebruikerswensen ondersteund worden en wat is de beste manier om al deze nieuwe technologieën te integreren met traditionele datawarehouse systemen? Wanneer dienen Hadoop en NoSQL ingezet te worden? Kan Spark gebruikt worden als datamart? Welke modules van Hadoop dienen voor welke toepassing ingezet te worden? Wat is de relatie tussen een datawarehouse en een op Hadoop-gebaseerd data lake? Wat kan wel en niet met de nieuwe technologieën?
Tijdens dit seminar worden al deze nieuwe Big Data technologieën kritisch besproken. Wat is hun geheim? Hoe kunnen zij opvallend meer verwerken dan de traditionele databaseservers? Voor- en nadelen worden toegelicht en mogelijkheden en technische eigenschappen worden besproken. Na het seminar heeft u een gedegen en compleet overzicht van deze snel veranderende wereld van Big Data technologie en hoe deze in te zetten bij BI-systemen.
Dit seminar biedt een unieke kans om alles over de nieuwe BI-ontwikkelingen te zien en te horen. Het biedt een perfecte update voor diegenen die meer willen weten over hoe zij BI-systemen klaar kunnen maken voor de komende tien jaar.
WIE mag dit seminar niet missen ?
Dit seminar is bedoeld voor iedereen die alles wil leren over de nieuwste ontwikkelingen in de databasewereld, o.a.:
- Databasespecialisten en databasebeheerders,
- Business Intelligence-specialisten,
- Database-ontwerpers en datawarehouse-ontwerpers,
- Big data projectleiders,
- Business Analysten,
- Technology Planners,
- Technische en Enterprise Architecten,
- IT Consultants en IT Strategists,
- Systeemanalisten,
- Database-ontwikkelaars en Database Administrators,
- Solution en Data Architecten,
- CIOs en IT Managers
- ...
Volledig Programma
13.30u - 14.00u
Registratie en ontvangst van de deelnemers met koffie/thee en croissants
14.00u
Begin van dit Seminar
1.De Komst van Big Data en Fast Data
- Nieuwe BI-vormen, waaronder data science, investigative analytics en streaming analytics
- Het inzetten van Big Data om een concurrentievoordeel te krijgen
- Verschillen tussen semi-structured, poly-structured, multi-structured en unstructured data
- Voorbeelden van Big Data: sensordata, (micro-)eventdata en clickstream data
- Fast Data = Big Data + fast analytics + fast reactions
- Het belang van meer schaalbaarheid en query performance
Wat heeft Big Data en Hadoop te bieden aan bedrijven in retail, utilities, banking, insurance, ..., en de overheid ?
2. De Wereld van Hadoop, NoSQL en Spark Toegelicht
- De Hadoop stack: HDFS, MapReduce, Hive, Spark, HBase, YARN, ZooKeeper, Pig, HCatalog, enzovoorts
- Alternatieve implementaties onder andere van MapR, Amazon (Hadoop as a service) en ScaleOut (Hadoop in-memory)
- MapReduce of Spark voor analytics en reporting?
- Classificatie van NoSQL producten: key-value stores, document stores, column-family stores en graph data stores
- Marktoverzicht, inclusief Apache HBase, Cassandra, CouchDB, Cloudera, DataStax, MongoDB, Neo4j en Riak
Big SQL oplossingen: SQL-on-Hadoop, NewSQL en analytical SQL databaseservers
- Hoe volwassen zijn de huidige SQL-on-Hadoop oplossingen?
- Marktoverzicht van SQL-on-Hadoop engines, inclusief Apache Drill, Apache Hive, Apache Phoenix, Cloudera Impala, HP Vertica, JethroData, Spark SQL en Splice Machine
- Classificatie van analytical SQL databaseservers
- De voor- en nadelen van kolomgebaseerde opslagstructuren
- Wat is in-database analytics en wat is de relatie met Google’s MapReduce?
- Marktoverzicht, inclusief Apache Greenplum, Exasol, HP Vertica, IBM PureData Systems for Analytics, InfoBright, JustOneDB, Kognitio WX2, Microsoft PDW, Oracle In-Memory, SAP HANA en Sybase IQ, SnowflakeDB, Teradata Appliances en Teradata Aster Database
- NewSQL betekent high-performance transactie-georiënteerde SQL systemen
- Simpelere transactiemechanismen om scale-out te realiseren
- Het voorkomen van multi-table joins die niet geparallelliseerd kunnen worden
- Marktoverzicht inclusief Akiban, Clustrix, GenieDB, NuoDB en VoltDB
Technologieën voor Fast Data en Streaming Analytics
- De grootste toepassing van Fast Data: het Internet of Things (IoT)
- IoT betekent streaming data en snel analyseren van die data
- IoT devices: smartphones, smartwatches, RFID sensoren, machines, algemene sensoren, cameras, pacemakers, ...
- De uitdaging: real-time reacties op streaming data
- De verschillen tussen Big Data en fast Big Data
- Technologieën voor streaming data: Apache Kafka, Apache ActiveMQ, Amazon Kinesis, Kestrel, RabbitMQ en ZeroMQ
- Verschillen tussen de nieuwe technologieën en traditionele message queuing producten
- Voorbeelden van producten voor Big Data streaming: Apache Storm en Flink, IBM InfoSphere Streams, Informatica for Streaming Analytics, Software AG Apama en Spark Streaming
- Hoe integreren we Fast Data met het enterprise data warehouse?
Integreren van Big Data Technologie in Datawarehouse Systemen
- Gebruiken van Hadoop en Spark in datawarehouse systemen
- Hadoop als staging area, datawarehouse, data mart of archiveringsgebied
- Datawarehouse gegevens beschikbaar stellen voor rapportage en analyse met SQL-on-Hadoop engines
- Gebruik van datavirtualisatie om gegevens te integreren die opgeslagen zijn in Hadoop, NoSQL- en SQL-systemen
- De mogelijke rol van NoSQL
Ontwikkelen van data lakes met Big Data technologie
- Wat is een data lake?
- Welke technologieën zijn geschikt voor het ontwikkelen van data lakes?
- Is het realistisch om een fysiek data lake op te bouwen met Big Data?
- Het ontwikkelen van een virtueel of logisch data lake met datavirtualisatie-servers
- Let op de technische en business metadata !
Data Science, Big Data Technologie en het Datawarehouse
- Wat is data science en waarom is het anders dan analytics?
- Wat hebben MapReduce en Spark data scientists te bieden?
- Kunnen we standaard BI tools, zoals QlikView en Tableau, gebruiken in samenwerking met Spark?
- Hadoop als sandbox voor geavanceerde vormen van analytics
- De waarde van graph databases voor data science, zoals AllegroGraph, InfiniteGraph en Neo4J
Samenvatting en afsluiting
21.00u
Einde van dit Seminar
Sprekers
Rick van der Lans is een gerespecteerd en onafhankelijk analist, adviseur, auteur en internationaal bekende spreker. Hij is gespecialiseerd in datawarehousing, business intelligence, big data en databasetechnologie.
Hij heeft vele seminars en webinars gepresenteerd en keynotes bij industry-leading conferenties. Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische en strategische zaken. Al meer dan tien jaar is hij de voorzitter van de jaarlijkse European Enterprise Data and Business Intelligence Conference in London en de jaarlijkse Data Warehousing en Business Intelligence Summit in Nederland.
Rick helpt cliënten wereldwijd met het ontwerpen van hun data warehouse, big data en business intelligence architecturen en begeleid hen bij het selecteren van de geschikte producten. Hij is invloedrijk geweest bij het wereldwijd introduceren van de nieuwe logische datawarehouse architectuur waarmee organisaties meer flexibele business intelligence systemen kunnen ontwikkelen.
Rick heeft honderden artikelen en blogs geschreven voor toonaangevende vakbladen en websites en van zijn hand zijn vele educatieve en populaire whitepapers verschenen voor een groot aantal leveranciers. Hij was de auteur van het eerste beschikbare boek over SQL, getiteld Introduction to SQL, dat in vele talen gepubliceerd is en waarvan meer dan 100.000 exemplaren verkocht zijn. Recentelijk publiceerde hij het boek Data Virtualization for Business Intelligence Systems.
Questions about this ? Interested but you can't attend ? Send us an email !