Ontwerpen van de Nieuwe Generatie Datawarehouses
Deze tweedaagse "Masterclass Datawarehousing" door Rick van der Lans geeft u een leveranciersonafhankelijk beeld van de markt van datawarehousetools. Tevens krijgt u technieken en vuistregels voor het ontwerpen van de logische en fysieke aspecten ervan.
27-28 May 2009 (14-21)
Locatie:
Pullman Diegem (Diegem)
Gepresenteerd
in het Nederlands
door
Prijs:
1350 EUR (excl. 21% BTW)
This event is history,
please check out the List of Upcoming Seminars, or send us an email
Check out these related open workshops:
Check out our related in-house workshops:
Leerdoelen
Doel en opbouw van dit tweedaags seminar
De wereld van datawarehousing staat niet stil. Er zijn technologieën beschikbaar gekomen die nieuwe mogelijkheden bieden. Denk hierbij aan datawarehouse appliances, mashups en SOA. Ook de moderne wensen die gebruikers hebben en de eisen die zij stellen, maakt dat warehouse-architecturen anders opgezet moeten worden. Gebruikers willen meer accurate rapporten, ofwel operational BI is in opkomst. Kortom, de wereld van datawarehousing is aan het veranderen. Deze twee-daagse masterclass richt zich op alle nieuwe ontwikkelingen, inzichten, ideeën en technologieën. Een must voor elke datawarehouse-specialist.
Het ontwerpen van een datawarehouse behelst meer dan alleen het bepalen van een databasestructuur. Er moeten diverse soorten tools gekozen worden, waaronder OLAP-tools (On Line Analytical Processing), rapportage-tools, analytic applications, ETL-tools (Extract Transform Load), portals en databaseservers. Daarnaast moet er ook een architectuur gekozen worden: moeten we één groot centraal datawarehouse opzetten, gebruiken we datamarts of kiezen we voor een virtueel datawarehouse? Er moet ook nagedacht worden over integratie met andere systemen, zoals ERP, CRM en websites. Tevens moet er bestudeerd worden hoe er met metadata omgegaan wordt.
De volgende onderwerpen worden uitvoerig behandeld:
- Jarenlang zijn datawarehouses met een statisch karakter gebouwd. Slechts periodiek (bijvoorbeeld elke week of elke maand) worden nieuwe gegevens aan datawarehouse toegevoegd. Recentelijk beginnen gebruikers echter te vragen om gegevens die bijna 100% up to date zijn. We spreken dan van realtime of active datawarehouses. Deze nieuwe behoefte heeft grote invloed op welke tools ingezet kunnen en moeten worden en op hoe datawarehouses ontworpen moeten worden.
- De oorspronkelijke gebruiker van het datawarehouse is de manager die beslissingen moet nemen. Tegenwoordig zien we ook andere gebruikersgroepen, zoals klanten, toeleveranciers en agenten, die direct toegang krijgen tot het warehouse en analyses willen uitvoeren. Ook zien we niet-menselijke gebruikers, ofwel geautomatiseerde processen, die voorgeprogrammeerde beslissingen nemen. Deze processen vormen ook een nieuwe groep van gebruikers.
- Het werken met datawarehouses leidt tot data-integratie. Er bestaan ook andere vormen van integratie, waaronder applicatie-integratie. Op dit terrein is de Service-Oriented Architecture (SOA) sterk in opkomst. Tijdens dit seminar wordt belicht wat de toegevoegde waarde is van het integreren van de SOA met het datawarehouse.
- Naast het werken met gestructureerde data, vragen steeds meer gebruikers om ook ongestructureerde data te kunnen analyseren.
- Nieuwe technologie blijft ontwikkeld worden en vooral op het gebied van databasetechnologie. Er zal onder andere ingegaan worden op datawarehouse-appliances, cubing services, business process engines, streaming database servers en enterprise service bussen.
- De populaire mashup zal ingezet kunnen worden in een Business Intelligence omgeving om direct externe bronnen te benaderen en externe met interne data te integreren.
Kortom, na het bijwonen van dit seminar, bent u weer volledig bijgepraat over de nieuwste ontwikkelingen op het dynamische gebied van datawarehousing.
Wat zijn de doelstellingen van deze masterclass ?
Deze masterclass wil de deelnemers:
- Een compleet beeld geven van de markt van datawarehousetools (in al zijn verscheidenheid) en criteria aandragen waarmee tools geselecteerd kunnen worden.
- Technieken en vuistregels doceren voor het ontwerpen van de logische en fysieke aspecten van een relationeel datawarehouse.
- Adviseren bij hun keuze van een datawarehouse-architectuur.
Dit zal u toelaten om de juiste tools te selecteren, uw datawarehouse doordacht te ontwerpen, en vooraf na te denken over de performantie ervan.
Opmerking: Dit seminarie is volledig produkt-onafhankelijk. De meeste technieken en tips zijn relevant voor welk systeem dan ook: Oracle, IBM DB2, Microsoft SQL Server, Informix of Sybase.
Voor wie is dit seminar bestemd ?
Dit seminarie is van belang voor diegenen die direct of indirect betrokken zijn bij het ontwerpen en ontwikkelen van datawarehouse-databases zoals:
- datawarehouse-specialisten
- databaseontwerpers en databasebeheerders
- technologieplanners en consultants
- informatieanalisten en systeemanalisten
Dit tweedaags seminarie is gericht op gebruikers met middelgrote tot grote computersystemen. Een minimale kennis van relationele databasetechnologie en
databaseontwerp wordt verondersteld.
Volledig Programma
13.30h - 14.00h
Registratie en ontvangst van de deelnemers met koffie/thee
14.00h
Begin van dag 1 en van dit seminarie
1. Inleiding
- Overzicht van de status van datawarehousing
- Introductie terminologie
- Van statische naar online datawarehouses
2. De Levenscyclus van het datawarehouseproject
- Bepalen van een implementatiestrategie: top down of bottom up
- Analyseren van de bedrijfsdoelstellingen
- In kaart brengen van de huidige situatie
- Selecteren van een datawarehouse-architectuur: één groot centraal datawarehouse, verscheidene werkgroep warehouses (datamarts), of een virtueel datawarehouse ?
- Kan Extreme Programming ingezet worden bij datawarehousing projecten ?
- Van klassieke datawarehouse architectuur naar virtuele warehouse architectuur, ofwel de opkomst van het Data/Information Delivery Platform.
3. Selecteren van Business Intelligence tools
- Zes groepen BI-tools: executive reporting, managed query, OLAP, data mining, BAM en spreadsheets
- De terugkeer van executive reporting met tools van o.a. Business Objects (SAP), Cognos (IBM), Information Builders, Hyperion (Oracle), Microsoft en SAS
- Marktoverzicht van OLAP tools
- Criteria voor het selecteren van OLAP tools
- De opkomst van analytic applications; ofwel "BI out-of-the-box"
- De rol van de Enterprise Information Portal in een datawarehouse, inclusief marktoverzicht
- Zijn open source oplossingen volwassen ?
- De mashup als alternatief voor BI-tools
4. Selecteren van Databaseservers
- Hoe geschikt zijn de klassieke relationele databaseservers, waaronder DB2, Informix, Oracle, SQL Server, Sybase en Teradata
- Markt van datawarehouse-appliances, waaronder die van DATAllegro (Microsoft), Dataupia, Greenplum, HP, Kickfire, Netezza, Teradata en Sun
- Overzicht van OLAP technologie geïmplementeerd in relationele databaseservers, zoals DB2, Oracle11g en SQL Server
- Speciale database interfaces: MDX, XML for Analysis en OLE DB for OLAP
- De opkomst van open source databaseservers
- OLAP- en datamining-functionaliteit in een relationele databaseserver
Hier ongeveer eindigt het programma voor de eerste dag, en begint het programma voor de tweede dag
5. Logisch ontwerp van datawarehouses
- Verhogen van de flexibiliteit van een informatiemodel
- De vraag- versus de aanbodgedreven analyse-aanpak
- Omgaan met feiten en dimensionale gegevens: fact-dimension diagramma's
- Identificeren van detailniveau's binnen dimensies
- Modelleren van historische gegevens: van statische naar dynamische databases
- Zijn star schema- en snowflake-ontwerpen wel geschikt voor operational BI ?
- Ontwerpen vanuit universele gegevensmodellen
- Wat is de toegevoegde waarde van Data Vault ?
6. Fysiek ontwerp van datawarehouses
- Normalisatie of denormalisatie?
- Introduceren van kunstmatige sleutels (surrogaten) - uniek binnen de database
- Hoe om te gaan met afgeleide ofwel geaggregeerde gegevens ?
7. De Kwaliteit van gegevens
- Hoe en waar dienen gegevens te worden opgeschoond ?
- Hoe goed zijn data-profiling tools voor het signaleren van vervuilde gegevens ?
- Overzicht van de markt van data-profiling tools
- Verschillen tussen data-cleaning en data-profiling tools
- Mogelijkheden en onmogelijkheden van data-cleaning tools
8. Kopiëren van Gegevens - Van ETL naar SOA
- XML als taal om gegevens te kopiëren
- Marktoverzicht van ETL-tools, inclusief Ab Initio, Business Objects (SAP), Cognos (IBM), Informatica, iWay, Microsoft, Oracle en SAS
- Aspecten van kopiëren: extraheren, verplaatsen, filteren, opschonen, consolideren en laden
- Het synchroon houden van het centrale datawarehouse en de datamarts
- ETL versus SOA: wanneer dient welk tool ingezet te worden ?
- Webservices voor het binnenhalen van externe gegevens
9. Metadata en Master Data Management
- Het belang van metadata voor gebruikers
- Het verschil tussen technische en bedrijfsmatige metadata
- De opkomst van operationele metadata
- Wat is een Master Data Management systeem?
- Tools voor MDM, waaronder die van IBM, Kalido, Oracle en SAP
10. Samenvatting, Conclusies en Trends voor de Toekomst
- Werken met ongestructureerde gegevens: datamining op en analyses van tekst en beelden
- Webservices voor het importeren van externe gegevens
- Datawarehouses als informatiebron voor de buitenwereld
21.00u
Einde van dag 2 en van dit seminarie
Sprekers
Rick van der Lans is onafhankelijk adviseur, docent en auteur op de terreinen datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Als consultant heeft hij door de jaren heen veel grote bedrijven (nationaal en internationaal) geadviseerd bij het ontwerpen van hun datawarehouse-architectuur en bij het maken van een toolkeuze.
Rick heeft als spreker op conferenties een zeer goede naam verworven zowel in binnen- als buitenland. Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische en strategische zaken.
Hij schrijft voor het bekende BeyeNetwork.com. Tevens verschenen van zijn hand diverse artikelen in toonaangevende vakbladen. Verschillende van zijn boeken, waaronder het populaire "SQL Leerboek", zijn in vele talen gepubliceerd. Recent is van zijn hand verschenen Data Virtualization for Business Intelligence Systems", alsook tientallen whitepapers over BI.
Questions about this ? Interested but you can't attend ? Send us an email !