Ontwerpen van de Nieuwe Generatie Datawarehouses
Deze tweedaagse "Masterclass Datawarehousing" door Rick van der Lans geeft u een leveranciersonafhankelijk beeld van de markt van datawarehousetools. Tevens krijgt u technieken en vuistregels voor het ontwerpen van de logische en fysieke aspecten ervan.
25-26 October 2005 (14-21)
Locatie:
Sofitel Diegem (Diegem near Brussels (Belgium))
Gepresenteerd
in het Nederlands
door
Prijs:
1250 EUR (excl. 21% BTW)
This event is history,
please check out the List of Upcoming Seminars, or send us an email
Check out these related open workshops:
Check out our related in-house workshops:
Leerdoelen
Doel en opbouw van dit tweedaags seminar
Het ontwerpen van een datawarehouse behelst meer dan alleen maar het bepalen van een databasestructuur. Er moeten diverse soorten tools gekozen worden, waaronder
OLAP-tools (On Line Analytical Processing), rapportage-tools, analytic applications, ETL-tools (Extract
Transform Load), portals en databaseservers. Daarnaast moet er ook een architectuur gekozen worden: moeten we uitgaan van één groot centraal datawarehouse of gebruiken we datamarts? Bovendien moet er ook nagedacht worden over integratie met andere systemen, zoals ERP, CRM en Websites. Ook moet er bestudeerd worden hoe er met metadata wordt omgegaan. Kortom, het ontwerpen van een datawarehouse vandaag is vergelijkbaar met het oplossen van een lastige puzzel. Alle stukjes moeten haarscherp passen om een volledig en passend datawarehouse te kunnen ontwikkelen.
Velen zijn inmiddels bekend met het datawarehouse concept. Bill Inmon's algemeen geaccepteerde definitie luidt als volgt: "A data warehouse organizes and stores the data needed for informational, analytical processing over a long time perspective. A data warehouse is a subject-oriented, integrated, time-variant, non-volatile collection of data in support of management's decision-making process." Het is een database of een verzameling databases waarin zeer grote hoeveelheden gegevens worden opgeslagen. Helaas kan een datawarehouse niet worden gekocht. Omdat elk bedrijf anders is (verschillend qua eisen, gebruikersbehoeften, gegevensbronnen en tijdseisen), dient ieder zijn eigen warehouse te ontwerpen.
Deze conferentie is opgebouwd uit 3 hoofdonderwerpen:
- Selecteer de Juiste Tools ! Aan het selecteren van alle benodigde tools zal veel aandacht besteed worden. Welke OLAP, query of rapportage tools dienen wanneer ingezet te worden ? Kunt u volstaan met een out-of-the-box analytic application ? Gaan we voor een ETL- of EAI-tool (Enterprise Application Integration) ? Wanneer dient een Enterprise Information Portal gebruikt te worden ? Door het beantwoorden van dit soort vragen, krijgt de deelnemer tevens een goed beeld van de markt voor datawarehousetools.
- Ontwerp Doordacht ! Het tweede hoofdonderwerp gaat in op het ontwerpen van de logische structuur van een datawarehouse.
De spelregels zijn hier anders dan bij het ontwerpen van een productiedatabase. De 2 belangrijkste verschillen zijn historische gegevens en aanpasbaarheid. In tegenstelling tot datawarehouses bevatten productiedatabases weinig tot geen historische gegevens. Omwille hiervan en omdat vele analisten niet gewend zijn tijd te modelleren, zal dit onderwerp zeer uitgebreid ter sprake komen. Het tweede aspect, aanpasbaarheid, heeft betrekking op het feit dat de struktuur van een datawarehouse niet statisch is, maar frequent verandert. Dit betekent dat de struktuur zodanig ontworpen dient te worden dat deze eenvoudig uitgebreid en gewijzigd kan worden. Er zal ook aandacht besteed worden aan CWM (Common Warehouse Model)
en XMI (XML Metadata Interchange) van de OMG.
- Denk aan de Performantie ! Vele krachtige OLAP en data mining tools zijn commercieel beschikbaar waarmee we gegevens uit het warehouse kunnen onttrekken. Maar functionaliteit en gebruiksvriendelijkheid zijn niet alles: queries moeten een goede performantie hebben. Wat kunnen we en wat moeten we doen om een adequate performance te garanderen? Deze belangrijke vraag, die betrekking heeft op de fysieke specificaties van een warehouse, is het derde hoofdonderwerp tijdens dit seminar.
Opmerking: Dit seminarie is volledig produkt-onafhankelijk. De meeste technieken en tips zijn relevant voor welk systeem dan ook: Oracle, IBM DB2, Microsoft SQL Server, Informix of Sybase.
Welke vragen worden op dit seminar beantwoord ?
- u krijgt een compleet, produktonafhankelijk beeld van de markt van
datawarehousetools (in al zijn verscheidenheid), alsook criteria waarmee tools
geselecteerd kunnen worden
- welke zijn de technieken en vuistregels voor het ontwerpen van de logische en
fysieke aspecten van een relationeel datawarehouse ?
- hoe kies ik een datawarehouse-architectuur ?
Voor wie is dit seminar bestemd ?
Dit seminarie is van belang voor diegenen die direct of indirect betrokken zijn bij het ontwerpen en ontwikkelen van datawarehouse-databases zoals:
- datawarehouse-specialisten
- databaseontwerpers en databasebeheerders
- technologieplanners en consultants
- informatieanalisten en systeemanalisten
Dit tweedaags seminarie is gericht op gebruikers met middelgrote tot grote computersystemen. Een minimale kennis van relationele databasetechnologie en
databaseontwerp wordt verondersteld.
Volledig Programma
13.30h - 14.00h
Registratie en ontvangst van de deelnemers met koffie/thee
14.00h
Begin van dag 1 en van dit seminarie
1. Inleiding
- Overzicht van de status van datawarehousing
- Introductie terminologie
- Van statische naar online datawarehouses
2. De Levenscyclus van het datawarehouseproject
- Bepalen van een implementatiestrategie: top down of bottom up
- Analyseren van de bedrijfsdoelstellingen
- In kaart brengen van de huidige situatie
- Selecteren van een datawarehouse-architectuur: één groot centraal datawarehouse, verscheidene werkgroep warehouses (datamarts), vele private datawarehouses, of een combinatie
- Kan Extreme Programming ingezet worden bij datawarehousing projecten ?
3. Selecteren van Business Intelligence tools
- Zes groepen BI-tools: executive reporting, managed query, OLAP, data mining, BAM en spreadsheets
- De terugkeer van executive reporting met tools van o.a. Business Objects, Cognos, Information Builders, Hyperion, Microsoft en SAS
- Marktoverzicht van OLAP tools, inclusief Applix TM/1, BusinessObjects, Cognos ReportNet en PowerPlay, Hyperion BrioQuery en Essbase, Information Builder WebFocus, Microsoft Analysis Services, MicroStrategy, Oracle Discoverer en ProClarity
- Criteria voor het selecteren van OLAP tools
- De opkomst van analytic applications; ofwel "BI out-of-the-box"
- De rol van de Enterprise Information Portal in een datawarehouse, inclusief marktoverzicht
4. Selecteren van Databaseservers
- Hoe geschikt zijn de klassieke relationele databaseservers, waaronder DB2, Informix, Oracle, SQL Server, Sybase en Teradata
- Wat is een in-memory database server ?
- Overzicht van OLAP technologie geïmplementeerd in relationele databaseservers, zoals DB2, Oracle10g en SQL Server
- Speciale database interfaces: MDX, XML for Analysis en OLE DB for OLAP
- OLAP- en datamining-functionaliteit in een relationele databaseserver
Hier ongeveer eindigt het programma voor de eerste dag, en begint het programma voor de tweede dag
5. Logisch ontwerp van datawarehouses
- Verhogen van de flexibiliteit van een informatiemodel
- De vraag- versus de aanbodgedreven analyse-aanpak
- Omgaan met feiten en dimensionale gegevens: fact-dimension diagramma's
- Identificeren van detailniveau's binnen dimensies
- Modelleren van historische gegevens: van statische naar dynamische databases
- Het star schema- en snowflake-ontwerp
- Ontwerpen vanuit universele gegevensmodellen
- De invloed van analytic applications op logisch ontwerp
6. Fysiek ontwerp van datawarehouses
- Normalisatie of denormalisatie?
- Introduceren van kunstmatige sleutels (surrogaten) - uniek binnen de database
- Hoe om te gaan met afgeleide ofwel geaggregeerde gegevens?
- Brugtabellen om hiërarchieën "plat te slaan"
- Het nut van mini- en macro-dimensionale tabellen
- Implementeren van historie door het decomponeren van tabellen
- De voordelen van nieuwe indextypes, zoals de bitmap- en multi-table-index
7. De Kwaliteit van gegevens
- Hoe en waar dienen gegevens te worden opgeschoond ?
- Hoe goed zijn data-profiling tools voor het signaleren van vervuilde gegevens ?
- Overzicht van de markt van data-profiling tools, waaronder Ascential (IBM), Human Inference, Trillium Discovery,
Evoke Axio, FirstLogic IQ Insight en Business Data Quality
- Verschillen tussen data-cleaning en data-profiling tools
- Mogelijkheden en onmogelijkheden van data-cleaning tools
8. Kopiëren van Gegevens - ETL (Extraction, Transformation, and Loading)
- XML als taal om gegevens te kopiëren
- Marktoverzicht van ETL-tools, inclusief Ab Initio, Ascential (IBM), Business Objects, Cognos, Informatica, iWay, Microsoft en SAS
- Aspecten van kopiëren: extraheren, verplaatsen, filteren, opschonen, consolideren en laden
- Het synchroon houden van het centrale datawarehouse en de datamarts
- ETL versus EAI-tools: wanneer dient welk tool ingezet te worden ?
- Webservices voor het binnenhalen van externe gegevens
9. Metadata in het Datawarehouse
- Het belang van metadata voor gebruikers
- Het verschil tussen technische en bedrijfsmatige metadata
- Integratie van metagegevens in de datawarehouse-architectuur
- Standaarden voor metagegevens, zoals CWM en XMI
- Tools voor het beheer van metadata, o.a. DAG's MetaCenter, Informatica's SuperGlue en SAS
10. Samenvatting, conclusies en trends voor de toekomst
- Werken met ongestructureerde gegevens: datamining op en analyses van tekst en beelden
- Webservices voor het importeren van externe gegevens
- Datawarehouses als informatiebron voor de buitenwereld
21.00u
Einde van dag 2 en van dit seminarie
Sprekers
Rick van der Lans is onafhankelijk adviseur, docent en auteur op de terreinen datawarehousing, business intelligence, applicatie-integratie en databasetechnologie. Als consultant heeft hij door de jaren heen veel grote bedrijven (nationaal en internationaal) geadviseerd bij het ontwerpen van hun datawarehouse-architectuur en bij het maken van een toolkeuze.
Rick heeft als spreker op conferenties een zeer goede naam verworven zowel in binnen- als buitenland. Hij weet als geen ander een goede balans te vinden tussen op de praktijk toegesneden technologische en strategische zaken.
Hij schrijft voor het bekende BeyeNetwork.com. Tevens verschenen van zijn hand diverse artikelen in toonaangevende vakbladen. Verschillende van zijn boeken, waaronder het populaire "SQL Leerboek", zijn in vele talen gepubliceerd. Recent is van zijn hand verschenen Data Virtualization for Business Intelligence Systems", alsook tientallen whitepapers over BI.
Questions about this ? Interested but you can't attend ? Send us an email !