Skip to main content

2011 | Buch

Data-Warehouse-Systeme kompakt

Aufbau, Architektur, Grundfunktionen

verfasst von: Kiumars Farkisch

Verlag: Springer Berlin Heidelberg

Buchreihe : Xpert.press

insite
SUCHEN

Über dieses Buch

Dieses Buch untersucht Data-Warehouse-Systeme als einheitliche, zentrale, unternehmensweite, vollständige, historisierte und analytische IT-Plattform und stellt diese zur Unterstützung der Datenanalyse und des Entscheidungsfindungsprozesses dar. Dabei wird auf die einzelnen Komponenten eingegangen, die am Aufbau, an der Architektur und an dem Betrieb eines Data-Warehouse-Systems von Bedeutung sind. Es werden die multidimensionale Datenmodellierung mit deren Dimensionen und Fakten, der ETL-Prozess, OLAP, OLAM und deren jeweiligen Eigenschaften, Besonderheiten und Fähigkeiten erörtert. Zusätzlich werden die Optimierungsmaßnahmen zur Erhöhung der Performance des Data-Warehouse-Systems diskutiert.

Inhaltsverzeichnis

Frontmatter
Kapitel 1. Einleitung
Zusammenfassung
Datenbanksysteme sind eine wesentliche Grundlage für die betriebliche Informationsversorgung in Unternehmen; sie stellen den Anwendern eine strukturierte Datenverwaltung und einen effizienten Datenzugriff zur Verfügung. Vorwiegend werden in Datenbanksystemen operative1 Daten, d. h. die für Arbeitsabläufe im Unternehmen notwendigen Daten abgelegt und verwaltet. Neben operativen Daten werden heutzutage von vielen im Unternehmen eingesetzten Anwendungen Daten automatisch erzeugt und gesammelt.2 Die meisten Unternehmen betreiben mehrere zum Teil heterogene operative Systeme, die aufeinander nicht abgestimmt und oft mangelhaft dokumentiert sind. Erschwerend kommen die vielen unterschiedlichen Datenformate, Zugriffsmechanismen und Speichertechniken dazu, die es den Mitarbeitern und Managern in einem Unternehmen fast unmöglich machen, zu wissen, wo welche Daten verfügbar sind und wie eine gewünschte Information aus unterschiedlichen Quellen abgerufen werden kann. In Anbetracht der rasant steigenden Rechenleistungen und Rechenkapazitäten sowie der Entwicklung von effizienten Techniken, Methoden und Werkzeugen zur Analyse und zur Auswertung von Daten im Unternehmen stellt sich die Frage nach der Analyse und Auswertung und nach dem unternehmerischen Nutzen solcher gesammelten bzw. gespeicherten Daten. Hinzu kommt der Wunsch, aus den gesammelten Daten neue Informationen und neue Erkenntnisse zu generieren bzw. zu gewinnen, die in dieser Form nicht explizit in den Daten vorkommen oder zu erkennen sind.
Kiumars Farkisch
Kapitel 2. Terminologie und Definition
Zusammenfassung
In zahlreichen Publikationen und Fachzeitschriften tauchen die Begriffe Data Warehouse , Data Warehousing, Data-Warehouse-System, Metadaten, Dimension, multidimensionale Datenmodellierung und OLAP (On-Line Analytical Processing) zum Teil mit unterschiedlichen Interpretationen und Auslegungen auf, was manchmal sehr verwirrend sein kann.
Kiumars Farkisch
Kapitel 3. Multidimensionale DatenmodellierungDatenmodellierung
Zusammenfassung
Traditionelle und klassische relationale Datenmodellierungen, die während der Entwurfsphase einer Datenbank erstellt werden, basieren meist auf dem Entity-Relationship-Modell. Hierbei werden durch Relationen die Attribute einer oder mehrerer Entitäten logisch in Zusammenhang gebracht, sodass Teile oder Ausschnitte aus den realen Zusammenhängen modelliert werden bzw. durch logische Schemata ausgedrückt werden können. Inwieweit so entstandene Modelle die realen Gegebenheiten korrekt, vollständig und redundanzfrei wiedergeben, hängt neben den Eigenschaften und den Fähigkeiten des eingesetzten Datenbanksystems auch vom durchgeführten Grad der Normalisierung en ab.
Kiumars Farkisch
Kapitel 4. Grundlagen von OLAPOLAP
Zusammenfassung
OLAP steht für O n- L ine A nalytical P rocessing und stellt den Prozess der explorativen, interaktiven Analyse der archivierten und gespeicherten Daten in einem Data Warehouse auf Basis eines multidimensionalen Datenmodells dar. Hierbei handelt es sich vor allem um die Unterstützung von Anfragen (Query) zu Analysezwecken oder um die Aufbereitung von Geschäftsdaten für Manager und Entscheidungsträger in einem Unternehmen.
Kiumars Farkisch
Kapitel 5. Datenanalyse, NavigationNavigation anhand multidimensionaler Funktionen und Operatoren
Zusammenfassung
Die grundlegenden multidimensionalen Operationen zum interaktiven Navigieren durch einen multidimensionalen Datenraum zur Datenanalyse und Auswertung der Daten sind:
1. Pivot (Rotate)
Durch Anwendung dieser Operation auf einen multidimensionalen Datenwürfel wird der Datenwürfel um seine Achsen gedreht, was durch ein Vertauschen der Dimensionen erreicht wird. Pivot – manchmal auch Rotate genannt – ermöglicht es, den Datenbestand aus unterschiedlichen Perspektiven auszuwerten sowie zu analysieren und verschafft dem Anwender mehr Flexibilität bei der Analyse.
Kiumars Farkisch
Kapitel 6. MetadatenMetadaten
Zusammenfassung
Sogenannte Metadaten – Daten über Daten – sowie deren Verwaltung sind ein integraler Bestandteil eines Data Warehouse und beeinflussen direkt dessen Datenqualität. Unter dem Begriff Metadaten versteht man sämtliche Informationen, die für den Entwurf, den Aufbau, den Betrieb und die Nutzung eines Data Warehouse benötigt werden. Metadaten beschreiben Daten, Systemeigenschaften und Systemabgrenzungen.
Kiumars Farkisch
Kapitel 7. Eigenschaften von Data-Warehouse-Systemen
Zusammenfassung
Data-Warehouse-Systeme dienen primär der Gewinnung von Informationen und statistischen Aussagen im Rahmen eines Entscheidungsfindungsprozesses aus unterschiedlichen heterogenen Datenbanken, die als Datenquellen untersucht, analysiert und ausgewertet werden. Es existieren zahlreiche Unterschiede zwischen Eigenschaften eines Data-Warehouse-Systems und den eines Datenbanksystems zur Durchführung des operativen Geschäfts in einem Unternehmen. Traditionell gesehen basieren die meisten Datenbanksysteme und Datenbankanwendungen auf dem Konzept der Transaktion.
Kiumars Farkisch
Kapitel 8. Aufbau und Architektur eines Data-Warehouse-Systems
Zusammenfassung
Ein universelles Vorgehensmodell zur Realisierung und zum Aufbau eines Data Warehouse existiert nicht. Vielmehr sollte das Data-Warehouse-System im Idealfall in der Lage sein, ein genaues Abbild des immer dezentral operierenden Unternehmens zu erzeugen. Dazu gehören sämtliche Geschäftsprozesse und -regeln, externe und interne Beziehungen, Organisationsstrukturen und Produkte. Ein Data Warehouse soll nicht die konventionell operative Datenverarbeitung ersetzen, vielmehr schafft es daneben eine völlig neue technische und organisatorische Infrastruktur.
Kiumars Farkisch
Kapitel 9. OptimierungOptimierung
Zusammenfassung
Multidimensionale Anfragen, die an ein Data Warehouse gerichtet sind, bestehen meist aus Aggregationen von bestimmten Daten. Die Ausführung dieser Anfragen führt dazu, dass aus den u.U. sehr großen detaillierten Datenbeständen bestimmte, in den Dimensionen eingeschränkte Datenbereiche selektiert werden. Das Problem hier ist, dass die Ausführungszeiten solcher Aggregationsanfragen auf große Datenbestände und Datenmenge sehr lange dauern. Um eine Aggregationsanfrage zu beantworten, müssen teilweise die gesamten Datenbestände gelesen werden.
Kiumars Farkisch
Kapitel 10. Realtime Data-Warehouse-Systeme
Zusammenfassung
Mit weiterschreitende Globalisierung der Märkte und damit verbundenen Umverteilungen wächst der Wettbewerbsdruck auf viele Unternehmen, die zur Sicherung ihrer Existenz und zur Umsetzung ihrer ökonomischen Ziele auf aktuelle Informationen, Analysen und Trends angewiesen sind. Eine unternehmensweite Lösung zur Unterstützung dieser Anforderungen bestünde in der so genannten „Realtime (Echtzeit) Data-Warehouse-Systeme“. Im Allgemeinen wird durch die Eigenschaft der Echtzeit eines DV-Systems garantiert, dass das DV-System innerhalb eines vorher bestimmten Zeitintervalls sämtliche Daten verarbeitet und die benötigten Ergebnisse berechnet.
Kiumars Farkisch
Kapitel 11. Data MiningData Mining
Zusammenfassung
Immer mehr Unternehmen nutzen Vorteile von Informationstechnologien, um wettbewerbsfähig zu bleiben. Eine zielgerichtete, effektive, systematische und schnelle Nutzung und Auswertung von im Unternehmen vorhandenen Daten kann Manager im Rahmen des Entscheidungsfindungsprozesses bestens unterstützen, z. B. Wettbewerbsvorteile ausfindig zu machen, um diese dann auch sinnvoll zu nutzen. In diesem Zusammenhang werden die Daten aus der operativen Geschäftsabwicklung nicht mehr nur als Nebenprodukt angesehen, sondern als strategische Ressource verstanden.
Kiumars Farkisch
Backmatter
Metadaten
Titel
Data-Warehouse-Systeme kompakt
verfasst von
Kiumars Farkisch
Copyright-Jahr
2011
Verlag
Springer Berlin Heidelberg
Electronic ISBN
978-3-642-21533-9
Print ISBN
978-3-642-21532-2
DOI
https://doi.org/10.1007/978-3-642-21533-9