/

Data Warehouse (DWH)

Definition:

Data Warehouse (DWH)

Inhalt

Im täglichen Betrieb eines Unternehmens fallen regelmäßig große Mengen von Daten an. Ein Data Warehouse (DWH) ermöglicht es, diese komplexen Daten aus verschiedenen Bereichen des Unternehmens zu speichern und zusammenzuführen, damit sie für unterschiedliche Zwecke verwendbar sind. Ziel dieser speziellen Datenbank ist es, einen schnellen und einfachen Zugriff auf wichtige Informationen zu ermöglichen.

Definition: Was ist ein Data Warehouse?

Bei einem Data Warehouse handelt es sich um ein spezielles, für betriebswirtschaftliche Analysen und gezielte Datenabfragen nutzbares, Datenbanksystem mit mehreren Schichten. Eine Besonderheit dabei ist, dass ein Data Warehouse die zusammengeführten Daten aus verschiedenen Quellen in einheitliche Datenformate umwandelt. 

Diese einheitliche Datenbasis stellt es zentral für unterschiedliche Zwecke, etwa Analysesysteme, zur Verfügung. Üblicherweise greifen Data Warehouses für das Sammeln der Daten über Schnittstellen direkt auf einen zentralen Datenspeicher, wie einen Data Lake zu. 

Abgrenzung zu verwandten Begriffen

Aus dieser Data Warehouse-Definition ergeben sich auch die Unterschiede zu ähnlichen Lösungen

  • Anders als beim Data Mining geht es nicht um das Aufdecken von Mustern in großen Datenmengen, sondern vor allem um die qualitativ hochwertige Aufbereitung und Zusammenführung von unterschiedlichen Datentöpfen für die regelmäßige Analyse.
  • Im Gegensatz zu klassischen Datenbanken ist das Konzept eines Data Warehouses (DWH) klar auf geschäftliche Analysezwecke ausgerichtet und in mehreren Schichten strukturiert.
  • Ein Data Lake wiederum kann als Teil des Data Warehouses fungieren, indem zunächst alle eingehenden Daten vor der Verarbeitung gesammelt werden.
  • Nicht zuletzt gibt es auch Unterschiede zum Data Mart, der üblicherweise auf Abteilungsebene eingesetzt wird, während ein DWH das gesamte Unternehmen umfasst. Sinnvollerweise werden zentrale Geschäftsobjekte in Data Marts innerhalb des DWHs bereits als eigene Schicht aufbereitet. Daraus werden analytische Modelle der Fachbereiche mit Daten beliefert, wodurch die Logik für Geschäftsprozesse zentral bereitgestellt wird.

DWH-Architektur: Wie ist ein Data Warehouse aufgebaut?

Wie ein Data Warehouse in der Praxis funktioniert, lässt sich gut am Aufbau erkennen. Dieser kann sich, je nach spezifischen Anforderungen des Unternehmens, im Detail unterscheiden. Es gibt zum Beispiel Unterschiede, je nachdem, ob das Warehouse global für das ganze Unternehmen arbeitet oder in Data Marts für die einzelnen Abteilungen unterteilt ist. Ein typischer Aufbau besteht aus den folgenden Teilen:

  • Datenquelle – aus diesen Quellsystemen, zum Beispiel dem ERP eines Unternehmens, stammen die gesammelten und verarbeiteten Rohdaten. 
  • Datenerfassung – in diesem Abschnitt der Data Warehouse-Architektur werden Daten aus den Quellsystemen extrahiert, formatiert und ins Datenlager des DWH übertragen. Dieser Prozess wird auch als ETL (Extraction, Transform, Load) bezeichnet. 
  • Datenhaltung – alle aus den Datenquellen extrahierten, einheitlich formatierten Datenbestände werden zentral gespeichert. 
  • Datenaufbereitung, Data Integration – die Daten werden angereichert, bereinigt und es werden Business-Logiken angewendet. 
  • Datenanalyse und Datenauswertung – hierfür können in einem getrennten Bereich (Staging Area) Daten für Abfragen durch unterschiedliche Analyseprogramme (Data Access Tools) bereitgestellt werden. Hierzu zählen etwa OLAP-Tools (OLAP = Online Analytical Processing). Diese ermöglichen die mehrdimensionale Verdichtung, Analyse und Auswertung von Daten. 
  • Datenpräsentation – die Ergebnisse aus den Analyseprogrammen lassen sich visuell darstellen und präsentieren. Die Data Presentation Area ist ein separater Bereich für den Datenzugriff. 

Durch diese Architektur kann das Data Warehouse verschiedene wichtige Funktionen rund um Daten in einem Unternehmen erfüllen. Dabei ist der größte Vorteil, dass ein DWH geeignete Strukturen für große, komplexe Datensammlungen schafft. Somit kann das gesamte Unternehmen aus einer einheitlichen Perspektive betrachtet werden. Daraus ergeben sich mehrere einzelne Aufgaben im betrieblichen Alltag:

  • Kosten- und Ressourcenanalyse 
  • Prozessanalysen 
  • Erstellung von Statistiken, Dashboards und Berichten als Grundlage für Entscheidungen 
  • analysierbare Darstellung von Unternehmenskennzahlen

Hierfür werden in der Regel spezielle Softwarelösungen, die sogenannten Data Access Tools, eingesetzt.

Data Warehouse-Systeme und -Tools

Die Implementierung eines DWHs erfordert sorgfältige Planung und Strukturierung. Bei den Data WarehouseSystemen ist grundsätzlich zwischen frei verfügbaren Open-Source-Tools sowie kommerziellen DWH-Lösungen zu unterscheiden. Der Vorteil einer kommerziellen Data WarehouseAnwendung liegt darin, dass die komplette Architektur und Funktionalität in einer Technologie abgebildet wird. Bei OpenSourceSoftware müssen hingegen oft mehrere Lösungen, Produkte und Werkzeuge von verschiedenen Anbietern miteinander kombiniert werden. 

Eine weitere Unterscheidungsmöglichkeit besteht in der Örtlichkeit der Datenspeicherung und -verarbeitung – nämlich ob die Daten in der IT-Infrastruktur vor Ort (On-Premise) verarbeitet und gespeichert werden oder in einer Cloud. Ein Beispiel für eine solche Cloud-Lösung ist Microsoft Azure Synapse Analytics (beinhaltet das ehemalige Azure SQL Data Warehouse bzw. Parallel Data Warehouse PDW). In diesem Analysedienst können alle Aufgaben der Verarbeitungsstrecke zum Einsatz kommen – von der Extraktion der Daten, über die explorative Analyse sowie die Aufbereitung dieser. Für eine aussagekräftige, gut verständliche Visualisierung lässt sich Microsoft Power BI nutzen.

Welche Vorteile hat ein Data Warehouse?

Grundsätzlich erfordert Data Warehousing, wie jede neue Softwarelösung, zunächst eine Investition. Aufgrund der zahlreichen Vorteile amortisieren sich die Kosten jedoch schnell.

  • Schnelle datenbasierte Entscheidungsfindung: Alle nötigen Daten sind dank einheitlicher Formatierung und zentraler Speicherung für unterschiedliche Analysen für relevante Entscheidungsträger:innen verfügbar. 
  • Bessere Business Intelligence: Daten aus unterschiedlichen Quellen können integriert und mit vorhandenen Daten abgeglichen werden. Davon profitiert das Business und es können wertvolle Erkenntnisse gewonnen werden. 
  • Aus Erfahrung lernen: Da große Mengen von Unternehmensdaten analysiert und über lange Zeit gespeichert werden können, lassen sich Geschäftsvorgänge, wie zum Beispiel Marketing-Kampagnen, im Zeitverlauf miteinander vergleichen und optimieren. 
  • Datenverlust vorbeugen: Die in einem Data Warehouse abgelegten Daten sind wie in einem sicheren Back-up vor Datenverlust geschützt. 

Die Benefits, die sich aus dem Einsatz eines Data Warehouses ergeben, sorgen ganzheitlich betrachtet für transparente Prozesse rund um das Thema Daten und das Minimieren von Risiken. Der DWH-Ansatz sorgt darüber hinaus für eine höhere Datenqualität, bessere Entscheidungen und für die Steigerung der Effizienz im Unternehmen.

Sie haben weitere Fragen?

Sprechen Sie jetzt mit unserem Cloud Analytics Experten und wir zeigen Ihnen, wie Sie Ihr Unternehmen auf die nächste Stufe bringen können.

Dürsin Kurt, CO-CEO Cloud Analytics

Dürsin Kurt
CEO Cloud Analytics