Im täglichen Betrieb eines Unternehmens fallen regelmäßig große Mengen von Daten an. Ein Data Warehouse (DWH) ermöglicht es, diese komplexen Daten aus verschiedenen Bereichen des Unternehmens zu speichern und zusammenzuführen, damit sie für unterschiedliche Zwecke verwendbar sind. Ziel dieser speziellen Datenbank ist es, einen schnellen und einfachen Zugriff auf wichtige Informationen zu ermöglichen.
Bei einem Data Warehouse handelt es sich um ein spezielles, für betriebswirtschaftliche Analysen und gezielte Datenabfragen nutzbares, Datenbanksystem mit mehreren Schichten. Eine Besonderheit dabei ist, dass ein Data Warehouse die zusammengeführten Daten aus verschiedenen Quellen in einheitliche Datenformate umwandelt.
Diese einheitliche Datenbasis stellt es zentral für unterschiedliche Zwecke, etwa Analysesysteme, zur Verfügung. Üblicherweise greifen Data Warehouses für das Sammeln der Daten über Schnittstellen direkt auf einen zentralen Datenspeicher, wie einen Data Lake zu.
Aus dieser Data Warehouse-Definition ergeben sich auch die Unterschiede zu ähnlichen Lösungen.
Wie ein Data Warehouse in der Praxis funktioniert, lässt sich gut am Aufbau erkennen. Dieser kann sich, je nach spezifischen Anforderungen des Unternehmens, im Detail unterscheiden. Es gibt zum Beispiel Unterschiede, je nachdem, ob das Warehouse global für das ganze Unternehmen arbeitet oder in Data Marts für die einzelnen Abteilungen unterteilt ist. Ein typischer Aufbau besteht aus den folgenden Teilen:
Durch diese Architektur kann das Data Warehouse verschiedene wichtige Funktionen rund um Daten in einem Unternehmen erfüllen. Dabei ist der größte Vorteil, dass ein DWH geeignete Strukturen für große, komplexe Datensammlungen schafft. Somit kann das gesamte Unternehmen aus einer einheitlichen Perspektive betrachtet werden. Daraus ergeben sich mehrere einzelne Aufgaben im betrieblichen Alltag:
Hierfür werden in der Regel spezielle Softwarelösungen, die sogenannten Data Access Tools, eingesetzt.
Die Implementierung eines DWHs erfordert sorgfältige Planung und Strukturierung. Bei den Data Warehouse–Systemen ist grundsätzlich zwischen frei verfügbaren Open-Source-Tools sowie kommerziellen DWH-Lösungen zu unterscheiden. Der Vorteil einer kommerziellen Data Warehouse–Anwendung liegt darin, dass die komplette Architektur und Funktionalität in einer Technologie abgebildet wird. Bei Open–Source–Software müssen hingegen oft mehrere Lösungen, Produkte und Werkzeuge von verschiedenen Anbietern miteinander kombiniert werden.
Eine weitere Unterscheidungsmöglichkeit besteht in der Örtlichkeit der Datenspeicherung und -verarbeitung – nämlich ob die Daten in der IT-Infrastruktur vor Ort (On-Premise) verarbeitet und gespeichert werden oder in einer Cloud. Ein Beispiel für eine solche Cloud-Lösung ist Microsoft Azure Synapse Analytics (beinhaltet das ehemalige Azure SQL Data Warehouse bzw. Parallel Data Warehouse PDW). In diesem Analysedienst können alle Aufgaben der Verarbeitungsstrecke zum Einsatz kommen – von der Extraktion der Daten, über die explorative Analyse sowie die Aufbereitung dieser. Für eine aussagekräftige, gut verständliche Visualisierung lässt sich Microsoft Power BI nutzen.
Grundsätzlich erfordert Data Warehousing, wie jede neue Softwarelösung, zunächst eine Investition. Aufgrund der zahlreichen Vorteile amortisieren sich die Kosten jedoch schnell.
Die Benefits, die sich aus dem Einsatz eines Data Warehouses ergeben, sorgen ganzheitlich betrachtet für transparente Prozesse rund um das Thema Daten und das Minimieren von Risiken. Der DWH-Ansatz sorgt darüber hinaus für eine höhere Datenqualität, bessere Entscheidungen und für die Steigerung der Effizienz im Unternehmen.
Sprechen Sie jetzt mit unserem Cloud Analytics Experten und wir zeigen Ihnen, wie Sie Ihr Unternehmen auf die nächste Stufe bringen können.
Dürsin Kurt
CEO Cloud Analytics