/

Data Warehouse Automation

Definition:

Data Warehouse Automation

Inhalt

Data Warehouse Automation (DWA) ist ein wichtiger Teil der Data Warehouse Modernisierung und durch Themen wie Big Data, Advanced Analytics sowie DevOps/DataOps stärker in den Fokus gerückt. Grundsätzlich geht es bei der Data Warehouse Automation darum, alle manuellen Eingriffe im Lifecycle Management eines Data Warehouses, die repetitiv und gleichartig sind, durch Automatisierung obsolet zu machen. Unternehmen müssen sich bewusst sein, dass nicht alle Tätigkeiten im Lebenszyklus eines DWH automatisierbar sind.

Definition: Was ist Data Warehouse Automation?

Die Data Warehouse Automation ist ein datengesteuertes Konzept, das auf Standardisierung und Automatisierung basiert. DWA ist gleichzeitig ein technisches, strukturelles und kulturelles Transformationsprojekt. Im Zentrum stehen dabei oft ETL-Prozesse (ETL = Extract, Transform und Load), SQL-Abfragen und Datenbank-Objekte.

DWH Automation steht für die Einführung von automatisierten Warehousing-Prozessen, Methoden und Tools für die Verwaltung sowie Pflege eines DWHs, in dem sonst häufig manuell betriebene, repetitive, nicht standardisierte und fehleranfällige Abläufe bestehen.

Das Data Warehouse ist durch seinen Aufbau vielschichtig und umfasst eine große Anzahl von Stakeholdern, Tools und Methoden. Zunächst müssen für eine DWH Automation relevante Prozesse analysiert und in die richtige Abhängigkeit gesetzt werden (Ist-Analyse). Im nächsten Schritt können Unternehmen potenziell automatisierbare Schritte ermitteln. Hierbei können DevOps bzw. DataOps zum Einsatz kommen. Oft geht DWA auch mit einer modellgetriebenen Entwicklung einher.

Was sind die Vorteile von Data Warehouse Automation?

Das Data Warehouse (DWH) als Speicherort für strukturierte Daten stößt angesichts einer stetig wachsenden Zahl von Datenmengen, Quellen und Operationen zunehmend an die Grenzen der Benutzer- und Entwicklerfreundlichkeit. In klassischen DWH-Prozessen werden die zentralen ETL-Operationen von Hand an verschiedenen Orten durchgeführt – und je nach Fachbereich, Abteilung oder Mitarbeiter:in mehr oder weniger konsistent erledigt.

Über die Automatisierung von Prozessen zur Quellcodegenerierung und Datenintegration im DWH entfallen bei einem Teil dieser Aufgaben personelle Ressourcen. Das hat gleich mehrere entscheidende Vorteile für Unternehmen:

  • Sinkender Aufwand, weniger Kosten und geringere Arbeitsbelastung für die DWH-Pflege
  • Deutlich steigende Datenqualität und Datenintegrität
  • Einfachere und präzisere Ad-hoc-Analysen oder Reportings sind möglich
  • Erfolgreichere Entwicklung und Durchführung datengetriebener Projekte
  • Durch die Anwendung von Automatisierungssoftware können Unternehmen ihre Dateninfrastrukturen verbessern und somit auch ihre Geschäftsprozesse optimieren
  • Schnellere und realistischere Entscheidungen
  • Aufbau passgenauerer Data Governance-Richtlinien
  • Bessere Zusammenarbeit von DevOps- und DataOps-Teams
  • Steigerung der Agilität und Produktivität im Betrieb

Wie funktioniert DWH Automation?

DWH Automation ist kein isoliertes Projekt, sondern im Idealfall eine kontinuierliche Teilaufgabe einer grundsätzlichen DWH Modernisierung. Sie sollte durch DevOps/DataOps angestoßen werden und mit einer ganzheitlichen Entwicklung der Unternehmenskultur als datengetriebenes Unternehmen einhergehen. Die Automatisierungsprozesse eröffnen zahlreiche Anknüpfungspunkte für den generellen Umgang mit Daten und machen im Data Warehouse die effizientere Nutzung von Analysetools und -methoden möglich.

Wie bei jedem Modernisierungsprojekt ist DWA zudem ein wichtiger Anreiz, um etablierte Strukturen und Ansätze im operativen sowie strategischen Geschäft zu hinterfragen und damit agilere Prozesse im gesamten Unternehmen zu implementieren. Grundsätzlich besteht DWH Automation aus folgenden Schritten:

  1. Ist-Analyse der DWH-Architektur und Abstimmung mit allen Beteiligten zu Anforderungen und (benötigten) Fähigkeiten.
  2. Bestimmung der einzelnen Prozessschritte und ihrer Schnittstellen (APIs).
  3. Erstellung einer Roadmap für die Umsetzung, inklusive Auswahl zu automatisierender Abläufe und Integration in bestehende Arbeitsstrukturen.
  4. Auswahl der Tools, Werkzeuge und Technologien nach den Bedürfnissen des Unternehmens. Bei der DWA werden automatische Regeln und Skripte angewendet.
  5. Implementierung der Tools und Schulung der relevanten Mitarbeitenden für Support und Controlling.

Data Warehouse Automation Tools

Zu wichtigen DWH Automation Tools zählen zum Beispiel ETL-, Entwicklungs-, Analyse- sowie Visualisierungstools. Im Zuge der Umsetzung des Automatisierungsprojekts sollte darauf geachtet werden, dass die gewählte Plattform bzw. die Tools erweiterungsfähig, anschlussfähig und nahtlos integrierbar sind. Das Data Warehouse als zentrale Datenquelle folgt zwar einem festeren Bauplan als bspw. ein Data Lake, muss aber offen für zukünftige Bedarfe sowie neue Anforderungen an die Bereitstellung von Daten sein.

Durch den Einsatz von Automatisierungswerkzeugen können verschiedene Datentypen konsolidiert und harmonisiert werden, um sicherzustellen, dass die Daten im Warehouse konsistent sind sowie eine hohe Qualität aufweisen.

Eine DWH Automation-Software oder -Plattform sollte auf folgenden essenziellen Säulen ruhen:

  1. Automatisierung von ETL-Prozessen
  2. Anbindung von Quellsystemen (automatisierbar durch Reverse Engineering)
  3. Intuitive Benutzerführung, z. B. über Drag-and-Drop-Funktionen
  4. Teilautomatisierte Objektgenerierung in Datenmodellen eines Data Warehouses (Geschäftsobjekte)
  5. Schnittstellen bzw. Connectors zu wichtigen Business Intelligence-Anwendungen wie Power BI

Unterschiedliche Lösungen können sich zwar in ihren Details unterscheiden, sollten aber dem Prinzip folgen, dass die DWH Automatisierung zwar ein einmaliges Projekt, aber kein abgeschlossener oder isolierter Prozess ist. Die regelmäßige Arbeit an der DWA und kontinuierliche Verbesserung von Geschäftsprozessen trägt maßgeblich zum Erfolg eines Unternehmens bei.

Sie haben weitere Fragen?

Sprechen Sie jetzt mit unserem Cloud Analytics Experten und wir zeigen Ihnen, wie Sie Ihr Unternehmen auf die nächste Stufe bringen können.

Dürsin Kurt
CEO Cloud Analytics