SSIS (SQL Server Integration Services) ist eine Microsoft-Lösung für ETL-Prozesse (Extrahieren, Transformieren, Laden) in Datenbanken und entscheidende Komponente des Microsoft SQL Servers. SSIS wird für verschiedene Aufgaben im Umfeld der Data Warehouse Modernisierung sowie für automatisierte Datenflüsse genutzt.
Die SQL Server Integration Services bilden zusammen mit den SQL Server Analysis Services (SSAS) und den SQL Server Reporting Services (SSRS) das Fundament des Microsoft SQL Servers als vielschichtige Business Intelligence-Lösung. Die SSIS fungieren dabei als eine Art Vermittler und Übersetzer im Informationsfluss. Sie bieten Anwendungen zur Datenintegration und Datentransformation.
Daten aus verschiedenen Quellen und Formaten werden extrahiert, verarbeitet und geladen, somit vereinheitlicht und für Analysen sowie das resultierende Reporting (Berichtswesen) bereitgestellt.
SSIS bietet Werkzeuge und Services, mit denen sich diese Abläufe über eine Benutzeroberfläche individuell modellieren, ausführen und überwachen lassen. Ähnlich wie die Analysekomponente SSAS sind auch die Integration Services keine endanwenderorientierte Lösung, sondern ein machtvolles Expertenwerkzeug, zum Beispiel für die Erstellung oder Modernisierung eines Data Warehouses oder einer Analytics Plattform.
Über die Einführung von SQL Server Integration Services können ETL-Verfahren vollständig automatisiert werden – was die SSIS zu einem Instrument der DWH Automation macht.
Die Konfiguration von SSIS beginnt oft mit der Auswahl von Parametern (Parametergruppen) und Einstellungen in der Optionsgruppe des SQL Server Management Studio (SSMS). Diese Parameter ermöglichen es Benutzer:innen, die Datenverarbeitung genau auf ihre Anforderungen abzustimmen.
Die Definition und Verwaltung von SSIS-Paketen erfolgt in der MSDB-Datenbank, die als zentraler Konnektor für diese Aufgaben dient.
ETL-Datenprozesse umfassen neben ihren drei Hauptkategorien Extraktion, Transformation und Laden weitere wichtige Aspekte in Bezug auf den Datenfluss und die Datenqualität. So lassen sich Daten per SSIS auch aus verschiedenen Datenquellen zusammenfassen und zusammenführen, aggregieren, bereinigen sowie kopieren.
Ziel ist dabei immer, einen stringenten und konsistenten Data Flow zu erzeugen, der widerspruchsfrei und reibungslos automatisiert durchgeführt werden kann. Die SSIS-Software besteht aus:
Für die grafische Entwicklung über Microsoft Visual Studio werden SQL Server Data Tools (SSDT) integriert. Ohne Visual-Studio-Lizenz können die Data Tools auch selbstständig genutzt werden, sind dann in ihrer Anwendungsfreiheit aber beschränkt.
Zentrales Element der SSIS-Modellierung sind sogenannte SSIS-Pakete, die jeweils einen Schritt im Datenfluss (als Operationen) beinhalten. Die verschiedenen Pakete eines Workflows lassen sich per Drag-and-Drop-Verfahren zusammenstellen und anschließend ausführen. Neben den eigentlichen Datenflüssen bilden SSIS auch Kontrollflüsse ab, die Log-Daten oder Versandinformationen zur Nachverfolgung enthalten.
Die Erweiterung SSIS-DevOps-Tools besteht aus dem SSIS-Build-Task, SSIS-Bereitstellungs-Task und dem Konfigurations-Task für SSIS-Kataloge. SSIS- oder auch SSISDB-Kataloge sind der zentrale Ort, an dem mit SSIS-Projekten gearbeitet wird. Hier werden z. B. verschiedene Parameter für Pakete und Projekte bestimmt oder Umgebungen konfiguriert.
SSIS werden in einer Vielzahl von Geschäftsanwendungen verwendet. Mit ihrem Fokus auf ETL-Prozesse können SSIS für unzählige Aufgaben in Verbindung mit der Modellierung und Integration von Daten eingesetzt werden. Dazu gehören beispielsweise alle Aspekte rund um das Data Warehouse sowie Data Mining. Typischerweise werden die SSIS als Bestandteil der SQL Server Suite für Business Intelligence-Anwendungen herangezogen – etwa für die Datenanalyse per SSAS und das Reporting per SSRS.
Aus Spezialistensicht ist SSIS – zusammen mit der Verwendung der gesamten SQL Server-Umgebung – ein machtvolles Instrument, bei dem es wichtig ist, dass es in seiner Komplexität verstanden und ideal genutzt wird.
Als einer der größten Vorteile gilt die Möglichkeit, neue Komponenten oder Workflows vollständig selbst zu entwickeln und damit dem DWH genau die Funktionen zu verleihen, die zum eigenen Unternehmen passen.
Weitere Vorteile auf einen Blick:
Sprechen Sie jetzt mit unserem Cloud Analytics Experten und wir zeigen Ihnen, wie Sie Ihr Unternehmen auf die nächste Stufe bringen können.
Dürsin Kurt
CEO Cloud Analytics