Klaus-Peter Sauer

SAP Data Warehouse Cloud


Скачать книгу

um die Zusammenarbeit zwischen den Abteilungen zu stärken, ohne die Daten ständig kopieren zu müssen. Dadurch werden dem Endbenutzer Informationen in einem digitalen Format zugänglich gemacht, über das sich Daten ohne Hilfe von außen sammeln und analysieren lassen. Dieser Prozess wird auch als Datendemokratisierung bezeichnet.

      Semantische Schicht

      Die semantische Schicht im Business Builder bietet die Möglichkeit der Abstraktion von oft komplexen und sehr technischen Datenmodellen in Objekte mit normaler Sprache. So erstellen Sie wiederverwendbare Objekte, anhand derer andere Anwender die Daten sofort verstehen. Sie können zudem die Beziehungen zwischen Elementen in Ihrem Datenmodell definieren und Ihre Datenfelder mit weiteren Geschäftsinformationen anreichern.

      Um die semantische Modellierung im Sinne einer Self-Service-Modellierung nutzen zu können, benötigen Sie einen guten Grundstock an Entitäten und analytischen Modellen, damit sich die Benutzer einfach an bestehenden Objekten bedienen können, um eigene Consumption-Modelle oder Perspektiven zu erstellen.

      Offenheit

      Die Offenheit der Lösung ist ein ganz zentraler Bestandteil des Konzepts und zeigt sich auf allen Ebenen: bei Werkzeugen, Daten und Schnittstellen.

      In Bezug auf die Datenintegration bedeutet dies Konnektivität sowohl zu klassischen On-Premises-Systemen als auch zu cloudbasierten Software-Lösungen, unabhängig davon, ob es sich dabei um SAP-Systeme handelt oder nicht. Eine gute Integration in eine bestehende SAP-Landschaft mit unterschiedlichen Lösungen wird vom Kunden ohnehin vorausgesetzt. Diesbezüglich deckt Data Warenhause Cloud bereits eine breite Palette von Quellsystemen ab.

      Reichen die ausgelieferten Quellsystemverbindungen nicht aus, können Sie beliebige externe Werkzeuge (z.B. SAP Data Services, SAP Data Intelligence, Informatica, SnapLogic, Adverity und andere) zur Datenintegration verwenden, sofern diese einen SQL-basierten HANA-Konnektor anbieten. Dabei werden die Daten in ein offenes SQL-Schema geschrieben, in dem Sie außerdem SQL-basiert Datenmodellierungen vornehmen und diese nahtlos in die weitere Modellierung mit Data Warehouse Cloud integrieren können. So kommen die in Unternehmen häufig vorhandenen SQL-Kenntnisse zum Einsatz.

      Gleichzeitig lassen sich über ein offenes SQL-Schema die Bibliotheken für maschinelles Lernen aus dem HANA-Cloud-Scriptserver nutzen, um Data-Science-Projekte auf den vorhandenen Datenbeständen durchzuführen.

      Für Analytics-Werkzeuge von Drittanbietern steht ebenfalls eine SQL-Schnittstelle zur Verfügung. Die weitere Roadmap sieht darüber hinaus Schnittstellen auf der Ebene von Spaces und der Datenmodellierung vor, über die Data-Warehouse-Cloud-Objekte von externen Werkzeugen erzeugt werden können.

      Design-Time versus Runtime

      Wie viele moderne Software-Umgebungen unterscheidet Data Warehouse Cloud zwei Phasen:

      1. Design-Time (Entwurf): Die Design-Time beschreibt das Objekt beim Entwurf, wie z.B. die Definition einer Tabelle. Beim Speichern

werden die Metadaten im lokalen Repository abgelegt. Um die Tabelle in anderen Modellen weiterzuverwenden oder mit Daten zu befüllen, muss sie schließlich als Runtime-Objekt in der Datenbank erzeugt werden.

      2. Runtime (Laufzeit): Nach der Implementierung

(Deployment) können Sie die Daten über das Laufzeitobjekt auswerten.

      Anwendungsfälle, Einsatzszenarien, Use Cases – die Verwendung von Software-Produkten lässt sich mit verschiedenen Begriffen beschreiben. Sehr oft hängt dieser vom individuellen Blickwinkel des Betrachters ab. Den Anwendungsfällen liegt eine systemorientierte Sichtweise zugrunde.

      Hybride Einsatzszenarien

      Der Begriff hybrid wird in der IT-Branche mit vielfältiger Bedeutung verwendet. In diesem Zusammenhang wird darunter die nahtlose Integration vorhandener Data-Warehouse-Systeme mit Data Warehouse Cloud verstanden. In Kapitel 5 erfahren Sie Details zu den Möglichkeiten hybrider Einsatzszenarien von Data Warehouse Cloud, insbesondere mit SAP BW, BW/4HANA und SQL-basierten Data Warehouses mit SAP HANA.

      Data Marts und applikationsübergreifendes Data Warehousing

      Die Lösung eignet sich sehr gut zum Aufbau von cloudbasierten Data Marts, also für Teile des gesamten Datenbestands. In den zuvor benannten Spaces werden neue Data Marts aufgebaut und die Daten bei Bedarf mit anderen geteilt – ebenfalls, ohne eine Datenkopie erzeugen zu müssen. Das können Daten für neue Projekte oder für Ihren Start in die Cloud sein. Diese Data Marts können auch zu einem Data Warehouse heranwachsen und so applikationsübergreifende Szenarien abbilden.

      Self-Service-Modellierung und Datendemokratisierung

      Wie zuvor erwähnt, ermöglicht die Self-Service-Modellierung das Erstellen neuer Modelle und Analysen, über die Endanwender zügig zu neuen Erkenntnissen (Time-to-Value) gelangen. Die IT kann gleichzeitig über unterschiedliche Spaces die Datendemokratisierung im Unternehmen weiter vorantreiben und Data-Science-Projekte der Fachabteilung durch die Verwendung der HANA-Cloud-Bibliotheken für maschinelles Lernen unterstützen.

      Technisch ist SAP Data Warehouse Cloud auf SAP HANA Cloud als Datenbankplattform und SAP Analytics Cloud aufgebaut. So bedient sich die Applikation bei der Persistenz etwa an den Services von SAP HANA Cloud und beim Benutzer- und Rollenkonzept an einigen Services von SAP Analytics Cloud.

      Abbildung 1.1 stellt die wesentlichen Funktionsbereiche und Software-Komponenten vereinfacht dar.

      Abbildung 1.1: Architektur von SAP Data Warehouse Cloud

      Sie können cloudbasierte sowie klassische On-Premises-Quellsysteme an Data Warehouse Cloud anschließen. Einige unterstützen den virtuellen Zugriff oder eine Echtzeitreplikation, manche auch nur Batch-Ladungen für Datenflüsse. Welche Konnektoren Data Warehouse Cloud bietet und welche Datentransferverfahren diese jeweils unterstützen, erfahren Sie in Abschnitt 2.4. Daneben gibt es eine Schnittstelle (Application Programming Interface, kurz API) für externe Werkzeuge von Drittanbietern, um das System mit Daten zu befüllen.

      Daten lassen sich persistent speichern. Dafür stehen Ihnen drei Bereiche zur Verfügung:

       Hauptspeicher (In-Memory)

       SSD (Solid State Drive)

       Relationaler Data Lake

      Letzterer steht seit Mitte 2020 in den meisten Rechenzentren weltweit zur Verfügung und kann optional dazugekauft werden.

      Wie eingangs schon erwähnt, sind SAP Analytics Cloud und Data Warehouse Cloud eng miteinander verzahnt, obwohl es sich lizenzseitig um zwei verschiedene Cloud-Lösungen handelt. Deshalb ist Analytics Cloud mit einer gestrichelten Linie in der Grafik umrandet, ebenso wie die externen Werkzeuge der SAP Business Technology Platform und anderer Anbieter.

      Zur Datenkonsumierung steht ein weiteres API zur Verfügung, um externe Visualisierungswerkzeuge von Drittanbietern anschließen zu können.

      Spaces sind die virtuellen und isolierten Arbeitsbereiche, in denen die Objekte wie Tabellen, Views, Business-Entitäten etc. zugeordnet und verwaltet werden (siehe Kapitel