Data Warehouse

Ein Data Warehouse (DW oder DWH), auch bekannt als Enterprise Data Warehouse (EDW), ist ein System zur Berichterstattung und Datenanalyse und gilt als eine Kernkomponente der Business Intelligence. DWs sind zentrale Repositorien für integrierte Daten aus einer oder mehreren unterschiedlichen Quellen. Sie speichern aktuelle und historische Daten an einem einzigen Ort, die für die Erstellung von Analyseberichten für Mitarbeiter im gesamten Unternehmen verwendet werden.

Die im Lager gespeicherten Daten werden aus den operativen Systemen (z.B. Marketing oder Vertrieb) hochgeladen. Die Daten können einen operativen Datenspeicher durchlaufen und erfordern möglicherweise eine Datenbereinigung für zusätzliche Operationen, um die Datenqualität zu gewährleisten, bevor sie im DW für das Reporting verwendet werden.

Das typische ETL-basierte Data Warehouse (Extract, Transform, Load) nutzt Staging, Datenintegration und Zugriffsschichten, um seine wichtigsten Funktionen unterzubringen. Die Staging-Schicht oder Staging-Datenbank speichert Rohdaten, die aus jedem der unterschiedlichen Quelldatensysteme extrahiert wurden. Die Integrationsschicht integriert die unterschiedlichen Datensätze, indem sie die Daten aus der Staging-Schicht transformiert, die diese transformierten Daten oft in einer ODS-Datenbank (Operational Data Store) speichert. Die integrierten Daten werden dann in eine weitere Datenbank verschoben, die oft als Data Warehouse Datenbank bezeichnet wird, wo die Daten in hierarchische Gruppen, oft als Dimensionen bezeichnet, und in Fakten und aggregierte Fakten eingeteilt werden. Die Kombination von Fakten und Dimensionen wird manchmal als Sternschema bezeichnet. Die Zugriffsebene hilft Benutzern beim Abrufen von Daten.

Die Hauptquelle der Daten ist die Bereinigung, Transformation, Katalogisierung und Bereitstellung für Manager und andere Geschäftsleute für Data Mining, Online-Analytik, Marktforschung und Entscheidungsunterstützung. Die Mittel zum Abrufen und Analysieren von Daten, zum Extrahieren, Transformieren und Laden von Daten und zum Verwalten des Data Dictionary gelten jedoch auch als wesentliche Bestandteile eines Data Warehouse Systems. Viele Verweise auf Data Warehousing nutzen diesen breiteren Kontext. Eine erweiterte Definition für Data Warehousing umfasst daher Business Intelligence-Tools, Tools zum Extrahieren, Transformieren und Laden von Daten in das Repository sowie Tools zum Verwalten und Abrufen von Metadaten.

Vorteile

Ein Data Warehouse verwaltet eine Kopie von Informationen aus den Quelltransaktionssystemen. Diese architektonische Komplexität bietet die Möglichkeit,:

  • Integration von Daten aus mehreren Quellen in eine einzige Datenbank und ein einziges Datenmodell. Zusammenführung von Daten in einer einzigen Datenbank, so dass eine einzige Abfragemaschine verwendet werden kann, um Daten in einem ODS darzustellen.
  • Verringerung des Problems der Sperrkonkurrenz auf Datenbankisolationsebene in Transaktionsverarbeitungssystemen, das durch Versuche verursacht wird, große, lang laufende Analyseabfragen in Transaktionsverarbeitungsdatenbanken auszuführen.
  • Pflegen der Datenhistorie, auch wenn die Quelltransaktionssysteme dies nicht tun.
  • Integration von Daten aus mehreren Quellsystemen, was eine zentrale Sicht auf das gesamte Unternehmen ermöglicht. Dieser Vorteil ist immer wertvoll, vor allem aber, wenn das Unternehmen durch Fusion gewachsen ist.
  • Verbesserung der Datenqualität, indem konsistente Codes und Beschreibungen bereitstellt, schlechte Daten markiert oder sogar korrigiert werden.
  • Präsentationen von Informationen des Unternehmens sind konsistent.
  • Einziges gemeinsames Datenmodell für alle Daten von Interesse, unabhängig von der Datenquelle.
  • Strukturierung der Daten so, dass sie für die Fachanwender sinnvoll sind.
  • Strukturierung der Daten so, dass sie auch bei komplexen analytischen Abfragen eine hervorragende Abfrageleistung liefern, ohne die Betriebssysteme zu beeinträchtigen.
  • Wertschöpfung für operative Geschäftsanwendungen, insbesondere Customer Relationship Management (CRM)-Systeme.
  • Erleichterung von Schreiben von entscheidungsunterstützenden Abfragen.
  • Organisieren und disambiguieren von sich wiederholende Daten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.