Big Data zu Smart Data

Große Datenbestände in ihrer Rohform werden Big Data genannt. Data Mining macht Big Data zu Smart Data. Dabei ist die Herangehensweise entscheidend. Den Daten werden mit der Wahl eines geeigneten Filterprinzips erst Bedeutung und Sinn verliehen, also eine Semantik hinzugefügt. Die gefilterten Datenbestände werden damit im Wortsinn raffiniert. Big Data Analytics, also die Analyse der großen Datenmengen, verleiht diesen ihren eigentlichen, informativen Wert. Smart Data sind also solche Daten, die schon für einen späteren, potenziellen Nutzer aufbereitet, klassifiziert und entsprechend lesbar gemacht wurden.

Big Data Analytics – Data Mining und Predictive Analaytics

Data Mining und Predictive Analytics sind zwei Teilbereiche von Big Data Analytics. Beide Methoden sind darauf ausgelegt, große Datenbestände zu analysieren. Werden auf smarte Daten zugeschnittene Algorithmen und statistische Modelle so entwickelt, dass sich Trends und Prognosen aus den gesammelten und analysierten Datenmengen ableiten lassen, mittels derer man Handlungsempfehlungen und Strategien für die Zukunft entwickeln kann, spricht man von Predictive Analytics. Predictive Analytics macht smarte Daten also zukunftstauglich.

Anwendungsbeispiele für erfolgreich implementierte, smarte Datentechnologie

Die aus Big Data gewonnene Information stellt einen wirtschaftlich wertvollen Mehrwert dar. Der Markt um die Big Data Analytics wächst daher stetig. Schon 2018 wird der Umsatz der Branche wohl mehr als 50 Milliarden Euro betragen. Deutschland möchte im Bereich der Entwicklung von zukunftsweisenden Datentechnologien eine führende Rolle spielen. Derzeit werden dreizehn Leuchtturmprojekte im Rahmen des vom Bundeswirtschaftsministerium für Wirtschaft und Energie initiierten Technologieprogramms “Smart Data – Innovationen aus Daten” gefördert.

  • Energiesektor
    Die Plattform von SmartEnergyHub verwendet Predictive Analytics, um mit an einer Software angeschlossene Stromzähler Verbrauchsdaten elektronisch zu erfassen. Für Verbraucher, die mehr als 6.000 kWh im Jahr verbrauchen, sind derartige Zähler bereits verpflichtend. Alle 15 Minuten speichern und übertragen sie aktuelle Daten. Damit erzeugen die Zähler große Datenmengen, die nach ihrer Auswertung Auskunft darüber geben, wann Energie “just in time” bereitgestellt werden muss. Erneuerbare Energien sind immer noch schwer zu speichern, was es notwendig macht, Anlagen, die Wind- oder Sonnenenergie einspeisen, vorübergehend abzuschalten, damit das Netz stabil bei einer Spannung von 50 Hertz bleibt und nicht beschädigt wird. Die digitalen Zähler können den Betreibern also rechtzeitig Mitteilung darüber machen, wann sie ihre Anlagen herunterfahren müssen. Dem Verbraucher hilft der “Smart Meter” seinen Verbrauch besser einzuschätzen, was zu einer Energieersparnis von bis zu 10 Prozent führen kann.
  • Katastrophenschutz
    sd-kama ist eine smarte Datentechnologie, die für das Katastrophenmanagement entwickelt wurde und unter anderem beim Hochwasserschutzmanagement der Stadt Köln eingesetzt wird. Daten zur Verkehrssituation, Pegelstände, Satellitendaten aber auch Meldungen oder Bilder, die Einsatzkräfte vor Ort übermitteln, können vernetzt und in Echtzeit an eine Zentrale übertragen werden. Grafisch aufgearbeitet können die Daten von der Einsatzleitung ausgewertet und an die Einsatzkräfte mit daraus abgeleiteten Handlungsanweisungen zurückgegeben werden. Die Einsatzleitung weiß so jederzeit, wo eine kritische Situation droht oder wo und in welcher Stärke der nächste Einsatz gefahren werden muss.
  • Datensicherheit
    Die Verarbeitung personenbezogener Daten ist nur mit ausdrücklicher Genehmigung der Betroffenen erlaubt. Mit der Einführung der Datenschutz-Grundverordnung (DSGVO wird den europäischen Verbrauchern mit Mai 2018 der umfassende Schutz ihrer Daten gesetzlich garantiert. Das französische Projekt ISÆN(Individual perSonal data Auditable addrEss Number) hat eine Technologie entwickelt, die eine Online-Authentifizierung von Internetnutzern ermöglicht. Einmal angemeldet und durch Video-Ident oder ein biometrisches Verfahren zertifiziert, kann der Nutzer festlegen, wer seine personenbezogenen Daten verwenden darf, welche Daten genau hinterlegt werden dürfen oder auch, ob er eine erteilte Zustimmung zur Verarbeitung von persönlichen Daten zurücknehmen will.
  • Mobilität
    Die Plattformen ExCELL und SD4M nutzen Verkehrsmeldungen offizieller Stellen aber auch spontane Mitteilungen von Verkehrsteilnehmern, die online über eine lokale Verkehrssituation berichten. Sie verbinden diese Informationen mit meteorologischen Daten und den Fahrplandaten der städtischen Verkehrsbetriebe oder der Bahn, um Verkehrsfluss, Staus oder Verkehrskomplikationen so präzise wie möglich zu prognostizieren. Ihr Ziel ist es, alle Verkehrsteilnehmer, Bürger und Unternehmen gleichermaßen, die aktuell ökonomisch und ökologisch vorteilhaftesten Wege aufzuzeigen.
  • Gesundheitsbranche
    Das Projekt KDI – Klinische Datenintelligenz zielt darauf ab, Daten aus elektronischen Patientenakten gezielt auszulesen und so zu vernetzen, dass Krankheitsverläufe besser dokumentiert und optimierte Therapieansätze entwickelt werden können. Die Dosierung oder Zusammensetzung verabreichter Medikamente könnte immer individuell an aktuell ermittelte Werte angepasst. Werden Nebenwirkungen bemerkt, könnte eine Behandlung unmittelbar entsprechend angepasst werden. Erfolgreiche Behandlungstechniken könnten sich gegenüber weniger erfolgreichen Therapieansätzen schneller durchsetzen und die Früherkennung von Krankheiten würde noch besser funktionieren. Medizinisch verwertbare Daten, die in großer Menge in Praxen und Kliniken gesammelt werden, können bei anonymisierter Auswertung die medizinische Forschung schnell und deutlich weiter bringen. Menschen, die mit tragbaren Messgeräten Gesundheitsdaten wie Blutdruck oder Blutzuckerwerte selber ermitteln, tragen ebenfalls zur potenziell disponiblen Datenmenge bei. Allerdings handelt es sich um Datenbestände in heterogener Form: Numerisch erfasste Befunde, beschreibende Diagnosen und radiologische Aufnahmen oder andere Bilddaten müssen so homogenisiert werden, dass sie sich anschließend in ein gemeinsames, beschreibbares Modell einfügen.

Gewusst wie kann aus einem Wust an Daten Wertschöpfung gelingen. Es lohnt sich also, an der Weiterentwicklung der Big Data Analytics und Smart Data Technologien zu arbeiten. Zumal man gewiss sein darf, dass die Menge produzierter, gespeicherter und abrufbarer Daten täglich weiter wächst.